前提条件

  • 已经获取 QingCloud 管理控制台账户和密码。

  • 创建在线推理服务,且状态为运行中已关闭

扩容

  1. 登录 QingCloud 管理控制台。

  2. 在顶部导航栏,点击产品与服务 > AI 智算平台 > AI 智算平台,进入其总览页面。

  3. 在左侧导航栏,选择推理服务 > 在线推理服务,进入在线推理服务列表页面。

  4. 点击指定推理服务操作列中的服务详情,进入其详细信息页面。

  5. 在推理服务详细信息页面,点击右上角更多操作,并选择扩容

    model inference exp 1
  6. 在弹出的扩容窗口中,设置扩容实例数量,点击确定,并等待服务更新完成即可。

    注意

    只能扩容与原在线推理服务中,同种规格的资源。

    model inference exp 2

缩容

仅包含多个实例的推理服务支持缩容操作。

  1. 进入指定推理服务的详情页面,点击右上角更多操作,并选择缩容

  2. 在弹出的缩容窗口中,设置缩容实例数量,点击确定,并等待服务更新完成即可。缩容后,当前推理服务所用的实例费用会同步下调。

    注意

    在线推理服务中至少包含一个实例。