前提条件

操作步骤

  1. 登录 QingCloud 管理控制台。

  2. 在顶部导航栏,点击产品与服务 > AI 智算平台 > AI 智算平台,进入其总览页面。

  3. 在左侧导航栏,选择推理服务 > 在线推理服务,进入在线推理服务列表页面。

    model inference view 1
  4. 在推理服务列表页面,可查看当前平台内所有在线推理服务的基本信息。

    页面信息 说明

    服务名称/ID

    • 服务名称:为创建在线推理服务时用户自定义。

    • 服务 ID:系统自动生成,点击服务 ID 可直接进入该推理服务的详情页面。

    状态

    当前推理服务的状态,包括等待中、创建中、运行中、已关闭、失败等状态。

    资源配置

    创建推理服务时,用户选择资源规格。

    模型

    创建推理服务时,部署的模型名称。

    实例

    Pod 实例的总数和正常数量。其中总数,即用户在创建推理服务,选择资源配置时设置的实例数量。

    访问地址

    部署成功的模型的访问地址,支持内网访问外网访问

    创建时间

    当前推理服务创建的时间。

    更新时间

    当前推理服务更新的时间。

    操作

    针对不同状态的推理服务,其所支持的操作不尽相同,主要包括服务详情、关闭、开启以及删除等。

  5. 点击某一推理服务的服务名称/ID(或点击操作列中的服务详情),即可进入其详情页面。

  6. 服务信息页签内,可查看当前推理服务的基本信息、实例信息以及计费信息。

    model inference view 2
  7. 选择服务日志页签,即可查看当前推理服务所有实例上的日志信息,同时也支持用户根据起止时间或在搜索框中输入关键字查看指定的日志内容。

    model inference view 3