本章节主要介绍如何查看平台内的镜像仓库以及使用指定镜像提交训练任务。

前提条件

  • 已获取管理控制台账号和密码。

  • 已完成个人实名认证且账户余额大于 0 元。

查看预置镜像

  1. 登录管理控制台。

  2. 点击产品与服务 > 计算 > AI 算力平台,选择左侧导航栏中的镜像仓库,默认进入预置镜像列表页面。

    image lib 1
  3. 点击该页面右上角列表排列方式切换图标,可以卡片列表形式展示平台内的镜像。

    image lib 2
  4. 在列表上方的搜索框内输入关键词,支持镜像列表筛选。

拉取预置镜像

  1. 开启开发环境,并登录指定计算节点的后台

  2. 在预置镜像列表页面,复制指定镜像的拉取命令。

    image lib 3
  3. 在 Terminal 界面,输入上一步骤中复制的拉取命令,等待镜像下载完成即可。

    说明

    下载成功的镜像将保存至当前集群挂载的并行文件存储的共享目录中的 /data 路径下。

    以拉取 PyTorch 架构下的 2.0.1-cuda11.7-cudnn8-runtime 为例,拉取命令:

    docker pull j1-dockerhub.qingcloud.com/pytorch/pytorch:2.0.1-cuda11.7-cudnn8-runtime

    命令回显:

    2.0.1-cuda11.7-cudnn8-runtime: Pulling from pytorch/pytorch
    99803d4b97f3: Pull complete
    4ade0a4bc5d5: Pull complete
    035a286326d6: Pull complete
    4f4fb700ef54: Pull complete
    2185b402c9ca: Pull complete
    Digest: sha256:82e0d379a5dedd6303c89eda57bcc434c40be11f249ddfadfd5673b84351e806
    Status: Downloaded newer image for j1-dockerhub.qingcloud.com/pytorch/pytorch:2.0.1-cuda11.7-cudnn8-runtime
    j1-dockerhub.qingcloud.com/pytorch/pytorch:2.0.1-cuda11.7-cudnn8-runtime

提交训练任务

若需要在镜像仓库使用预置镜像提交训练任务,需提前创建好 AI 算力集群。

  1. 镜像仓库页面,选择待使用的镜像,点击其上对应的提交训练任务

  2. 跳转至创建训练任务页面,其中运行环境已设定为上一步骤中选择的镜像。参考创建训练任务相关章节,完成任务的创建与提交即可。