作业是用户在集群中提交的一个计算任务,作业在相应的集群队列中运行并输出结果。集群会对其中的作业进行统一的调度管理。

登录高性能计算 的作业页面,可显示当前集群的所有作业,系统提供两种提交作业的方式界面提交 CLI 提交

查看作业列表

  1. 登录 QingCloud 管理控制台。选择产品与服务 > 高性能计算 > 弹性高性能计算 EHPC,默认进入快速入门页面。

  2. 点击左侧导航栏中的作业管理,进入作业管理页面,默认显示当前 EHPC 集群中所有作业列表。

    jonlist_1
    参数 说明

    作业名称/ ID

    作业的名称和 ID

    状态

    作业当前状态,包括正在运行、排队中、运行结束、失败、暂停以及未知

    所属队列

    作业所属的队列

    核心数

    运行作业的核心数

    运行时长

    作业运行的时长

    总计耗时

    当前作业运行总共消耗的时间

    用户名

    提交该作业的用户名称

    创建时间

    该作业的创建时间

    更新时间

    该作业状态更新的时间

    操作

    针对当前作业可进行的操作:查看详情、重新提交作业和删除作业

  3. 点击所属集群右侧的下拉框,可通过当前平台内以创建的集群类型对作业列表进行筛选。

查看作业详情

  1. 作业页面,勾选待查看详情的作业,点击操作 > 详情

  2. 弹出的作业详情页面,主要包含作业的以下信息。

    joblist 4
    • 基本信息:包括作业名称/ID、作业状态、作业提交时间、作业更新时间、作业运行时长、作业软件、核心数、作业调度 ID。

    • 计算目录:包括计算所需的所需的所有文件与输出文件。

    • 输出日志:包括标准输出日志和错误输出日志。

    • 作业输入文件:提交作业时上传的所需命令文件。

    • 所属集群和队列:主要描述集群和队列的基本信息。

删除/重新提交作业

用户可以对作业进行暂停或者删除操作,如作业运行失败,也可以进行命令文件更新,重新设置一些参数,然后重新提交此作业。

删除作业

  1. 作业页面,勾选待删除作业,点击操作 > 删除

  2. 在弹出的删除相应作业的提示窗口中,点击确定即可。

重新提交作业

  1. 作业页面,勾选待重新提交的作业,点击操作 > 重新提交作业

  2. 弹出提交作业页面,根据需要相应资源、软件进行选择,并对作业执行命令进行进一步的配置修改,点击提交作业即可。

    jonlist_7