弹性高性能计算 EHPC 是基于云基础设施,为用户提供基于公有云、专属云、混合云等多种产品形态,面向科研机构、学校教育、工业生产、行业计算等用户提供弹性灵活、快捷高效、安全可靠的超算服务。

适用于生命科学、CAE 仿真、海洋气象、影视渲染、石油勘探、深度学习、测绘地理等高性能计算场景。

工作原理

弹性高性能计算 EHPC 是由计算、存储和网络三个产品构建的集群,保证了资源之间的网络互联、文件的存储管理、作业的执行、监控、预览等,并提供集群创建、删除、扩容、增加节点、集群关机等全生命周期管理。

弹性高性能计算 EHPC 基于计算机上的多个处理器或某一集群中几台计算机的硬件资源、计算系统和环境,将大规模的运算任务拆分成很多的小任务分发到各个服务器上并行计算,再将计算结果汇总成最终的一个结果。用于解决计算密集型、海量数据处理等业务的计算需求,通过计算来分析、模拟试验,来验证理论正确性。

集群

高性能计算中的集群是用于高性能并行计算的资源集,由云平台弹性计算实例组成,包含了调度管理集群资源的高性能调度器,以及运行业务所需的软件栈,解决超大规模的科学、工程和商业问题。EHPC 集群是共享集群技术与云计算技术的融合升级,用户可以根据需求申请独享的专属集群,包含登录节点、计算节点、管控节点。

用户可完全根据需求场景进行配置集群。集群创建完成后,可以拥有专属集群的 Admin 权限,具有完整的管理权限。可以随时创建、删除、停机、扩容集群,也可以进行软件安装、编译等定制化行为,拥有独享的二层隔离网络。用户可以同时享有 HPC 计算的超高性能和云计算的弹性与可扩展性。

集群节点

弹性高新能计算 EHPC 集群由多种类型的节点组成,包括:管控节点、计算节点、登录节点。

  • 登录节点

    登录节点是用户访问到集群的节点,通过登录节点可操作集群或访问其他节点,用户可以在该节点上自定义软件编译安装,挂载共享存储,同时也是绑定公网 IP 的节点,用户可以通过此节点进行外网通信上传下载文件等。

  • 管控节点

    管控节点提供调度服务和账户管理服务,可连接到共享存储进行文件管理。

  • 计算节点

    计算节点是执行任务的节点,节点的能力和数量决定了集群的计算能力。计算节点可连接到共享存储,支持多个节点,挂载共享存储,计算节点又分为 CPU 计算、GPU 计算和裸金属计算类型,可以根据实际应用场景进行配置。

资源介绍

弹性高性能计算使用的相关资源:

  • 专用高性能计算服务器

  • 集成 Luster 的文件存储 EPFS

队列

队列是计算节点的集合,将运行不同作业或执行不同任务的节点进行分类,加入到不同的队列进行分类管理,从而更高效的管理大量运行作业的计算节点。队列的计算节点越多、核心数越多、计算效率越高。