戴尔HPCC/AI解决方案参考架构发表时间:2024-02-27 15:21 方案描述: 1.典型的高性能计算架构包括管理、计算、存储、网络等子系统,以及集群软件; 2.计算集群包括普通计算节点、胖点节(大内存)以及异构加速节点(GPU/FPGA等); 3.存储系统有多种可选方案,小型集群可采用NSS存储(服务器挂载ME4存储),中大型HPC集群存储一般采用Lustre、BeeGFS或Isilon等并行文件系统提高存储性能; 4.网络部分:数据网络用于存储或者数据传输;计算网络用于计算过程中的消息传递;管理网络用于集群系统管理;存储网络和数据网络常用低延时的56G/100G/200G InfiniBand或100G OPA,或者10G/40G/100G以太网; 5.硬件平台之上部署一整套集群软件,从操作系统到客户应用,集群软件核心是集群管理和作业调度平台,推荐使用经过验证的合作伙伴软件或者开源软件; 下一篇服务器虚拟化解决方案
|