数据中心资源池
数据中心资源池解决方案是一种将数据中心的物理资源(如服务器、存储、网络)进行虚拟化和统一管理的技术方案,它可以实现资源的动态分配和优化,提高资源的利用率和效率,降低资源的成本和风险。
背景
某计算中心是国家重点研发计划的重要组成部分,中心需要建设一个CPU与GPU混合算力集群平台,以支持中心的研究项目和应用需求,提高中心的计算能力和效率。
需求分析
01.
构建卓越集群平台
集群平台应具备高性能、高可靠、高可扩展、高安全的特点,能够满足中心的各类计算任务的需求,包括高性能计算、大数据分析、深度学习、图像处理等。 展开
02.
混合架构卓越表现
集群平台应采用CPU与GPU混合的架构,利用CPU的通用性和GPU的并行性,实现高效的计算加速。集群平台应支持多种类型的GPU,包括英伟达、寒武纪等,以适应不同的计算场景和需求 展开
03.
卓越通信架构
集群平台应具备良好的网络通信能力,采用高速、低延迟、高带宽的网络设备,实现节点间的高效数据传输和协同计算
04.
全面运维解决方案
集群平台应具备完善的管理和监控功能,采用统一的管理软件,实现集群的配置、调度、监控、故障处理等功能,提高集群的运维效率和可用性 展开
05.
云端多租户管理
集群平台云管理功能,支持多租户管理,并能够纳管裸金属服务器
方案描述
服务器
- 采用H3C R4900G5作为通用服务器、高性能服务器和国外GPU x86服务器载体,搭配不同性能的CPU来提供相应的计算性能。采用飞腾服务器作为信创服务器及国产GPU载体。国外显卡部署在2台通用GPUx86服务器上,而2块国产显卡部署在飞腾服务器上 展开
网络
- 采用2台H3C全万兆交换机作为业务交换机来上联服务器与核心交换机,传输业务数据。采用2台H3C全万兆交换机作为存储交换机来下联服务器、超融合数据复制,来传输虚拟化平台基础数据。采用1台H3C作为带外管理交换机来远程管理本项目所有硬件设备 展开
虚拟化
- 在所有服务器上部署H3C的超融合平台,对计算及GPU资源进行池化资源管理
云管理平台
- 在虚拟化平台上部署H3C云平台软件,对所有服务器进行云数据中心管理
方案优势
超融合管理平台基于多角色集群引擎打破了物理资源壁垒,以其自适应架构,不仅可以统一管理X86资源池和ARM资源池,还可以同时管理纯虚拟化节点、纯分布式存储节点、超融合节点、AI加速节点、裸金属节点等。
兼容不同芯片、不同款型、不同配置、不同能力的物理节点。
实现了硬件资源高度集约的同时,保证了集群操作的一致性,实现了异构式的硬件资源池,大大丰富了应用场景。
客户收益