数据中心资源池

数据中心资源池解决方案是一种将数据中心的物理资源(如服务器、存储、网络)进行虚拟化和统一管理的技术方案,它可以实现资源的动态分配和优化,提高资源的利用率和效率,降低资源的成本和风险。

背景

某计算中心是国家重点研发计划的重要组成部分,中心需要建设一个CPU与GPU混合算力集群平台,以支持中心的研究项目和应用需求,提高中心的计算能力和效率。

需求分析

01.

构建卓越集群平台

集群平台应具备高性能、高可靠、高可扩展、高安全的特点,能够满足中心的各类计算任务的需求,包括高性能计算、大数据分析、深度学习、图像处理等。

02.

混合架构卓越表现

集群平台应采用CPU与GPU混合的架构,利用CPU的通用性和GPU的并行性,实现高效的计算加速。集群平台应支持多种类型的GPU,包括英伟达、寒武纪等,以适应不同的计算场景和需求

03.

卓越通信架构

集群平台应具备良好的网络通信能力,采用高速、低延迟、高带宽的网络设备,实现节点间的高效数据传输和协同计算

04.

全面运维解决方案

集群平台应具备完善的管理和监控功能,采用统一的管理软件,实现集群的配置、调度、监控、故障处理等功能,提高集群的运维效率和可用性

05.

云端多租户管理

集群平台云管理功能,支持多租户管理,并能够纳管裸金属服务器

方案描述

服务器


  • 采用H3C R4900G5作为通用服务器、高性能服务器和国外GPU x86服务器载体,搭配不同性能的CPU来提供相应的计算性能。采用飞腾服务器作为信创服务器及国产GPU载体。国外显卡部署在2台通用GPUx86服务器上,而2块国产显卡部署在飞腾服务器上

网络


  • 采用2台H3C全万兆交换机作为业务交换机来上联服务器与核心交换机,传输业务数据。采用2台H3C全万兆交换机作为存储交换机来下联服务器、超融合数据复制,来传输虚拟化平台基础数据。采用1台H3C作为带外管理交换机来远程管理本项目所有硬件设备

虚拟化


  • 在所有服务器上部署H3C的超融合平台,对计算及GPU资源进行池化资源管理

云管理平台


  • 在虚拟化平台上部署H3C云平台软件,对所有服务器进行云数据中心管理

方案优势

超融合管理平台基于多角色集群引擎打破了物理资源壁垒,以其自适应架构,不仅可以统一管理X86资源池和ARM资源池,还可以同时管理纯虚拟化节点、纯分布式存储节点、超融合节点、AI加速节点、裸金属节点等。

兼容不同芯片、不同款型、不同配置、不同能力的物理节点。

实现了硬件资源高度集约的同时,保证了集群操作的一致性,实现了异构式的硬件资源池,大大丰富了应用场景。

客户收益

UIS云平台支持对虚拟化、裸金属等异构资源统一管理

支持基于裸金属服务器的容器实例部署,基于裸金属部署大数据服务

裸金属和云主机统一资源池化管理

通过H3C UIS超融合管理软件集成的数据安全隔离功能,确保虚拟化、多租户环境下的用户隐私信息及数据的安全。不同组织的业务系统和应用系统独立部署,互不干扰

支持GPU资源池功能,根据设置的业务模板及资源抢占策略,实现对GPU资源的自动分配和回收