FusionSpace大模型加速引擎
为大模型落地加速
销售热线 400-080-6888
产品介绍
超聚变FusionSpace大模型加速引擎集成了AI开发平台、AI加速软件栈、资源编排和调度等一系列软件与服务,为企业使能AI提供了更高效、更可靠的解决方案,提升大模型的研发效率,同时保障了模型训练过程的可靠性,助力企业实现数字化转型和智能化升级。
产品亮点
GPU、NPU等多算力资源统一调度、统一管理,通过节点标签定义各类资源池,AI任务可灵活选择最匹配的资源池
GPU节点可以通过裸金属服务在多个租户资源池中跨集群弹性调度,实现资源共享
提供REST、SNMP等标准北向接口,方便被客户自有系统集成
增强作业调度,支持Gang、Binpack、Proportion、Priority等高阶调度策略,资源利用率提升50%以上
GPU/NPU多实例和虚拟化技术,单卡可以当多卡使用,有效降低客户TCO
Checkpoint时长低至30秒,快速保存训练过程中的数据,训练时长最多可缩短6%
自动识别作业是否卡死,告警提醒用户及时释放资源,节省训练资源成本
训练过程中检测到节点故障、计算资源耗尽、程序崩溃等故障后自动从最近的Checkpoint点恢复训练,训练任务秒级恢复
通过BMC和多种诊断工具,支持集群的GPU故障监控和诊断,故障诊断准确率达96%
集成数据管理、算法开发、训练管理、模型管理、推理服务、镜像管理等多个功能模块,一站式AI模型开发训练部署,打通深度学习全链路
预置常见预训练模型和深度学习框架镜像,帮助用户快速开发AI应用
集成模型迁移工具,实现模型快速迁移和可视化性能分析,助力客户业务快速上线
方案架构
推荐产品
FusionServer G8600 V7是新一代旗舰级GPU服务器,支持8GPU模组,具备12个PCIe标准卡和1个OCP卡的扩展能力,通过支持25块2.5寸硬盘和8个NVMe SSD盘获得超大容量或超高速存储。G8600 V7用于训练、科学计算、图片和数据分析等高性能场景。G8600 V7具有旗舰算力、极致能效、极致可靠、易于运维等优点。
FusionServer G5500 V7是新一代4U2路GPU服务器,最多支持10个双宽GPU卡,具备4个PCIe标准卡和3个OCP卡的扩展能力,通过支持24个3.5寸硬盘或12个NVMe SSD盘获得超大容量或超高速存储。G5500 V7具有高性能、架构灵活、高可靠、易部署、易管理等优点。G5500 V7为AI训练、AI推理、HPC、图片视频分析和数据库等应用加速,支持企业和公有云的部署。
FusionServer G5200 V7是面向大容量存储AI需求的新一代4U2路GPU服务器。G5200 V7可用于训练和推理工作负载,适用于语音、图像和视频分析等场景,具有强劲性能、可靠安全、高效节能、易管理、易部署等优点。
FusionServer G5500 V6是一款4U2路GPU服务器,支持多种规格GPU卡,具有计算性能卓越、配置灵活均衡、高效部署运维等特点,适合为AI推理、AI训练、HPC、视频分析和数据库等应用加速,针对深度学习的训练、推理和HPC等业务类型进行了优化,同时支持企业和公有云的部署。
FusionServer G5500 V5是面向数据中心部署的异构服务器,具有高密的异构计算能力,支持GPUDirect RDMA和P2P;支持一键切换异构拓扑,为多样化应用负载提供最优的异构拓扑配置;基于全模块化设计,支持CPU和异构部件的长期演进。FusionServer G5500 V5是适配AI、HPC、智能云、视频分析和数据库加速等应用场景的最佳异构计算平台。
CX5200 V5是针对人工智能、HPC、云计算和大数据处理等业务需求推出的GPU服务器,可适用于AI推理&训练、HPC异构计算、图形渲染等各种应用需求。CX5200 V5具有卓越的系统性能、安全可靠、简易运维、高效节能等特点。
技术支持
如何购买
欢迎在线留下项目诉求,我们将会有工作人员与你取得联系
立即留资
如果你对我们的企业产品或服务感兴趣,或有遇到问题,请联系我们的在线工作人员
立即咨询
如果你需要购买我们的企业产品或服务,请立即拨打以下电话,我们的工作人员将及时与你对接
400-080-6888
立即联系