CloudMartix 384超节点架构:创新算力基础设施 推动行业数智化发展

内容摘要人工智能(AI)技术的快速演进正在深刻重塑产业格局。日前举行的华为云AI峰会上,华为云介绍了CloudMartix 384超节点的创新技术优势。业内人士认为,作为创新的算力基础设施,超节点架构为加速AI应用落地以及行业智能化发展提供了切实

人工智能(AI)技术的快速演进正在深刻重塑产业格局。日前举行的华为云AI峰会上,华为云介绍了CloudMartix 384超节点的创新技术优势。业内人士认为,作为创新的算力基础设施,超节点架构为加速AI应用落地以及行业智能化发展提供了切实可行的技术路径。

随着大模型训练和推理对算力需求的爆炸式增长,传统计算架构已难以支撑AI技术的代际跃迁。对此,华为云推出了采用全对等互联架构的CloudMatrix 384超节点。

“通过新型高速互联总线实现384张卡互联成为一个超级云服务器,最高能提供300Pflops的算力规模。”华为云副总裁黄瑾介绍,这项技术创新跳出了单点技术的限制,以系统性、工程性的创新算力架构,直面通信效率瓶颈、内存墙制约、可靠性短板三大技术挑战,具备MoE亲和、以网强算、以存强算、长稳可靠、朝推夜训、即开即用六大技术优势,并以系统架构创新重新定义了新一代AI基础设施。

稳定的AI算力供给,离不开可靠的数据中心载体。目前,基于CloudMatrix的超节点集群已经在安徽芜湖、贵州贵安、内蒙古等多地数据中心规模上线。华为云数据中心全球DC运维首席专家谢峰认为,当前,数据中心在空间、供电、散热和运维等方面面临更多挑战,包括AI集群超大规模组网带来的光链路可靠性挑战,AI集群功率快速增长和毫秒级功率波动带来的供电可靠性挑战,AI集群超高密度散热带来的水质安全和水力平衡挑战等。据他介绍,华为云数据中心通过产品化,实现了快速交付、低成本、低PUE(电能利用效率指标,PUE值越接近于1,表示能效水平越高),并开展了锂电预测、液冷预测等智能化实践,以打造绿色低碳、稳定可靠、安全可信的云数据中心。

华为北京总经理张东亚透露,面向政府、教育、金融、零售、互联网、交通、制造等行业,昇腾AI云服务已经成为超过600家创新先锋企业的数字化转型伙伴。

基于CloudMatrix 384超节点昇腾云服务,专注于AI基础设施和生成式人工智能计算的高科技公司硅基流动率先实现了DeepSeek-R1推理服务的持续升级。“硅基流动与华为云联合攻关实现了技术突破。”硅基流动联合创始人、首席产品官胡健介绍,通过采用大规模专家并行方案进行DeepSeek-R1部署,以多专家负载均衡和极致通信优化,实现了高吞吐、高性能。

“AI化转型其实是数字化转型的延伸,敏捷化的AI战略可能是传统行业的最佳实践策略。”大家保险信息科技部总经理郝晓波表示,大家保险依托华为云算力、AI平台等,建设企业AI中台、业务应用,覆盖智能营销、风控投资等核心场景,推动了保险业务的持续增长,共同构筑起AI时代的保险生态。

德勤中国合伙人刘晓羽表示,德勤基于华为昇腾云+DeepSeek进行AI场景化咨询与实施,通过专业调优,帮助客户一站式构建AI Native应用,从而实现企业的降本增效和高质量发展。

值得关注的是,AI技术当前已在多个学科领域实现应用,助力科学发现突破。中国科学院自动化研究所研究员李林静表示,AI赋能科研,成为全球科技发展的制高点,且亟需从作坊模式转向平台化建设,而平台化建设的核心是构建面向科学研究的基座大模型。基于CloudMatrix 384超节点的大模型后训练,支撑不同训练范式时稳定和扩展性强,为AI模型的迭代升级提供了可靠的算力保障,能有效支持基座模型持续优化。

 
举报 收藏 打赏
24小时热闻
今日推荐
浙ICP备2021030705号-2