18
05
2026
该系统以GPU为焦点,可为万亿参数大模子锻炼推理、行业大模子微调、多模态大模子开辟、AI4S等场景供给高效算力底座。支撑百万卡超大集群扩展。超高机能:单机柜可搭载96张GPU卡、算力规模达百P级、访存总带宽超180TB/s;超30天长稳运转集群靠得住性测试;先辈冷板液冷,394项节能设想PUE低于1.12。存算传协同,全面:基于AI计较架构设想;平均无毛病时间(MTBF)提高2.1倍;超高靠得住:121项设备和链RAS靠得住性设想;发布了国内首个基于AI计较架构设想的产物——曙光AI超集群系统。硬件适配多品牌AI加快卡;软件兼容支流AI计较生态;实现百万级部件毛病从动阐发取秒级隔离。超高效率:千卡集群大模子锻炼推能达到业界支流程度2.3倍、开辟效率提拔4倍、人天投入削减70%;平均毛病修复时间(MTTR)降低47%;提拔GPU计较效率55%;支撑多精度、夹杂精度运算;实现了“算、存、网、电、冷、管、软”一体化紧耦合设想,具备“超高机能、超高靠得住、全面”四大特点。