核心定位:主攻大模型训练与推理 Decode 阶段(逐 token 生成),访存密集型场景优先,适合千亿参数级模型的预训练、微调与高吞吐长文本推理。
核心参数:
算力:与 PR 一致,FP8 1 PFLOPS,FP4 2 PFLOPS;
内存:自研 HiZQ 2.0 HBM,144GB 超大容量,带宽高达 4TB/s;
互联带宽:2TB/s,支持灵衢全光互联,柜内卡间时延 < 200ns;
采用 SIMD/SIMT 双编程模型同构设计,适配 MoE 等复杂模型。
产品形态与规划:2026 年 Q4 同步推出 Atlas 950 SuperPOD 超节点,单机柜 64 张 950DT 卡,支持液冷高密度部署,面向超大规模 AI 集群。

