发布与定位:2022 年 GTC 发布,第九代数据中心旗舰,接替 A100,主打大规模 AI 训练、大模型微调、高性能计算(HPC),是生成式 AI 基础设施的核心芯片。
核心架构与工艺:台积电 4N 工艺,800 亿晶体管,Hopper 架构;提供 SXM5(700W,极致性能)与 PCIe 5.0(350W,通用部署)两种形态;支持第四代 NVLink 与 NVLink Switch,可构建 256 卡超大规模集群。
关键规格
显存:80GB HBM3,显存带宽 3.35 TB/s;
计算单元:第四代 Tensor Core+Transformer Engine,原生支持 FP8 低精度,FP8 算力达 3341 TFLOPS;
功能:第二代 MIG(多实例 GPU),最高 7 个实例,内置机密计算。
性能与场景:相较 A100,LLM 训练速度最高提升 9 倍、推理提速 30 倍;适用于 GPT 类大模型预训练、自动驾驶算法开发、气象模拟、量子化学、金融量化等超算级任务。


