咨询热线 4001616691
联系我们 中国大陆 CNY

新闻中心

NVIDIA Blackwell 横扫 MLPerf Training 6.0:在所有基准测试中创下纪录 NEWS DETAIL

当前位置:首页 > 新闻中心
资讯分类 · 新闻中心 发布时间 · 2026-06-23

NVIDIA 在 MLPerf Training v6.0 中实现全面领先,这是 MLCommons 联盟发布的最新行业标准 AI 训练基准测试。NVIDIA 在每项测试中均取得最快训练时间,同时也是唯一在所有测试中提交结果的平台。

本轮 MLCommons 引入了反映最新 AI 模型趋势的新预训练基准,包括 DeepSeek-V3(671B 参数的混合专家模型)和 GPT-OSS-20B。NVIDIA GB300 NVL72 系统通过优化的软件栈和连接 72 块 Blackwell Ultra GPU 的 NVLink 设计,在这两项新基准测试中设定了性能标杆。

在数据中心规模的测试中,NVIDIA 合作伙伴在多达 8,192 块 Blackwell GPU 集群上成功运行,验证了平台在实际超大规模数据中心中的稳健性。Spectrum-X 以太网的先进自适应路由和拥塞控制技术确保 MoE 模型中的专家并行通信高效运行。

关键成绩包括:DeepSeek-V3 671B 在 8,192 GPU 上仅需 2.02 分钟训练完成;Llama 3.1 405B 在 8,192 GPU 上仅需 7.07 分钟;FLUX.1 在 512 GPU 上仅需 17.1 分钟。NVIDIA 还首次为无 token 丢弃的 MoE 架构实现了全迭代 CUDA Graphs,大幅减少了 CPU-GPU 同步开销。