英伟达秀 Blackwell GPU 肌肉:训练 AI 模型速度比Hopper快2.2倍
测试简介
英伟达于今年 8 月,首次公布了 Blackwell GPU 在 MLPerf v4.1 AI 推理方面的基准测试成绩,而今天首次公布了该 GPU 在 MLPerf v4.1 AI 训练工作负载方面的测试成绩。
NVIDIA 表示,随着新模型的推出,AI 领域对计算的需求正在以指数级增长,因此需要大幅提升训练和推理 AI 的能力, 附上本次训练工作负载主要使用的模型如下:
Llama 2 70B(LLM 微调)
Stable Diffusion(文本到图像)
DLRMv2(推荐系统)
BERT(自然语言处理)
RetinaNet(目标检测)
GPT-3 175B(LLM 预训练)
R-GAT(图神经网络)
这些工作负载的基准测试为评估 AI 加速器的训练性能提供了准确的数据支持。
Hopper GPU 的持续优化
Hopper GPU 自发布以来,经过持续的软件优化,性能得到了显著提升。H100 GPU 在 LLM 预训练性能上比首次提交时快了 1.3 倍,并且在 GPT-3(175B 训练)中实现了 70% 的性能提升。
英伟达利用 11616 个 H100 GPU 进行了 MLPerf 的最大规模提交,进一步证明了其在数据中心级别的强大能力。
Blackwell 的技术优势
Blackwell GPU 的设计旨在提高每个 GPU 的计算吞吐量,配备更大更快的高带宽内存,不降低性能的前提下,能够在更少的 GPU 上运行 GPT-3 175B 基准测试。
根据测试结果,64 张 Blackwell GPU 的测试性能,可以达到 256 张 Hopper GPU 的水平。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
-
Oura CEO 坚信苹果不会开发智能戒指,因为会削弱Apple Watch销量
11 月 14 日消息,Oura首席执行官汤姆・黑尔 (Tom Hale) 认为,苹果没有进入智能戒指市场的计划,因为这个产品类别可能会削弱 Apple [详细] -
OpenAI 被曝明年将推 Operator,可控制电脑、独立执行任务
11 月 14 日消息,科技媒体 The Verge 今天(11 月 14 日)发布博文,报道称 OpenAI 公司计划于 2025 年 1 月,以研究预览 [详细] -
NEC 收获新超算订单:英特尔 CPU + AMD 加速器 + 英伟达交换机
11 月 14 日消息,NEC 当地时间昨日宣布已收到日本量子科学技术研究开发机构(QST)和日本国立核聚变科学研究所(NIFS)的下一代超级计 [详细] -
Meta 社交平台Threads商业化新进程:明年试点在信息流中投放广告
11 月 14 日消息,科技媒体 The Information 昨日(11 月 13 日)发布博文,报道称 Meta 旗下的社交平台 Threads 将于 2025 [详细] -
Canalys:2024 年第三季度全球 AI PC 市场份额提高至 20%
11 月 14 日消息,Canalys 今日发布报告称,2024 年第三季度,全球 AI PC 出货量达到 1330 万台,占本季度 PC 总出货量的 20% [详细]