[图说] 越来越离谱了你们（09.01） - 技術討論區

本頁主題: [图说] 越来越离谱了你们（09.01）	字體大小寬屏顯示只看樓主最新點評熱門評論時間順序

dingdang13

級別：精靈王 ( 12 )
發帖：10822
威望：1333 點
金錢：268652 USD
貢獻：1474 點
註冊：2015-03-28

赞(29) | 資料短信推薦編輯

你们
自愿疫苗
自愿核酸
自愿不出门
自愿隔离
自愿去死
都是你们自愿的
政府三令五申禁止层层加码

——————————————————————————

A100 和 H100 有多强悍？

相比于英伟达前一代的 Volta GPU，A100 的性能提升了 20 倍，非常适合于人工智能、数据分析、科学计算和云图形工作负载。该芯片由 540 亿个晶体管组成，打包了第三代 Tensor 核心，并具有针对稀疏矩阵运算的加速功能，对于 AI 推理和训练来说特别有用。此外，每个 GPU 可以划分为多个实例，执行不同的推理任务，采用 Nvidia NVLink 互连技术可以将多个 A100 GPU 用于更大的 AI 推理工作负载。

然而，这些在 H100 出现之后显得略有不足了。在今年春季的发布会中，黄仁勋发布了面向高性能计算（HPC）和数据中心的下一代 Hopper 架构，搭载新一代芯片的首款加速卡被命名为 H100，它就是 A100 的替代者。

H100 是一款针对大模型专门优化过的芯片，使用台积电 5nm 定制版本制程（4N）打造，单块芯片包含 800 亿晶体管。同时也是全球首款 PCI-E 5 和 HBM 3 显卡，一块 H100 的 IO 带宽就是 40 terabyte 每秒。

Transformer 类预训练模型是当前 AI 领域最热门的方向，英伟达以此为目标专门优化 H100 的设计，提出了 Transformer Engine，集合了新的 Tensor Core、FP8 和 FP16 精度计算，以及 Transformer 神经网络动态处理能力，可以将此类机器学习模型的训练时间从几周缩短到几天。

针对服务器应用，H100 也可以虚拟化为 7 个用户共同使用，每个用户获得的算力相当于两块全功率的 T4 GPU。此外，H100 还实现了业界首个基于 GPU 的机密计算。

基于 Hopper 架构的 H100，英伟达还推出了机器学习工作站、超级计算机等一系列产品。8 块 H100 和 4 个 NVLink 结合组成一个巨型 GPU——DGX H100，一共有 6400 亿晶体管，AI 算力 32 petaflops，HBM3 内存容量高达 640G。

与此同时，得益于与 Equinix（管理全球 240 多个数据中心的全球服务提供商）的合作， A100 和 H100 的新型 GPU 通过水冷方式来节省用户的能源成本。使用这种冷却方法最多可以节省 110 亿瓦时，可以在 AI 和 HPC 推理工作中实现 20 倍的效率提升。

點評