图片
人工智能的兴起,让英伟达GPU在服务器中的受重视程度日益提升,但他们不满足于此。通过收购Arm公司和发表基于Arm 架构的Grace处理器,英伟达走出了在服务器市场替代英特尔X86的前两部。
而最近,他们发布了最新的数据,对英特尔步步紧逼。
英伟达表示,它已经证明,当与用于 AI 应用程序(特别是机器学习推理)的 GPU 搭配使用时,基于 Arm 的 CPU 可以提供与基于 x86 的 CPU 几乎相同的性能水平。 
图片
这家总部位于加利福尼亚州圣克拉拉的这家公司本周做出了这一断言,并使用了周三发布的同行评审性能数据作为支持,该数据是多家 OEM 和芯片制造商针对新的 MLPerf Inference v1.1 机器学习推理基准套件的测试结果的一部分.
在与记者和分析师的简报中,英伟达人工智能推理和云计算高级产品经理 Dave Salvator 表示,该公司通过采用基于 Arm 的 CPU 的 MLPerf 结果,确定了基于 Arm 的 CPU 和基于 x86 GPU 系统和基于 x86 的 GPU 系统,并在每个加速器的基础上比较它们。 
“我们能够提供您在这里看到的与配置非常相似的 x86 服务器并驾齐驱的结果,”他说。
在查看一个加速器提供的性能时,Nvidia 发现基于 Arm 的系统和基于 x86 的系统之间的测试结果相似。在离线设置中进行测试,基于 x86 的系统仅在六个机器学习模型中的五个中显示出较小的优势,其中包括用于自然语言处理的 BERT-Large 和用于语音识别的 RRN-T。对于 3D U-Net 医学成像模型,基于 Arm 的系统具有更明显的优势。
当涉及到需要在线连接的测试时,基于 Arm 的系统在 ResNet-50 图像分类模型上有轻微的性能优势,而基于 X86 的系统在 SSD-Large object detection 和 DLRM 推荐模型上有类似的优势。但是,对于 RNN-T 和 BERT-Large 模型,基于 x86 的系统具有更大的优势。
根据 Salvator 的说法,基于 Arm 的系统和基于 x86 的系统之间的性能结果基本相似,这是“一个重要的里程碑”。 
“首先,它表明 Arm 作为加速平台可以提供与类似配置的 x86 服务器差不多的性能,”他说。“这也是关于我们的软件堆栈准备好能够在数据中心环境中运行 Arm 架构的声明。”
在上述的测试中,基于 Arm 的系统是一台 Gigabyte 服务器,系统中运行了来自半导体初创公司 Ampere Computing的Altra CPU和四个通过 PCIe 连接的 Nvidia A100 GPU。基于 x86 的系统是 Nvidia 的 DGX A100,配备了两个 AMD EPYC 7742 CPU 和八个通过 SXM 连接连接的 Nvidia A100 GPU。Nvidia 还展示了相同的基于 Arm 的系统与使用相同 CPU 和 GPU 但使用 PCIe 的不同基于 x86 的系统之间的类似性能比较。
Salvator 在给 CRN 的一份声明中表示,在每个加速器的基础上比较系统是使数据直接可比的最佳方式,因为基于 Arm 的系统和基于 x86 的系统具有不同数量的 CPU 和 GPU。他补充说,鉴于“推理性能与 GPU 数量成线性关系”,这是进行比较的一种公平方式。
“通过对每个加速器或每个处理器进行比较,我们能够直接比较一个和另一个,并真正了解相对性能,”他说。 
审查和发布 MLPerf 测试结果的联盟 MLCommons 的执行董事 David Kanter 告诉 CRN,在基于 CPU 的系统的情况下测量每个处理器的性能或在基于 GPU 的系统的情况下测量每个加速器的性能是“相当普遍的使用”指标。 
“每个处理器的性能数字是有道理的,因为推理通常是一个明确的并行工作负载,”他在一封电子邮件中说。“每个推理都是独立的,因此 [它] 理论上可以转到单独的处理器,因此归一化是合理的。”
但是,他指出,MLCommons“仅正式认可测得的 MLPerf 分数”,该分数基于整个系统的性能,而不是单个加速器或处理器的性能。 
英伟达在数据中心提出了关于 Arm 的新论点,因为它希望让替代芯片架构成为其未来的重要组成部分。这家芯片制造商正试图以 400 亿美元的价格收购 Arm,尽管它面临着监管机构的严格审查以及一些竞争对手和生态系统参与者的反对。该公司还计划制造自己的基于 Arm 的数据中心 CPU。
位于马萨诸塞州普利茅斯的 Nvidia 合作伙伴 Microway 的战略客户和高性能计算计划副总裁 Eliot Eshelman 告诉 CRN,他的 HPC 客户需要看到主要的性能优势才能从 x86 跃升到 Arm,这还没有发生。表明两种芯片架构仅具有可比性对他们来说是不够的。
“在我们的客户中,需要有一些大的、明确的卖点,说明他们为什么需要改用新架构,”他说。 
Eshelmen 表示,Arm 最终可能会推出架构改进,这将使其在人工智能方面优于英特尔和 AMD,但他认为性能提升更有可能来自英伟达计划在 CPU 和 GPU 之间进行的互连工作这家芯片制造商即将推出的基于 Arm 的数据中心 CPU。
他说:“我不知道 Arm 是否会在 x86 上提供如此巨大的乘数,或者这只是 Nvidia 为实现目标而采取的道路。”

作者 scforum

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注