中讯网>商业>英伟达联手Arm迎战高性能计算！GPU加速卡将支持Arm架构CPU

英伟达联手Arm迎战高性能计算！GPU加速卡将支持Arm架构CPU

商业2019-06-1815802

文| 心缘

智东西6月17日消息，在今日于德国举行的ISC 2019国际超算大会上，美国芯片巨头英伟达（NVIDIA）今天宣布其用于超级计算机的加速平台将对Arm架构CPU支持，即计划利用其芯片与使用Arm架构的CPU协作打造超级计算机。

这为高性能计算（HPC，High Performance Computing）行业开辟了一条全新的路径，为能够实现“exascale”性能的超级计算机铺平道路，有助于构建具有极高能效水平的百万兆级AI超级计算机。

NVIDIA表示，将于年底前向Arm生态系统提供全堆栈的AI和HPC软件。堆栈优化完成后，NVIDIA将能为包括x86、POWER和Arm在内的所有主流CPU架构提供加速。

此外，NVIDIA还于今日推出了全球排名第22快的超级计算机DGX SuperPOD，据称可满足自动驾驶车辆部署计划的大量需求。

一、NVIDIA将支持Arm CPU

NVIDIA一直是数据中心市场的佼佼者，其GPU芯片被用于与英特尔、IBM等公司的中央处理器（CPU）协同工作，完成大规模并行计算的加速任务。

在超大规模数据中心和高性能计算的服务器市场，英特尔x86处理器长期占据主导地位，随后IBM Power芯片则成为后起之秀，而IBM的Power处理器在近年亦出现翻盘之势，主要在中低端服务器芯片市场分食x86的市场蛋糕，而Arm则试图在中低端服务器市场赢得更多的市场份额。

英国Arm公司是全球领先的半导体知识产权（IP）供应商，于2016年被日本软银集团以234亿英镑（约合310亿美元）高价收购。

不同于英特尔和IBM，Arm公司本身不直接从事芯片生产，而是依靠给芯片厂商们提供底层的处理器架构授权，从而获得授权费用和一定版税。

苹果、三星、高通、华为、飞利浦等各大芯片厂商们都从Arm那里购买授权，全球绝大多数智能手机和平板电脑等便携式消费电子产品均采用Arm架构。

和其他架构相比，Arm的一大特色在于出色的能效，它能够为超级计算机提供开放式架构，因此用户可以添加各种有益于超级计算的有趣技术，例如紧密集成。

NVIDIA副总裁兼加速计算总经理Ian Buck称，通过将Arm CPU与Tesla GPU相结合，使用者可以完成大量的HPC仿真和AI所需的繁重计算，并且Arm可以使用快速单线程来执行CPU。

Arm已经在世界各地的许多HPC中心获得了越来越多的关注，此前采用Arm架构的exascale系统没有GPU，如今NVIDIA新增对Arm支持的举动并不令人意外。

Buck表示，从技术角度来看，用Arm制造超级计算机的项目将是一次“重举”。据他介绍，现在是NVIDIA宣布支持Arm CPU的最佳时期，他们花了两年的时间来完成所有这些工作，希望在今年年底之前发布第一个完整版本。

NVIDIA支持Arm CPU后，将为研发超算的研究人员们提供了除英特尔和IBM外的第三种选择，并使得研发者可以通过这种方式获得更多的自主控制能力。

二、年底前向Arm生态系统提供全堆栈的AI和HPC软件

HPC市场预计到2025年价值将达到596.5亿美元，NVIDIA一直是推动高性能计算发展的重要力量。今日发布的Green500排行榜，在全球最节能的25款超级计算机中，有22款都得益于NVIDIA的支持。

之所以能有如此成绩，源自NVIDIA的多项核心技术。采用NVIDIA GPU的超级计算机，能够将繁重的处理作业卸载至更为节能的并行处理CUDA GPU之上，另外NVIDIA与InfiniBand和以太网互连供应商Mellanox合作优化整体超级计算集群的处理，NVIDIA还在SXM 3D封装技术和可实现极密集型扩展节点的NVIDIA NVLink互联技术方面投入大量研发。

NVIDIA对基于Arm的HPC系统的支持建立在双方超过10年的合作基础之上。NVIDIA的几款用于便携式游戏、自动驾驶汽车、机器人和嵌入式AI计算的系统级芯片产品都采用了Arm。

据悉，NVIDIA将于年底前向Arm生态系统提供全堆栈的AI和HPC软件，该堆栈为600多个HPC应用程序和所有AI框架提供加速，其中包括所有NVIDIA CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具，如支持OpenACC的PGI编译器和性能分析器。

NVIDIA创始人兼首席执行官黄仁勋表示：“超级计算机是促进科学发现的重要工具，建立百万兆级超级计算将能够极大地扩展人类知识的边界。随着传统计算规模扩展步伐的停止，功率也将成为所有超级计算机的限制因素。NVIDIA CUDA加速的计算和Arm的高能效CPU架构的相结合，将助力HPC社区实现大幅提升，以达到百万兆级。”

“Arm正在与生态系统合作，为基于Arm的SoC带来前所未有的计算性能提升，并实现百万兆级功能，”Arm首席执行官Simon Segars表示，“HPC社区已经部署了Arm技术，以应对全球最复杂的研究挑战。通过与NVIDIA合作，将CUDA加速引入Arm架构，这一举措对于HPC社区来说，可谓是一大重要里程碑。”

三、在HPC行业及Arm生态系统，部分业内人士这么看

Ampere Computing董事长兼首席执行官Renee James认为，其客户正致力于寻求基于Arm的高性能处理器，来运行其最苛刻的工作负载，因此很高兴NVIDIA正在将CUDA和围绕NVIDIA所建立的丰富的生态系统引入Arm。

Arm生态系统另一位领导者——Atos的高级执行副总裁、大数据和网络安全部门负责人Pierre Barnabé亦表示，这一重要发布将加速AI和模拟世界的融合，同时优化能效。

Cray总裁兼首席执行官Peter Ungaro表示，其Cray系统管理和编程环境（编译器、库和工具）已经能够在XC和未来的Shasta超级计算机上支持Arm处理器，将CUDA和CUDA-X HPC和AI软件堆栈用于Arm平台，并将其与Cray系统管理和编程环境紧密集成。

此外， CSC、 EPI、HPE、Jülich超算中心、Marvell等均表态称，看好将Arm架构与NVIDIA GPU相结合，认为它将有助于优化HPC和AI工作负载，匹配未来百万兆级前（pre-exascale）解决方案的构建模块，助力HPC行业解决日益不可持续的功耗水平问题。

在高校与科研机构的一些专家也发表了看法，比如理化学研究所计算科学研究中心负责人、东京工业大学教授Satoshi Matsuoka。

“过去十年中，我们一直积极率先在大型超级计算机上采用NVIDIA GPU，包括日本最强大的ABCI超级计算机，”Satoshi Matsuoka说，“理化学研究所计算科学研究中心目前正在致力于开发下一代基于Arm的百万兆级Fugaku超级计算机，我们很高兴听到NVIDIA的GPU加速平台很快将能够用于基于Arm的系统。”

四、全球第22快的超算DGX SuperPod

今日，NVIDIA还推出了全球排名第22快的超级计算机：DGX SuperPOD。据NVIDIA人工智能基础设施副总裁Clement Farabet表示，它提供的AI基础设施可满足公司自动驾驶车辆部署计划的大量需求。

据介绍，SuperPOD包含96个DGX-2H单元和1536个V100 Tensor Core图形芯片，与Mellanox和NVIDIA的NVSwitch技术相互连接。

它比同等顶级超级计算系统小约400倍，组装只需三周，同时提供9.4 petaflops的计算性能。在实际测试中，它试图在不到两分钟的时间内训练基准AI模型ResNet-50。

“很少有AI挑战与训练自动驾驶汽车一样苛刻，这需要对神经网络进行数万次重新训练，以满足极端的精确度需求，”Farabet说，“没有像SuperPOD那样的大规模处理能力的替代品。”

客户可以从NVIDIA的任何DGX-2合作伙伴处购买SuperPOD的全部或部分内容。

结语：进一步推动HPC扩展性能和优化能效

如果NVIDIA按照预期，在年底前为Arm生态系统提供全套的人工智能和高性能计算（HPC）软件，这将为超算研发者们提供除x86、Power之外，另一种更具开放性的选择。

此外，从众多业内人士的表态来看，这一重要发布对于基于Arm打造超级计算机的研发机构或企业而言，将是进一步扩展其超算性能，推动高性能计算提供更出色能效的重要推动力。

上一篇：徕卡CEO：裁员100人，未来重心放在软件

下一篇：618电子烟销售榜出炉铂德客单价全行业第一

发表评论

英伟达联手Arm迎战高性能计算！GPU加速卡将支持Arm架构CPU

相关资讯