AMD CDNA GPU架构:一个专门为数据中心设计的GPU架构

原创内容,转载请注明:  [http://www.ssdfans.com]  谢谢!

在过去的十年里,业界对数据中心的GPU需求激增。在很大程度上,由于神经网络、深度学习等人工智能领域的快速发展,GPU已经成为一些数据中心工作负载的关键部分,并且它们的作用还在逐年增加。

对AMD来说,不幸的是,他们在GPU繁荣期基本上被忽视了。到目前为止,最大的赢家是英伟达,它已经在这个领域赚了几十亿美元。这并不是说AMD的Radeon Instinct系列等产品没有获得成功,但他们占据市场的份额和收入只是英伟达的一小部分。

不过,AMD的命运即将改变。AMD(作为Cray的供应商)在美国赢得了两大超级计算机大奖,总计为CPU和GPU赢得了超过10亿美元的收入,因此,美国政府一直对AMD潜心研究的项目存在很多疑问。不过最近AMD透露,答案是他们新的数据中心计算专用GPU架构:CDNA。

RDNA专注于计算机游戏,而CDNA则是AMD专注于计算的架构,主要用于数据中心。AMD揭示CDNA已经达到了一个非常高的水平。但即便如此,AMD也明确表示,他们的GPU开发过程中出现了某种裂变,导致CDNA和RDNA成为他们自己的架构。

这些架构的不同之处还有待观察。AMD已经简要地提到CDNA的“图形位”将更少,因此其图形功能应该是有限的,这与RDNA GPU有很大不同。因此,从广义上讲,AMD现在正走在一条与其他GPU供应商类似,和游戏GPU相比,计算GPU正日益成为一个独特的产品类别。

AMD对CDNA的目标是简单而直接的:建立一个庞大的,强大的GPU系列,专门针对计算和数据中心进行优化。这是AMD已经开始采用诸如Vega 20(在Radeon Instinct MI 50/60中使用)之类的GPU的途径,但是现在更加专业化并进行了优化。其中很大一部分当然是机器学习性能,这意味着支持更快地执行较小数据类型(例如INT4 / INT8 / FP16),AMD甚至更明确地提到了张量运算。但这也不能以传统FP32 / FP64计算为代价; AMD GPU将要使用的那些超级计算机将进行大量的高精度数学运算。因此,AMD需要在多种数据类型的计算和机器学习范围内保持良好的性能。

为了达到这个目标,AMD还需要提高其每瓦性能,因为在这一点他们经常落后。AMD还没有明确表示将如何做到在制造工艺上有明显的改进,但是AMD已经敏锐地意识到他们需要改进。

同时,CDNA还将通过一些功能保持自己的独特性,包括一些只有AMD才能做的事情。企业级的可靠性和安全性将是以及对日益流行的虚拟化需求的支持将是其中重要的功能。

AMD也将依靠他们的无限架构,使他们在性能扩展和CPU/GPU集成方面具有优势。到目前为止,Infinity Fabric一直是AMD在CPU方面取得成功的重要组成部分,而AMD正在将同样的逻辑应用到GPU方面。这意味着使用IF不仅可以实现GPU直接的链接,还可以将GPU链接到CPU。在AMD超级计算机获胜的作品中我们已经看到了这一点,这两个系统都将使用IF将4个GPU与一个CPU组合在一起。

但是,当他们的第三代Infinity Fabric准备就绪时,AMD的重大胜利将更加遥远。此时,AMD打算提供完全统一的CPU / GPU内存空间,从而充分利用其为系统提供CPU和GPU的能力。统一内存可以采用几种不同的形式,因此这里遗漏了一些重要的细节,总有一天会暴露。但是最终拥有统一的内存空间将使异构系统的编程变得更加容易,这反过来又使GPU的合并成为可能。

由于CDNA现在是AMD GPU架构的一个独立分支,而它的控制权在数据中心负责人Forrest Norrod的掌控之下,它也有自己的多代GPU路线图。随着AMD将Vega 20作为分支点,该公司将揭示未来的两代CDNA,分别命名为CDNA(1)和CDNA(2)。

CDNA(1)是AMD即将推出的数据中心GPU。我们相信这是AMD的“Arcturus”, 据AMD称,它将针对机器学习和HPC使用进行优化,使用AMD第二代IF技术的支持Infinity Fabric。不过,目前尚不清楚这部分是否会在AMD的超级计算机大奖赛中胜出。但是,鉴于我们对后来的El Capitan(目前肯定使用CDNA 2)的了解,CDNA(1)可能会出现在Frontier中。

紧随CDNA(1)之后的当然是CDNA2。AMD在没有分享太多细节,毕竟,他们还没有交付第一款CDNA。但他们已经确认它将纳入AMD第三代Infinity Fabric。此外,它将使用较新的制造节点,AMD现在将其称为“高级节点”,因为他们没有透露他们打算使用的节点。因此,从几个不同的方面来看,CDNA 2将成为AMD异构计算计划的一部分,最终,他们将在离散CPU和GPU之间拥有一个统一的内存系统。

至于出货日期,虽然AMD目前尚未透露确切的日期,但路线图就到2022年年底,这意味着AMD预计届时将批量出货CDNA 2。这与最近的El Capitan声明相当吻合,该声明的超级计算机将于2023年交付。

总的来说,AMD对他们未来的数据中心gpu有很大的野心。虽然实现这些雄心壮志还有很多工作要做,但他们确实为实现这一目标制定了有希望的路线图。从技术角度和收入角度来看,AMD都对数据中心市场的重要性没有错,而拥有专用于其GPU架构的分支机构可能正是AMD最终需要寻求成功的目标。

原文链接:https://www.anandtech.com/show/15593/amd-unveils-cdna-gpu-architecture-a-dedicated-gpu-architecture-for-data-centers

分类目录 国外动态, 行业动态.
扫一扫二维码或者微信搜索公众号ssdfans关注(添加朋友->点最下面的公众号->搜索ssdfans),可以经常看到SSD技术和产业的文章(SSD Fans只推送干货)。
ssdfans微信群介绍
技术讨论群 覆盖2000多位中国和世界华人圈SSD以及存储技术精英
固件、软件、测试群 固件、软件和测试技术讨论
异构计算群 讨论人工智能和GPU、FPGA、CPU异构计算
ASIC-FPGA群 芯片和FPGA硬件技术讨论群
闪存器件群 NAND、3D XPoint等固态存储介质技术讨论
企业级 企业级SSD、企业级存储
销售群 全国SSD供应商都在这里,砍砍价,会比某东便宜20%
工作求职群 存储行业换工作,发招聘,要关注各大公司招聘信息,赶快来
高管群 各大SSD相关存储公司高管和创始人、投资人

想加入这些群,请微信扫描下面二维码,或搜索nanoarchplus,加阿呆为微信好友,介绍你的昵称-单位-职务,注明群名,拉你进群。SSD业界需要什么帮助,也可以找阿呆聊。