要想了解CPU行业最大的利润点,就必须从服务器和数据中心市场找答案。自从Opteron问世以来,AMD的市场份额已经四舍五入到零,随着其第一代EPYC处理器使用其新的Zen微体系结构,这个数字波动了几个点,但是所有人都在等待下一次波动。AMD的Rome平台解决了第一代Naples所面临的问题,此外,这一系列处理器可以用于做许多事情:一个7纳米的新的处理器微体系结构,可以提供多达64个内核,128个PCIe 4.0的通道,8个内存通道,而且包含基于芯片的统一内存体系结构。今年八月Rome诞生,我们将用一些数据说明它到底性能如何。
首次启动
六十四核,每个内核都有一个改进的Zen 2内核,比Naples的IPC性能高出约15%,并将AVX2/FP性能提高了一倍。该芯片共有256 MB的三级高速缓存和128条PCIe 4.0通道。AMD的第二代EPYC,在本例子中是EPYC 7742,是一个庞然大物。
启动至BIOS,检查节点信息。
显然,新的Rome CPU 的原始规格是市场上最有竞争力的。接下来的问题是,这是否是市场上最新最快的服务器芯片——据称AMD正在全力证明这种说法。如果这是市场上速度最快的新处理器,那么大家更关心的就是它到底都多快?以及价格会达到多少。
这款CPU具有强大的市场竞争力,芯片上的处理器数量是竞争对手(英特尔、Cavium,甚至是IBM)的两倍。AMD企业高级副总裁Forrest Norrod表示:“我们设计这一部分是为了与Ice Lake竞争,希望在单线程性能方面取得一些进展。我们没想到反而会面对重新变暖的Skylake。这将是我们职业生涯的亮点之一。”
AMD的自信心空前高涨,理论上看这是有道理的。新的Rome服务器CPU已经改进了核心处理器IPC,高端处理器的核心数量增加了一倍,而且它正在使用一种新的制造工艺(7纳米级)技术。通常我们看到服务器公司一次只会做其中一件事,而不是三件同时做。这的确是一个很大的风险,但如果都可以做到位,结果一定会令人振奋。
客观地说,承诺高达2倍的FP性能、2倍的内核和一项新的工艺技术在几年前听起来会很不可思议。就在4-5年前在Opteron时代的尾声,英特尔最好的处理器速度提升了三倍,当时,几乎没有任何理由购买AMD Opterons服务器。两年前,EPYC让AMD重返服务器市场,尽管它的性价比远高于英特尔,但这还算不上彻底的胜利,因为AMD不仅在数据库性能和AVX/FP性能方面仍然落后,而且合作伙伴和原始设备制造商也不愿意在没有成熟产品的情况下与该公司合作。
所以现在AMD已经证明了它在Naples的价值,并且AMD承诺将Rome的部署设计增加一倍以上从而能够很快吸引客户,我们必须将新旧产品进行比较,为了推出新硬件,AMD为我们提供了Quanta的双EPYC 7742系统,配备了两个64核处理器。
Zen2优化内核
我们的微体系结构分析文章详细介绍了为什么AMD声称其新的Zen2架构明显优于Zen1:
- 一个不同的第二阶段分支预测器,称为TAGE预测器
- 加倍微操作缓存
- L3缓存加倍
- 增加整数资源
- 增加加载/存储资源
- 每个循环周期支持两个AVX-256指令(而不是必须结合两个128位)。
这些改进表明,AMD在性能方面冲击其关键市场的消费者和企业。凭借额外的计算能力和承诺的效率,我们可以猜测AMD也有夺回高性能市场的野心。与至强处理器不同,第二代EPYC处理器在运行AVX2时不声明时钟较低,而是运行在一个功率感知调度器上,该调度器在平台的功率限制范围内提供尽可能多的频率。
用户可能会问,尤其是在英特尔嵌入高性能和机器学习领域,为什么AMD没有采用AVX-512设计?作为回应,AMD表示,并非所有例程都可以并行化到这种程度,同时也有一个非常明确的信号,那就是“我们的硅预算没有得到很好的利用”。随着新一代硬件的出现,每家公司如何处理向量并行化将会很有趣。但就目前情况而言,AMD没有全力投入AVX-512,而是在提升其平板电脑性能。
作为对AMD声称Zen2的整体IPC增长15%的回应,我们从消费者处理器系列中对Zen2的分析中看到了这些结果。根据我们的分析,发现它确实快了15%-17%。除了性能改进之外,还进行了安全加固更新、改进了的虚拟化支持以及新的但专用的缓存和内存带宽服务质量(QoS)说明。(QoS特性与Intel在Broadwell/Xeon E5版本4中引入的特性非常相似,而Skylake—AMD正在该领域迎头赶上)。
参考链接:https://www.anandtech.com/show/14694/amd-rome-epyc-2nd-gen/1