作者:EVE
在上一篇文章中,我总结了人工智能工作负载的计算架构需求与我们在过去几十年所熟悉的计算架构(如x86和ARM等传统计算架构)有何不同。在这篇文章中,我也会提出新的AI计算架构需要材料工程在哪些方面有所突破。我将给出一些我们遇到的突破类型的例子,并描述一个新存储领域的具体例子。
从经典的2D缩放到架构创新
在跨越20多年的PC和移动时代,该行业是由“经典2D缩放”驱动的,即根据1965年摩尔定律预测的几何晶体管缩放。随着晶体管的特性变小,性能提高,功耗降低,这与登纳德定律(Dennard Scaling)一致。更高的晶体管密度也能降低每个晶体管的成本,这样芯片总成本就降低了。在这期间,我们并没有看到很多架构上的创新,很多关注都集中在一个主流架构的几何尺度上,这加速了x86和ARM CPU架构的崛起。
你可能已经意识到,传统的2D缩放已经不像以前那么有效了。它已经变得非常复杂和昂贵,而且它所带来的收益也在减少。因此,当我们过渡到人工智能和物联网时代时,很多重点放在了架构的变化上,以推动性能和功耗的改进。体系结构的变化(通过从根本上改变数据的处理方式)可以极大地提高性能。正如我们已经看到的谷歌的新TPUs、NVIDIA的新GPU和Microsoft的Project Brainwave,与传统CPU相比,性能上的提升是数量级以上的,例如30x、50x甚至更多。与传统2D缩放相比,这显然是一个更高层次的改进(即使是在2D缩放最好的时候)。架构的进步可以通过全新的设备来实现,或使用3D技术来扩展现有的逻辑和内存架构,也可以使用先进的封装技术以新的方式将不同的硅结合在一起来执行特定的功能。
John Hennessy和David Patterson (被公认为现代计算机体系结构之父)于2017年12月出版的第六版书中进行了细致的总结:近40年来处理器性能数据证明三种流行的“定律”与CPU性能进展都在逐渐消失。根据参考文献,登纳德定律(Dennard Scaling)在2003年结束,阿姆达尔定律(Amdahl’s Law)在2011年左右达到极限,摩尔定律(Moore’s Law)进步在2015年左右结束。我们对他们分析的解释是,从经典的2D缩放到性能提升的免费搭车已经结束了,我们现在必须努力将架构创新和材料工程突破结合起来,以实现AI所需的性能提升。
材料工程的突破
在传统的2D缩放时代,材料工程只涉及到有限的材料,如硅、二氧化硅、氮化硅和碳,但是这些材料已经达到了缩放限制。事实上,我们正在有效地用完元素周期表上的材料,这些材料在单独情况下可以很好地工作。现在我们越来越需要创造独特的变化,这给了我们10种不同类型的二氧化硅和8种氮化硅。在新的人工智能时代,材料工程越来越多地涉及创造新的材料组合,作为一个系统一起工作以实现特定的性能。我们称之为集成材料系统。
正如我在本系列的第一篇文章中所讨论的,我们认为AI工作负载需要三个主要的架构改进:更高的带宽内存、更高的数据并行性和更低的精度。
为了实现这些改进,我们可以借鉴材料工程的突破。例如,我们可以在现有的逻辑设备中集成新的内存结构。新材料可以实现全新的存储(如英特尔®3D XPoint™技术);还可以使用材料工程来帮助实现自校准密集特性(如GPU中存在的数十亿个vias);也可以用来帮助晶体管的垂直方向以获得更大的面积密度。材料工程通过先进的封装在异构集成中也发挥作用:独特的基底、聚合物和硅通孔技术(TSV)可以帮助实现各种独立芯片的高密度封装。
这是一个材料工程突破的例子,用来实现一种新型的存储器。下面是STT-MRAM阵列的图片。左边显示了一组内存单元,包括其中一个内存单元的特写。右边显示了超过15种材料是如何堆积起来形成这些设备的。每个薄膜的厚度从0.2nm到2nm不等。相比之下,你可能会想起大约十年前的一项创新——高k金属门(HKMG);HKMG涉及大约6种新材料,每一种大约1纳米厚。
实例: STT-MRAM
这是一个材料工程突破的例子,用来实现一种新型的存储器。下面是STT-MRAM阵列的图片。左边显示了一组内存单元,包括其中一个内存单元的特写;右边显示了超过15种材料是如何堆叠起来形成这些设备的。每个薄膜的厚度从0.2nm到2nm不等。相比之下,你可能会想起大约十年前的一项创新——高k金属门(HKMG),HKMG涉及大约6种新材料,每一种大约1纳米厚。
以STT-MRAM集成材料系统为例,所有的加工都必须在真空环境中进行——事实上,在-9到-10托的更强的真空环境中进行,而HKMG的真空环境约为-8托(1托等于1个大气压的1/760)。材料薄膜层之间的相互影响被称为界面工程,就是它定义所得到器件的性能。生产该设备需要使用各种工艺技术,包括沉积、腐蚀和改性,所有这些都在一个集成的材料系统中和真空环境下小心处理。应用材料越来越多地提供综合材料解决方案,将新的架构创新带入行业。这就是为什么我们的客户越来越多地在先进的节点和设备上与我们合作,以证明这些解决方案是否可行,并为大规模生产和商用做准备。
总结
总之,有两条关键信息要传递给你。首先,人工智能工作负载(即机器学习、深度学习)需要处理数据的新方法——我们称之为架构创新。其次,人工智能架构需要材料工程的突破。在应用材料领域,我们很兴奋地预见到人工智能将为材料工程带来巨大的增长机会。
原文链接:http://blog.appliedmaterials.com/ai-workloads-computing-architectures-part-2