存算一体化怎样突破冯·诺依曼架构?

原创内容,转载请注明:  [http://www.ssdfans.com]  谢谢!

在讨论超越冯·诺依曼计算架构之前,最好先解释一下冯·诺依曼计算是什么。首先介绍一下摩尔定律的背景知识。

作为一个行业,我们已经通过摩尔定律在降低芯片的尺寸、成本和功耗方面取得了巨大的进步。从1956年Univac I(第一台商用电子计算机,每秒1900次浮点操作消耗125千瓦)到今天的超级计算机(测试结果达到每瓦6673.8 MFLOPS),浮点操作的功耗成本降低了约4000亿倍。4000亿倍这个数字对我们而言可能无法掌握,可以考虑将功耗性能类比为每加仑可以行驶的英里数,如果我们将初始状态设置为15英里/加仑,改善4000亿倍后汽车可以达到6万亿英里每加仑,大概是一个光年,或离地球最近恒星的四分之一距离,或者往返冥王星500次以上。

这种由规模化带来的功耗成本性能的三重胜利(或者说,为了达到同样的性能,使用更少的硅和更少的功耗,从而降低了生产成本)使得计算机行业不再那么依赖于颠覆传统的冯·诺依曼计算架构。冯•诺伊曼计算的核心是获取输入数据,并将其在存储数据的内存和按时钟进行操作的逻辑之间移动。所有数据都存储在内存中,然后传送到计算引擎。这些数据的来回搬移会带来大量的功耗和性能的降低,但由于摩尔定律的惊人进步,这种功耗和性能降低在很大程度上被掩盖了。此外,如果我们考虑冯·诺伊曼架构的时钟或计算周期,数据的物理移动比实际计算需要更多的功耗和计算周期。记忆和逻辑的分离是冯·诺依曼结构的核心,但生物学找到了更好的方法——在记忆体中进行计算。

当您查看针对GPU或CPU的最新产品描述时,很明显焦点和市场营销都集中在本地或芯片上包含了多少内存。如果产品可以在本地或芯片上进行几次数据循环,然后再通过主板将数据发送回DRAM或非易失性存储器,那么芯片的工作速度会更快,性能也会更好。有许多巧妙的方法可以提高冯•诺伊曼架构的功耗效率,它们都涉及“近内存”——使内存元素更接近逻辑单元。将不同的芯片紧密地封装在一起,并将更多的内存放在芯片上,这些应用材料都在积极支持。

虽然业界在提高计算的功耗效率方面取得了很大的进步,但生物学已经设计了一种更节能的策略——把数据存放在大脑中,也就是把数据存储在计算的地方。我们要么检查一个典型突触/神经元的权重,要么调整它的值(所有这些工作都是并行的),以驱动生物逻辑。这比在两个不同的芯片之间来回移动数据要省电得多。

作为电子复兴计划(ERI)的一部分,这个由DARPA资助项目的最终目标是使系统超越冯·诺依曼架构,进入“内存计算”。“通过将一个相关的电子元件编程成一个离散的阻值和状态,然后将这些具有不同权重的电子元件相互卷积,我们就可以建立一个近似突触和神经元的系统。”如果我们将内存元素组织成一个数组,我们就可以对元素进行编程,利用正确的工程材料来实现不同的阻值。在这种架构下,我们可以组织许多权重值(基于元素的电阻),并通过数组将它们相互关联,这让我们更接近生物系统的效率。

在许多方面,挑战并不在于开发架构,而在于开发的材料能使架构可行。应用材料正在通过材料创新来实现神经形态计算,我们的相关电子工作只是诸多应用场景之一。

目前该团队已经做了很多工作,在许多混合材料中准备了超过1800个样品,在评估电特性和探索方向上得到了来自合作方英国哥伦比亚大学、科罗拉多大学、ARM以及Symetrix的鼎立帮助。下面即将缩小项目第二阶段的特定材料系统,期待着在接下来的几个月里再次向大家更新进展。

原文链接:http://blog.appliedmaterials.com/beyond-von-neumann-shift-to-in-memory-compute 

分类目录 其他, 技术文章.
扫一扫二维码或者微信搜索公众号ssdfans关注(添加朋友->点最下面的公众号->搜索ssdfans),可以经常看到SSD技术和产业的文章(SSD Fans只推送干货)。
ssdfans微信群介绍
技术讨论群 覆盖2000多位中国和世界华人圈SSD以及存储技术精英
固件、软件、测试群 固件、软件和测试技术讨论
异构计算群 讨论人工智能和GPU、FPGA、CPU异构计算
ASIC-FPGA群 芯片和FPGA硬件技术讨论群
闪存器件群 NAND、3D XPoint等固态存储介质技术讨论
企业级 企业级SSD、企业级存储
销售群 全国SSD供应商都在这里,砍砍价,会比某东便宜20%
工作求职群 存储行业换工作,发招聘,要关注各大公司招聘信息,赶快来
高管群 各大SSD相关存储公司高管和创始人、投资人

想加入这些群,请微信扫描下面二维码,或搜索nanoarchplus,加阿呆为微信好友,介绍你的昵称-单位-职务,注明群名,拉你进群。SSD业界需要什么帮助,也可以找阿呆聊。