阿呆读可重构计算3:FPGA做AI三板斧

FPGA vs. ASIC

专用芯片ASIC的开发流程是:设计、验证、流片、封装、测试;

而FPGA已经是做好的芯片,所以不需要流片、封装、测试。这样,可以至少节省四个月的时间。

另外ASIC还有可能多次流片才能成功,同步的软件开发也需要芯片做好才能完成大部分功能,这些也是时间成本

在量小的时候,FPGA[……]

阅读全文

阿呆读可重构计算2:FPGA如何克服CPU的缺陷?

一个故事理解流水线、并行、缓存、内存、存储

查看源图像

蛋蛋花了一天给小蛋蛋做了一个玩具汽车,没想到做的太好了,同学们都来买。蛋蛋一个人忙不过来,就一家人合作生产。蛋蛋负责把原料分类摆放在桌上,小蛋蛋拧螺丝组装,蛋妈把玩具放到包装盒里。三个人采用流水线的方式,每个人都没闲着,生产效率大为提高,一天能造50个玩具。[……]

阅读全文

AlphaGo Zero:算法战胜暴力计算

作者 琥珀

 

近期,谷歌的AI研究机构DeepMind研发的最新版本的AlphaGo Zero横空出世,将打败世界冠军的AlphaGo赶下神坛。AlphaGo Zero凭借的正是前所未有的”自学”棋局的能力,这种能力也将协助DeepMind研发出针对科学领域极为困难的一些问题的解决算法。

 [……]

阅读全文

FPGA也能做RNN!

作者 琥珀

导言:循环神经网络(RNNs)具有保留记忆和学习数据序列的能力。由于RNN的循环性质,难以将其所有计算在传统硬件上实现并行化。当前CPU不具有大规模并行性,而由于RNN模型的顺序组件,GPU只能提供有限的并行性。针对这个问题,普渡大学的研究人员提出了一种LSTM在Zynq 7020[……]

阅读全文

基于FPGA的深度学习CNN加速器设计

作者 琥珀

因为CNN的特有计算模式,通用处理器对于CNN实现效率并不高,不能满足性能要求。 因此,近来已经提出了基于FPGA,GPU甚至ASIC设计的各种加速器来提高CNN设计的性能。 在这些方法中,基于FPGA的加速器引起了研究人员越来越多的关注,因为它们具有性能好,能源效率高,开发周期快[……]

阅读全文