FPGA也能做RNN!

作者 琥珀

导言:循环神经网络(RNNs)具有保留记忆和学习数据序列的能力。由于RNN的循环性质,难以将其所有计算在传统硬件上实现并行化。当前CPU不具有大规模并行性,而由于RNN模型的顺序组件,GPU只能提供有限的并行性。针对这个问题,普渡大学的研究人员提出了一种LSTM在Zynq 7020 FPGA的硬件实现方案,该方案在FPGA中实现了2层128个隐藏单元的RNN,并且使用字符级语言模型进行了测试。该实现比嵌入在Zynq 7020 FPGA上的ARM Cortex-A9 CPU快了21倍。

 

LSTM是一种特殊的RNN,由于独特的设计结构,LSTM适合于处理和预测时间序列中间隔和延[……]

阅读全文

最佳固态硬盘花落谁家?

作者 陈浩

 

虽然下一代的64层或者更多层的3D NAND还没有正式上市,但是距离上市也越来越近了。东芝和西部数据最近在Computex上宣布推出首款采用3D NAND的主流消费级SSD。镁光和海力士在新的下一代3D NAND以及基于它们的SSD方面应该也不会太过于落后。随着闪存生产商逐渐实现 3D NAND 的满负荷生产,当前正在持续的NAND缺货现象将会逐渐得到缓解,SSD的价格也会渐渐停止上升。然而,这些新的SSD目前还没正式对外销售,所以这篇文章的介绍也不会带来任何的重大变化。

 

如果你正在考虑在大容量或高性能的SSD上进行大量投资,请考虑等到秋季,在64层及以上的SSD开始[……]

阅读全文

SSD模拟器 disksim 和 SSD Extension 的介绍(一):安装

作者 陈浩

Disksim 是由卡内基梅隆大学开发的一款磁盘模拟工具。后来微软基于 disksim 开发了一个 SSD Extension 插件,使其可以模拟固态硬盘。

 

接下来我会具体介绍下 SSD Extension 的实现和使用。今天主要是介绍下安装过程。

 

1.安装须知

Disksim 本身是基于32位的 linux 系统开发的,所以最好先确保你的系统是32位的。如果没安装flex、bison的话,先要安装 flex、bison。

sudo apt-get install bison flex

 

2.下载源码:

disksim 4.0: 

http://www.pdl.cmu.e[……]

阅读全文

移芯通信急招嵌入式软件、协议栈工程师等(张江)


上海移芯通信科技有限公司(www.eigencomm.com

坐落于中国∙上海张江硅谷,公司于2017年2月成立,致力于蜂窝物联网芯片的研发和销售,目前已获千万美金级别投资。

公司创始人及核心开发团队自于国际知名手机芯片厂商,团队完整,技术实力雄厚。团队成员全部毕业于中国知名院校,其中20%为博士,80%为硕士,平均工作年限10年以上,开发的手机芯片累计出货超过1亿片。团队具备算法,基带SOC,协议栈,射频,模拟以及系统软硬件的完整研发能力,尤其在芯片架构,通信性能和低功耗方面具有核心竞争力。

公司第一代产品为基于NB-IoT标准的物联网终端芯片。NB-IoT作为中国企业主导的国际物联[……]

阅读全文

基于FPGA的深度学习CNN加速器设计

作者 琥珀

因为CNN的特有计算模式,通用处理器对于CNN实现效率并不高,不能满足性能要求。 因此,近来已经提出了基于FPGA,GPU甚至ASIC设计的各种加速器来提高CNN设计的性能。 在这些方法中,基于FPGA的加速器引起了研究人员越来越多的关注,因为它们具有性能好,能源效率高,开发周期快,重构能力强等优点。

 

在实验中,研究人员发现在FPGA相同的逻辑资源利用率情况下,两种不同解决方案可能会有多达90%的性能差异。所以找出最佳解决方案是很重要的,特别是当考虑到FPGA平台的计算资源和存储器带宽的限制时。 实际上,如果加速器结构没有精心设计,其计算吞吐量与提供FPGA平台的内存带宽[……]

阅读全文