作者简介
唐杰
目前在Xilinx从事DC架构,曾任职于Fusion-IO,LSI,希捷等公司。6月NVMe新版发布在即,了解内情的唐杰详解跟NVMe Over Fabric相关的各家公司,尤其是两家神秘的初创公司。
想要和唐大师还有全世界的大牛讨论SSD及存储相关技术?加nanoarch为微信好友,拉你进ssdfans微信群
上一篇之后,很多童鞋不同意,说我偏袒Ethernet,下面就是原因吧.
–从一场并购开始谈起(2)
相信看到这标题,大部分的读者心里就松口气,因为这个商业要比技术好理解多了。2015年年初,AWS宣布收购了一家以色列的芯片公司『1』,Annapurna labs。新闻中讲这家公司是2011年成立,创始人是Avigdor Willenz,其中的投资者有一个叫:Andy Bechtolsheim。大部分人可能不太熟悉这个名字,但是他的一个著名的光环就是Google的第一个投资人。当然,还有Sun Microsystem的创始人和Arista的投资人以及DSSD的投资人和董事。
这个基本上算是含着银汤勺出生的芯片公司,还有两个著名的董事会成员,ARM和Cadence『2』。关于这家公司做什么,因为AWS的一贯风格,我们基本上得不到任何信息。从大部分比较多的新闻中,我可以看到这个公司的芯片是alpine AL5140, 包含4个1.7G的ARM A15,设计的功耗是10W。在技嘉使用它设计的存储服务器中『3』,他可以提供的带宽是
关于Alpine系列的ARM CPU的设计详细信息,我们知道的不多。但是,我们从AWS提供的EBS的SSD服务看出了一些信息『4』,16T的容量,单个Volume 20K的IOPS,要知道EBS是基于网络的存储,这样的规格,直到现在,也不是每家做云计算都可以提供的。
讲这个故事的主要目的是,从Flash存储诞生的第一天起,大家都在考虑过如何将SSD从机箱中拿到外面去。笔者最喜欢前Fusion-io CEO David Flynn『5』的一个判断。 因此,可以这样讲,把SSD拉出去的开端是从网络侧开始的,而且是必须的。
现在回到NVMe OverFabric协议,大家应该还记得NVMe组织宣布这个工作方向的时候的厂家,没错,就是DSSD。当DSSD在2013年脱离stealth 模式的时候,宣布过它一个机架可以支持1P的Flash存储,提供1TB/s的带宽,大家都觉得是个神话,它卖给EMC可能有两个不同的原因:1. 他们的技术成熟了,需要钱产品化,2. 他们玩不下去了,要找个金主买单。随着DSSD在美国德州大学的部署,以及他代表的NVMe Over Fabric技术的成熟,大家应该觉得是前者了。
和前面讲的一样,作为NVMeover Fabric的积极推进者和设备供应商,除了原来的NVMe协议的13个系统级以及存储厂商外,就是网络厂商了。对于网络厂商来讲,大家对于X86传统上基本无感。对于网络厂商在协议没有完成之前的技术路线上来看,大家基本都是基于ARM的SoC。对于Annapurna 和DSSD的方案,我们了解的不多,但是从Annapurna Lab独立出来的CNex Lab的方案,我们有一个比较详细的了解。
可以看出,从网络侧进入NVMeover Fabric的厂商基本都是选择了Ethernet,4X10GE是CNexLab的选择,2X10GE是Annapurna Lab的选择。同时,这样的SoC同时具有下列的特点:
ARM (关于ARM和X86的对比,请参考[6] )
PCIE 接口, 即便有SATA,也是转成PCIE
集成网络接口。
设备上有DRAM
因为笔者的信息有限,但是我相信在协议出现之前的NVMe Over Fabric的厂家的技术路线都类似。因为大家面临的问题也类似:
Intel在发布它的SPDK的时候曾经引用的一个数据是:使用NVMe的标准驱动,4个CPU Core才能驱动一个NVMe设备,而使用Intel的SDPK,一个Core可以驱动4个NVMe设备。
笔者在2016年5月18号参加的Intel的DPDK的APCC的workshop的时候,Intel对于DPDK给予厚望,希望使用DKDP来解决两个问题:
1.CPU从2005年走上了增加Core数量比增加主频更容易的道路,如何利用这些核?
2. 设备和CPU之间的通讯是通过中断,对于一个高速的网络设备,如何实现OS的kernel bypass来提升效率。
可以看到,Intel使用DPDK试图解决的问题会在NVMeover Fabric上更进一步加重。没错,Intel希望大家能够尽可能修改原有的软件,更加利用好Intel的CPU。可是,Intel在2015的一次收购表明了他们自己也在走两条道路。Intel在2015年斥资16.7B$收购了FPGA厂家Altera。[7]
本文是从一个并购开始的,因此很自然就从另一个并购结束。Intel和Altera的收购说明了对于未来,因为CPU的通用性需求的限制,他不可能把所有的逻辑都集成在CPU中,同时因为多个CPU Core之前的NUMA问题造成了I/O的效率下降,从而使Intel也意识到基于FPGA/SoC的专用加速方案的价值。对于NVMe Over Fabric,这个就是一个比较明显的I/O 加速,从CPU 上卸载的例子。
在后续的文章中,因为协议会按时间发布,我会插播一场对协议的理解,然后给大家介绍基于Xilinx FPGA的NVMe over Fabric的加速方案。不要走开!
不想错过唐大师的后续精彩文章?长按或扫描下面二维码关注ssdfans就可以了!
引用:
【1】 http://www.ynetnews.com/articles/0,7340,L-4618056,00.html
【2】 https://en.wikipedia.org/wiki/Annapurna_Labs
【3】 http://www.servethehome.com/exclusive-gigabyte-annapurna-labs-arm-storage-server-benchmarks/
【4】 http://docs.aws.amazon.com/AWSEC2/latest/UserGuide/EBSVolumeTypes.html#EBSVolumeTypes_piops
【5】 http://www.hotchips.org/wp-content/uploads/hc_archives/hc25/HC25.0T2-Storage-epub/HC25.25.280-Flash-Adaption-Flynn-PrimaryData.pdf
【6】 https://research.cs.wisc.edu/vertical/papers/2013/isa-power-struggles-tr.pdf
【7】 http://fortune.com/2015/12/28/intel-completes-altera-acquisition/
公司招聘:
Memblaze华东区高薪招聘,销售经理,FAE 上海/杭州
联想SSD专家招聘,FW,QA,NAND特性工程师,北京/武汉
欢迎转载,转载请保留二维码!