学习断电好榜样 (1) — 前言

 

SSD断电测试这个题目,之前就想学习一下,一直没下决心。

前段时间兵哥写了一篇介绍SSD掉电测试的文章反响不错,他说是在飞机上随便写写,半个小时就搞定了。

我读的书不够多,走的路不够远,做不到他这么举重若轻,只能花笨功夫慢慢磨。

最近找到一篇还不错的paper,一帮外国友人自己设计了一套测试SSD掉电的流程,然后从市面上买了15块SSD回来跑,最后发现有13块有问题(你没有看错,13块有问题)。

首先,这群歪果仁列出了SSD掉电可能导致的问题:

1. Bit Corruption: User data里存在个别bit错误; (Cell编程未完成)

2. Flying Write: 正确[……]

阅读全文

阴谋?闪存涨价事件背后真相

这个社会都没有阴谋?如果你说某件事是有人背后操纵,总是会有人站出来义正辞严的说不要相信阴谋论。但其实,在巨大的利益面前,没有阴谋就怪了。

 

 

很多阴谋,并不是几个人躲在小黑屋里,点着昏暗的灯光,烟雾缭绕商量出一个可怕的阴谋。更多的是在某件事情发生后,各种利益攸关方不谋而合自觉地采取对策,屏蔽真相,通过控制媒体混淆视听,获得对自己有利的结果。举个例子,阿呆有一次去逛商场,看到大厅里有个健康男士的评选,商家和媒体鼓噪了半天,最后选出了一位亮闪闪的肌肉男作为健康男士的冠军。出于嫉妒他肌肉的险恶用心,阿呆开始思考:有一身肌肉就是健康吗?按照我们中国人传统的观念,没有疾病,保持长寿才是健康,但是[……]

阅读全文

LDPC 填 3D NAND 的坑

本文作者为MemBlaze李月宽

无论是2D NAND还是3D NAND,都存在RBER(初始比特出错率)的问题,并且PE(擦写)次数增加,RBER将逐渐变大。有错误就需要纠错,在2D NAND时代, MLC寿命末期的RBER示意如下。

上图共有4096*8个单元,每个单元为1bit,代表一个4KB大小的数据块,红点则是出错的比特(下文图片仍采用这种规范表示NAND的出错率)

对于MLC的这些错误比特,BCH编码即可以完成纠正,这也是2D NAND时代MLC能够成为企业级固态硬盘广泛应用的直接原因(SLC太贵,TLC出错率太高造成硬盘寿命达不到要求)。而3D TLC NAND出错率比2D[……]

阅读全文

秘密终于曝光:破解3D XPoint!

在3D XPoint刚发布之后,Intel一直把它搞得神神秘秘,也不透漏到底是个什么秘密器件。任何一种器件总是有个发展历史,不能像孙悟空一样吸收天地日月之精华,突然从石头里蹦出来。悟空本来是个天资很好的石猴,经过了菩提老祖的传授,变得神通广大,改了个齐天大圣的名字,一下子玉皇大帝都被惊动了。Intel也是把曾经的某款器件经过工艺优化,改了个3D XPoint的名字,震惊世人。

 

不过,山外有山,人外有人。没有XPoint的实物,大家只能瞎猜,一旦有了基于3D XPoint的Optane SSD,就有大神来破解了。UBM Techinsights是业界著名的反向工程和芯片分析专业公司,他们[……]

阅读全文

跟着兵哥捡垃圾 (8) — 第一季(完)

 

兵哥为了实现能者多劳的,打破原有的大锅饭机制,必须判断闪存的真实耐磨度(如:page1为3000P/E cycle,page3为5000P/E cycle)。

 测试page真实耐磨度的方法有很多,可以通过某个关键指标或者多个指标综合判断,也可以通过高温或者低温条件下的加速测试事先做好某一型号Nand Flash的耐磨度关键指标测试,具体做法有如下思路:

 通过对某一个型号的Nand Flash做破坏性测试,对Nand Flash做最彻底的P/E测试,记录随着P/E cycle的增加,误码率(原始误码率和不可纠正误码率)和操作时间的精准数据,建立三者之间的数学模型,定义不同误码率(原始[……]

阅读全文