分區存儲助力QLC應用到嵌入式存儲設備
發布時間:2023-02-14 來源:江波龍電子 責任編輯:lina
【導讀】目前應用在移動終端的嵌入式存儲設備(這裏主要指UFS/eMMC等,以下統稱“嵌入式存儲設備”)中主流介質還是TLC。但更高存儲密度的QLC也已經產品化,比如一些數據中心(讀密集型應用)已經在部署QLC存儲設備。QLC可以給存儲設備帶來更低的成本,作為消費級產品的嵌入式存儲設備,未來引入QLC也是勢在必行。
背景
目前應用在移動終端的嵌入式存儲設備(這裏主要指UFS/eMMC等,以下統稱“嵌入式存儲設備”)中主流介質還是TLC。但更高存儲密度的QLC也已經產品化,比如一些數據中心(讀密集型應用)已經在部署QLC存儲設備。QLC可以給存儲設備帶來更低的成本,作為消費級產品的嵌入式存儲設備,未來引入QLC也是勢在必行。
但和當前主流TLC相比,QLC在性能和壽命上都相差很大,從下麵某原廠TLC和QLC在性能和壽命方麵的一個對比可見一斑。

(Table 1:某原廠TLC和QLC性能和壽命對比) 因此,QLC要應用在嵌入式存儲設備上,首先需要解決性能差和壽命短兩大問題。 雖然QLC還不到TLC的1/4寫入性能,但目前消費級固態存儲產品都有成熟的SLC cache機製,能保證用戶有比較好的突發寫入性能(寫SLC的性能)。由於嵌入式存儲設備有比較充裕的空閑時間,存儲設備可以利用空閑時間把數據從SLC搬到QLC,隻要不是重度寫入場景,這部分QLC寫入性能,用戶一般感知不到。 但數據一旦寫到QLC,對比TLC,用戶讀取性能變差。針對這個讀取性能差的問題,有一種方案是把熱數據(經常讀取)寫回SLC,但這樣無疑增加了設備複雜性,而且數據搬移帶來了額外的寫放大,這讓壽命本來就不長的QLC“雪上加霜”。 如果說性能問題可以通過SLC解決或者緩解,那對於QLC壽命問題,在分區存儲引入之前,可能的解決方案有:用戶端使用類F2FS文件係統和使用數據分流。
F2FS文件係統化隨機寫為順序寫,這會減少存儲設備內部垃圾回收導致的寫放大,但F2FS文件係統本身的垃圾回收,會給存儲設備帶來額外的寫。綜合下來,F2FS文件係統給設備帶來的寫放大不一定減少。 數據分流需要主機和設備配合:主(zhu)機(ji)端(duan)對(dui)數(shu)據(ju)進(jin)行(xing)冷(leng)熱(re)甄(zhen)別(bie),設(she)備(bei)端(duan)根(gen)據(ju)數(shu)據(ju)的(de)冷(leng)熱(re)程(cheng)度(du)把(ba)它(ta)們(men)存(cun)儲(chu)在(zai)不(bu)同(tong)的(de)閃(shan)存(cun)塊(kuai)上(shang)。數(shu)據(ju)分(fen)流(liu)能(neng)一(yi)定(ding)程(cheng)度(du)上(shang)減(jian)少(shao)存(cun)儲(chu)設(she)備(bei)寫(xie)放(fang)大(da),但(dan)具(ju)體(ti)能(neng)帶(dai)來(lai)多(duo)大(da)收(shou)益(yi),這(zhe)取(qu)決(jue)於(yu)用(yong)戶(hu)冷(leng)熱(re)數(shu)據(ju)的(de)比(bi)例(li),因(yin)此(ci)有(you)一(yi)定(ding)的(de)局(ju)限(xian)性(xing)。 今天要介紹減小寫放大的終極大招——分區存儲(Zoned Storage),它能消除QLC和TLC壽命之間的差異,而且能提升存儲設備性能,讓QLC應用到嵌入式存儲設備上變得可能。
什麼是分區存儲?
分區存儲概念最早來源於SMR HDD。SMR是“Shingled Magnetic Recording”(疊瓦式磁記錄)的首字母縮寫,是一種用於增加容量並降低硬盤每TB成本的重要技術。SMR硬盤把硬盤分成一個個的分區(Zone),每個分區內部必須順序寫,否則會發生數據覆蓋從而導致之前寫入的數據丟失問題。

(Figure 1:SMR HDD) 分(fen)區(qu)存(cun)儲(chu)設(she)備(bei)的(de)邏(luo)輯(ji)空(kong)間(jian)被(bei)劃(hua)分(fen)成(cheng)一(yi)個(ge)個(ge)連(lian)續(xu)的(de)分(fen)區(qu),分(fen)區(qu)內(nei)部(bu)隻(zhi)能(neng)被(bei)順(shun)序(xu)寫(xie)入(ru)。每(mei)個(ge)分(fen)區(qu)都(dou)有(you)一(yi)個(ge)寫(xie)指(zhi)針(zhen),用(yong)於(yu)跟(gen)蹤(zong)下(xia)一(yi)次(ci)寫(xie)入(ru)的(de)位(wei)置(zhi)。分(fen)區(qu)中(zhong)的(de)數(shu)據(ju)不(bu)能(neng)被(bei)覆(fu)蓋(gai),必(bi)須(xu)首(shou)先(xian)使(shi)用(yong)特(te)殊(shu)命(ming)令(ling)(區域重置)擦除數據。 (Figure 2:分區存儲概念)
除了HDD,基於閃存的固態存儲設備,也是非常喜歡順序寫入的,因為順序寫性能好,而且導致的寫放大也小。“讓主機端順序寫入”一直是固態存儲設備的夢想,在SMR HDD助力下,分區存儲生態日趨完善,NVMe也製定了ZNS(Zoned Namespace)標準,SSD也算是“圓夢”了。
分區存儲帶來的好處
分區存儲帶來的一大好處就是能消除存儲設備內部的垃圾回收。存儲設備垃圾回收會導致兩個主要問題:一是引入寫放大,導致存儲設備壽命減少;二是垃圾回收的同時如果伴有主機讀寫,垃圾回收操作則會影響主機讀寫性能。
(Figure 3:垃圾回收示例)
垃圾回收原理:為騰出空閑閃存塊,需要把有效數據A、B、C從源閃存數據塊搬到新的閃存塊,內部數據的搬移引入寫放大。寫放大 = 寫入閃存的數據量/主機寫入的數據量,寫放大越大,對閃存磨損越厲害。
分區存儲怎麼就能消除存儲設備垃圾回收的呢?
如(ru)果(guo)分(fen)區(qu)大(da)小(xiao)是(shi)存(cun)儲(chu)設(she)備(bei)閃(shan)存(cun)塊(kuai)大(da)小(xiao)的(de)整(zheng)數(shu)倍(bei),這(zhe)樣(yang)一(yi)個(ge)分(fen)區(qu)的(de)數(shu)據(ju)會(hui)被(bei)寫(xie)到(dao)閃(shan)存(cun)設(she)備(bei)的(de)整(zheng)數(shu)個(ge)閃(shan)存(cun)塊(kuai)內(nei)。由(you)於(yu)分(fen)區(qu)不(bu)允(yun)許(xu)覆(fu)蓋(gai)寫(xie),一(yi)個(ge)分(fen)區(qu)數(shu)據(ju)隻(zhi)能(neng)被(bei)整(zheng)體(ti)無(wu)效(xiao)掉(diao),也(ye)就(jiu)是(shi)意(yi)味(wei)著(zhe)該(gai)分(fen)區(qu)對(dui)應(ying)的(de)閃(shan)存(cun)塊(kuai)也(ye)是(shi)整(zheng)體(ti)被(bei)無(wu)效(xiao)掉(diao)(上麵沒有任何有效數據),因此存儲設備內部回收閃存塊無需垃圾回收——隻需要一個擦除動作。 chuantonglajihuishouyouyuxuyaobanyishancunkuaishangdeyouxiaoshuju,huidaozhixiefangda。haiyou,weijianxiaoxiefangdahejiasulajihuishou,cunchushebeidouhuiyuliuyixieshancunkongjian(也就是我們常說的OP),以減少閃存塊上有效數據數量。現在分區存儲設備中由於不存在垃圾回收,因此沒有寫放大,同時這部分OP也可以省掉了(節省成本)。
(Figure 4:傳統SSD數據存放和分區SSD數據存放比較) 分區存儲帶來的另一大好處就是大大減少了映射表大小,從而提升係統性能,減少存儲設備成本。 基於閃存的傳統存儲設備一般按4KB邏輯塊大小為映射粒度,其L2P映射表(邏輯地址到物理地址的映射)大小一般為存儲設備容量的1/1024,比如一個512GB的UFS設備,其L2P映射表大小為512MB。企業級SSD一般都配有相應大小的DRAM來存儲運行時的L2P映射表,比如512GB的企業級SSD需要搭載至少512MB的DRAM;而業界消費級存儲設備則是出於成本考慮,一般都沒有DRAM,它利用控製器小的SRAM緩存部分L2P映射表,而絕大多數L2P映射表都是存在閃存,固件按需從閃存加載映射關係數據到控製器SRAM。這種DRAM-less的存儲設備,與帶DRAM的存儲設備相比,少了DRAM的成本,但性能無疑會大打折扣,因為控製器SRAM大da小xiao有you限xian,對dui隨sui機ji讀du取qu場chang景jing來lai說shuo,映ying射she表biao緩huan存cun命ming中zhong率lv很hen低di,固gu件jian很hen多duo時shi候hou需xu要yao先xian從cong閃shan存cun加jia載zai映ying射she關guan係xi,然ran後hou再zai根gen據ju獲huo得de的de物wu理li地di址zhi去qu讀du用yong戶hu數shu據ju,也ye就jiu是shi說shuo讀du取qu一yi筆bi數shu據ju需xu要yao訪fang問wen幾ji次ci閃shan存cun,意yi味wei著zhe讀du取qu性xing能neng肯ken定ding比bi隻zhi訪fang問wen一yi次ci閃shan存cun要yao慢man得de多duo。 問題的根因是傳統存儲設備映射粒度太細了,導致映射表巨大。而分區存儲設備,我們可以按照分區大小為映射粒度。假設分區大小為128MB,一個512GB的設備有4096個分區,每個分區對應的物理地址用4字節表示,那麼整個L2P映射表隻有16KB!這麼小的映射表完全可以存儲在控製器SRAM中,因此在企業級SSD中可節省DRAM的使用;對消費級存儲產品來說,L2P映射表可以常駐內存,無需從閃存中獲取映射關係,讀取一筆數據隻需訪問一次閃存,這大大加速了隨機讀取性能。
(Table 2:傳統存儲設備和分區存儲設備映射對比)
分區存儲助力QLC嵌入式存儲設備 回到QLC應用到嵌入式存儲設備的話題。 在傳統嵌入式存儲設備中,垃圾回收一般會引入3-4的寫放大,即一個3000次擦寫次數的TLC閃存,真正給到用戶的擦寫次數可能不到1000次。而分區存儲的使用,由於不存在垃圾回收,因此寫放大可以做到接近1,也就是一個1500次擦寫次數的QLC,給到用戶就是實打實的1500次。這意味著:傳統用3000次擦寫次數TLC的存儲設備,假設TBW為100TB,現在如果用QLC,雖然QLC的擦寫次數隻有TLC的一半,但由於分區存儲的使用,TBW反而能提升到150TB。 對分區存儲設備,由於L2P映射表很小,完全能夠存放在控製器SRAM,因此可快速更新和獲取映射關係,從而大幅提升係統讀寫性能。傳統基於TLC的嵌入式存儲設備,在隨機讀取一筆數據(4KB)的時候,由於L2P映射緩存很小(幾百KB),固件大概率要先從閃存上加載L2P映射關係,這個時間大概40us左右,然後再花60us左右的時間從閃存加載用戶數據——隨機讀取一筆數據的時間大概需要花100us左右;而現在基於分區存儲的嵌入式存儲設備,由於省掉了加載映射關係的時間,雖然讀取閃存的時間QLC要比TLC長,但總的時間下來,兩者是相當的。 由於分區存儲設備的使用,再加上成熟的SLC緩存機製,這兩大特性彌補了QLC壽命短和性能差兩大短板,讓QLC應用到嵌入式存儲設備上變得可行。現在典型的嵌入式存儲設備為UFS設備,如果引入了分區存儲,像UFS中的HPB、FBO等特性完全可以拋棄,這也無疑簡化了UFS設備的設計。
嵌入式存儲設備技術展望 前端接口協議方麵,應用於安卓平台上的嵌入式存儲設備當前主流是UFS設備,相信未來很長一段時間也會沿著UFS路線繼續向前。UFS4.0協議今年8月份發布,三星早前也發布了UFS4.0存儲設備。
(Figure 5:嵌入式存儲協議發展路線)
存儲介質方麵,作為消費級產品,嵌入式存儲設備對成本敏感,隨著QLC閃存的成熟,QLC必然會應用到未來的嵌入式存儲設備上,無論是廠商還是消費者,都要做好這個心理準備。事實上,今年(2022年)年初鎧俠已經發布了基於QLC的UFS3.1產品。 QLC應用到嵌入式存儲設備上,要讓消費者用得放心,這需要相關的技術來解決QLC介質可靠性差、壽命短、性能差等問題。因此在技術趨勢方麵,一方麵是嵌入式存儲控製器糾錯能力需要變得越來越強;另一方麵,像數據分流、分區存儲這些能減小寫放大的技術也會被引入,來彌補QLC壽命短這塊短板。 目前,江波龍具有基於主流3D TLC閃存的豐富的嵌入式存儲產品,從eMMC到高性能UFS3.1,從消費級存儲到車規級存儲,產品矩陣全麵。同時,公司也在思考怎麼把存儲密度更高的QLC應用到嵌入式存儲產品上,並開展相關技術預研工作。未來,江波龍會持續給客戶帶來更多超越期望的嵌入式存儲產品。
(來源:江波龍電子)
免責聲明:本文為轉載文章,轉載此文目的在於傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯係小編進行處理。
推薦閱讀:
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
- 1200餘家企業齊聚深圳,CITE2026打造電子信息產業創新盛宴
- 掌握 Gemini 3.1 Pro 參數調優的藝術
- 築牢安全防線:電池擠壓試驗機如何為新能源產業護航?
- Grok 4.1 API 實戰:構建 X 平台實時輿情監控 Agent
- 電源芯片國產化新選擇:MUN3CAD03-SF助力物聯網終端“芯”升級
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall




