芯耀輝軟硬結合的智能DDR PHY訓練技術
發布時間:2021-07-05 來源:芯耀輝 責任編輯:lina
【導讀】DDR接口速率越來越高,每一代產品都在挑戰工藝的極限,對DDR PHY的訓練要求也越來越嚴格。本文從新銳IP企業芯耀輝的角度,談談DDR PHY訓練所麵臨的挑戰,介紹芯耀輝DDR PHY訓練的主要過程和優勢,解釋了芯耀輝如何解決DDR PHY訓練中的問題。
引言
DDR接口速率越來越高,每一代產品都在挑戰工藝的極限,對DDR PHY的訓練要求也越來越嚴格。本文從新銳IP企業芯耀輝的角度,談談DDR PHY訓練所麵臨的挑戰,介紹芯耀輝DDR PHY訓練的主要過程和優勢,解釋了芯耀輝如何解決DDR PHY訓練中的問題。
DDR PHY訓練簡介
高可靠性是係統級芯片SoC重要的質量和性能要求之一。SoC的複雜在於各個IP模塊都對其產生至關重要的影響。從芯耀輝長期服務客戶的經驗來看,在客戶的SoC設計中,訪問DDR SDRAM是常見的需求,所以DDR PHY則成為了一個非常關鍵的IP,其能否穩定可靠的工作決定了整個SoC芯片的質量和可靠性。
製定DDR協議的固態技術協會(JEDEC)標準組織並沒有在規範中要求動態隨機存取存儲器(DRAM)需要具備調整輸入輸出信號延時的能力,於是通常DDR PHY就承擔起了輸入和輸出兩個方向的延時調整工作,這個調整的過程稱為訓練(training)。訓練是為了使DDR PHY輸出信號能符合固態技術協會標準的要求,DDR PHY通過調節發送端的延遲線(delay line),讓DRAM顆粒能在接收端順利地采樣到控製信號和數據信號;相對應的,在DDR PHY端,通過調整內部接收端的延遲線,讓DDR PHY能順利地采樣到DRAM顆粒的輸出信號。從而在讀寫兩個方向,DDR接口都能穩定可靠地工作。

圖1:DDR PHY承擔了輸入和輸出兩個方向的延時調整工作
然而,隨著DDR工作頻率提高,DDR PHY訓練的準確性和精度要求也隨之提高。訓練的準確性和精度決定了DDR係統能否穩定可靠地工作在較高的頻率。
DDR PHY訓練所麵臨的挑戰
DDRxunliandezhongleifanduo,meigexunliandejieguodoubunengchucuo。tongshigutaijishuxiehuidingyidexunlianxuliedoubijiaodanyi,ruguozhishiyongzhexiemorenxuliedehua,xunlianjieguozaishijigongzuozhongbingbushiyigezuiyouzhi。
目前絕大多數DDR PHY都采用硬件訓練的方式,如果硬件算法有問題,會導致訓練出錯,DDR無法正常穩定地工作,導致整個SoC的失敗。同時,硬件訓練模式很難支持複雜的訓練序列和訓練算法,從而無法得到訓練結果的最優解。
芯耀輝的DDR PHY采用軟硬件結合的固件(firmware)訓練方式跳出了上述DDR PHY訓練模式的固定思維。
芯耀輝DDR PHY在訓練上的優勢
解決寫入均衡(write leveling)的難題
寫入均衡是為了計算出flyby結構下命令通路和數據通路的走線延遲的差值,在DDR PHY中把這個差值補償到數據通路上,從而最終讓數據通路和命令通路的延遲達到一致。

圖2:DDR flyby拓撲結構示意圖
在實際的應用中,命令(command)路徑上的延時會超過數據(DQ)路徑的延時。假設路徑差值 = 命令路徑延時 – 數據路徑延時,一般路徑差值在0~5個時鍾周期之間。可以把路徑差值分為整數部分和小數部分(單位是0.5個時鍾周期)。

圖3:命令路徑延時、數據路徑延時和路徑差值
根據固態技術協會標準(如JESD79-4C)的寫入均衡的要求,DRAM在寫入均衡模式下會用DDR PHY發送過來的DQS沿去采樣CK,並把采樣的值通過DQ返回給DDR PHY。

圖4:寫入均衡模式下調整DQS時延的示意圖
通過該訓練,DDR PHY可以計算出命令與數據路徑延時差值的小數部分,卻沒有辦法訓練出命令與數據路徑延時差值的整數部分(把DQS多延遲一個時鍾周期或者少延遲一個時鍾周期,用DQS采樣CK的采樣值是相同的)。
為了解決這個問題,通常會根據版圖設計估算出大概的路徑差值,從而自行得到路徑差值的整數部分,直接配置到DDR PHY的寄存器中。這種做法在頻率比較低、量產一致性比較好的時候問題不大。但在大規模量產的時候,如果平台之間的不一致性超過一個時鍾周期(LPDDR4最高頻下周期為468ps)的話,上述直接配置整數部分的方法就沒法進行工作了,必然會導致部分芯片無法正常工作。
芯耀輝采用固件的訓練方式,通過DDR寫操作時特殊調節方法,能夠幫助客戶計算出路徑差值整數加小數部分,無需客戶根據版圖設計估算路徑差值範圍。

圖5:路徑差值整數部分訓練和小數部分訓練
過濾訓練時DQS的高阻態
讀操作時,DQS信號在前導(preamble)前是高阻態,同時DQS信號的前導部分也不能達到最穩定的狀態,所以需要訓練出讀DQS的gate信號來過濾掉前麵的高阻態和前導,恰好得到整個讀突發(Read Burst)操作的有效DQS,這就是讀DQS gate訓練。
芯耀輝采用特定的方法,在訓練的時候,排除不穩定DQS的幹擾,用讀DQS的gate信號得到讀突發數據對應的第一個DQS的上升沿位置,從而得到gate的位置。

圖6:讀DQS gate訓練
延遲DQS提高讀DQ訓練的準確性
一般在DDR PHY中沒有這個訓練,因為該訓練不是固態技術協會標準要求的,可是在實際應用中,這個訓練卻有著比較重要的意義。

圖7:LPDDR4突發讀(來源固態技術協會標準JESD209-4B)
讀DQS和讀DQ之間的偏差為tDQSQ,這個值的範圍是0~0.18UI(在高頻下約為0~42ps)。讀訓練的時候,采用延遲DQS的方法,找到DQ的左右窗口,最後把DQS放在DQ窗口的中心點。由於DDR PHY內部的DQS-DQ延遲偏差、封裝的pad延遲偏差、以及PCB走線偏差,雖然DRAM端輸出的tDQSQ為正數(DQ的延遲比DQS大),但在DDR PHY內部看到的tDQSQ卻可能為負數(DDR PHY內部DQS的延遲比DQ大),如圖8上半部分所示。
在這種情況下,即使DQS的延遲為0,DQS也落在DQ的窗口內,PHY內部會通過從0延遲開始增加DQS的延遲來搜索DQ的左右窗口,這樣必然導致最終搜索到的DQ的窗口比實際的窗口要小,讀訓練後的DQS的采樣點不在DQ的正中間,而在偏右的位置,最終讀餘量(margin)變小。
芯耀輝通過特定的方法,能讓每個DQ的窗口都在DQS右邊,這樣做讀訓練的時候,可以搜索到DQ的完整窗口,提高了讀訓練的準確性,提升DDR的讀性能。

圖8:Read DQ skew training
用固件的訓練方法獲取讀數據眼圖(Read data eye)的優化值
讀數據眼圖訓練通過延遲讀DQS的方法,把讀DQS放在DQ窗口的中間。目前最大的問題是固態技術協會標準對讀數據眼圖的讀序列定義的比較簡單,比如對於DDR4,定義的序列是01010101的固定序列。因為高速信號的符號間幹擾以及信號反射,在不同的讀序列的情況下DQ窗口是有差異的,所以采用簡單固定的序列並不能很好地覆蓋實際的使用場景,導致訓練結果在實際工作時並不是一個優化值。
芯耀輝采用固件的訓練方法,可以設置不同的範式(pattern),如PRBS範式、特殊設計的掃頻範式等。顯然此類範式能更好地反映數據通道的特性,因為它包含了高頻、中頻、低頻信息,以及長0和長1帶來的碼間串擾等問題,可以獲得較優的訓練結果,從而得到一個能覆蓋實際工作場景的可靠值。
二維訓練模式下優化的參考電壓(Vref)電壓和地址線(CA)延遲
LPDDR3中引入了地址線訓練,DRAM把采樣到的地址信號通過數據通路反饋給DDR PHY,DDR PHY可以通過這個反饋去調節地址線的延遲。在LPDDR4中zhong,還hai加jia入ru了le地di址zhi線xian參can考kao電dian壓ya的de訓xun練lian,所suo以yi不bu僅jin需xu要yao調tiao節jie地di址zhi線xian的de延yan遲chi,還hai需xu要yao找zhao到dao一yi個ge最zui優you的de參can考kao電dian壓ya值zhi。傳chuan統tong使shi用yong硬ying件jian訓xun練lian的de方fang式shi在zai麵mian對dui這zhe種zhong兩liang個ge維wei度du的de訓xun練lian時shi就jiu會hui顯xian得de捉zhuo襟jin見jian肘zhou,同tong時shi硬ying件jian算suan法fa也ye沒mei法fa做zuo得de太tai複fu雜za。
芯xin耀yao輝hui采cai用yong固gu件jian的de二er維wei訓xun練lian模mo式shi,可ke以yi繪hui製zhi出chu完wan整zheng的de以yi地di址zhi線xian延yan遲chi為wei橫heng坐zuo標biao和he以yi參can考kao電dian壓ya為wei縱zong坐zuo標biao的de二er維wei圖tu像xiang,從cong而er得de到dao較jiao優you的de參can考kao電dian壓ya和he對dui應ying的de地di址zhi線xian延yan遲chi。
二維訓練模式下優化的DQ參考電壓和DQ延遲
DDR4的固態技術協會標準中引入了DQ參考電壓,可是對於如何訓練並沒有給出說明和支持,所以大多數DDR PHY並不支持DDR4的DQ參考電壓訓練,隻能配置一個固定參考電壓值。
LPDDR4的固態技術協會標準增加了寫DQS-DQ訓練(調整寫DQ相對於寫DQS的相位)和DQ參考電壓訓練協議上的支持。
芯耀輝采用固件的方式,不僅支持了DDR4的DQ參考電壓訓練,同時對於LPDDR4的寫DQS-DQ和DQ參考電壓訓練,也采用了固件的二維訓練模式,繪製出完整的以DQ延遲為橫坐標和以DQ參考電壓為縱坐標的二維圖像,在整個二維圖像中找到較優的DQ參考電壓和對應的DQ延遲。
總結
隨著工藝節點的提升和DDR顆粒技術的演進,DDR的工作頻率越來越高,DDR顆粒的訓練要求也越來越高。同時對於DDR PHY來說,內部的模擬電路(FFE,DFE等)隨著頻率的提升也需要做各種高精度的訓練。芯耀輝采用軟硬結合的智能訓練方法不僅可以支持DDR顆粒的各種必要的複雜訓練,也同時可以支持DDR PHY內部模擬電路的各種訓練。通過不斷優化訓練算法,持續挑戰每一代DDR產品的速率極限。
百尺竿頭,更進一步,芯耀輝人必將以提供高性能的接口類IP,高品質的設計服務為己任,奮發圖強,攜手廣大芯片設計公司推出更優秀的產品,助力中國芯片產業的發展。
免責聲明:本文為轉載文章,轉載此文目的在於傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請電話或者郵箱聯係小編進行侵刪。
2021第22屆西部光電博覽會招商順利
實用低頻功率放大器的設計
如何使用相位噪聲圖方向時鍾器件特性及適用應用場景
城市軌道交通視頻監控係統的應用解決方案
從傳感器到ADC的信號鏈難題:新版經典儀表放大器是這樣解決的
特別推薦
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
技術文章更多>>
- 1200餘家企業齊聚深圳,CITE2026打造電子信息產業創新盛宴
- 掌握 Gemini 3.1 Pro 參數調優的藝術
- 築牢安全防線:電池擠壓試驗機如何為新能源產業護航?
- Grok 4.1 API 實戰:構建 X 平台實時輿情監控 Agent
- 電源芯片國產化新選擇:MUN3CAD03-SF助力物聯網終端“芯”升級
技術白皮書下載更多>>
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索
數字鎖相環
雙向可控矽
水泥電阻
絲印設備
伺服電機
速度傳感器
鎖相環
胎壓監測
太陽能
太陽能電池
泰科源
鉭電容
碳膜電位器
碳膜電阻
陶瓷電容
陶瓷電容
陶瓷濾波器
陶瓷諧振器
陶瓷振蕩器
鐵電存儲器
通信廣電
通訊變壓器
通訊電源
通用技術
同步電機
同軸連接器
圖像傳感器
陀螺傳感器
萬用表
萬用表使用




