2026智能駕駛分水嶺:蔚來能否憑世界模型重回第一梯隊?
發布時間:2026-02-20 來源:轉載 責任編輯:lily
【導讀】自特斯拉FSD V12率先將端到端大模型引入量產車以來,"規則驅動"向"數據驅動"的範式轉移已成為行業共識——動作是否流暢、能否應對長尾場景、決jue策ce是shi否fou擬ni人ren化hua,取qu代dai了le傳chuan統tong的de功gong能neng清qing單dan,成cheng為wei衡heng量liang智zhi能neng駕jia駛shi體ti驗yan的de新xin標biao尺chi。在zai這zhe場chang由you方fang法fa論lun革ge新xin引yin發fa的de浪lang潮chao中zhong,蔚wei來lai經jing曆li了le從cong規gui則ze構gou建jian到dao數shu據ju驅qu動dong的de艱jian難nan轉zhuan身shen,如ru今jin又you以yi"世界模型+閉環強化學習"的全新架構重新出發。當技術路線的迷霧逐漸散去,蔚來新版NOA能否憑借這套端到端強化學習體係,在複雜的中國城市場景中實現真正的"擬人化"突破,重回行業第一梯隊?
Part 1、蔚來的輔助駕駛的轉型
在中國智能駕駛的迭代中,特斯拉提出的端到端一個拐點,在出現了這個技術變化之後,城市NOA中擬人化變成了非常重要的評價點,規則味比較重,是落後的標誌。
體驗上主要是動作機械、加減速轉向不流暢、卡頓,無法應對各種Corner case, FSD V12、V13 V14 的一路發展,在方法論上特斯拉是一路牽引整個行業的發展。
在蔚來的第一代車型,是圍繞規則來構建的輔助駕駛,確定變道距離、確定的加減速邏輯、確定的安全邊界。在中國複雜的城市場景複雜度下並不完善。
從規則開始,蔚來花了很多時間來切換技術路線。轉向數據驅動過程中,用模型把規則“壓縮”進參數裏,讓係統通過學習大量真實駕駛數據,自己學會如何變道、擇道。
數(shu)據(ju)驅(qu)動(dong)的(de)問(wen)題(ti)是(shi),同(tong)一(yi)個(ge)場(chang)景(jing)下(xia),人(ren)類(lei)的(de)行(xing)為(wei)並(bing)不(bu)一(yi)致(zhi)。在(zai)道(dao)路(lu)上(shang),人(ren)的(de)習(xi)慣(guan)和(he)交(jiao)通(tong)流(liu)量(liang)都(dou)會(hui)影(ying)響(xiang)決(jue)策(ce),從(cong)結(jie)果(guo)來(lai)看(kan),能(neng)看(kan)到(dao)不(bu)同(tong)的(de)駕(jia)駛(shi)員(yuan)在(zai)不(bu)同(tong)的(de)位(wei)置(zhi)換(huan)道(dao),模(mo)型(xing)學(xue)到(dao)的(de)是(shi)一(yi)種(zhong)“折中選擇”,為了安全往往選擇保守跟隨,或者說要真正實現“高效、主動通行”,伴隨著不少的小事故。
為了平衡風險,引入更強的地圖和路徑引導、采集專家駕駛數據並減少行為差異,或者加回一部分規則邏輯。這些都是中國在這段時間走過的路。
Part 2、蔚來新版的NOA
蔚來世界模型在2026年的目標是回到行業的數一數二的位置。方法是對智能輔助駕駛全研發迭代方法進行調整,引入世界模型 + 閉環強化學習的模式。
這也是以端到端係統為基礎,核心分為三步:
基礎行為習得:通過學習海量人類駕駛行為,讓模型形成駕駛答題本,標記各類場景下的行為概率,習得駕駛基本肌肉記憶;
環境深度理解:模mo型xing從cong當dang前qian時shi刻ke出chu發fa,預yu測ce自zi身shen下xia一yi步bu多duo種zhong動dong作zuo,並bing推tui演yan不bu同tong動dong作zuo對dui周zhou圍wei環huan境jing的de影ying響xiang,及ji環huan境jing變bian化hua對dui自zi身shen行xing為wei的de反fan作zuo用yong,實shi現xian長chang達da數shu分fen鍾zhong的de長chang時shi序xu思si考kao,這zhe是shi核he心xin運yun行xing機ji製zhi;
閉環強化校準:在虛擬「駕駛考場」中,通過數上億輪專業場景訓練和評估反饋,讓模型精準理解「好行為與差行為的區別」,基於駕駛常識和人類經驗校準行為「答題本」,這一過程即為閉環強化學習。
zheliyaohuidajigeguanjianwenti,qianghuaxuexidaodijiejueleshenmewenti?zheshigeijieguodafen,rangmoxingzijixue,moxingshuchuxingweihou,xitonghuigenjujieguogeiyuzhengxianghuofuxiangfankui,rangmoxingzaifanfuchangshizhongxuehuishenmeshi“更優解”,過程本身就是一種自我校正。
在實際訓練中,通過獎勵評估機製直接給行為打分;利用真實人類行為反饋,反推出獎勵信號, 模型在其中會經曆自監督學習,逐步形成穩定的決策偏好。
舉例來說先構建一個仿真環境,在其中設定一條“目標線”,車輛如果順利完成左轉並線,就得到獎勵;完成得越快、越平順,獎勵越高。
在此基礎上,隻保留少量必要的約束,比如壓實線會被扣分,但不再寫複雜規則。在哪個位置變道、如何跨越三條車道、怎樣兼顧效率與安全,全部交給模型在仿真環境中自行探索。
在這樣的基礎上不需要為每一個特殊路口單獨采集數據。隻要仿真環境中構建出“相似結構”的場景,模型就能遷移能力,避免了為成百上千個複雜路口重複采數據的低效過程。目標簡單、約束少,讓模型自己找路徑。
規則一旦極簡,反而更穩定、更通用。
Part 3、實際的體驗
在我們的實際體驗中,換道策略、導航選道,在道路中的刹車控製都有很大的改善。
偏航和複雜路口,是需要“提前判斷”的場景,NOA的係統在快到路口才反應一般感受會很差或者就錯了(要麼壓實線要麼錯了),需要在更早的階段就意識到,模型會提前接收到“未來懲罰”,從而主動調整決策。
實際上,在擬人化抉擇上,比如判斷安心感充足時果斷切入,不魯莽擠壓旁車;目標車道擁堵時,緩慢前行並持續尋找變道空隙;通過蠕行尋找通行空隙,這些行為都是挺大的改善。
結論
蔚來的探索揭示了一個核心趨勢:智能駕駛的下半場競爭,本質上是"學習效率"與"泛化能力"的較量。世界模型賦予係統長時序推演能力,讓車輛能夠"預見"而非"反應";閉環強化學習則通過虛擬考場中的億級輪次訓練,使模型在極少規則約束下自主尋優,實現從"學會開車"到"開好車"的躍遷。實際體驗中換道策略的果斷、複雜路口的提前預判、擁堵場景下的蠕行尋隙,都是這一技術路線落地的直觀印證。
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
- 1200餘家企業齊聚深圳,CITE2026打造電子信息產業創新盛宴
- 掌握 Gemini 3.1 Pro 參數調優的藝術
- 築牢安全防線:電池擠壓試驗機如何為新能源產業護航?
- Grok 4.1 API 實戰:構建 X 平台實時輿情監控 Agent
- 電源芯片國產化新選擇:MUN3CAD03-SF助力物聯網終端“芯”升級
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall




