2026智能駕駛分水嶺：蔚來能否憑世界模型重回第一梯隊？-互連技術-電子元件技術網

你的位置：首頁 > 互連技術 > 正文

2026智能駕駛分水嶺：蔚來能否憑世界模型重回第一梯隊？

發布時間：2026-02-20 來源：轉載責任編輯：lily

【導讀】自特斯拉FSD V12率先將端到端大模型引入量產車以來，"規則驅動"向"數據驅動"的範式轉移已成為行業共識——動作是否流暢、能否應對長尾場景、決jue策ce是shi否fou擬ni人ren化hua，取qu代dai了le傳chuan統tong的de功gong能neng清qing單dan，成cheng為wei衡heng量liang智zhi能neng駕jia駛shi體ti驗yan的de新xin標biao尺chi。在zai這zhe場chang由you方fang法fa論lun革ge新xin引yin發fa的de浪lang潮chao中zhong，蔚wei來lai經jing曆li了le從cong規gui則ze構gou建jian到dao數shu據ju驅qu動dong的de艱jian難nan轉zhuan身shen，如ru今jin又you以yi"世界模型+閉環強化學習"的全新架構重新出發。當技術路線的迷霧逐漸散去，蔚來新版NOA能否憑借這套端到端強化學習體係，在複雜的中國城市場景中實現真正的"擬人化"突破，重回行業第一梯隊？

Part 1、蔚來的輔助駕駛的轉型

在中國智能駕駛的迭代中，特斯拉提出的端到端一個拐點，在出現了這個技術變化之後，城市NOA中擬人化變成了非常重要的評價點，規則味比較重，是落後的標誌。

體驗上主要是動作機械、加減速轉向不流暢、卡頓，無法應對各種Corner case， FSD V12、V13 V14 的一路發展，在方法論上特斯拉是一路牽引整個行業的發展。

在蔚來的第一代車型，是圍繞規則來構建的輔助駕駛，確定變道距離、確定的加減速邏輯、確定的安全邊界。在中國複雜的城市場景複雜度下並不完善。

從規則開始，蔚來花了很多時間來切換技術路線。轉向數據驅動過程中，用模型把規則“壓縮”進參數裏，讓係統通過學習大量真實駕駛數據，自己學會如何變道、擇道。

數(shu)據(ju)驅(qu)動(dong)的(de)問(wen)題(ti)是(shi)，同(tong)一(yi)個(ge)場(chang)景(jing)下(xia)，人(ren)類(lei)的(de)行(xing)為(wei)並(bing)不(bu)一(yi)致(zhi)。在(zai)道(dao)路(lu)上(shang)，人(ren)的(de)習(xi)慣(guan)和(he)交(jiao)通(tong)流(liu)量(liang)都(dou)會(hui)影(ying)響(xiang)決(jue)策(ce)，從(cong)結(jie)果(guo)來(lai)看(kan)，能(neng)看(kan)到(dao)不(bu)同(tong)的(de)駕(jia)駛(shi)員(yuan)在(zai)不(bu)同(tong)的(de)位(wei)置(zhi)換(huan)道(dao)，模(mo)型(xing)學(xue)到(dao)的(de)是(shi)一(yi)種(zhong)“折中選擇”，為了安全往往選擇保守跟隨，或者說要真正實現“高效、主動通行”，伴隨著不少的小事故。

為了平衡風險，引入更強的地圖和路徑引導、采集專家駕駛數據並減少行為差異，或者加回一部分規則邏輯。這些都是中國在這段時間走過的路。

Part 2、蔚來新版的NOA

蔚來世界模型在2026年的目標是回到行業的數一數二的位置。方法是對智能輔助駕駛全研發迭代方法進行調整，引入世界模型 + 閉環強化學習的模式。

這也是以端到端係統為基礎，核心分為三步：

基礎行為習得：通過學習海量人類駕駛行為，讓模型形成駕駛答題本，標記各類場景下的行為概率，習得駕駛基本肌肉記憶；

環境深度理解：模mo型xing從cong當dang前qian時shi刻ke出chu發fa，預yu測ce自zi身shen下xia一yi步bu多duo種zhong動dong作zuo，並bing推tui演yan不bu同tong動dong作zuo對dui周zhou圍wei環huan境jing的de影ying響xiang，及ji環huan境jing變bian化hua對dui自zi身shen行xing為wei的de反fan作zuo用yong，實shi現xian長chang達da數shu分fen鍾zhong的de長chang時shi序xu思si考kao，這zhe是shi核he心xin運yun行xing機ji製zhi；

閉環強化校準：在虛擬「駕駛考場」中，通過數上億輪專業場景訓練和評估反饋，讓模型精準理解「好行為與差行為的區別」，基於駕駛常識和人類經驗校準行為「答題本」，這一過程即為閉環強化學習。

zheliyaohuidajigeguanjianwenti，qianghuaxuexidaodijiejueleshenmewenti？zheshigeijieguodafen，rangmoxingzijixue，moxingshuchuxingweihou，xitonghuigenjujieguogeiyuzhengxianghuofuxiangfankui，rangmoxingzaifanfuchangshizhongxuehuishenmeshi“更優解”，過程本身就是一種自我校正。

在實際訓練中，通過獎勵評估機製直接給行為打分；利用真實人類行為反饋，反推出獎勵信號，模型在其中會經曆自監督學習，逐步形成穩定的決策偏好。

舉例來說先構建一個仿真環境，在其中設定一條“目標線”，車輛如果順利完成左轉並線，就得到獎勵；完成得越快、越平順，獎勵越高。

在此基礎上，隻保留少量必要的約束，比如壓實線會被扣分，但不再寫複雜規則。在哪個位置變道、如何跨越三條車道、怎樣兼顧效率與安全，全部交給模型在仿真環境中自行探索。

在這樣的基礎上不需要為每一個特殊路口單獨采集數據。隻要仿真環境中構建出“相似結構”的場景，模型就能遷移能力，避免了為成百上千個複雜路口重複采數據的低效過程。目標簡單、約束少，讓模型自己找路徑。

規則一旦極簡，反而更穩定、更通用。

Part 3、實際的體驗

在我們的實際體驗中，換道策略、導航選道，在道路中的刹車控製都有很大的改善。

偏航和複雜路口，是需要“提前判斷”的場景，NOA的係統在快到路口才反應一般感受會很差或者就錯了（要麼壓實線要麼錯了），需要在更早的階段就意識到，模型會提前接收到“未來懲罰”，從而主動調整決策。

實際上，在擬人化抉擇上，比如判斷安心感充足時果斷切入，不魯莽擠壓旁車；目標車道擁堵時，緩慢前行並持續尋找變道空隙；通過蠕行尋找通行空隙，這些行為都是挺大的改善。

結論

蔚來的探索揭示了一個核心趨勢：智能駕駛的下半場競爭，本質上是"學習效率"與"泛化能力"的較量。世界模型賦予係統長時序推演能力，讓車輛能夠"預見"而非"反應"；閉環強化學習則通過虛擬考場中的億級輪次訓練，使模型在極少規則約束下自主尋優，實現從"學會開車"到"開好車"的躍遷。實際體驗中換道策略的果斷、複雜路口的提前預判、擁堵場景下的蠕行尋隙，都是這一技術路線落地的直觀印證。

3-958x200_20251021044704_586_20260213110352_663_20260218181015_530.png

上一篇：4200VAC耐壓測試頻頻失效？警惕串聯隔離的電壓堆疊陷阱

下一篇：14.4Gbps！SK海力士刷新LPDDR6速度紀錄

特別推薦

技術文章更多>>

技術白皮書下載更多>>

熱門搜索

友情鏈接(QQ：317243736)

我愛方案網 ICGOO元器件商城創芯在線檢測芯片查詢天天IC網電子產品世界無線通信模塊控製工程網電子開發網電子技術應用與非網世紀電源網 21ic電子技術資料下載電源網電子發燒友網中電網中國工業電器網連接器礦山設備網工博士智慧農業工業路由器天工網乾坤芯電子元器件采購網亞馬遜KOL 聚合物鋰電池工業自動化設備企業查詢工業路由器元器件商城連接器 USB中文網今日招標網塑料機械網農業機械中國IT產經新聞網高低溫試驗箱

關閉

關閉