国产精品国产三级农村av,亚洲精品久久久久久久久久,久久精品欧美一区二区三区不卡,精品久久www,精品久久久久久一区二区,国产精品一区在线免费观看,超碰色偷偷

每日經濟新聞
頭條

每經網首頁 > 頭條 > 正文

何小鵬立“賭約”:明年8月底前達到特斯拉FSD效果!理想高管回應宇樹王興興質疑,多家車企押注的VLA,靠譜嗎?

每日經濟新聞 2025-12-13 14:25:43

每經記者|孫磊    每經編輯|段煉 裴健如    

12月11日,小鵬汽車董事長何小鵬發(fā)文稱,小鵬汽車的VLA 2.0(Vision-Language-Action,視覺語言動作模型)將在下個季度發(fā)布,“因為是第一個版本,所以壓力很大”。

CFF20LXzkOycArQibKcIibjFdDUhSNQzEtDmNJ2rz0icOXOd0rHl5rFMMuMVkhTaAXmrrYT61ibZlCOvaN6nsy13zA.jpg

圖片來源:何小鵬微博

此外,何小鵬還與公司自動駕駛團隊立下特別“賭約”:若2026年8月30日前,小鵬VLA系統(tǒng)在國內達到特斯拉FSD V14.2版本在硅谷的整體效果,他將在硅谷籌建特色中國風味食堂。反之,自動駕駛負責人需在金門大橋完成裸跑挑戰(zhàn)。

CFF20LXzkOycArQibKcIibjFdDUhSNQzEtibTx8jUXNKlNabmWn3uD0gdsTfLuQibMTes3VFW9Vdhial8TY124lseJA.jpg

就在前一天,理想汽車自動駕駛研發(fā)高級副總裁郎咸朋在社交平臺發(fā)布長文,回應宇樹科技創(chuàng)始人王興興此前對VLA模型的質疑。

“我跟王興興觀點最不一樣的地方在于,他認為模型架構更重要,但我認為模型的關鍵是要與整個具身智能系統(tǒng)適配。在此基礎上,數(shù)據是起決定意義的。”郎咸朋認為,“VLA就是自動駕駛最好的模型方案。”

CFF20LXzkOycArQibKcIibjFdDUhSNQzEtiaFuZic5FFK7xKbibGvuC3D3duRnNHDJvsaumDWLn7jaosythBF4LTyXA.jpg

近幾年,輔助駕駛行業(yè)經歷了多次“技術底座”的范式遷移——從企業(yè)普遍把激光雷達+高精地圖奉為“黃金組合”,到引入BEV(鳥瞰圖)+Transformer擺脫高精度地圖,再到端到端將輔助駕駛帶入AI時代,企業(yè)普遍按照這個路徑來推進輔助駕駛功能。

但進入2025年,行業(yè)在輔助駕駛的發(fā)展方向上出現(xiàn)了VLA與世界模型的“分歧”,而理想與小鵬就是選擇VLA方案的代表。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

兩技術派別“各執(zhí)一詞”

據了解,VLA被業(yè)內視為端到端方案的“智能增強版”。其名稱中的V代表視覺感知(Vision),A代表動作執(zhí)行(Action),而中間的L則是大語言模型(Language Model)。V負責實時感知環(huán)境,A負責輸出具體控制指令,L則像“中臺”一樣,把感知信息轉譯為可供A執(zhí)行的規(guī)劃與決策。

清華大學車輛與運載學院助理研究員顏宏偉表示:“VLA是多模態(tài)大模型驅動的智能體架構,其核心突破在于引入思維鏈,通過語言模型實現(xiàn)對環(huán)境理解與決策推理的可解釋性?!?/span>

“VLA模型融合了語言模型,具備強大的思維鏈能力,能擺脫傳統(tǒng)端到端模型的黑盒難題,并將信息串聯(lián)、分析,從而推理出因果關系。此外,它天然集成海量知識庫,泛化能力更強,能夠更好地適應復雜多變的真實道路環(huán)境?!痹謫⑿蠧EO周光認為。

不過,王興興在今年8月的一次演講中則表示:“我個人對VLA模型還是保持比較懷疑的態(tài)度?!痹谒磥?/span>,VLA模型是一個相對比較傻瓜式的架構,在和真實世界交互時,它的數(shù)據質量、能采集的數(shù)據是不太夠用的。

郎咸朋則認為,空談架構不如看療效。在自動駕駛領域,脫離了海量真實數(shù)據談模型架構都是空中樓閣,“我們之所以堅持VLA,是因為我們擁有數(shù)百萬輛車構建的數(shù)據閉環(huán),這讓我們能在當前算力下,把駕駛水平做到接近人類”。

CFF20LXzkOycArQibKcIibjFdDUhSNQzEtAd6qZUDQKibpVdXibKMMpNgTiaibKdoRY92Jicy7uDmatnq2icKn7bmdODrA.jpg圖片來源:理想汽車官網

郎咸朋稱,要想做好自動駕駛,必須先把自動駕駛當作完整的具身智能系統(tǒng)對待,每一部分在研發(fā)過程中要相互配合才能將價值發(fā)揮出來。此外,他還認為,模型的關鍵是要與整個具身智能系統(tǒng)適配,在此基礎上,數(shù)據是起決定意義的。在機器人領域獲取數(shù)據相對困難,但在自動駕駛領域,特別是建立起數(shù)據閉環(huán)能力的車企來說并不是大問題。

盡管郎咸朋表明了機器人領域與汽車領域有別,車企搭建數(shù)據閉環(huán)并非難事,仍有一些汽車背景的公司并未踏上VLA這條路徑。比如,華為智能汽車解決方案BU CEO靳玉志就表示:“我們不會走向VLA的路徑。這樣的路徑看似取巧,其實并不是走向真正自動駕駛的路徑?!?/span>

“華為更看重WA(世界行為模型),也就是World Action,中間省掉Language這個環(huán)節(jié)……直接通過Vision這樣的信息輸入控車,而不是把各種各樣的信息轉成語言,再通過語言大模型來控制車。”靳玉志進一步解釋稱,華為乾崑自研的WEWA架構包含云端的世界引擎(WE)與車端的世界行為模型(WA)。其中,WE負責海量數(shù)據訓練與場景生成,WA則實現(xiàn)車端的實時環(huán)境推理與擬人化決策。

據悉,“世界模型”源自人類對環(huán)境的認知機制,指的是AI系統(tǒng)通過感知數(shù)據構建一個對物理世界的內部模擬,從而具備預測、推理和生成合理行為鏈的能力。在輔助駕駛中,它不再只是“看見”世界,而是理解世界,預測未來可能發(fā)生的情況,并提前做出決策。例如,它不僅能識別前方有一輛自行車,還能預測它是否會突然變道,從而提前減速或避讓。

除華為外,蔚來、商湯等企業(yè)也都在此技術路線上進行布局。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

VLA與世界模型未來有望深度融合

需要注意的是,盡管不同企業(yè)對于VLA和世界模型兩種技術“各執(zhí)一詞”,但兩者并不矛盾。

國海證券在研報中表示:“VLA與世界模型在技術上并非同級或對立關系。我們將發(fā)展路徑分為兩派,實質上是產業(yè)玩家在實現(xiàn)端到端能力之后,在能力優(yōu)化側重點上出現(xiàn)了分化。”

“雙方技術融合趨勢明顯,雙方均在向對方領域滲透。例如,VLA 引入強化學習與仿真優(yōu)化動作生成?!眹WC券表示。

理想汽車董事長李想在去年底的直播中也提到,VLA可以拆解為預訓練、后訓練和強化學習三個層面。強化學習中最重要的一步就是在世界模型里閉環(huán)學習,引入舒適度、碰撞、交通規(guī)則等規(guī)則來打磨、反饋,讓VLA比人類開得更好。

“世界模型的高算力需求(訓練和推理都是)決定了它更適合在云端做數(shù)據生成和極度逼真的仿真測試和強化訓練,這也是理想目前正在做的?!崩上膛笳f。

小馬智行CTO樓天城則表示:“我了解大部分公司兩種技術都用,比如Waymo也用了谷歌Gemini大語言模型。世界模型和VLA模型不是一個維度的東西,而是交錯的。這兩個東西不矛盾、不沖突,機器人領域非常多。我認為想要做百輛無人車以上,世界模型最關鍵。對其他公司(而言),可能做VLA模型賣車最關鍵。大家選擇不同的路線是因為目標不同?!?/span>

值得一提的是,既向C端賣車,又計劃推出Robotaxi的小鵬,有將兩種技術融合的趨勢。在11月5日的2025 AI DAY小鵬科技日上,小鵬汽車正式發(fā)布了第二代VLA。第一代VLA的方案是V到L再到A,第二代VLA是V+L到A,也就是把L轉移到了輸入端。

CFF20LXzkOycArQibKcIibjFdDUhSNQzEtdp6UpGGoJpJPptE62Xur644icaWTcyUm9fwXGVCa9BGQj3ViaQyaT48A.jpg圖片來源:小鵬汽車官網

“第一代VLA模型中間涉及兩次語言轉換,這會帶來大量信息損耗,比如一段1200多字的文字描述也無法精準地‘翻譯’一個十幾秒的視頻,而以視覺為核心,則把模型看到的世界直接轉換成運動軌跡?!焙涡※i說。

11月7日的上海進博會上,小鵬汽車自動駕駛產品高級總監(jiān)袁婷婷分享了她對小鵬二代VLA架構的理解:“小鵬的二代VLA既是VLA模型,也是世界模型。”

在其展示的PPT中,世界模型是作為二代VLA的一個記錄器存在的:當V和L作出車輛運動軌跡和動作決策時,這個決策會被記錄到世界模型中;同時,與這個決策一同被記錄的,還有決策前的車輛狀態(tài),即V和L形成的感知信號。也就是說,小鵬二代VLA在用其VLA數(shù)據訓練世界模型。

在小米汽車主任科學家陳龍看來:“一個管‘抽象思考’,一個管‘物理感知’,完全沒必要拉踩!VLA+WM的結合,才是通往更強通用具身智能?!?/span>

對于輔助駕駛底層技術的演進,國元證券方面認為,未來,VLA與世界模型的深度融合,有望成為高階智駕系統(tǒng)實現(xiàn)類人駕駛決策能力的關鍵拐點。

長安汽車智能駕駛高級總工程師則表示,在未來2至3年內,輔助駕駛的技術架構還將迎來1至2輪迭代,到2028年有望收斂至相對穩(wěn)定的狀態(tài)。

(聲明:文章內容和數(shù)據僅供參考,不構成投資建議。投資者據此操作,風險自擔。)

記者|孫磊

編輯|段煉?裴健如?杜波

校對|黃博文

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

|每日經濟新聞 ?nbdnews? 原創(chuàng)文章|

未經許可禁止轉載、摘編、復制及鏡像等使用

如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0