2026-01-06 07:09:28
英偉達宣布開源首個推理VLA模型Alpamayo 1,加速安全自動駕駛技術(shù)開發(fā)。該模型通過類人思維處理復雜駕駛場景,解決長尾問題。1月5日,CEO黃仁勛在CES發(fā)布Alpamayo平臺,首款搭載英偉達技術(shù)的汽車將于第一季度在美國上路。此外,英偉達還發(fā)布配套工具和數(shù)據(jù)集,構(gòu)建完整開發(fā)生態(tài)系統(tǒng),并宣布新款Rubin數(shù)據(jù)中心產(chǎn)品等消息。
每經(jīng)編輯|畢陸名
英偉達(NVDA,股價:188.120美元;總市值:4.57萬億美元)在無人駕駛領(lǐng)域邁出關(guān)鍵一步,宣布開源其首個推理VLA(視覺-語言-動作)模型Alpamayo 1,這一舉措旨在加速安全的自動駕駛技術(shù)開發(fā)。該模型通過類人思維方式處理復雜駕駛場景,為解決自動駕駛長尾問題提供新路徑。
當?shù)貢r間1月5日,美東時間1月5日周一,英偉達CEO黃仁勛在拉斯維加斯舉行的CES展會上發(fā)布了Alpamayo平臺,使汽車能夠在真實世界中進行"推理"。黃仁勛表示,首款搭載英偉達技術(shù)的汽車將于第一季度在美國上路。
圖片來源:視頻截圖
英偉達免費開放Alpamayo模型,允許潛在用戶自行對模型進行重新訓練。該模型旨在打造能在意外情況下"思考"解決方案的車輛,例如交通信號燈故障等場景。車載計算機將分析來自攝像頭和其他傳感器的輸入,將其分解為步驟并提出解決方案。
英偉達此次發(fā)布的Alpamayo家族整合了三大基礎(chǔ)支柱:開源模型、仿真框架和數(shù)據(jù)集,構(gòu)建了一個完整的開放生態(tài)系統(tǒng)供任何汽車開發(fā)者或研究團隊使用。
Alpamayo 1是業(yè)界首個為自動駕駛研究社區(qū)設(shè)計的思維鏈推理VLA模型,現(xiàn)已在Hugging Face平臺發(fā)布。該模型采用100億參數(shù)架構(gòu),使用視頻輸入生成軌跡及推理軌跡,展示每個決策背后的邏輯。開發(fā)者可以將Alpamayo 1改編為更小的運行時模型用于車輛開發(fā),或?qū)⑵渥鳛樽詣玉{駛開發(fā)工具的基礎(chǔ),例如基于推理的評估器和自動標注系統(tǒng)。
黃仁勛表示:“物理AI的ChatGPT時刻已到來——機器開始理解、推理并在真實世界中行動。無人出租車是首批受益者。Alpamayo為自動駕駛汽車帶來推理能力,使其能夠思考罕見場景,在復雜環(huán)境中安全駕駛,并解釋其駕駛決策——這是安全、可擴展自動駕駛的基礎(chǔ)。”
英偉達強調(diào),Alpamayo模型并非直接在車內(nèi)運行,而是作為大規(guī)模教師模型,供開發(fā)者微調(diào)并提取到其完整自動駕駛技術(shù)棧的骨干中。未來該家族的模型將具有更大的參數(shù)規(guī)模、更詳細的推理能力、更多的輸入輸出靈活性以及商業(yè)使用選項。
推理VLA是一種統(tǒng)一的AI模型,將視覺感知、語言理解和動作生成與逐步推理集成在一起。
這類模型整合了明確的AI推理功能,在傳統(tǒng)視覺-語言-動作模型的基礎(chǔ)上構(gòu)建。AI推理是AI逐步解決復雜問題并生成類似于人類思維過程推理痕跡的能力。這些系統(tǒng)對一系列互聯(lián)網(wǎng)規(guī)模的任務(wù)進行預訓練,包括語言生成和視覺連接,以發(fā)展通用知識和感知基礎(chǔ)。
與將視覺輸入直接映射到動作的標準VLA模型不同,推理VLA模型將復雜的任務(wù)分解成可管理的子問題,并以可解釋的形式闡明其推理過程。這使模型能夠更準確地解決問題或執(zhí)行任務(wù),還能對模型正在進行的操作提供一定程度的反思。
構(gòu)建推理VLA模型需要三種基本AI功能:視覺感知、語言理解以及動作和決策制定。視覺感知處理來自攝像頭、毫米波雷達或激光雷達等感知傳感器的實時數(shù)據(jù);語言理解通過自然語言處理解釋命令、上下文提示和對話輸入;動作和決策制定則使用融合的感官和語言信息來計劃、選擇和安全地執(zhí)行任務(wù),同時生成可解釋的推理痕跡。
在自動駕駛場景中,推理VLA可以對交通狀況進行逐步推理。例如,接近一個十字路口時,系統(tǒng)可能會進行如此推理:“我看到一個停止標志,左邊有車輛駛來,還有行人正在過馬路。我應該減速,完全停下來,等待行人通過人行橫道,安全時再繼續(xù)前進。”
除Alpamayo 1模型外,英偉達還發(fā)布了配套的仿真工具和數(shù)據(jù)集,構(gòu)建完整的開發(fā)生態(tài)系統(tǒng)。
此外,英偉達CEO黃仁勛表示,AI的復雜性推高需求。新款Vera Rubin設(shè)計已經(jīng)全面量產(chǎn)。宣布面向Vera Rubin電腦的六款新芯片。新款VeraCPU擁有88 Arm定制核。公司現(xiàn)在是最大的網(wǎng)絡(luò)公司。
英偉達計劃2027年測試一款無人駕駛出租車服務(wù)。
黃仁勛表示,英偉達公司備受期待的新款Rubin數(shù)據(jù)中心產(chǎn)品將于今年發(fā)布,客戶很快就能試用該技術(shù),這將有助于加速人工智能的發(fā)展。相比前代Blackwell架構(gòu),Rubin加速器在AI訓練性能上提升3.5倍,運行(推理)性能提升5倍,并配備擁有88個核心的新款中央處理器(CPU)。英偉達表示,基于Rubin的系統(tǒng)運行成本將低于Blackwell版本,因為它們可以用更少的組件實現(xiàn)相同的效果。微軟公司和其他大型云服務(wù)商將成為首批部署這一新硬件的客戶。
英偉達宣布,作為全棧NVIDIA BlueField平臺的一部分,NVIDIA BlueField?-4數(shù)據(jù)處理器將為推理上下文記憶存儲平臺提供動力。賦能推理上下文記憶存儲平臺(Inference Context Memory Storage Platform)。這是一種專為千億級參數(shù)規(guī)模(Gigascale)推理設(shè)計的新型AI原生存儲基礎(chǔ)設(shè)施,旨在加速并擴展代理式AI(Agentic AI)。
每日經(jīng)濟新聞綜合公開信息
封面圖片來源:視頻截圖
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP