2026-03-03 19:31:01
當地時間3月2日,MWC 2026期間華為推出多個超節點產品及解決方案,首次向海外展示超節點計算集群。隨著AI發展,算力需求大增,傳統計算架構難滿足低時延要求。華為通過多芯片互聯打造超節點,推出昇騰384超節點等。此次展示的Atlas 950 SuperPoD等基于靈衢協議,還全面開源開放CANN異構計算架構,支持開發者加速自主創新。
每經記者|王晶 每經編輯|董興生
當地時間3月2日,在2026年世界移動通信大會(以下簡稱“MWC 2026”)期間,華為推出了智算超節點Atlas 950 SuperPoD、通算超節點TaiShan 950 SuperPoD等多個型號超節點產品及解決方案。這也是華為首次面向海外市場展示超節點算力集群。

圖片來源:每經記者 王晶 攝
當前,人工智能加速發展,每個月都在突破認知。智能體(Agentic AI)時代下,模型從僅限于LLM(大語言模型)走向全模態的原生融合,萬億級的模型參數和10萬億級的數據訓練成為標配,算力需求提升十倍到百倍。同時,模型支持的上下文序列長度從K級提升到M級,具備更長久的記憶能力,但對內存容量和帶寬的需求也提升了5至10倍。
隨著AI深入行業應用,實時性挑戰愈發凸顯。在金融風控場景,時延要求小于20毫秒,反欺詐場景的時延則要在10毫秒以下。智能體還需要更多任務協同和多輪次推理迭代,傳統的計算架構難以滿足低時延要求。
單一芯片的提升已經無法滿足AI的算力需求,必須依賴多芯片互聯、做大規模計算節點的方式來解決。
去年,華為發布了業界規模最大的超節點,即昇騰384超節點。華為將384顆昇騰AI芯片連接在一起組成集群,通過全對等高速互聯架構,基于系統工程方法,對計算、內存、通信的極致優化調度,可提供高達300PFLOPs的密集BF16算力,該性能表現接近英偉達GB200 NVL72系統的兩倍。
“由于美國制裁,我們不能產出最先進工藝制程的芯片,但我們基于過去30多年構筑的聯接技術能力,使得我們能夠做到萬卡級的超節點,經營萬卡級的超節點,做到在世界上算力最強。”去年9月,華為副董事長、輪值董事長徐直軍在華為全聯接大會上說。
當時,他罕見地披露了關于昇騰芯片、超節點、集群以及靈衢互聯協議在內的規劃以及未來的演進和目標,其中就包括此次在MWC 2026上亮相的Atlas 950 SuperPoD等產品。
所謂超節點,是指通過系統工程方法,將成千上萬顆芯片高效互聯,形成一個邏輯統一的超級計算機,從而實現整體算力的跨越式增長。超節點是華為在算力戰場上“以架構創新打破制程封鎖”的戰略支點,它不再依賴于單芯片性能的極限突破。
不過,要把這么多張“卡”連起來,對互聯技術構成了巨大挑戰。為此,華為開創了面向超節點的互聯協議“靈衢”,可以把更多計算資源連接到一起。但客觀來看,集群也面臨諸如能耗、占比面積大等問題,昇騰384超節點在超越英偉達NVL72的同時,功耗也達到后者的4.1倍,每FLOP(浮點運算)功耗高出2.5倍。
產品演進方面,2025年3月,華為推出基于靈衢1.0的Atlas 900超節點,滿配支持384卡,自交付以來已在互聯網、電信、制造等行業實現商用部署數百套。此后,在靈衢1.0基礎上進行功能與規模優化,形成靈衢2.0版本,此次華為展示的Atlas 950 SuperPoD便基于靈衢2.0演進。
華為計算產品線總裁張熙偉在會上表示,Atlas 950 SuperPoD智算超節點,以單柜64卡為基本單元,最大可支持8192張NPU卡高速互聯,為超大規模AI訓練與海量推理并發場景提供選擇;TaiShan 950 SuperPoD則是業界首款通算超節點,可以解決通算場景時延高、數據搬移開銷大、協同效率低的難題。
如果說硬件性能的突破是基礎,那么繁榮的軟件生態就是昇騰能否長期繁榮的關鍵,開源策略成為華為算力體系的另一組成部分。會上,華為方面表示,華為全面開源開放CANN異構計算架構,通過分層解耦,已經將算子庫、加速庫、圖計算、編程語言等軟件代碼全量開源,支持開發者按需使用,加速自主創新。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP