要聞

直擊MWC 2026：華為超節點算力集群首次面向海外市場亮相

2026-03-03 19:31:01

當地時間3月2日，MWC 2026期間華為推出多個超節點產品及解決方案，首次向海外展示超節點計算集群。隨著AI發展，算力需求大增，傳統計算架構難滿足低時延要求。華為通過多芯片互聯打造超節點，推出昇騰384超節點等。此次展示的Atlas 950 SuperPoD等基于靈衢協議，還全面開源開放CANN異構計算架構，支持開發者加速自主創新。

每經記者｜王晶每經編輯｜董興生

當地時間3月2日，在2026年世界移動通信大會（以下簡稱“MWC 2026”）期間，華為推出了智算超節點Atlas 950 SuperPoD、通算超節點TaiShan 950 SuperPoD等多個型號超節點產品及解決方案。這也是華為首次面向海外市場展示超節點算力集群。

圖片來源：每經記者王晶攝

當前，人工智能加速發展，每個月都在突破認知。智能體（Agentic AI）時代下，模型從僅限于LLM（大語言模型）走向全模態的原生融合，萬億級的模型參數和10萬億級的數據訓練成為標配，算力需求提升十倍到百倍。同時，模型支持的上下文序列長度從K級提升到M級，具備更長久的記憶能力，但對內存容量和帶寬的需求也提升了5至10倍。

隨著AI深入行業應用，實時性挑戰愈發凸顯。在金融風控場景，時延要求小于20毫秒，反欺詐場景的時延則要在10毫秒以下。智能體還需要更多任務協同和多輪次推理迭代，傳統的計算架構難以滿足低時延要求。

單一芯片的提升已經無法滿足AI的算力需求，必須依賴多芯片互聯、做大規模計算節點的方式來解決。

去年，華為發布了業界規模最大的超節點，即昇騰384超節點。華為將384顆昇騰AI芯片連接在一起組成集群，通過全對等高速互聯架構，基于系統工程方法，對計算、內存、通信的極致優化調度，可提供高達300PFLOPs的密集BF16算力，該性能表現接近英偉達GB200 NVL72系統的兩倍。

“由于美國制裁，我們不能產出最先進工藝制程的芯片，但我們基于過去30多年構筑的聯接技術能力，使得我們能夠做到萬卡級的超節點，經營萬卡級的超節點，做到在世界上算力最強。”去年9月，華為副董事長、輪值董事長徐直軍在華為全聯接大會上說。

當時，他罕見地披露了關于昇騰芯片、超節點、集群以及靈衢互聯協議在內的規劃以及未來的演進和目標，其中就包括此次在MWC 2026上亮相的Atlas 950 SuperPoD等產品。

所謂超節點，是指通過系統工程方法，將成千上萬顆芯片高效互聯，形成一個邏輯統一的超級計算機，從而實現整體算力的跨越式增長。超節點是華為在算力戰場上“以架構創新打破制程封鎖”的戰略支點，它不再依賴于單芯片性能的極限突破。

不過，要把這么多張“卡”連起來，對互聯技術構成了巨大挑戰。為此，華為開創了面向超節點的互聯協議“靈衢”，可以把更多計算資源連接到一起。但客觀來看，集群也面臨諸如能耗、占比面積大等問題，昇騰384超節點在超越英偉達NVL72的同時，功耗也達到后者的4.1倍，每FLOP（浮點運算）功耗高出2.5倍。

產品演進方面，2025年3月，華為推出基于靈衢1.0的Atlas 900超節點，滿配支持384卡，自交付以來已在互聯網、電信、制造等行業實現商用部署數百套。此后，在靈衢1.0基礎上進行功能與規模優化，形成靈衢2.0版本，此次華為展示的Atlas 950 SuperPoD便基于靈衢2.0演進。

華為計算產品線總裁張熙偉在會上表示，Atlas 950 SuperPoD智算超節點，以單柜64卡為基本單元，最大可支持8192張NPU卡高速互聯，為超大規模AI訓練與海量推理并發場景提供選擇；TaiShan 950 SuperPoD則是業界首款通算超節點，可以解決通算場景時延高、數據搬移開銷大、協同效率低的難題。

如果說硬件性能的突破是基礎，那么繁榮的軟件生態就是昇騰能否長期繁榮的關鍵，開源策略成為華為算力體系的另一組成部分。會上，華為方面表示，華為全面開源開放CANN異構計算架構，通過分層解耦，已經將算子庫、加速庫、圖計算、編程語言等軟件代碼全量開源，支持開發者按需使用，加速自主創新。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

上一篇文章

雙環科技：3月3日召開董事會會議

返回每經網首頁

下一篇文章

中國石化：受地緣政治等因素影響國際原油價格走勢存在諸多不確定性