2026-01-22 23:51:18
北京時間1月21日晚,在世界經濟論壇2026年年會上,月之暗面Kimi總裁張予彤稱Kimi僅用美頂尖實驗室約1%資源,就開發出兩款開源模型,實測多項測試達SOTA水平。月之暗面通過基礎研究創新換取極致效率,其效率優勢正轉化為社會生產力平權。此外,中國大模型行業競爭加速,月之暗面稱已完成5億美元C輪融資,短期不著急上市。
每經記者|李宇彤 每經編輯|余婷婷
在算力被普遍視為AI(人工智能)競賽“硬通貨”的今天,月之暗面卻給出了一個截然不同的競爭敘事。
北京時間1月21日晚,在瑞士達沃斯舉行的世界經濟論壇2026年年會上,月之暗面Kimi總裁張予彤分享了一個極具沖擊力的數據:Kimi僅使用美國頂尖實驗室約1%的資源,就開發出開源模型Kimi K2、Kimi K2 Thinking。
圖片來源:企業供圖
去年7月,月之暗面宣布正式發布Kimi K2模型,并同步開源;四個月后,Kimi K2 Thinking正式發布,被定義為“Kimi迄今能力最強的開源思考模型”。官方公布的實測顯示,該模型在“人類最后的考試”、自主網絡瀏覽能力、復雜信息收集推理等多項前沿基準測試中,達到了SOTA(當前最優)水平。
在全球AI賽道中,這一系列動作為世界提供了一種來自中國、以效率為核心的發展范本。在Kimi持續突破技術邊界的同時,國內AI獨角獸們猛踩油門,大廠的重資押注也使戰況不斷升級。在效率與場景化的驅動下,智能技術正加速邁向平權與普適的新階段。
1%資源背后的效率革命
去年K2 Thinking上線時,外界對其性能表現高度關注,而同步成為焦點的還有其背后的成本效率。去年11月,月之暗面創始人Kimi楊植麟曾在一場線上問答中透露,外界廣為流傳的K2模型訓練成本“460萬美元”并非官方數字,他強調真正的訓練成本很難準確量化。
這場問答中,聯合創始人吳育昕還透露,K2 Thinking是在配備了InfiniBand的H800 GPU集群上完成訓練的,盡管算力規模不占優勢,但團隊“把每張顯卡的性能都壓榨到了極致”。
“從創業第一天起我們就清醒地意識到,中國初創公司沒有隨意堆砌算力的條件?!睆堄柰诒敬握搲咸寡?。正是這種資源約束,迫使團隊轉向通過大量的基礎研究創新來換取極致效率。
她透露,Kimi投入大量精力將工程化思維引入研究環節,以確保算法創新能穩定應用于生產系統。例如,Kimi是全球首個在大型語言模型訓練中跑通Muon優化器的公司,其自研的線性注意力機制(Kimi Linear)也在處理速度上顯著超越了傳統系統。
這種效率優勢正在轉化為社會層面的生產力平權?!癆I讓專業技能平權化,釋放了每個人的個體創造力?!睆堄柰Q。
此外,張予彤還進一步總結了中國AI產業實現這種效率超越的三大底層驅動力。首先是規?;袌龅馁x能,中國龐大的制造業與零售業提供了海量數據與復雜業務邏輯結合的獨特場景,使技術能在真實生產環節中高效迭代;其次是中國社會對新技術的包容與開放態度,從新能源汽車到自動駕駛的發展歷程表明,用戶與企業對提升生產力的工具抱有極高的接納意愿;最后,中國“基建先行”的思維模式以及在電力、數據中心等方面的持續投入,有效降低了能源獲取成本,為技術創新提供了穩固支撐。
隨著AI推理成本在過去一年中急劇下降,張予彤判斷“智能”正成為新的通用語言,軟件將走向“無形化”。
她表示,未來人類無需通過復雜界面操作,只需以自然語言經由Agent(智能體)調用功能即可?!败浖粫?,但它將變得隨手可得且‘可丟棄’?!彼A測,未來的代碼將通過“氛圍編程”(vibe coding),只要意圖清晰,AI就能即時編寫出個性化工具交付結果。
大模型行業加速競跑
隨著AI的成本降低和技術的不斷演進,過去一年來,中國大模型行業競爭正在加速。
2026年1月初,AI大模型企業智譜(HK.02513)與MiniMax(HK.00100)先后在香港聯合交易所上市,分別被稱為“全球大模型第一股”和“最快上市AI公司”。
而月之暗面也在2025年末由創始人楊植麟通過內部信確認,公司完成了5億美元C輪融資且大幅超募,當前現金持有量超過100億元。盡管行業上市潮涌動,月之暗面表示短期不著急上市,也不以上市為目的。楊植麟明確,C輪融資資金將用于“更加激進地擴增顯卡”,加速K3模型的訓練和研發。另外,部分資金也將用于2026年的激勵計劃和期權回購計劃。
值得注意的是,據《科創板日報》日前報道,月之暗面正推進新一輪融資,其投前估值已升至約48億美元(約合人民幣335億元)。若此輪融資順利完成,公司估值將再度刷新國內大模型初創企業的融資紀錄。報道還引用一名知情人士消息稱,月之暗面已向部分潛在投資者表示,公司目標是在2026年下半年啟動IPO進程。
對此,《每日經濟新聞》記者向月之暗面方面求證,但截至發稿其未對上述消息做出回應。
而對于Kimi下一代模型,張予彤在論壇問答環節被問及今年是否會出現新的“中國AI時刻”時,她笑著回應:“我們很快就會發布一個新模型。”據楊植麟此前透露,下一代K3模型可能會使用其最新的實驗性架構KDA(Kimi Delta Attention,一種線性注意力模塊)的相關思路。當時楊植麟強調,“我們希望在K3中實現重大的架構革新,并開拓出全新的能力?!?/p>
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP