每日經濟新聞 2026-01-01 20:09:50
1月1日消息,DeepSeek發布了一篇新論文,提出了一種名為mHC(流形約束超連接)的新架構。該研究旨在解決傳統超連接在大規模模型訓練中的不穩定性問題,同時保持其顯著的性能增益。這篇論文的第一作者有三位:Zhenda Xie(解振達)、Yixuan Wei(韋毅軒)、Huanqi Cao。值得注意的是,DeepSeek創始人梁文鋒也在作者名單中。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP