国产精品国产三级农村av,亚洲精品久久久久久久久久,久久精品欧美一区二区三区不卡,精品久久www,精品久久久久久一区二区,国产精品一区在线免费观看,超碰色偷偷

每日經濟新聞
今日報紙

每經網首頁 > 今日報紙 > 正文

號稱“AI打工人”的OpenClaw,值得用嗎?

每日經濟新聞 2026-02-25 19:05:15

每經記者|岳楚鵬    每經編輯|王嘉琦 蘭素英    

最近,號稱能“接管電腦、解放雙手”的AI Agent(AI智能體)工具——OpenClaw,在技術圈火得一塌糊涂。

OpenClaw被吹捧為“AI打工人”,似乎只要下個指令,它就能替你寫文章、發郵件甚至買咖啡。但事實真的如此嗎?它是生產力神器,還是僅供技術極客嘗鮮的“玩具”?

近日,《每日經濟新聞》記者聯合每經科技開發人員,展開了一場深度實測。

《每日經濟新聞》記者和每經科技開發人員將OpenClaw分別接入千問Qwen3-Max、月之暗面Kimi-K2.5、MiniMaxM2.1、MiniMax-M2.5和智譜GLM-4.7五款國產大模型,以及OpenAI的GPT-5-mini,要求它們完成本地文件檢索、網絡資料搜索、稿件撰寫、發送郵件等步驟,試圖通過這些測試揭開 OpenClaw的真實能力。

視覺中國圖

實測結果顯示,部分模型表現不佳,尤其是在需要操控瀏覽器的環節,如網絡搜索和發送郵件,大多失敗。有行業專家直言,當前的OpenClaw不僅難用、費錢,對于信息安全等,更有可能是一場“噩夢”。

實測對比:GPT-5、MiniMax、智譜完成任務 另兩款“行動力”不足

OpenClaw本身并非大模型,它更像一個“指揮官”,負責接收用戶指令、調用工具和組織流程,并將指令理解與具體工作交由其接入的外部大模型來完成。因此,接入的大模型的能力、穩定性與表達方式,決定了任務的最終成敗。

為了更貼近《每日經濟新聞》記者的真實工作場景,測試人員設定了一項綜合性測試任務:讓接入不同大模型的OpenClaw,在電腦中找到對“電車教父”Andy Palmer的采訪速記稿,要求它總結文稿內容,并結合搜索到的網絡資料,撰寫一篇專訪新聞稿,最后將新聞稿通過郵件發送到指定郵箱。

這一任務涵蓋了指令理解、操控電腦進行本地文件檢索、操控瀏覽器進行網絡信息搜索、信息整合和文章寫作以及應用操控等多個維度。

在首次測試中,各模型的表現分化顯著。以下為首次測試結果:

● OpenClaw+千問Qwen3Max:首 先 測 試 的 是 千 問Qwen3-Max模型。該模型在本地文件檢索環節便陷入困境。即便測試人員明確提示文件在電腦中的位置,Qwen3-Max在經過約5分鐘檢索后,仍無法準確定位。在后續單獨測試其發送郵件任務時,Qwen3-Max也未能成功執行,只是不斷重復指令,但無實際動作。

● OpenClaw+月之暗面Kimi-K2.5:Kimi-K2.5的表現稍好,它在5分鐘內成功檢索到了文件,并完成內容總結。但在執行網絡搜索并補充行業最新熱點資訊時,因觸發了“429錯誤”(通常指請求過于頻繁),導致未能完成信息搜索工作。在郵件發送環節,Kimi-K2.5無法成功操控瀏覽器向指定郵箱發送郵件。

● OpenClaw + MiniMaxM2.1:MiniMax-M2.1在文件檢索、網絡搜索資料和寫作方面沒有遇到明顯阻礙。郵件發送環節,MiniMax-M2.1在瀏覽器操控上遇到了困難,但并未就此卡住,而是主動給出了一個可行的解決方案。測試人員根據其提示手動操作后,成功解決了問題,使其最終能夠發送郵件。不過,MiniMaxM2.1發送的郵件只包含了稿件的“關鍵引語”,未附上完整的稿件正文。

● OpenClaw + MiniMaxM2.5:雖然都是MiniMax旗下模型,2月12日發布的MiniMaxM2.5,表現比MiniMax-M2.1更好,不僅順利完成文件檢索、網絡搜索資料和寫作,在發送郵件環節也無需人工介入。

● OpenClaw +智譜GLM-4.7:由于OpenClaw暫未接入智譜于2月12日發布的最新模型GLM-5,所以,本次測試選擇了智譜GLM-4.7。結果顯示,在發送郵件環節,智譜GLM-4.7會在瀏覽器中輸入錯誤的郵箱網址,導致網頁訪問失敗,需要人工提醒更正。除此之外,智譜GLM-4.7在其他環節處理速度較快。

● OpenClaw + GPT- 5mini:GPT-5-mini的表現較為穩定和流暢。從文件檢索、內容總結、網絡搜索、資料補充到郵件發送,全流程幾乎無需人工干預和額外提示,僅在個別時候出現了網絡連接不穩定的情況。

為了保證測試的嚴謹性,測試人員對整個流程進行了兩次復測。

以下為第二輪測試結果:

● OpenClaw+月之暗面Kimi-K2.5:成功檢索并讀取本地文件,補充網絡搜索資料,但在郵件發送環節依舊失敗。其報告的錯誤顯示,在讀取郵箱網絡代碼、獲取輸入框節點時出現問題。

● OpenClaw+千問Qwen3Max:成功讀取文件并補充網絡資料,但在郵件發送環節出現明顯卡頓,未能成功。

● OpenClaw + MiniMaxM2.1/2.5:完成任務全部流程。

● OpenClaw+智譜GLM-4.7:完成任務全部流程。

● OpenClaw + GPT- 5mini:完成任務全部流程。

以下為第三輪測試結果:

● OpenClaw+月之暗面Kimi-K2.5:成功檢索并讀取本地文件,在網絡搜索資料環節出現問題(出現讀取網頁內容錯誤,錯誤的網站訪問路徑,理解不了瀏覽器控制臺指令等),在郵件發送環節依舊失敗。

● OpenClaw+千問Qwen3Max:成功讀取文件,但無法操控瀏覽器搜索網絡資料,在郵件發送環節依舊失敗。

● OpenClaw + MiniMaxM2.1/2.5:完成任務全部流程。

● OpenClaw+智譜GLM-4.7:完成任務全部流程。

● OpenClaw + GPT- 5mini:完成任務全部流程。

業內視角:OpenClaw能力上限取決于大模型 尚未成為合格生產力工具

日前,《每日經濟新聞》記者對一些業內人士和資深用戶的采訪情況,也一定程度上印證上述測試結論。

一名使用OpenClaw來輔助運營網店,設計海報和優惠券等宣傳物料的程序員告訴《每日經濟新聞》記者,其平時都是接入OpenAI的Codex-5.3和Gemini3 Pro模型,效果比國產大模型好很多。

多位業內人士和資深用戶指出,OpenClaw更像一個“任務框架”,其最終表現非常依賴所接入大模型的能力,就像一個指令清晰但能力有限的指揮官,手下士兵(即大模型)的強弱,直接決定了戰役的勝敗。

非凡產研研究負責人宦家臣向《每日經濟新聞》記者表示,“模型對OpenClaw的影響,其實取決于任務的復雜程度。國際頭部大模型上限更高,但是如果都是普通任務,國內的智譜GLM-4.7、Kimi-K2.5都很不錯,畢竟Claude太貴了,錢包受不了。”

盡管部分大模型在測試中展現了執行復雜任務的潛力,但OpenClaw離成為一款合格的生產力工具,似乎還有不小的距離。

“我感覺,目前版本的OpenClaw并不是一個合格的生產力工具?!痹诮邮堋睹咳战洕侣劇酚浾卟稍L時,前小米OS AI產品專家、現出海AI應用公司ExcelMaster.ai創始人張和直言,OpenClaw在一定程度上是此前爆火的程序員工具——Anthropic旗下Claude Code的“套殼”,雖然通過聊天界面和內置技能(Skill)做了更好的封裝,降低了交互門檻,但在核心能力上并未超越。

“我沒找到太多OpenClaw能做,而Claude Code做不了的事情。并且,OpenClaw查詢資料的水準,也沒有Claude Code好?!睆埡瓦M一步表示。

“等大模型能力再躍升一點,OpenClaw就會越來越好,就會越來越普及。哪怕它什么都不做,就等著更新的大模型出來……OpenClaw的門檻就會降低?!睆埡蛷娬{,OpenClaw的進步與普及,本質上是在等待底層大模型技術的突破。

Akamai云和AI產品經理張璐博士也表達了相似的觀點。在張璐博士看來,OpenClaw若要真正用于生產,還必須經過二次開發和微調,因為目前版本還“有點不成熟,很多時候會卡頓”。

用戶體驗:高門檻、高成本和高風險勸退普通用戶

《每日經濟新聞》記者還了解到,除了對大模型能力的依賴,技術門檻、使用成本和安全風險也讓OpenClaw目前難以走向普通用戶。

首先是較高的部署和使用門檻。目前,OpenClaw并未提供類似“一鍵安裝”的簡化部署方案,用戶需要在電腦上通過命令行操作,完成本地配置、依賴管理以及權限設置。

每經科技開發人員表示,整個過程對使用者的技術背景有一定要求,至少需要具備基本的開發經驗,這無疑勸退了絕大多數非技術人員。雖然阿里云、騰訊云、亞馬遜云等云廠商都提供了OpenClaw云端部署服務,并聲稱可以在其配置好的服務器上便捷部署OpenClaw,但在云端部署的OpenClaw,并不能提供操控用戶本地電腦的能力。

高昂的使用成本是另一個現實問題。由于OpenClaw在執行任務時需要頻繁調用大模型,token(令牌/詞元,是計算機領域的數字標識符)消耗量巨大,堪稱“token燃燒器”。

有用戶向《每日經濟新聞》記者表示,其使用智譜GLM-4.7模型,僅僅交互了20多次,就花費了200元。

張璐博士也提到,其在使用DeepSeek(深度求索)模型時,一天就“燒掉”幾十元。如果換成能力更強的模型,賬單將更驚人,“一天幾百元就出去了”。

高成本使得許多用戶只能選擇接入免費或更便宜的大模型,但這又會影響OpenClaw的實際表現。  有用戶向《每日經濟新聞》記者反映,其因成本問題選擇了Qwen-8B模型,但OpenClaw總是只會回答問題,不會執行操作。

《每日經濟新聞》記者了解到,比高門檻和高成本更令人擔憂的是其內在的安全風險。OpenClaw的定位是“做事”而非“聊天”,這意味著它必須獲得很高的系統權限,才能操控本地文件和應用。

思科AI威脅研究與安全團隊主管Amy Chang直言,從安全角度來看,OpenClaw“是一場噩夢”,它可以在用戶的計算機上任意運行shell命令、讀寫文件和執行腳本。這種高級權限一旦被錯誤配置或被惡意指令利用,后果不堪設想。

網絡安全公司Dvuln的創始人Jamieson O'Reilly也證實存在這種風險。Jamieson O'Reilly發現OpenClaw存在漏洞,攻擊者可借此獲取用戶數月內的私人消息、賬戶憑證、API密鑰等敏感信息。更可怕的是,用戶為了方便AI執行任務而存儲的銀行賬戶、加密貨幣錢包API等信息,都可能以明文形式保存在本地文件中,一旦被黑客入侵,“一秒就可以搬空用戶”。

OpenClaw的開發者Peter Steinberger也坦言,這只是一個免費的開源業余項目,需要用戶進行仔細的配置才能確保安全。Peter Steinberger明確表示:“它并不適合非技術用戶。”

(每經科技駱方平對本文亦有貢獻)

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

1

0