<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      太瘋狂了!“龍蝦”紅透A股,OpenClaw連更兩日,32款養蝦大模型集結,創始人在線打假

      0
      分享至


      智東西
      作者 陳駿達
      編輯 心緣

      智東西3月9日報道,就在剛剛,OpenClaw發布了2025.3.8版本的更新,引入CLI備份能力、macOS遠程網關令牌配置、ACP溯源功能,并修復了飛書插件安裝后重復提示下載的問題,進一步優化了OpenClaw框架的安全性、提升了與外部服務的集成深度。


      ▲OpenClaw2026.3.8更新(圖源:X平臺)

      這是兩天內OpenClaw發布的第二次更新,就在昨天,OpenClaw一口氣推出300多條修復、27項變更和1項重大變更,OpenClaw官方更是發文稱:“我們不搞那種瑣碎的小版本發布?!?strong>言下之意就是:要搞就搞大的。


      ▲OpenClaw2026.3.7更新(圖源:X平臺)

      OpenClaw創始人Peter Steinberger還在3月7日順勢轉發了專用于評估大模型在OpenClaw智能體任務中表現的基準測試PinchBench,從32款模型評出最新養龍蝦大模型排行榜。

      其中排名前三的,有兩個都是國產模型,分別是MiniMax M2.1和Kimi K2.5。


      ▲Peter Steinberger轉發PinchBench(圖源:X平臺)

      英偉達創始人兼CEO黃仁勛在上周摩根士丹利TMT大會發出感嘆:“Linux花了30年才達到的成就,OpenClaw只用了3周?!?/strong>

      雖然黃仁勛的表述可能有些夸張,不過事實是,自今年1月以來,OpenClaw的熱度迅速攀升。截至今天下午18點,其GitHub星標數量已經達到27萬個,超過了知名開源項目Linux、React,排名全球第一。


      一系列圍繞OpenClaw的活動、討論乃至“搞錢機會”多點開花。上周,在深圳,騰訊大廈門口免費安裝OpenClaw的活動排起長隊,有騰訊員工評價這一盛況堪比春節發紅包,甚至連馬化騰都在朋友圈感嘆:“沒有想到會這么火”。


      ▲馬化騰感嘆OpenClaw熱度(圖源:雷鋒網)

      在美國紐約,一場以OpenClaw為主題的ClawCon大會吸引了超1300人,從大學生、游戲開發者到硅谷程序員都紛紛報名,遠超會場本身容量,600多人最后被拒之門外。一位參會者稱:“沒有人關心你本來是做什么的,大家只關心你在用OpenClaw Agent做什么?


      ▲ClawCon大會盛況(圖源:The Verge)

      腦子活絡的網友已經靠OpenClaw賺到第一桶金了,以OpenClaw上門安裝為關鍵詞搜索,能找到不少帖子,一次上門安裝服務的價格在500元左右。有從業者甚至宣稱,短短數日內憑借這門手藝賺了26萬元,不過這一數據的出處已經無從考證。


      ▲MiniMax股價逼近1000港元(圖源:騰訊自選股)

      爆火之中摻雜著混亂。

      今年2月,工業和信息化部網絡安全威脅和漏洞信息共享平臺監測發現OpenClaw開源AI Agent部分實例在默認或不當配置情況下存在較高安全風險,極易引發網絡攻擊、信息泄露等安全問題。相關部門建議,在部署和應用OpenClaw時,應充分核查公網暴露情況、權限配置及憑證管理情況,關閉不必要的公網訪問。

      OpenClaw創始人Peter Steinberger昨天在X上親自下場手撕國內社交平臺上的“李鬼”賬號,明確強調:OpenClaw目前在微博、B站沒有任何官方號。


      ▲Peter Steinberger在打假(圖源:X平臺)

      OpenClaw甚至帶動了A股和港股市場中“龍蝦概念股”的瘋漲,A股優刻得、博睿數據等漲停,港股MiniMax收盤漲23.77%,總市值突破3100億港元,智譜、云知聲等相關股跟漲。


      一、OpenClaw框架大更新,安全與上下文成重點

      OpenClaw項目在3月8日進行的一次重磅更新,發布了300多條修復、27項變更和1項重大變更。貢獻者列表顯示,一共有194人參與,這對于一個開源項目來說已經很多了。


      OpenClaw在X平臺的官方賬號,給這次更新劃了重點:支持OpenAI、谷歌的新模型、優化各大通訊平臺的兼容性問題、新增SecretRef安全驗證以及新增可插拔上下文引擎等等,直指OpenClaw在日常使用中出現的多種痛點,許多更新項目就是由用戶自己開發的,顯示出這一社區的活躍度。

      這次更新解決了OpenClaw原版框架中無法自主選擇記憶管理插件的痛點,還優化了客戶端與Agent之間的通信協議的穩定性,并提供持久性的Discord頻道與Telegram的綁定存儲。

      中國開發者也貢獻了不少更新。OpenClaw在國內常常與飛書一起搭配使用,但在與飛書生態的結合上還做得不是很好。國內開發者@liuxiaopai-ai、@rexl2018、@kcinzgg和@aerelune等就提交多個更新,優化了OpenClaw在飛書內部進行命令識別、消息交互、身份識別優化時的效果。


      對于飽受詬病的安全性問題,OpenClaw項目也進行了查缺補漏。最重大的變更是,如今網關認證不再允許模棱兩可的配置——當同時設置了認證令牌和密碼時,系統會強制要求明確指定認證模式,而不是讓系統猜測或允許兩者共存,從根源上杜絕了因配置歧義導致的安全漏洞或服務啟動失敗。

      OpenClaw的網關與模型驗證現已支持SecretRef,這允許用戶以引用方式管理認證令牌,而不再需要將明文密鑰直接寫在配置文件中。此外,系統為了防止信息意外外泄,移除了/status/models等用戶界面中的權限密鑰片段,并增加了在CLI輸入密碼時的硬化處理,避免密碼通過進程列表泄露。

      不過,除了底層框架的優化之外,用OpenClaw搭建Agent也需要一個智慧的大腦,PinchBench的推出,正好為廣大用戶提供了一個標準。

      二、Kilo Code推出“龍蝦基準測試”,中國模型性價比突出

      PinchBench目前包含23項不同類別的任務,比如股票價格研究、文檔摘要、文件結構創建、多步復雜工作流等,為的是全面評估模型在OpenClaw框架下完成編程、辦公、創作等多類型任務的能力。

      目前,已經有超30款模型參與了這一基準測試。值得一提的是,中國模型展現出明顯的性能與價格優勢。

      在正確率榜單的前10名中,來自谷歌的Gemini 3 Flash Preview拿下第一,而MiniMax M2.1和Kimi K2.5分列第二、第三,接下來是來自谷歌、OpenAI和Anthropic的多款模型,阿里的Qwen3 Coder Next位列第十。


      在性價比方面,中國模型的優勢更為明顯。比如,MiniMax M2.1與Gemini 3 Flash Preview的正確率差距為1.5%,而MiniMax M2.1的成本只有Gemini 3 Flash Preview的大約1/10;Kimi K2.5的表現超過了Claude Opus 4.6,而價格僅為后者的零頭。


      分數之外,這些模型在具體場景的表現究竟如何?

      拿下準確率榜第一的Gemini 3 Flash Preview參加了11項任務的測試,滿分11分,得分為10.5。在日歷填寫、編程和文件操作等任務中,Gemini 3 Flash Preview拿到了滿分成績,不過在理解、寫作等任務中出現瑕疵,而在上下文記憶檢索任務中其表現最差,得分僅為80%。


      位列榜二的MiniMax M2.1同樣拿到10.5分的成績,在編程任務上,其得分略遜于Gemini 3 Flash Preview,在上下文記憶檢索任務其得分與Gemini 3 Flash Preview一致,都為80%。

      在事實驗證、寫作、研究等任務上,MiniMax M2.1拿到了滿分。此外,MiniMax M2.1在復雜多步驟工作流上的表現要比Gemini 3 Flash Preview好上3%,這類工作流在Agent任務中是極為常見的。


      位列第三的Kimi K2.5拿下寫作、編程、研究等7項滿分,不過同樣在上下文記憶檢索任務中踩坑。看來,對目前的大模型而言,長上下文中的信息捕捉能力仍是有待提升的短板。


      榜單上,還有幾款新發布的模型意外地表現不佳。比如,OpenAI最新發布的GPT-5.4任務正確率僅有76%,在總榜上排名第20,甚至不如2024年發布的GPT-4o。

      其在上下文記憶檢索任務、復雜工作流、信息理解上的正確率僅有70%左右,在文檔總結、記憶兩項測試中得分為零。


      Qwen3 Max Thinking的任務正確率僅有46%,在部分涉及文件操作、腳本撰寫的任務上未能成功執行,拿了零分。


      從PinchBench的初步測評結果來看,我們已經能總結出一些共性特點。

      對于Agent這一任務場景來說,并不是模型越大就越好,也不是越新越好。許多進入正確率排名前十的模型都不是最大、最強的版本,比如Gemini 3 Flash Preview的成績要優于Gemini 3 Pro Preview,Claude Haiku 4.5的得分要優于Claude Opus 4.6。

      在Agent任務中,尤其是多步驟工作流、文件操作、編程等,模型通常需要多次調用工具或與環境交互。在這些任務中,輕量級模型更快的推理速度與響應延遲,以及更短的思考長度,可能提升了整個工作流的穩定性和成功率。

      結語:OpenClaw熱度不減,開源生態持續推高熱度

      以OpenClaw為代表的Agent框架,正深刻影響著大模型行業的方方面面。比如,衡量模型在OpenClaw中表現的基準測試“PinchBench”,未來有可能成為指導模型開發商優化模型能力的重要參考,以便讓模型更好地適應Agent工作流。

      同時,OpenClaw也在不斷補齊自身的安全與兼容性短板。OpenClaw的開源特性讓全球開發者都可以參與到這一框架的優化過程中。隨著更多技術力量的匯入,這股“養龍蝦”的熱潮或許仍將持續發酵。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      最低9°C!廣東繼續降溫又下雨

      最低9°C!廣東繼續降溫又下雨

      南粵女聲
      2026-03-10 14:36:05
      “我是中國人!”德國猶太裔百億富翁,帶全部身家加入中國國籍

      “我是中國人!”德國猶太裔百億富翁,帶全部身家加入中國國籍

      瑩瑩的歷史說
      2026-03-06 21:27:21
      偉偉道來 | 伊朗降溫美以升級,戰爭進入第二階段

      偉偉道來 | 伊朗降溫美以升級,戰爭進入第二階段

      經濟觀察報
      2026-03-09 16:20:16
      馬筱梅回應家庭矛盾,承諾讓汪小菲跟張蘭道歉,當時不阻止是對的

      馬筱梅回應家庭矛盾,承諾讓汪小菲跟張蘭道歉,當時不阻止是對的

      白面書誏
      2026-03-09 13:29:49
      撕開“影子”偽裝——江陰市水利局原副局長陳轉蘭被查背后的警示

      撕開“影子”偽裝——江陰市水利局原副局長陳轉蘭被查背后的警示

      飛鶴傳媒
      2026-03-10 14:03:14
      特朗普著急訪華,苦等4天,中方終于給出回應,提了一個新要求

      特朗普著急訪華,苦等4天,中方終于給出回應,提了一個新要求

      南權先生
      2026-03-09 15:47:50
      絕殺+反絕殺+再絕殺,MVP爭奪戰無懸念,約基奇、東契奇都不行!

      絕殺+反絕殺+再絕殺,MVP爭奪戰無懸念,約基奇、東契奇都不行!

      生活新鮮市
      2026-03-10 14:54:09
      那個坐飛機從2000米高空跳機自殺的清華女學霸,已離開11年了

      那個坐飛機從2000米高空跳機自殺的清華女學霸,已離開11年了

      紀實錄
      2024-04-08 22:15:05
      成都德云社開業2天翻車?3800元票背后,誰在砸相聲的飯碗

      成都德云社開業2天翻車?3800元票背后,誰在砸相聲的飯碗

      手工制作阿殲
      2026-03-10 12:04:24
      笑發財,那些年港媒取的標題真的狠毒!網友:鴨脖也是鴨,沒毛病

      笑發財,那些年港媒取的標題真的狠毒!網友:鴨脖也是鴨,沒毛病

      夜深愛雜談
      2026-03-01 20:12:43
      萬人請愿,送特朗普兒子上前線,美國反戰怒火燒向白宮

      萬人請愿,送特朗普兒子上前線,美國反戰怒火燒向白宮

      愛史紀
      2026-03-10 10:50:29
      江西48.8萬彩禮后續:男子轉頭退婚提豪車,女子破防:要告你強奸

      江西48.8萬彩禮后續:男子轉頭退婚提豪車,女子破防:要告你強奸

      鋭娛之樂
      2025-09-09 22:24:54
      我國初中、高中、高等教育三個階段的學齡人口將分別于2026年、2029年、2032年達峰

      我國初中、高中、高等教育三個階段的學齡人口將分別于2026年、2029年、2032年達峰

      大象新聞
      2026-03-06 18:47:02
      康熙的皇子大多能力出眾,為何雍正以后一代不如一代了呢?

      康熙的皇子大多能力出眾,為何雍正以后一代不如一代了呢?

      大運河時空
      2026-03-09 16:05:03
      高市翻車了?日本打出藏了14年的“底牌”,外媒:根本攔不住了!

      高市翻車了?日本打出藏了14年的“底牌”,外媒:根本攔不住了!

      瘋狂小菠蘿
      2026-03-10 14:50:57
      CCTV5直播中國女籃首戰非洲勁旅,內線世界頂級 宮魯鳴帶隊開門紅

      CCTV5直播中國女籃首戰非洲勁旅,內線世界頂級 宮魯鳴帶隊開門紅

      中國籃壇快訊
      2026-03-10 14:44:25
      史前文明真的存在嗎?6.5萬年前壁畫曝光后,考古界一度集體沉默

      史前文明真的存在嗎?6.5萬年前壁畫曝光后,考古界一度集體沉默

      銅臭的歷史味
      2026-03-10 05:25:20
      突發!伊朗最高領袖選舉機構辦公樓遭襲!此前6名美軍死亡細節曝光:被自殺式無人機襲擊,無任何預警

      突發!伊朗最高領袖選舉機構辦公樓遭襲!此前6名美軍死亡細節曝光:被自殺式無人機襲擊,無任何預警

      每日經濟新聞
      2026-03-03 22:50:26
      小三上位!買超新歡挺孕肚備婚,全家認可,張嘉倪8年終是錯付了

      小三上位!買超新歡挺孕肚備婚,全家認可,張嘉倪8年終是錯付了

      八斗小先生
      2026-03-09 13:51:02
      太平年:同樣都是吳越王,為什么錢弘佐那么累,錢弘俶卻很輕松呢

      太平年:同樣都是吳越王,為什么錢弘佐那么累,錢弘俶卻很輕松呢

      鄉野小珥
      2026-03-10 14:30:31
      2026-03-10 17:04:49
      智東西 incentive-icons
      智東西
      聚焦智能變革,服務產業升級。
      11332文章數 116991關注度
      往期回顧 全部

      財經要聞

      全民"養龍蝦"背后 第一批受害者浮現

      頭條要聞

      特朗普稱已考慮接替穆杰塔巴的人選 外交部表態

      頭條要聞

      特朗普稱已考慮接替穆杰塔巴的人選 外交部表態

      體育要聞

      加蘭沒那么差,但鱸魚會用嗎?

      娛樂要聞

      肖戰首奪SMG視帝,孫儷四封視后創歷史

      科技要聞

      全民"養蝦"背后:大廠集體下場瘋狂賣Token

      汽車要聞

      蔚來換電和理想5C,誰能硬剛,比亞迪兆瓦閃充?

      態度原創

      手機
      數碼
      本地
      時尚
      公開課

      手機要聞

      vivo X300s新機官宣“移植”藍廠最強性能電競體驗全家桶

      數碼要聞

      QNAP威聯通推出TS-h1077AFU:10×SATA盤位1U全閃NAS

      本地新聞

      云游中國|候鳥高顏值亮相!沉浸式打卡青海濕地

      沒有人不愛這個穿平底鞋都發光的女人

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版