<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      剛剛,小扎的千億閉源AI終于交卷!當場被痛批「圖表犯罪」,28歲話事人火速道歉

      0
      分享至

      九個月前,如果你問 AI 圈里誰最焦慮,答案大概率是 Meta CEO 扎克伯格。

      Llama 4 的發布堪稱教科書級翻車。核心研究員陸續出走,技術社區的口碑幾乎在一夜之間崩掉,于是扎克伯格選擇推倒重來。

      Meta Superintelligence Labs 掛牌成立,接著小扎開出堪比 NBA 職業球星的簽約金,從 OpenAI、Google、Anthropic 撬走七十多名頂尖研究員,并在六個月內完成了四次組織架構調整。


      就在剛剛,這場 AI 豪賭終于亮出了它的第一張牌:Muse Spark。

      近千億美元的支出給了扎克伯格一張 AI 頂級玩家的入場券,但入場從來只是開始,能不能在這張桌子上贏下去,還要看今天這張牌打得怎么樣。


      扎克伯格的最新發文

      號稱「個人超級智能」第一步,Muse Spark 登場

      作為 Meta Superintelligence Labs 推出的 Muse 系列首款模型,Muse Spark 從架構層面原生支持圖像、音頻、視頻與文本的聯合理解,內置工具調用、可視化思維鏈與多智能體協調能力。

      Meta 將其定位為邁向「個人超級智能」的第一步。

      從評測數據看,Muse Spark 的能力分布相當不均勻。多模態方向上,它在 CharXiv Reasoning 圖表理解項目上得分 86.4,超過 GPT 5.4 的 82.8 和 Gemini 3.1 Pro 的 80.2,SimpleVQA 視覺事實題同樣領先競爭對手。


      但在 MMMU Pro 多模態理解項目上,Muse Spark 得分 80.4,低于 Gemini 3.1 Pro 的 83.9。文本推理方向,它在 GPQA Diamond 博士級推理題上得分 89.5,LiveCodeBench Pro 競爭編程測試得分 80.0,后者超過 Opus 4.6。

      然而 ARC AGI 2 抽象推理謎題上僅得 42.5,遠落后于 Gemini 3.1 Pro 的 76.5 和 GPT 5.4 的 76.1,差距頗為明顯。

      健康領域是這份成績單上比較大的亮點。

      HealthBench Hard 開放式健康問答中,Muse Spark 得分 42.8,遠超 GPT 5.4 的 40.1、Gemini 3.1 Pro 的 20.6 和 Opus 4.6 的 14.8。MedXpertQA 多模態醫療題得分 78.4,Meta 與超過 1000 名醫生合作標注訓練數據,這一投入在評測榜單上得到了直接回報,也是少見的、錢花到了刀刃上的地方。

      編碼與智能體任務則是另一面。Muse Spark 在 DeepSearchQA 智能體搜索項目上得分 74.8,優于 Gemini 3.1 Pro 的 69.7,但在 Terminal-Bench 2.0 終端編碼任務上僅得 59.0,落后于 GPT 5.4 的 75.1 和 Gemini 3.1 Pro 的 68.5。


      基準測試之外,社區的實戰對比更為直觀:有用戶同時讓 Muse Spark 和 GPT-5.4 完成「制作一個 Flappy Bird 克隆版」的任務,從游戲邏輯到交互細節,GPT-5.4 輕松勝出。在經典的六邊形小球測試中,對比昨天 DeepSeek 專家模式的表現,Muse Spark 再次敗下陣來。


      只能說,編碼與長鏈路智能體任務,仍是 Meta 明確承認、尚在補強的方向。

      與標準推理模式并行,Meta 同步推出了 Contemplating 模式,通過并行調度多個 AI 智能體協作處理復雜問題。

      該模式在「人類最后的考試」(Humanity’s Last Exam)無工具版本中得分 50.2,超過 Gemini 3.1 Deep Think 的 48.4 和 GPT 5.4 Pro 的 43.9,FrontierScience Research 科學研究任務中得分 38.3。但在物理奧賽 IPhO 2025 理論題上得分 82.6,仍落后于 GPT 5.4 Pro 的 93.5。


      支撐上述能力的,是 MSL 過去九個月徹底重建的技術棧。

      Codebase Perplexity 測試圖表顯示,Muse Spark 在相同性能水平下,比 Llama 4 Maverick Base 節省 10.3 倍算力,比 DeepSeek-V3.1 Base 節省 8.2 倍,比 Kimi-K2 Base 節省 3.3 倍。


      強化學習階段同樣表現穩定,pass@1 從約 46% 持續爬升至超 60%,pass@16 從 近 68% 升至近 80%,在未見過的評測集上泛化趨勢同樣平穩。


      博主 Yuchen Jin 評價稱,基礎設施才是 AI 實驗室真正的護城河,好的基礎設施讓研究人員能以更快速度訓練模型、用更短周期驗證更多想法。


      AI 評測機構 Artificial Analysis 在早期測試后表示,Muse Spark 在其綜合智能指數中得分 52,位列全球前五。


      Muse Spark 現已上線 meta.ai 及 Meta AI 應用,并向部分用戶開放 API 內測,用戶須以 Facebook 或 Instagram 賬號登錄方可使用。與此前開源 Llama 系列的路線不同,Meta 這次選擇閉源發布。

      Meta 未明確說明是否會使用社交賬號中的個人信息訓練模型,但鑒于 Meta 的一貫做法,這一可能性不低,其中健康數據的采集更是值得特別關注。

      Meta 重組后的首份 AI 答卷,及格了嗎?

      2025 年 4 月,Llama 4 以令人失望的表現觸發了 Meta 的人事地震。

      下定決心從頭來過的扎克伯格,成立了 Meta Superintelligence Labs,以 143 億美元將 Scale AI 創始人 Alexandr Wang 引入擔任首席 AI 官,前 GitHub CEO Nat Friedman 負責產品,前 OpenAI 研究員 Shengjia Zhao(趙晟佳)出任首席科學家。


      緊接著是四大團隊的重組、以及從 OpenAI、DeepMind、Anthropic 等對手處累計引進逾 70 名頂尖研究人員,單人簽約獎金最高達 1 億美元。

      代價是沉重的,圖靈獎得主 Yann LeCun 離職、600 個崗位被裁、內部薪酬不公引發大規模士氣危機,六個月內四次架構調整更是讓團隊方向感嚴重缺失。


      結果顯而易見,九個月重建、數百億投入,Muse Spark 交出的這份答卷,稱得上合格,卻還遠遠談不上亮眼。

      有一個有趣的細節是,Meta 在評測圖表中,通過給自家模型基準測試成績高亮的操作,試圖制造出全面領先的視覺觀感,隨即引發外界批評。


      網友 Armen Aghajanyan 直接定性為「圖表犯罪」,Alexandr Wang 隨后公開致歉,承認大多數評估恰恰顯示模型有很多需要改進的地方。



      事實上,Meta 新模型在健康領域的垂直優勢足夠亮眼,算力效率的提升也確有真實價值,但 ARC AGI 2 上的斷崖式落差、編碼任務上被 GPT-5.4 輕松超越,以及「圖表犯罪」風波所折射出的敘事焦慮,共同勾勒出一個仍在追趕、而非遙遙領先的 Meta AI。

      更關鍵的是,這是一份閉源答卷。Meta 曾以開源 Llama 系列樹立起差異化形象,如今轉向閉源商業化路線,意味著它放棄了社區生態這張最重要的底牌,卻尚未證明自己能在閉源賽道上與 OpenAI 和 Anthropic 正面掰手腕。


      如官方博客和 Alex 回應所說,別問,問就是「大的要來了」

      甚至就在 Muse Spark 發布的同一天,馬斯克在社交媒體上曬出 xAI Colossus 2 的訓練進度,七個模型同時在訓,參數規模從 1T 橫跨至 10T,并附上一句意味深長的「還有些追趕要做」。


      同期,Claude Mythos 預覽版、DeepSeek 新一輪更新也已經發布,包括阿里即將推出 Qwen-3.6 系列旗艦 Qwen-3.6-Max,騰訊混元 3.0 同樣蓄勢待發。

      對手們不會等 Meta 考完再出題,并且投資者的耐心本來就是有限度的。四月,依舊是最殘酷的一個月。名為 AGI 的這場考試,目前還看不到閱卷結束的那一天。

      我們正在招募伙伴

      簡歷投遞郵箱hr@ifanr.com

      ?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      太離譜!護士曬患者膀胱結石,整整一盆“鵪鶉蛋”,竟是一個人的

      太離譜!護士曬患者膀胱結石,整整一盆“鵪鶉蛋”,竟是一個人的

      譚談社會
      2026-04-25 10:48:04
      F-47原型機可能已秘密試飛多年,累計數百小時,項目推進符合計劃

      F-47原型機可能已秘密試飛多年,累計數百小時,項目推進符合計劃

      止戈軍是我
      2026-04-25 12:29:15
      活久見!網傳江西一新娘媽媽將一捆捆現金高舉頭頂,給賓客觀摩

      活久見!網傳江西一新娘媽媽將一捆捆現金高舉頭頂,給賓客觀摩

      火山詩話
      2026-04-26 11:29:17
      中美金融戰,意外地幫中國解決了,房地產這個尾大不掉的問題

      中美金融戰,意外地幫中國解決了,房地產這個尾大不掉的問題

      南宗歷史
      2026-04-24 05:20:02
      太狠了!OpenClaw之父一夜屠光5000 Issue,GitHub服務器先跪了

      太狠了!OpenClaw之父一夜屠光5000 Issue,GitHub服務器先跪了

      新智元
      2026-04-26 11:29:22
      “骨盆前傾成這樣,還不去醫院?”家長曬一年級女兒體態,被群嘲

      “骨盆前傾成這樣,還不去醫院?”家長曬一年級女兒體態,被群嘲

      妍妍教育日記
      2026-04-24 11:15:25
      17中13轟43分!歷史首人!6換2大交易撿到寶了

      17中13轟43分!歷史首人!6換2大交易撿到寶了

      世界體育圈
      2026-04-26 12:44:24
      心態被打崩了!麥丹上空籃,約基奇跑全場討說法引沖突,前者亮了

      心態被打崩了!麥丹上空籃,約基奇跑全場討說法引沖突,前者亮了

      籃球資訊達人
      2026-04-26 11:40:03
      男子戒煙3個月省下的煙錢鋪滿一床,當事人:成就感拉滿,堅決不再抽煙,會繼續攢錢,想要去西藏旅游

      男子戒煙3個月省下的煙錢鋪滿一床,當事人:成就感拉滿,堅決不再抽煙,會繼續攢錢,想要去西藏旅游

      觀威海
      2026-04-26 19:16:12
      首輪G3全部打完,2組3-0,5組2-1!2支偽強隊出現,2隊有奪冠實力

      首輪G3全部打完,2組3-0,5組2-1!2支偽強隊出現,2隊有奪冠實力

      毒舌NBA
      2026-04-26 09:03:54
      千年難遇的美人,太漂亮了,沒有一點毛病,太完美了

      千年難遇的美人,太漂亮了,沒有一點毛病,太完美了

      陳意小可愛
      2026-04-25 06:57:01
      數名醫生強調:只要做過白內障手術,術后病人一定關注這幾點

      數名醫生強調:只要做過白內障手術,術后病人一定關注這幾點

      健康科普365
      2026-04-25 17:30:07
      那個信了“朋友”去泰國潑水節的19歲女生,再也回不來了

      那個信了“朋友”去泰國潑水節的19歲女生,再也回不來了

      迷世書童H9527
      2026-04-25 09:10:21
      霍爾木茲海峽,傳來大消息!伊朗總統,最新發聲!比特幣跳水,超9.9萬人爆倉!

      霍爾木茲海峽,傳來大消息!伊朗總統,最新發聲!比特幣跳水,超9.9萬人爆倉!

      證券時報e公司
      2026-04-25 22:11:02
      被賣緬甸女大學生后續:園區同意放人,黑幕曝光,父親覺得不對勁

      被賣緬甸女大學生后續:園區同意放人,黑幕曝光,父親覺得不對勁

      云舟史策
      2026-04-26 17:10:28
      曼城再次令全英陷入絕望:瓜氏帝國的統治遠未終結

      曼城再次令全英陷入絕望:瓜氏帝國的統治遠未終結

      星耀國際足壇
      2026-04-26 20:58:49
      “窮人炫富,難掩心酸!”男大學生炫耀坐高鐵一等座,因長相被嘲

      “窮人炫富,難掩心酸!”男大學生炫耀坐高鐵一等座,因長相被嘲

      妍妍教育日記
      2026-04-24 09:05:03
      不吐不快:車展看了9款大6座SUV,設計撞臉成常態,造車像下餃子

      不吐不快:車展看了9款大6座SUV,設計撞臉成常態,造車像下餃子

      周哥一影視
      2026-04-26 11:27:08
      楊威雙胞胎女兒太爭氣,9歲同臺拿下全國冠軍+季軍,體操最強二代

      楊威雙胞胎女兒太爭氣,9歲同臺拿下全國冠軍+季軍,體操最強二代

      觀魚聽雨
      2026-04-25 23:23:30
      劉祝潤:第一反應以為首球沒打進;傷員正在積極恢復

      劉祝潤:第一反應以為首球沒打進;傷員正在積極恢復

      懂球帝
      2026-04-26 14:22:19
      2026-04-26 21:28:49
      AppSo incentive-icons
      AppSo
      讓智能手機更好用的秘密
      6312文章數 26830關注度
      往期回顧 全部

      科技要聞

      漲價浪潮下,DeepSeek推動AI“價格戰”

      頭條要聞

      特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

      頭條要聞

      特朗普內閣又一女部長落馬:強迫男下屬為其提供性服務

      體育要聞

      森林狼3比1掘金:逆境中殺出了多孫穆?!

      娛樂要聞

      僅次《指環王》的美劇,有第二季

      財經要聞

      事關新就業群體,中辦、國辦發文

      汽車要聞

      預售19.38萬元起 哈弗猛龍PLUS七座版亮相

      態度原創

      時尚
      藝術
      游戲
      手機
      本地

      比闊腿褲還時髦?今年夏天一定要有“這條褲子”,減齡又松弛

      藝術要聞

      18幅 列賓美院教師Artem Tikhonov風景寫生

      曝PS5.Xbox或重返獨占賽道!分析師銳評:這招早不靈了

      手機要聞

      小米系統又雙叒修Bug了:相冊、鬧鐘、控制中心,一個沒落下!

      本地新聞

      云游中國|逛世界風箏都 留學生探秘中國傳統文化

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 成人亚洲精品一区二区三区嫩花| 欧美三级午夜理伦三级| 中文字幕一区二区三区50路| av无码天堂| 99精品国产兔费观看久久99| 一个人看的www视频在线观看| 麻豆果冻传媒精品| 久久中文字幕无码一区二区| 99久久精品费精品国产一区二区| 多p在线观看| 人妻人人摸| 国产精品任我爽爆在线播放| 国产成熟人妻换╳╳╳╳| 亚洲AV日韩AV综合在线观看| 中文字幕在线高清| 国产精品亚洲二区亚瑟| 日韩有码中文字幕国产| 日韩成人无码毛片| 欧美激情精品久久| 91资源在线观看| 一色桃子中出欲求不满人妻 | 无码人妻精品一区二区三区蜜臀百度| 国产精品嫩草影院一二三区入口| 厨房与子乱在线观看| 产精品视频在线观看免费| 亚洲xxxx做受欧美| 国产成人一区免费观看| 啪一啪射一射插一插| 偷拍网日本一区二区三区| 熟女人妇 成熟妇女系列视频| 青青草原AV| 国产69精品久久久久人妻刘玥 | 青青青伊人色综合久久| 丁香花成人电影| 最近2019中文字幕大全视频1| 黄页网址大全免费观看| 欧美另类图片视频无弹跳第一页 | 亚洲国产精品久久久久久久| 久久露脸国语精品国产91| 伊人久久大香线蕉综合观| 久久激情影院|