<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      無人關心的 Meta AI,好像真有點說法。

      0
      分享至


      繞過元宇宙的彎路,放棄出道即巔峰的 Llama,怒燒幾百億美金組建超級智能實驗室。。。

      在 Meta 的 AI 戰略徹底顛覆以后,他們的首款通用模型 Muse Spark 耗時一年,終于嶄新出爐了。

      而在第一時間上手實測之后,世超感覺,之前的 Meta 是拉完了都排不上號的主,靠著鈔能力一路猛追,可能真爬上了榜單的人上人。

      根據官方發布的跑分結果,Muse Spark 在多模態、文字推理、健康和智能體領域,和 Opus 4.6,Gemini 3.1 Pro 等旗艦模型相比的確各有千秋。


      雖然這個健康領域挺詭異的,很少見這類 Benchmark 被搬上通用模型的臺面。。。

      而在即將推出的 “ 沉思模式 ” 下,Muse Spark 在一些高難測試集,如 Humanity's Last Exam 里的思考推理表現,也和 Gemini 3.1 Deep Think,GPT 5.4 Pro 差不多。


      但也有人并不看好 Meta 這一波。畢竟官方博客披露信息太少了,案例都沒幾個。模型閉源,又沒有發布 API,Meta 也有可能故技重施,在跑分上造假。這模型好不好用,難說。

      所以,為了看看這里面到底有幾分水分,世超把 Muse Spark 拉來,和 Gemini 3.1 pro,Opus 4.6,GPT 5.4 Thinking 做了個簡單橫向對比。

      目前 Muse Spark 只開放了 Instant 和 Thinking 兩種模式,前者快速回答,后者有一些思考和推理能力,我們這回主要測能力更強的 Thinking。


      咱們先從 Muse Spark 主推的多模態開始。比如,世超給它一張超市貨架圖,讓它推薦幾款減脂期零食。

      從回答里看得出,Muse Spark 對圖片的理解能力很強,細節也能抓到位,文字閱讀無障礙,推薦得有理有據,結果可靠。


      但要只是上面這種程度,所有模型都能做得到,Muse Spark 只能算是及格。下面這些上難度的玩法,才是 Muse Spark 表演的開始。

      在官方博客里,Meta 提供了一個一張圖變數獨游戲的案例。只要給出一張圖片,提示詞 “ 把這張圖變成網頁數獨游戲 ”,就能獲得一個可玩數獨。


      我們也做了個類似的,親測好用。不止交互很絲滑,答案也能準確計算好,頁面風格和提供的圖片完全一致。


      感覺 Muse Spark 的多模態不像其它模型,只是識圖看個大概,剩下的全憑自由發揮。它是真懂事,不僅能按照你提供的圖片像素級復刻,甚至可以準確推斷出背后的操作使用邏輯。

      下面這個例子就更猛了。世超只是隨手截了一個 win11 系統計算器圖給它,提示 “ 把這張圖片變成一個可用計算器 ”,Muse Spark 一口氣做出來的 demo,每個按鍵都好使,計算準確,界面和系統媽生計算器一模一樣。


      作為對比,GPT 5.4 Thinking 界面風格類似,但有亂碼;Gemini 3.1 pro 完全無視了原圖;只有真神 Opus 4.6 維持了一貫的高水準。


      而在據說 Muse Spark 并不擅長的代碼方面,我們實測也有驚喜。

      咱先試了試前端網頁設計實現。至少在這一塊,Muse Spark 的審美屬于一流水平。

      頁面功能實現得比較完整,部分鏈接按鈕可點擊,雖然具體內容存在一些杜撰,粗略看起來還是很舒服的。


      整體和 Opus 4.6 比起來有點差距,但比起不知所云的 GPT,還是強了很多。


      算法代碼方面,我們挑選了幾道 leetcode 高難題。

      最震驚的還是在 65 號題上,雖然所有模型都通過了測試,但 Muse Spark 給出了時間和空間上,都更加優雅的解法。。。

      作為對比,Opus 4.6 和 GPT 5.4 Thinking 的時間復雜度排名僅 50%,而 Gemini 3.1 pro 的空間復雜度只擊敗了 13% 的提交答案。


      再以 10 號題為例,Muse Spark 和 Opus 給出的依然是最優解;GPT 通過了測試,但解法不夠好;Gemini 3.1 pro 則直接出現 bug,失敗了。


      測到這里,Muse Spark 的表現已經遠遠超過世超的預期了。表現和 Opus 打的有來有回,反而 GPT 和 Gemini 顯得有點不夠看。

      不會吧不會吧,難道我們都誤會了,亞歷山大王真有點東西?

      再看看簡單的文字測試。不得不說,Muse Spark 思路相當清晰,Instant 模式回答幾個經典邏輯問題足夠用,3 秒必達。


      而作為對比,Gemini 和 Opus 的表現也是穩定且準確。唯獨 GPT,上個月新發布的版本 5.4 Thinking,還在這種簡單邏輯題上翻車,拉完了。


      最后,在健康領域,所有模型的回答都中規中矩,Muse Spark 無功無過。


      在簡單試用完一圈之后,世超感覺大模型界三足鼎立的局面,真要被打破了。

      而 Meta 目前放出來的,甚至還只是一個較輕量,試試水,可能在未來開源的版本。。。

      官方表示,他們正在 Muse Spark 的基礎上,繼續對整個技術棧加大投資力度,從研究,數據,模型訓練到基礎設施,規模全面擴張。

      在模型訓練技術細節上,Meta 提到了三個關鍵點:預訓練、強化學習、和測試時推理(test-time reasoning)。


      前兩個過程各位差友已經很熟悉了,但即使這是每個大模型的必經之路,Meta 依然背靠 Instagram 和 Facebook,有著得天獨厚的數據優勢。在數據這方面,可能只有谷歌能和 Meta 相提并論。

      而在測試時推理這個階段,Meta 主要做的是,讓模型在回答問題之前,先思考一陣,但不能耗太多 token。

      這一點世超在 GPT Thinking 系列上深有體會。這些模型經常想起來沒完,結果變得又臭又長,信息密度極低。

      而 Meta 選擇在訓練的過程中,對過長的思考進行懲罰。把長推理壓縮成盡量少 token 的前提下,又能讓模型回答準確,達成了微妙的平衡。


      最后,回過頭看,一次又一次失敗,Meta 居然從來沒退出這場比賽,最終再次歸位前沿陣地,這故事太燃了。

      但在另一邊,Claude Mythos Preview 已經強到另一個維度了。相比之下,Muse Spark 這一波,像是才剛補上了之前缺的課。

      所以,世超只能說,期待 Meta 加入這場模型大亂斗,讓小扎也有機會,癱坐在小小的辦公椅上吧。

      撰文:莫莫莫甜甜

      編輯:江江 & 面線

      美編:煥妍

      圖片、資料來源:

      感謝宅宅老師提供的跨國支援!

      莫莫實測

      Muse Spark 官方博客、X


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      網友喊話請何潤東代言霸王茶姬,有人都把圖P好了,客服:建議已詳細登記;何潤東翻紅后,賬號漲粉近200萬

      網友喊話請何潤東代言霸王茶姬,有人都把圖P好了,客服:建議已詳細登記;何潤東翻紅后,賬號漲粉近200萬

      魯中晨報
      2026-04-20 14:48:15
      男子買彩票中了5340萬 偷偷轉給別的女人2100萬 前妻起訴返還 法院判了

      男子買彩票中了5340萬 偷偷轉給別的女人2100萬 前妻起訴返還 法院判了

      閃電新聞
      2026-04-21 10:35:14
      太突然!800萬粉網紅挖機小何獲贈新挖掘機,流量密碼回來了

      太突然!800萬粉網紅挖機小何獲贈新挖掘機,流量密碼回來了

      雷科技
      2026-04-21 11:22:34
      南京隊前教練:感謝球迷邀請我回歸,但大家要對球隊保持耐心

      南京隊前教練:感謝球迷邀請我回歸,但大家要對球隊保持耐心

      懂球帝
      2026-04-22 00:31:07
      博格巴:我和穆帥在內的任何教練都沒問題,回曼聯感覺一切都變了

      博格巴:我和穆帥在內的任何教練都沒問題,回曼聯感覺一切都變了

      蘭亭墨未干
      2026-04-22 17:49:09
      兩性關系:不管你信不信,女性過60歲,基本都有如下幾個需求!

      兩性關系:不管你信不信,女性過60歲,基本都有如下幾個需求!

      周哥一影視
      2026-04-22 14:36:34
      白鹿北京的家餐桌要30000元,親自下廚給助理吃,自己卻不吃晚飯

      白鹿北京的家餐桌要30000元,親自下廚給助理吃,自己卻不吃晚飯

      椰黃娛樂
      2026-04-22 11:09:10
      張本智和再次全家大遷徙,這次是德國,網友:回中國也不必多慮!

      張本智和再次全家大遷徙,這次是德國,網友:回中國也不必多慮!

      玖宇維
      2026-04-21 21:23:08
      凱特出席已故女王百歲誕辰!穿丁香紫裙很優雅,44歲顏值卻很真實

      凱特出席已故女王百歲誕辰!穿丁香紫裙很優雅,44歲顏值卻很真實

      八八尚語
      2026-04-22 11:04:08
      炸裂!網傳寧波某豪宅業主群夫妻大戰,虎狼之詞流出,444人圍觀

      炸裂!網傳寧波某豪宅業主群夫妻大戰,虎狼之詞流出,444人圍觀

      火山詩話
      2026-04-22 17:56:13
      活塞vs魔術前瞻:活塞背水一戰力爭反彈,魔術客場力爭2-0

      活塞vs魔術前瞻:活塞背水一戰力爭反彈,魔術客場力爭2-0

      橙汁的味道123
      2026-04-22 18:04:53
      美15艘軍艦封鎖霍爾木茲?中國沉默6天后,一招讓特朗普徹底破防

      美15艘軍艦封鎖霍爾木茲?中國沉默6天后,一招讓特朗普徹底破防

      歸史
      2026-04-18 11:45:15
      首部全AI生成電影《靈魂擺渡》將定檔,監制為《唐朝詭事錄》主創郭靖宇,此前曾發問“真人能演的劇,為什么非要AI做出假人來演”

      首部全AI生成電影《靈魂擺渡》將定檔,監制為《唐朝詭事錄》主創郭靖宇,此前曾發問“真人能演的劇,為什么非要AI做出假人來演”

      極目新聞
      2026-04-22 11:21:22
      59歲宋祖英與男友合影曝光,氣質優雅素顏真實

      59歲宋祖英與男友合影曝光,氣質優雅素顏真實

      無處遁形
      2026-04-22 11:37:27
      邱淑貞工藤靜香母女同框聚會!57vs56凍齡比拼,女兒顏值各有韻味

      邱淑貞工藤靜香母女同框聚會!57vs56凍齡比拼,女兒顏值各有韻味

      人間煙火記事本
      2026-04-22 06:49:11
      斯洛伐克經濟部長:“友誼”輸油管道預計于23日恢復向斯方供油

      斯洛伐克經濟部長:“友誼”輸油管道預計于23日恢復向斯方供油

      國際在線
      2026-04-22 17:34:09
      對標優衣庫,干翻宜家?這家“摳門”會員店,憑什么讓中產上癮

      對標優衣庫,干翻宜家?這家“摳門”會員店,憑什么讓中產上癮

      青眼財經
      2026-04-20 14:48:46
      為什么東風-41洲際導彈堅決不用北斗?不是不用,是絕不能用!

      為什么東風-41洲際導彈堅決不用北斗?不是不用,是絕不能用!

      一姐說軍史
      2026-04-13 12:27:41
      吉林高新技術產業開發區黨工委書記張守華接受審查調查

      吉林高新技術產業開發區黨工委書記張守華接受審查調查

      界面新聞
      2026-04-22 15:59:44
      原來她早已去世,從患病到離世僅16天,去世原因讓人心痛!

      原來她早已去世,從患病到離世僅16天,去世原因讓人心痛!

      青梅侃史啊
      2026-04-22 17:10:45
      2026-04-22 18:44:49
      差評XPIN incentive-icons
      差評XPIN
      用知識和觀點Debug the world!
      10614文章數 489596關注度
      往期回顧 全部

      科技要聞

      對話梅濤:沒有視頻底座,具身智能走不遠

      頭條要聞

      三甲醫院科主任被舉報"巨額財產來源不明" 舉報人發聲

      頭條要聞

      三甲醫院科主任被舉報"巨額財產來源不明" 舉報人發聲

      體育要聞

      網易傳媒再度簽約法國隊和阿根廷隊

      娛樂要聞

      復婚無望!baby黃曉明陪小海綿零交流

      財經要聞

      伊朗拒絕出席 特朗普宣布延長停火期限

      汽車要聞

      純電續航301km+激光雷達 宋Pro DM-i飛馳版9.99萬起

      態度原創

      時尚
      藝術
      數碼
      手機
      家居

      初夏穿赫本的白褲子,清新又高級!

      藝術要聞

      無花不風景

      數碼要聞

      Beats發布3米USB-C數據線:售229元 最高240W快充

      手機要聞

      小米澎湃OS 3 Beta版推送“龍蝦”智能體Xiaomi miclaw

      家居要聞

      極簡繪夢 克制和諧

      無障礙瀏覽 進入關懷版