<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<style id="5ors8"></style><sub id="5ors8"><p id="5ors8"></p></sub>

<s id="5ors8"></s>

^{<blockquote id="5ors8"></blockquote>}

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

無人關心的 Meta AI，好像真有點說法。

2026-04-11 00:05:58　來源: 差評XPIN

浙江舉報

0

分享至

繞過元宇宙的彎路，放棄出道即巔峰的 Llama，怒燒幾百億美金組建超級智能實驗室。。。

在 Meta 的 AI 戰略徹底顛覆以后，他們的首款通用模型 Muse Spark 耗時一年，終于嶄新出爐了。

而在第一時間上手實測之后，世超感覺，之前的 Meta 是拉完了都排不上號的主，靠著鈔能力一路猛追，可能真爬上了榜單的人上人。

根據官方發布的跑分結果，Muse Spark 在多模態、文字推理、健康和智能體領域，和 Opus 4.6，Gemini 3.1 Pro 等旗艦模型相比的確各有千秋。

雖然這個健康領域挺詭異的，很少見這類 Benchmark 被搬上通用模型的臺面。。。

而在即將推出的 “ 沉思模式 ” 下，Muse Spark 在一些高難測試集，如 Humanity's Last Exam 里的思考推理表現，也和 Gemini 3.1 Deep Think，GPT 5.4 Pro 差不多。

但也有人并不看好 Meta 這一波。畢竟官方博客披露信息太少了，案例都沒幾個。模型閉源，又沒有發布 API，Meta 也有可能故技重施，在跑分上造假。這模型好不好用，難說。

所以，為了看看這里面到底有幾分水分，世超把 Muse Spark 拉來，和 Gemini 3.1 pro，Opus 4.6，GPT 5.4 Thinking 做了個簡單橫向對比。

目前 Muse Spark 只開放了 Instant 和 Thinking 兩種模式，前者快速回答，后者有一些思考和推理能力，我們這回主要測能力更強的 Thinking。

咱們先從 Muse Spark 主推的多模態開始。比如，世超給它一張超市貨架圖，讓它推薦幾款減脂期零食。

從回答里看得出，Muse Spark 對圖片的理解能力很強，細節也能抓到位，文字閱讀無障礙，推薦得有理有據，結果可靠。

但要只是上面這種程度，所有模型都能做得到，Muse Spark 只能算是及格。下面這些上難度的玩法，才是 Muse Spark 表演的開始。

在官方博客里，Meta 提供了一個一張圖變數獨游戲的案例。只要給出一張圖片，提示詞 “ 把這張圖變成網頁數獨游戲 ”，就能獲得一個可玩數獨。

我們也做了個類似的，親測好用。不止交互很絲滑，答案也能準確計算好，頁面風格和提供的圖片完全一致。

感覺 Muse Spark 的多模態不像其它模型，只是識圖看個大概，剩下的全憑自由發揮。它是真懂事，不僅能按照你提供的圖片像素級復刻，甚至可以準確推斷出背后的操作使用邏輯。

下面這個例子就更猛了。世超只是隨手截了一個 win11 系統計算器圖給它，提示 “ 把這張圖片變成一個可用計算器 ”，Muse Spark 一口氣做出來的 demo，每個按鍵都好使，計算準確，界面和系統媽生計算器一模一樣。

作為對比，GPT 5.4 Thinking 界面風格類似，但有亂碼；Gemini 3.1 pro 完全無視了原圖；只有真神 Opus 4.6 維持了一貫的高水準。

而在據說 Muse Spark 并不擅長的代碼方面，我們實測也有驚喜。

咱先試了試前端網頁設計實現。至少在這一塊，Muse Spark 的審美屬于一流水平。

頁面功能實現得比較完整，部分鏈接按鈕可點擊，雖然具體內容存在一些杜撰，粗略看起來還是很舒服的。

整體和 Opus 4.6 比起來有點差距，但比起不知所云的 GPT，還是強了很多。

算法代碼方面，我們挑選了幾道 leetcode 高難題。

最震驚的還是在 65 號題上，雖然所有模型都通過了測試，但 Muse Spark 給出了時間和空間上，都更加優雅的解法。。。

作為對比，Opus 4.6 和 GPT 5.4 Thinking 的時間復雜度排名僅 50%，而 Gemini 3.1 pro 的空間復雜度只擊敗了 13% 的提交答案。

再以 10 號題為例，Muse Spark 和 Opus 給出的依然是最優解；GPT 通過了測試，但解法不夠好；Gemini 3.1 pro 則直接出現 bug，失敗了。

測到這里，Muse Spark 的表現已經遠遠超過世超的預期了。表現和 Opus 打的有來有回，反而 GPT 和 Gemini 顯得有點不夠看。

不會吧不會吧，難道我們都誤會了，亞歷山大王真有點東西？

再看看簡單的文字測試。不得不說，Muse Spark 思路相當清晰，Instant 模式回答幾個經典邏輯問題足夠用，3 秒必達。

而作為對比，Gemini 和 Opus 的表現也是穩定且準確。唯獨 GPT，上個月新發布的版本 5.4 Thinking，還在這種簡單邏輯題上翻車，拉完了。

最后，在健康領域，所有模型的回答都中規中矩，Muse Spark 無功無過。

在簡單試用完一圈之后，世超感覺大模型界三足鼎立的局面，真要被打破了。

而 Meta 目前放出來的，甚至還只是一個較輕量，試試水，可能在未來開源的版本。。。

官方表示，他們正在 Muse Spark 的基礎上，繼續對整個技術棧加大投資力度，從研究，數據，模型訓練到基礎設施，規模全面擴張。

在模型訓練技術細節上，Meta 提到了三個關鍵點：預訓練、強化學習、和測試時推理（test-time reasoning）。

前兩個過程各位差友已經很熟悉了，但即使這是每個大模型的必經之路，Meta 依然背靠 Instagram 和 Facebook，有著得天獨厚的數據優勢。在數據這方面，可能只有谷歌能和 Meta 相提并論。

而在測試時推理這個階段，Meta 主要做的是，讓模型在回答問題之前，先思考一陣，但不能耗太多 token。

這一點世超在 GPT Thinking 系列上深有體會。這些模型經常想起來沒完，結果變得又臭又長，信息密度極低。

而 Meta 選擇在訓練的過程中，對過長的思考進行懲罰。把長推理壓縮成盡量少 token 的前提下，又能讓模型回答準確，達成了微妙的平衡。

最后，回過頭看，一次又一次失敗，Meta 居然從來沒退出這場比賽，最終再次歸位前沿陣地，這故事太燃了。

但在另一邊，Claude Mythos Preview 已經強到另一個維度了。相比之下，Muse Spark 這一波，像是才剛補上了之前缺的課。

所以，世超只能說，期待 Meta 加入這場模型大亂斗，讓小扎也有機會，癱坐在小小的辦公椅上吧。

撰文：莫莫莫甜甜

編輯：江江 & 面線

美編：煥妍

圖片、資料來源：

感謝宅宅老師提供的跨國支援！

莫莫實測

Muse Spark 官方博客、X

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

21歲小伙賣豬肉幫助撫養6個弟妹：羨慕同齡人上大學或出去打工，希望爸媽別再生了

極目新聞 2026-04-21 22:03:17
5958 跟貼 5958
渡船以渡車為主渡客為輔，女子慢悠悠上船被直接落下

南陽日報 2026-04-21 18:57:27
202 跟貼 202

大爺駕駛MPV強穿掛壁公路，出來時全車被刮花

荔枝新聞 2026-04-22 05:14:55
138 跟貼 138

謝鋒:中國大蒜做夢也沒想到會被美列為"國家安全威脅"

極目新聞 2026-04-22 08:45:19
332 跟貼 332
"取消午休改16點下班"火了上海人一針見血

魯中晨報 2026-04-22 14:28:23
20 跟貼 20

中國軍艦大片震撼上新：雷達一開周圍都是透明的

環球網資訊 2026-04-22 09:00:22
1488 跟貼 1488

寧德時代麒麟凝聚態電池發布，最高續航1500公里

新京報 2026-04-21 20:38:22
2007 跟貼 2007
寧馬線開通場面太火爆，有乘客等三趟車沒擠上

現代快報 2026-04-22 14:20:23
7 跟貼 7

黎巴嫩再成戰場民眾：在這沒有人沒有失去過親近的人

新京報 2026-04-20 08:22:24
888 跟貼 888
專家號剛放出就瞬間"秒空" 上海三甲醫院緊急報警

大風新聞 2026-04-22 15:12:13
0 跟貼 0
格力回應鋁線電機爭議：相關工程機已停產，海信稱靠多三兩銅多500元時代已終結

紅星資本局 2026-04-21 20:40:16
10 跟貼 10
云南一幼童十余天反復咳痰帶血，氣管內取出8厘米活體蠕動螞蟥

澎湃新聞 2026-04-22 11:02:28
565 跟貼 565
開封萬歲山現“啤酒交易所”，供應商：實為啤酒自助銷售裝置，價格隨人數動態變化，還可選無酒精版

極目新聞 2026-04-21 19:55:58
305 跟貼 305
樓市去庫存成效正在顯現

經濟日報 2026-04-22 06:55:13
145 跟貼 145
茶顏悅色深圳店用機械臂搖奶茶，有人凌晨4點半排隊：炒到100一杯

星視頻 2026-04-22 11:46:47
130 跟貼 130
湖南一高中生200米跑出20.99秒破紀錄，教練：他曾想放棄高考去打工

瀟湘晨報 2026-04-22 13:16:27
72 跟貼 72
股市三點鐘丨滬指收漲0.52%，重返4100點！兩市合計成交額2.56萬億元

北京商報 2026-04-22 15:28:05
10 跟貼 10
國家疾控局：4月以來流感病毒和鼻病毒呈上升趨勢

央視新聞客戶端 2026-04-22 15:13:09
81 跟貼 81
英國議會通過法案，2008年后出生者終身不得購煙

澎湃新聞 2026-04-22 14:53:04
62 跟貼 62
中國外骨骼助外籍女子重新邁步，好友喜極而泣

學申論的談妹 2026-04-22 15:56:22
37 跟貼 37
億縷陽光｜在春天邂逅美好

環球網資訊 2026-04-21 20:39:50
144 跟貼 144
地鐵口流動攤販占道主干道成“露天集市”埋隱患

上觀新聞 2026-04-22 18:19:08
0 跟貼 0
業主投訴小區旁空地堆放砂石擾民，“只要一起風，整個小區黃塵漫天“；社區：將核實是否有揚塵

大風新聞 2026-04-22 18:11:05
0 跟貼 0
乘聯分會：4月1—19日全國乘用車市場零售62.7萬輛同比下降26%

證券時報 2026-04-22 17:04:34
0 跟貼 0
超載近60噸！四川渠縣一重型貨車司機嚴重超載被罰2000元記6分

紅星新聞 2026-04-22 18:16:33
0 跟貼 0
小伙從7米堡坎跳入江中被“拍暈” 民警跳水托舉成功救人

上游新聞 2026-04-22 18:17:40
0 跟貼 0

網友喊話請何潤東代言霸王茶姬，有人都把圖P好了，客服：建議已詳細登記；何潤東翻紅后，賬號漲粉近200萬

網友喊話請何潤東代言霸王茶姬，有人都把圖P好了，客服：建議已詳細登記；何潤東翻紅后，賬號漲粉近200萬

魯中晨報

2026-04-20 14:48:15

男子買彩票中了5340萬偷偷轉給別的女人2100萬前妻起訴返還法院判了

男子買彩票中了5340萬偷偷轉給別的女人2100萬前妻起訴返還法院判了

閃電新聞

2026-04-21 10:35:14

太突然！800萬粉網紅挖機小何獲贈新挖掘機，流量密碼回來了

太突然！800萬粉網紅挖機小何獲贈新挖掘機，流量密碼回來了

雷科技

2026-04-21 11:22:34

南京隊前教練：感謝球迷邀請我回歸，但大家要對球隊保持耐心

南京隊前教練：感謝球迷邀請我回歸，但大家要對球隊保持耐心

懂球帝

2026-04-22 00:31:07

博格巴：我和穆帥在內的任何教練都沒問題，回曼聯感覺一切都變了

博格巴：我和穆帥在內的任何教練都沒問題，回曼聯感覺一切都變了

蘭亭墨未干

2026-04-22 17:49:09

兩性關系:不管你信不信，女性過60歲，基本都有如下幾個需求！

兩性關系:不管你信不信，女性過60歲，基本都有如下幾個需求！

周哥一影視

2026-04-22 14:36:34

白鹿北京的家餐桌要30000元，親自下廚給助理吃，自己卻不吃晚飯

白鹿北京的家餐桌要30000元，親自下廚給助理吃，自己卻不吃晚飯

椰黃娛樂

2026-04-22 11:09:10

張本智和再次全家大遷徙，這次是德國，網友：回中國也不必多慮！

張本智和再次全家大遷徙，這次是德國，網友：回中國也不必多慮！

玖宇維

2026-04-21 21:23:08

凱特出席已故女王百歲誕辰！穿丁香紫裙很優雅，44歲顏值卻很真實

凱特出席已故女王百歲誕辰！穿丁香紫裙很優雅，44歲顏值卻很真實

八八尚語

2026-04-22 11:04:08

炸裂！網傳寧波某豪宅業主群夫妻大戰，虎狼之詞流出，444人圍觀

炸裂！網傳寧波某豪宅業主群夫妻大戰，虎狼之詞流出，444人圍觀

火山詩話

2026-04-22 17:56:13

活塞vs魔術前瞻：活塞背水一戰力爭反彈，魔術客場力爭2-0

活塞vs魔術前瞻：活塞背水一戰力爭反彈，魔術客場力爭2-0

橙汁的味道123

2026-04-22 18:04:53

美15艘軍艦封鎖霍爾木茲？中國沉默6天后，一招讓特朗普徹底破防

美15艘軍艦封鎖霍爾木茲？中國沉默6天后，一招讓特朗普徹底破防

歸史

2026-04-18 11:45:15

首部全AI生成電影《靈魂擺渡》將定檔，監制為《唐朝詭事錄》主創郭靖宇，此前曾發問“真人能演的劇，為什么非要AI做出假人來演”

首部全AI生成電影《靈魂擺渡》將定檔，監制為《唐朝詭事錄》主創郭靖宇，此前曾發問“真人能演的劇，為什么非要AI做出假人來演”

極目新聞

2026-04-22 11:21:22

59歲宋祖英與男友合影曝光，氣質優雅素顏真實

59歲宋祖英與男友合影曝光，氣質優雅素顏真實

無處遁形

2026-04-22 11:37:27

邱淑貞工藤靜香母女同框聚會！57vs56凍齡比拼，女兒顏值各有韻味

邱淑貞工藤靜香母女同框聚會！57vs56凍齡比拼，女兒顏值各有韻味

人間煙火記事本

2026-04-22 06:49:11

斯洛伐克經濟部長：“友誼”輸油管道預計于23日恢復向斯方供油

斯洛伐克經濟部長：“友誼”輸油管道預計于23日恢復向斯方供油

國際在線

2026-04-22 17:34:09

對標優衣庫，干翻宜家？這家“摳門”會員店，憑什么讓中產上癮

對標優衣庫，干翻宜家？這家“摳門”會員店，憑什么讓中產上癮

青眼財經

2026-04-20 14:48:46

為什么東風-41洲際導彈堅決不用北斗？不是不用，是絕不能用！

為什么東風-41洲際導彈堅決不用北斗？不是不用，是絕不能用！

一姐說軍史

2026-04-13 12:27:41

吉林高新技術產業開發區黨工委書記張守華接受審查調查

吉林高新技術產業開發區黨工委書記張守華接受審查調查

界面新聞

2026-04-22 15:59:44

原來她早已去世，從患病到離世僅16天，去世原因讓人心痛！

原來她早已去世，從患病到離世僅16天，去世原因讓人心痛！

青梅侃史啊

2026-04-22 17:10:45

用知識和觀點Debug the world！

10614文章數 489596關注度

往期回顧全部

科技要聞

對話梅濤：沒有視頻底座，具身智能走不遠

頭條要聞

三甲醫院科主任被舉報"巨額財產來源不明" 舉報人發聲

頭條要聞

三甲醫院科主任被舉報"巨額財產來源不明" 舉報人發聲

體育要聞

網易傳媒再度簽約法國隊和阿根廷隊

娛樂要聞

復婚無望！baby黃曉明陪小海綿零交流

財經要聞

伊朗拒絕出席特朗普宣布延長停火期限

汽車要聞

純電續航301km+激光雷達宋Pro DM-i飛馳版9.99萬起

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

時尚

藝術

數碼

手機

家居

初夏穿赫本的白褲子，清新又高級！

藝術要聞

無花不風景

數碼要聞

Beats發布3米USB-C數據線：售229元最高240W快充

手機要聞

小米澎湃OS 3 Beta版推送“龍蝦”智能體Xiaomi miclaw

家居要聞

極簡繪夢克制和諧

詩意光影窺見自然之境
自然慢調慢享時光
法式線條時光靜淌

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<sub id="qixzw"></sub>

<sub id="qixzw"></sub>

<style id="qixzw"></style>

<sub id="qixzw"><p id="qixzw"></p></sub>