網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

神秘模型「大象」：僅100B拿下SOTA，Token效率超高！

2026-04-22 18:26:33　來源: 量子位

北京舉報

分享至

金磊發(fā)自凹非寺
量子位 | 公眾號 QbitAI

神秘模型Elephant的面紗，終于被揭開了。

事情是這樣的。

前一陣子OpenRouters在自家官方上提到了一個神秘模型Elephant Alpha，并且給到的評價是這樣的：

僅100B大小，在同規(guī)模模型里是SOTA，還巨省Token。

話題一出，立即引來不少網(wǎng)友們的圍觀，他們紛紛開始猜測這又是哪家的模型。

不過非常微妙的一點是，這次網(wǎng)友們猜測的對象，統(tǒng)一地指向了中國大模型：

是MiniMax、Kimi、DeepSeek，還是什么新黑馬？

量子位獨家獲悉了答案，只能說網(wǎng)友們猜對了一半——

確實是來自中國的模型；但玩家并未在他們給的選項里。

因為這頭「大象」，出自螞蟻Inclusion AI 團隊之手。

很反差的一點是，「大象」不大，自帶的只是100B大小、256K上下文窗口、32K輸出的敏捷屬性。

并且在整體體驗下來之后，很直觀的感受，就是它有點國產(chǎn)版Grok 4 Fast的味道，天生干活圣體。

來，咱們這就展開一波深度實測~

干活圣體，很省Token

針對「大象」的實測，我們是在OpenRouters上的網(wǎng)頁端來展開。

并且會取日常工作較高頻的工作內(nèi)容來進行測試，只為證明一件事：「大象」干活，到底行不行。

實測1：修Bug沒有多余廢話

對于程序員群里來說，AI寫代碼已經(jīng)不是什么新鮮事了。

但現(xiàn)在比較頭疼的，就是怕AI唰唰唰地寫了幾百行代碼，一跑全報錯，再讓它改，它又給你唰唰唰地重新生成幾百行……

不僅效率低，還很費Token。

為此，我們在這個實測環(huán)節(jié)中給「大象」先安排了一個接地氣的任務：

用HTML和原生JS寫一個帶表單校驗的活動報名頁，要求包含姓名、手機號、郵箱，并且手機號必須符合中國大陸格式。

△原速度展示

可以看到，「大象」在思考片刻后，以極快的速度將代碼給生成了出來。

把整段代碼保存為.html文件后，也是可以成功運行。

但這并不是重點，重點在于「大象」是否做到修復。

于是乎，我們接下來給剛才生成好的代碼來一波投毒的操作：

把JS邏輯里定義提交按鈕的變量 const submitBtn = document.getElementById(‘submitBtn’) 直接刪掉。

如此投毒之后，控制臺必定會爆出 Uncaught ReferenceError: submitBtn is not defined 的錯誤。

然后我們把這份代碼再喂給「大象」，并簡單地附上一句：

運行報錯了，找不到變量。

不同于其它大模型，「大象」特別精準地找到了問題所在，然后用極簡的方式給出了解法。

也正因為這種沒有多余廢話的回答，直接省去了Token的無用消耗。

實測2：雜亂文檔，會抓重點

代碼生成和修復還只能說是程序員工作圈子里的任務，但像會議內(nèi)容整理，幾乎是所有職場人都需要經(jīng)歷的事兒。

在這項測試中，我們特意準備了一份大約3000字的會議紀要，里面充滿了口語化的表述，毫無意義的重復強調(diào)、部門之間關(guān)于排期的互相扯皮，甚至還有中途某人跑題聊起中午吃什么的外賣討論：

然后我們把文件丟給「大象」并附上一句Prompt：

忽略所有寒暄和跑題內(nèi)容。請基于這3000字，嚴格按照以下JSON 格式（包含：結(jié)論摘要、待辦清單及責任人、一封用于抄送全員的跟進郵件草稿）輸出結(jié)果。

「大象」給出的整理結(jié)果可以說是一目了然。

在剔除了無用信息之后，嚴格按照Prompt要求的那樣，把會議內(nèi)容給呈現(xiàn)了出來。

或許單看「大象」的結(jié)果不夠明顯，我們?yōu)榇颂匾饽昧薌emini-2.5-Flash-Lite做了下對比：

正所謂沒有對比就沒有傷害。

Gemini-2.5-Flash-Lite雖然也是實現(xiàn)了Prompt里的結(jié)構(gòu)，但很明顯一點就是，太長，也就意味著更多Token的消耗。

所以「大象」在會議整理任務上，Win Again。

實測3：Agent任務，也是夠快

最后的實測，我們來上一道硬菜——大火的Agent。

我們用「大象」來模擬一個輕量級的Agent Loop：

讀取一份包含四個月度數(shù)據(jù)的CSV銷售報表 → 計算季度同比（需要調(diào)用數(shù)學邏輯） → 寫一段簡練的分析結(jié)論 → 自檢數(shù)字是否準確。

從內(nèi)容上來看，「大象」先是對數(shù)據(jù)做了快速分析和推理，并給出了初步結(jié)論；而后又完成了自檢的工作，最終輸出最終結(jié)論。

但更重要的還是速度：只思考了10秒鐘、輸出2秒鐘。

由此可見，這個只有100B大小的「大象」，是真的做到了快、準、省。

而這一點，同樣體現(xiàn)在權(quán)威榜單的評測中。

作為開發(fā)者圈層公認的模型測謊儀，AI BENCHY不看廠商宣傳跑分，只聚焦指令遵循、響應速度、Token效率三大實戰(zhàn)指標。

從AI BENCHY給出的結(jié)果來看，「大象」輸出Token維持在了2500左右，說明每一分錢的API算力，都用在了刀刃上。

平均響應時間方面，「大象」平均時延被壓制在了1秒左右，而其它選手則均是10-30秒的水平。

并且在最重要的輸出質(zhì)量上，它的一致性分數(shù)達到了9.6分（滿分10分）！

因此，不論是從實測的體驗，亦或是權(quán)威榜單的評測來看，「大象」已然是可以勝任日常絕大多數(shù)的工作了。

但也有不擅長的事

正所謂人無完人、模無完模。

「大象」畢竟走的是一條快、準、省的路線，所以它定然是在某些領(lǐng)域里有所妥協(xié)。

在我們的實測中，也發(fā)現(xiàn)了「大象」一些不太擅長的工作。

例如復雜長鏈規(guī)劃，就是其中之一：

幫我主導一個出海東南亞市場的戰(zhàn)略項目。請從市場調(diào)研開始，接著做競品分析，然后給出渠道策略建議，最后幫我排一個半年的執(zhí)行甘特圖。

對于這個任務，「大象」直言無法執(zhí)行。

因為它沒有數(shù)據(jù)采集工具、沒有分析工具、沒有策略生成工具，也沒有項目管理工具。

所以對于這類任務，我們不妨用大模型規(guī)劃 + 「大象」執(zhí)行的方式來操作。

再如，對于非常非常新的知識，「大象」也可能會心有余而力不足。

以及要求生成React 18新特性或剛更新的SDK代碼時，「大象」可能會基于舊知識產(chǎn)生API幻覺。

所以如果你有這方面的需求，可以在Prompt中注入最新文檔來解決。

最后，Prompt過于模糊，也會影響輸出的質(zhì)量。

例如跟「大象」說：

幫我寫個好看的網(wǎng)頁。

因此，在用「大象」的時候，我們還需切記，Prompt一定要細致、要有足夠的約束力。

Agent 時代，“快、好、省”的小模型同樣重要

其實，在這個時間節(jié)點發(fā)布這樣一款主打智效比的模型，本身就是一種信號。

過去幾年時間里，AI圈似乎都在比拼誰的模型更大、誰的訓練成本更貴、誰在榜單上刷的分更高。

但行業(yè)走到今天，做加法的人太多了，需要有人站出來做減法。

因為Token浪費，已然成了行業(yè)高度重視的關(guān)鍵內(nèi)容之一。

《財經(jīng)》報道，全球企業(yè)級AI應用中，約有50%的Token正在被浪費。AI應用從對話轉(zhuǎn)向執(zhí)行后，Agent在復雜多輪任務中會不斷累積歷史文件、對話記錄，大量冗余信息導致Token消耗指數(shù)級增長。

每一塊錢都要花出響動，這是工程落地的鐵律。而踐行這條路線的，遠不止百靈。

就在前不久，OpenAI連續(xù)發(fā)布了GPT-5.4 mini和GPT-5.4 nano兩款小型模型，專為高頻且對延遲敏感的任務設(shè)計。它們在保持了GPT-5系列優(yōu)秀推理基因的前提下，實現(xiàn)了極高的吞吐量、極低的延遲和極具競爭力的性價比。

谷歌則通過開源小模型Gemma 4，以低成本、高推理力打入低端AI市場。Gemma 4的參數(shù)規(guī)模僅為同智力水平大模型的約二十分之一，過去需要花費上千萬GPU成本才能跑動的模型，現(xiàn)在大概一張高階顯卡就能跑得動，成本差距將近十倍。

尤其是對于預算有限、算力資源匱乏、追求極致投入產(chǎn)出比的中小企業(yè)而言，無需為冗余Token支付高額算力成本，無需采購昂貴硬件部署大模型，輕量化的「大象」就能無縫承接代碼開發(fā)、文檔處理、數(shù)據(jù)復盤、輕量Agent執(zhí)行等高頻剛需工作。

在動輒消耗幾十萬Token的長文本辦公場景中，響應壓制在1秒內(nèi)、少說廢話的高效模型，正在成為AI從玩具跨越到生產(chǎn)力工具的堅實底座。

快、準、省，這三個看似接地氣的字眼，正在成為AI高效上崗的標準。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點推薦

Agent中的“愛馬仕”來啦：100k+ Star 的開源AI Agent ，正在偷偷給自己升級

鈦媒體APP 2026-04-23 09:27:15
0 跟貼 0
挖漏洞何必Mythos，國產(chǎn)智能體早跑通了

量子位 2026-04-23 08:40:08
0 跟貼 0

從GPU到Token：AI基礎(chǔ)設(shè)施競爭邏輯重構(gòu)

量子位 2026-04-22 12:46:38
0 跟貼 0

大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
Clawdbot進化速度離譜：突然開口說話，給自己捏臉，還能炒股砍價

DeepTech深科技 2026-01-29 18:14:10
600 跟貼 600

突發(fā)！GPT-5.5深夜炸場，天選“牛馬”，OpenAI悟了？

雷科技 2026-04-24 07:54:22
0 跟貼 0

00后小哥復刻Claude最強神話模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟貼 0
小象剛出生就遭到獅子襲擊，這象媽媽也沒有，立刻去保護孩子

孟夏搞笑 2026-04-21 14:31:42
3 跟貼 3

大象：我拉車是專業(yè)的！搞笑配音

俊明影視剪輯 2026-04-22 15:35:17
1 跟貼 1
大象帶著祖孫三代去酒吧買醉瀟灑，一群獅子還想攔路擋道

機智的動物王國 2026-04-23 16:19:11
0 跟貼 0
大象一下爬到樹上去，樹上的獅子瞬間慌亂，嚇得不敢下去

余溫生活說 2026-04-23 12:00:11
1 跟貼 1
小象：兩腳獸閑著沒事干！搞笑配音

北京蝸牛劉師傅 2026-04-22 16:05:40
1 跟貼 1
狗狗西裝造型，嚴肅表情揭秘！

巨信瑞 2026-04-23 01:35:05
3 跟貼 3
大象：這水桶太小了！搞笑配音

妙讀國學 2026-04-22 16:46:58
1 跟貼 1
200多只母獅圍捕成年公象，利爪獠牙難破防，大象軍團踏平包圍圈

一只快樂的夢璃醬 2026-04-20 15:00:26
0 跟貼 0
大象：下次記得準時送飯！搞笑配音

世界之最大排行 2026-04-22 15:43:36
3 跟貼 3
這種院子不是種出來的，是設(shè)計出來再長出來的！

超人飛不高 2026-04-19 19:00:00
2 跟貼 2
動物也有愛！大象媽媽洗澡時面對小象的調(diào)皮搗蛋，沒有半點指責

亮哥講動物 2026-04-23 15:09:13
3 跟貼 3
大象和長頸鹿打架的場景

屁桃大孫哥 2026-04-23 17:40:53
0 跟貼 0
大象：沒把我放在眼里？搞笑配音

皮特兒動漫 2026-04-22 17:39:45
1 跟貼 1
鬣狗偷偷來到黑馬身后，不料被“過肩踢”，下幕鬣狗來不及逃跑

蝴蝶愛生活 2026-04-23 15:26:27
0 跟貼 0
真正的龍蝦平權(quán)，是零門檻的全民生產(chǎn)力

虎嗅APP 2026-04-22 20:37:14
8 跟貼 8
廣東一路邊攤炒鍋里趴著大老鼠，路人：不知道老鼠呆了多久，攤位上沒有人

大象新聞 2026-04-23 17:49:17
17 跟貼 17
嚇得大象一秒不敢動

吖吖剪輯 2026-04-23 16:36:43
1 跟貼 1
鬣狗和獅子吃了中毒的大象，全部中毒身亡

珮光動物 2026-04-21 11:01:19
1 跟貼 1
陸地上最強壯的動物，獅子對其可無奈何，河馬犀牛也要退避三舍

劇情第一現(xiàn)場 2026-04-23 16:02:16
0 跟貼 0
大象：我的地盤不準停車！搞笑配音

北京蝸牛劉師傅 2026-04-22 16:25:06
1 跟貼 1
大象：這玉米只有皮??？搞笑配音

超人侃劇 2026-04-23 15:17:52
1 跟貼 1
河南一男子準備驚喜“盲盒”，把攢了倆月的兩三百個空瓶子送環(huán)衛(wèi)工人，大爺笑得合不攏嘴

大象新聞 2026-04-23 19:49:05
0 跟貼 0
小象：就知道吹牛皮！搞笑配音

小閱看影視 2026-04-22 16:28:36
1 跟貼 1
一頭水牛被三頭獅王瘋狂的蹂躪，突然一頭大象沖出來救援了它一下

于哥聊沙雕 2026-04-22 18:43:26
0 跟貼 0
大象帶著小象在大草原上游蕩，沒有任何食肉動物敢上來招惹

寵物招待所 2026-04-22 19:22:42
0 跟貼 0
小象：鼻子好疼啊！搞笑配音

打野小黃人 2026-04-23 15:38:03
1 跟貼 1
“模型超市”越開越多：字節(jié)、阿里、騰訊競相整合大模型公司“管道化”博弈全面升溫

財聯(lián)社 2026-04-24 09:38:12
0 跟貼 0
大象發(fā)怒起來把鬣狗給甩了出去

動物故事屋 2026-04-23 09:19:47
0 跟貼 0
新股提示：春光集團今日申購

每日經(jīng)濟新聞 2026-04-24 07:42:06
0 跟貼 0
什么是Token？5分鐘徹底搞懂大模型Token 原理、計算方式與作用詳解！

盧菁老師 2026-04-20 11:49:21
0 跟貼 0
大象：你瞧不起誰呢？搞笑配音

妙讀國學 2026-04-23 15:48:49
1 跟貼 1
女子大鬧國際航班南航否認與她有關(guān)：假空姐真誤機｜大象夜讀

大象新聞 2026-04-23 19:17:13
1 跟貼 1
非洲野牛與野象的較量，鋒利牛角穿透野象肚皮！在野象幾進幾出

生靈觀察喵 2026-04-23 09:35:26
3 跟貼 3

量子位

追蹤人工智能動態(tài)

12524文章數(shù) 176457關(guān)注度

往期回顧全部

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房產(chǎn)

本地

游戲

數(shù)碼

公開課

手機 / 數(shù)碼

房產(chǎn) / 家居

神秘模型「大象」：僅100B拿下SOTA，Token效率超高！

干活圣體，很省Token

但也有不擅長的事

Agent 時代，“快、好、省”的小模型同樣重要

凌晨突發(fā)！GPT-5.5正式上線：跑分更猛

用了16年的學位證"失效"男子舉報自己 高校最新通報

用了16年的學位證"失效"男子舉報自己 高校最新通報

給文班剃頭的馬刺DJ，成為NBA最佳第六人

王大陸因涉黑討債被判 女友也一同獲刑

19家企業(yè)要"鋁代銅"，格力偏不

預售30.29萬起 嵐圖泰山X8配896線激光雷達

態(tài)度原創(chuàng)

三亞安居房，突然官宣！

SAGA GIRLS 2026女團選秀

老外抱怨《黑旗RE》定價：太貴 我等打折了！

重磅回歸！當貝超級盒子正式開啟預約 4月27日全網(wǎng)開售

神秘模型「大象」：僅100B拿下SOTA，Token效率超高！

干活圣體，很省Token

Agent 時代，“快、好、省”的小模型同樣重要

凌晨突發(fā)！GPT-5.5正式上線：跑分更猛

用了16年的學位證"失效"男子舉報自己高校最新通報

用了16年的學位證"失效"男子舉報自己高校最新通報

給文班剃頭的馬刺DJ，成為NBA最佳第六人

王大陸因涉黑討債被判女友也一同獲刑

19家企業(yè)要"鋁代銅"，格力偏不

預售30.29萬起嵐圖泰山X8配896線激光雷達

三亞安居房，突然官宣！

老外抱怨《黑旗RE》定價：太貴我等打折了！