![]()
文:王智遠 | ID:Z201440
今天火山引擎 FORCE 大會。
我雖然沒去上海現場,但在朋友圈,已經感受到了「擠不進去」的熱度;朋友發來的照片里,連門口都站滿了人。
上午,聽完直播后,感觸最深的是冷冰冰的數據:
豆包日均調用量突破了 50 萬億 tokens,一年漲了 10 倍;這意味著 AI 徹底告別了「文青時代」,進入了流水線計件的「重工業時代」。
01
很多人盯著 50 萬億的數字流口水,覺得字節的勝利,其實,你得看透這背后的「潛規則」
以前企業用 AI,像去米其林餐廳吃頓大餐,那是偶爾顯擺一下的“奢侈品”;現在日均 50 萬億 tokens 的規模意味著,AI 已經變成了路邊的蘭州拉面,成了天天得吃的“剛需”。
你會發現,已經有超過 100 家企業累計用量過萬億了,這意味著在這些公司里,AI成了流水線上天天「計件干活」的苦力。
但問題是,如果這“拉面”一碗賣幾百塊,誰特么天天吃得起?火山這次干的第一件事,把這筆賬給算到了“地縫”里。
來看看一組市場份額,火山在公有云大模型調用量的份額已經占到了49.2%,相當于中國公有云上每產生兩個 tokens,就有一個來自火山。
別看現在各家模型都在卷性能,但市場是會「用腳投票」的;用的人越多,模型調優就越快,成本就壓得越狠,這是一個停不下來的「規模效應」。
為了讓這把火燒得更旺,火山搞了個「AI 節省計劃」,這邏輯非常「字節」。
不管你用自家豆包,還是用 DeepSeek 這些外面的開源模型,只要你在火山上跑,所有用量都給你算在一起打階梯折,用得越多,省得越多,最高能省快一半(47%)。
這解決了老板們最大的一個心病:試錯焦慮。
以前你想換個新模型試試,心里得盤算半天,之前錢是不是白花了?現在啟動成本高不高?現在好了,換模型不影響折扣,反正你只要在火山這個場子里玩,我就保你越玩越便宜。
再一個,他們還首創了「按思考長度付費」,這把 AI 的腦力活和體力活分開了,讓每一分錢都花在刀刃上,底層邏輯就一句話:
只有當一個 token 的價格低到讓企業心不疼的時候,AI 才能真正跑進煙火人間。
智遠看那 100 多家「萬億 tokens 俱樂部」的成員就在干這事兒,海底撈讓 AI 當用餐管家,華泰證券讓 AI 生成播客,連猿輔導都讓 AI 去批改作業了,這些是實實在在幫你省人力的「數字民工」。
可賬算明白了,活兒就一定能干好嗎?智遠跟很多企業聊過,他們不差那點 tokens 錢,他們怕「工程大坑」。就好比你有錢買磚頭,但你沒本事讓施工隊在爛泥地上蓋出一棟五星級酒店。
02
那為什么 Agent 總出不了實驗室?有三個扎心的真相:身份權限搞不清、模型確定性差、還有那堆陳年舊系統的接入成本太高。
這還只是表象,最底層的第一道坑,「算力消耗」的隱形成本能直接把你拖垮。
吳迪在演講里算了一筆極度現實的賬:以前你想在核心業務里跑 AI,得自建推理集群,初期投入起碼數百萬,折騰幾個月才能上線。
更要命的是,業務流量是有波峰波谷的,你為了應對那點高峰買了一堆昂貴的顯卡,等流量一過,就只能看著它們在那兒白白吃灰。
所以,火山提出了一個新詞:「推理代工」。
你來訓練,火山來跑。你只要把加密后的模型傳上去,底層的 GPU 運維、網絡調度你全都不用管。火山的算力池子大,能做到分鐘級的算力伸縮。
你的流量藍線怎么走,它的算力綠線就怎么貼著你長;根據實測,用這種「云上代工」模式代替自建集群,硬件和運維成本能降下一半,吞吐量還能提升 1.6 倍。
搞定了算力,第二道坑就是「工程化」的爛泥地。
譚待在現場直言:現在大家缺的不是強模型,是為 Agent 規模化運行而設計的基礎設施
你想想,一個 Agent 要進入生產環境,它得知道自己是誰(身份)、能干什么(權限)、在什么地方干活(環境);如果你沒法解決這些問題,Agent 在公司系統里永遠是個「黑戶」,誰敢放權給它?
為了填平這些坑,火山這次把Agent Kit給徹底翻新了。
你不用糾結怎么給 Agent 建辦公室(Runtime),也不用擔心它聊兩句就忘事,因為系統自帶了一個記性極好、反應極快的「超級大腦」(Memory)。
最絕的是,以前老古董 CRM 系統,Agent 根本聽不懂,現在配個「網關」就能實現即插即用,直接把老古董翻譯成 Agent 能秒懂的方言。
連「監工」的事兒火山都替你想好了。它內建了安全護欄(Guardrail)和實時監控(Observability),就是為了防止模型在那兒胡言亂語。
所以,這種「精裝房」模式最直觀的結果是什么?一句話總結即:代碼量的斷崖式下跌。
火山現場演示了這次 FORCE 大會的報名和簽到 Agent;如果按老辦法寫,起碼得折騰一兩千行代碼,累死累活還容易崩。
在 Agent Kit 模式下,因為復雜能力都是開箱即用的,Agent 本身的邏輯代碼只用了50 行,后端串聯只用了 11 行;加起來一共 61 行代碼,砍掉了 96% 的工作量。
這就是,為什么別人還在實驗室里慢吞吞地搓 Demo,而火山的 Agent 已經能出來幫幾千人辦會、簽到、做總結了。
底座穩了,代碼少了,那接下來該看什么了?得看「數字員工」的智商到底夠不夠。 這次豆包和多模態都進行了升級。
03
智遠先強調一點:很多人看模型升級,習慣盯著榜單上的跑分看;說實話,對于企業來說,跑分高幾分沒意義,能不能把活兒干成才是唯一的指標。
這次豆包沒有拿跑分炫技,底層邏輯非常清晰:它是面向 Agent 場景進行定向爆破的。
什么意思呢?
以往我們用 Agent 跑長任務,最怕「斷流」。你想想,一個復雜的任務需要調用十幾次工具,Agent 跑著跑著,上下文窗口就爆了,tokens 滿了,它就開始胡言亂語或者直接斷掉。
為了解決「短路」問題,豆包 1.8 出了一個殺手锏:「智能上下文管理」。根據你設定的策略,自動清理掉沒用的歷史信息,只留下最核心的邏輯。
現場演示了一個場景,處理十多個立項報告長任務,傳統模型很快就撞到了天花板,任務被迫終止;但豆包 1.8 靠著這個策略,tokens 始終控制在安全線內,穩穩地把活兒干完了。
這就是從「聰明」到「專業」的跨越。
在 Tool-use(工具調用) 和復雜指令遵循上,豆包 1.8 在全球主流評測集上都拿到了領先的成績,甚至在通用智能體測評中領跑全球。
不僅大腦進化了,豆包的「五官」也更靈敏了。
火山這次發布的視頻生成模型 Seaweed 1.5 Pro,解決了一個行業公認的頑疾:「張口不發聲」。
以前很多模型生成視頻,畫面很美,配上音效后口型對不上,或者語義不一致;Seaweed 1.5 Pro 做到了原生的音畫同步,能支持多人跨語言對白,四川話、粵語、上海話隨你挑,口型精準得嚇人。
為什么要卷這個?因為字節看透了,未來商業內容生產是需要「靈魂」的。
還有一個很有體感的例子:豆包 1.8 能通過低幀率看完一個一小時長的監控視頻,然后通過工具精準定位,幫你找出是誰劃了你的車。
抽象吧?以后誰劃拉你車,問豆包。這種對超長視頻的理解能力,直接讓 AI 從「看熱鬧」變成了「能斷案」。
所以,模型升級的本質為了讓 Agent 在真實業務場景里,不僅有「智商」,還得有「體力」和「眼力」。
但是,當你的 AI 員工既聰明又勤快時,問題又來了:你敢把核心數據交給它嗎?企業數據的「信任危機」怎么破?
04
你去問一個企業老板:要不要用 AI 提效?他肯定點頭。但你問,敢不敢把公司積攢了十年的核心知識庫、財務報表、合同細節全喂給云端的大模型?
他大概率會陷入沉默。
這是所謂的「信任赤字」。中國企業生意就這樣,很多企業為了安全,寧愿花大價錢搞私有化部署,哪怕算力利用率低得嚇人,哪怕模型升級慢得像蝸牛。
火山引擎這次也給解決了;他們在現場給出的方案叫 Mars on AICC(機密計算)。
啥意思呢?
底層邏輯在云端服務器里,給你的數據和模型套了一個「隱形保險箱」,通過硬件級別的加密技術(CPU 和 GPU 內存加密),數據在傳輸和計算的過程中,除了你,沒有任何人能看到里面的內容。
這有什么現實意義?譚代在現場舉了上汽大眾的例子。
他們有 5 萬多份機密的內部知識庫,搞私有化,那成本簡直是天文數字;于是他們直接用了這套機密計算方案,在公有云上跑。 結果很有意思:
安全感拉滿了,實現了端到端的加密,企業可以像在私有化環境里一樣安全地使用云端模型;賬面太好看了,相比于全套私有化方案,這套方案幫上汽大眾節省了 60% 以上的成本。
這就是智遠想說的「安全紅利」。以前安全是企業的「負重」,你得為了它犧牲效率和金錢;現在通過技術創新,安全成了 AI 規模化的「加速器」。
不僅汽車行業,聯想也在用這套方案搞 AI PC 的機密推理,OPPO 也在搞業界首款支持機密 AI 推理的智能手機。
當AI 員工在云端辦公室里戴著「防窺膜」干活,而且老板手里還攥著唯一的鑰匙時,信任危機才算真正解除了。
賬算清楚了,房子蓋好了,安全也保障了,這個 AI 員工就完美了嗎?也未必;很多企業發現,AI 員工剛入職那天最驚艷,結果干了一年還是那副老樣子。
05
那怎么讓新Agent越干越聰明呢?火山引擎拿出了兩把鑰匙。
第一把鑰匙,讓 Agent 像人類一樣通過練習來升級。吳迪在現場分享了一個非常硬核的產品:Serverless RL(強化學習平臺)。
火山把它做成了「冰山模式」,復雜算力調度、算法框架全沉在水下,用戶在水面上只需要關注業務邏輯、數據閉環和 Reward(獎勵函數)。
抖音客服就靠這個,讓模型模擬真人客戶不斷跟它對話、糾錯。 結果模型不僅學會了情緒識別,問題解決率還直接漲了 10 個百分點。
這就是「以賽代練」,讓 Agent 在實戰中從新兵磨成老兵。
第二把鑰匙,讓 Agent 真正懂你的生意。
以前AI 助手只能讀讀文檔,根本碰不到公司商品庫和真實用戶行為;這次,火山深度升級了Viking AI 搜索,把「搜索、推薦、問答」三合一,讓 Agent 真正綁定企業的核心經營數據。
比如:服飾零售員工問 AI「下季度發哪些款」,AI會去分析庫存,對比潮流數據,直接告訴你,這幾款搜得多但庫存不夠,得趕緊補貨。
這種不僅有智商、更有「業務感」的表現,才是真正的數字員工。
當然,光有鑰匙還不夠,你還得有個「管家」來盯著這幫 AI 員工。
所以,火山甩出了這次的重頭戲,Hi Agent(企業智能體工作站)。 其中AgentSphere 預覽版能幫企業打造一個統一的 AI 調度中心,不管財務、HR 還是產品經理,都能在這個空間里協同辦公。
再加上那個能把豆包最核心的搜索、語音能力全部開放出來的 豆包助手 API,企業基本上是「開箱即用」。
說白了,火山這次通過Hi Agent、Viking 搜索、強化學習平臺這一整套組合拳,給企業遞上了一份實實在在的 AI 時代「員工入職手冊」。
整場大會聽下來,我最觸動的是微山縣小學。
通過豆包和 Hi Agent,孩子們能用 AI 畫出怪想法,平均成績提升了 10 分以上。這讓我意識到,AI應該是老師手里的教具、老板手邊的助手。
2026 年,火山引擎計劃和 500 家企業機構合作,去推動 Agent 的落地;說實話,火山的方案很有意思:用一個 AI 助理(豆包)去瘋狂練習、蒸餾出 Agent 的能力,然后,打通企業老掉牙的傳統軟件。
這讓 Agent 真正長出了手腳,成了能進系統、干臟活的數字員工;再復用這一切,有意思的行業解決方案。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.