火山引擎發(fā)布豆包系列模型升級，披露日均tokens超30萬億

2025-10-16 13:17:21　來源: 數(shù)據(jù)猿DataYuan

內(nèi)蒙古舉報(bào)

分享至

10月16日，在 FORCE LINK AI 創(chuàng)新巡展武漢站上，火山引擎發(fā)布了豆包大模型的系列更新，包括豆包大模型 1.6 原生支持多種思考長度，并推出了豆包大模型1.6 lite、豆包語音合成模型2.0、豆包聲音復(fù)刻模型2.0等全新模型。

隨著AI產(chǎn)業(yè)落地持續(xù)加速，截至2025年9月底，豆包大模型日均tokens調(diào)用量已突破30萬億，相比今年5月底增長超80%。在企業(yè)市場，IDC報(bào)告顯示，2025年上半年中國公有云大模型服務(wù)市場，火山引擎以49.2%的份額占比位居中國第一。

火山引擎總裁譚待指出，全球AI大模型正在三個(gè)方向上快速發(fā)展：一是深度思考模型正與多模態(tài)理解能力融合，二是視頻、圖像、語音模型逐步實(shí)現(xiàn)生產(chǎn)級水平，三是企業(yè)級復(fù)雜Agent正在走向成熟，為企業(yè)激發(fā)新的生產(chǎn)力潛能。

火山引擎總裁譚待

豆包大模型1.6升級，國內(nèi)首個(gè)原生支持“分檔調(diào)節(jié)思考長度”的大模型

在服務(wù)大量企業(yè)用戶的過程中，火山引擎發(fā)現(xiàn)，當(dāng)開啟深度思考模式，模型效果平均可提升31%，但會提高模型延遲和使用成本，這導(dǎo)致在實(shí)際應(yīng)用中，深度思考模式的使用占比僅有18%。

針對這一痛點(diǎn)，豆包大模型1.6全新升級：提供Minimal、Low、Medium、High四種思考長度，平衡企業(yè)在不同場景下對模型效果、時(shí)延、成本的不同需求，并進(jìn)一步提升了思考效率。這也是國內(nèi)首個(gè)原生支持“分檔調(diào)節(jié)思考長度”的模型。

以低思考長度為例，相比模型升級之前的單一思考模式，升級后的豆包1.6模型總輸出tokens下降77.5%、思考時(shí)間下降84.6%，模型效果保持不變。

此外，為進(jìn)一步滿足企業(yè)的多樣化需求，火山引擎正式推出豆包大模型1.6 lite，相比旗艦版本更輕量、推理速度更快。效果上，該模型超越豆包大模型1.5 pro，在企業(yè)級場景測評中較豆包1.5 pro提升14%；在使用量最大的0-32k輸入?yún)^(qū)間里，綜合使用成本較豆包1.5 pro降低53.3%。

豆包語音合成、聲音復(fù)刻模型2.0發(fā)布，讓聲音能理解、會“表演”

巡展活動中，火山引擎正式發(fā)布豆包語音合成模型2.0（Doubao-Seed-TTS 2.0）、豆包聲音復(fù)刻模型2.0（Doubao-Seed-ICL 2.0），具備更強(qiáng)的情感表現(xiàn)力、更精準(zhǔn)的指令遵循能力，還能準(zhǔn)確朗讀復(fù)雜公式。

該模型基于豆包大語言模型研發(fā)語音合成新架構(gòu)，讓合成和復(fù)刻的聲音都能進(jìn)行深度語義理解，并拓展出上下文推理能力，從單純的文本朗讀進(jìn)化為 “理解后的精準(zhǔn)情感表達(dá)”。用戶還能通過自然語言，實(shí)現(xiàn)對語速、情緒、聲線、音調(diào)、風(fēng)格變化的精準(zhǔn)調(diào)整，大幅提升語音的可控性。

在教育場景中，復(fù)雜公式和符號的朗讀一直是業(yè)界難題，目前市面上的同類模型朗讀準(zhǔn)確率普遍低于50%。新發(fā)布的兩大語音模型進(jìn)行了針對性優(yōu)化，目前在小學(xué)至高中階段全學(xué)科的復(fù)雜公式朗讀中，準(zhǔn)確率可達(dá)90%。

自去年5月首次發(fā)布以來，豆包語音模型家族已覆蓋語音合成、語音識別、聲音復(fù)刻、實(shí)時(shí)語音、同聲傳譯、音樂創(chuàng)作、播客創(chuàng)作等7大領(lǐng)域，已覆蓋超過4.6億臺智能終端。語音，正在成為AI應(yīng)用的核心交互方式。

智能模型路由發(fā)布，國內(nèi)首個(gè)模型智能選擇解決方案

模型越來越多，面對具體需求時(shí)，如何選擇模型最有性價(jià)比？

為了解決這個(gè)問題，火山引擎發(fā)布智能模型路由（Smart Model Router），這是國內(nèi)首個(gè)針對模型智能選擇的解決方案。即日起，用戶可以在火山方舟上選擇“智能模型路由”功能，該功能支持“平衡模式”、“效果優(yōu)先模式”和“成本優(yōu)先模式”三種方案，可針對任務(wù)請求自動選擇最合適的模型，達(dá)到效果與成本的最優(yōu)解。

目前，火山引擎智能模型路由已支持豆包大模型、DeepSeek、Qwen、Kimi等多種主流模型。以DeepSeek為例，經(jīng)過實(shí)測，在效果優(yōu)先模式下，智能路由后，模型效果相比直接使用DeepSeek-V3.1提升14%；在成本優(yōu)先模式下，在實(shí)現(xiàn)DeepSeek-V3.1相似效果的條件下，模型的綜合成本最高下降超過70%。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.