10月16日,在 FORCE LINK AI 創(chuàng)新巡展武漢站上,火山引擎發(fā)布了豆包大模型的系列更新,包括豆包大模型 1.6 原生支持多種思考長度,并推出了豆包大模型1.6 lite、豆包語音合成模型2.0、豆包聲音復(fù)刻模型2.0等全新模型。
隨著AI產(chǎn)業(yè)落地持續(xù)加速,截至2025年9月底,豆包大模型日均tokens調(diào)用量已突破30萬億,相比今年5月底增長超80%。在企業(yè)市場,IDC報(bào)告顯示,2025年上半年中國公有云大模型服務(wù)市場,火山引擎以49.2%的份額占比位居中國第一。
火山引擎總裁譚待指出,全球AI大模型正在三個(gè)方向上快速發(fā)展:一是深度思考模型正與多模態(tài)理解能力融合,二是視頻、圖像、語音模型逐步實(shí)現(xiàn)生產(chǎn)級水平,三是企業(yè)級復(fù)雜Agent正在走向成熟,為企業(yè)激發(fā)新的生產(chǎn)力潛能。
![]()
火山引擎總裁 譚待
豆包大模型1.6升級,國內(nèi)首個(gè)原生支持“分檔調(diào)節(jié)思考長度”的大模型
在服務(wù)大量企業(yè)用戶的過程中,火山引擎發(fā)現(xiàn),當(dāng)開啟深度思考模式,模型效果平均可提升31%,但會提高模型延遲和使用成本,這導(dǎo)致在實(shí)際應(yīng)用中,深度思考模式的使用占比僅有18%。
針對這一痛點(diǎn),豆包大模型1.6全新升級:提供Minimal、Low、Medium、High四種思考長度,平衡企業(yè)在不同場景下對模型效果、時(shí)延、成本的不同需求,并進(jìn)一步提升了思考效率。這也是國內(nèi)首個(gè)原生支持“分檔調(diào)節(jié)思考長度”的模型。
以低思考長度為例,相比模型升級之前的單一思考模式,升級后的豆包1.6模型總輸出tokens下降77.5%、思考時(shí)間下降84.6%,模型效果保持不變。
此外,為進(jìn)一步滿足企業(yè)的多樣化需求,火山引擎正式推出豆包大模型1.6 lite,相比旗艦版本更輕量、推理速度更快。效果上,該模型超越豆包大模型1.5 pro,在企業(yè)級場景測評中較豆包1.5 pro提升14%;在使用量最大的0-32k輸入?yún)^(qū)間里,綜合使用成本較豆包1.5 pro降低53.3%。
![]()
豆包語音合成、聲音復(fù)刻模型2.0發(fā)布,讓聲音能理解、會“表演”
巡展活動中,火山引擎正式發(fā)布豆包語音合成模型2.0(Doubao-Seed-TTS 2.0)、豆包聲音復(fù)刻模型2.0(Doubao-Seed-ICL 2.0),具備更強(qiáng)的情感表現(xiàn)力、更精準(zhǔn)的指令遵循能力,還能準(zhǔn)確朗讀復(fù)雜公式。
該模型基于豆包大語言模型研發(fā)語音合成新架構(gòu),讓合成和復(fù)刻的聲音都能進(jìn)行深度語義理解,并拓展出上下文推理能力,從單純的文本朗讀進(jìn)化為 “理解后的精準(zhǔn)情感表達(dá)”。用戶還能通過自然語言,實(shí)現(xiàn)對語速、情緒、聲線、音調(diào)、風(fēng)格變化的精準(zhǔn)調(diào)整,大幅提升語音的可控性。
在教育場景中,復(fù)雜公式和符號的朗讀一直是業(yè)界難題,目前市面上的同類模型朗讀準(zhǔn)確率普遍低于50%。新發(fā)布的兩大語音模型進(jìn)行了針對性優(yōu)化,目前在小學(xué)至高中階段全學(xué)科的復(fù)雜公式朗讀中,準(zhǔn)確率可達(dá)90%。
自去年5月首次發(fā)布以來,豆包語音模型家族已覆蓋語音合成、語音識別、聲音復(fù)刻、實(shí)時(shí)語音、同聲傳譯、音樂創(chuàng)作、播客創(chuàng)作等7大領(lǐng)域,已覆蓋超過4.6億臺智能終端。語音,正在成為AI應(yīng)用的核心交互方式。
智能模型路由發(fā)布,國內(nèi)首個(gè)模型智能選擇解決方案
模型越來越多,面對具體需求時(shí),如何選擇模型最有性價(jià)比?
為了解決這個(gè)問題,火山引擎發(fā)布智能模型路由(Smart Model Router),這是國內(nèi)首個(gè)針對模型智能選擇的解決方案。即日起,用戶可以在火山方舟上選擇“智能模型路由”功能,該功能支持“平衡模式”、“效果優(yōu)先模式”和“成本優(yōu)先模式”三種方案,可針對任務(wù)請求自動選擇最合適的模型,達(dá)到效果與成本的最優(yōu)解。
目前,火山引擎智能模型路由已支持豆包大模型、DeepSeek、Qwen、Kimi等多種主流模型。以DeepSeek為例,經(jīng)過實(shí)測,在效果優(yōu)先模式下,智能路由后,模型效果相比直接使用DeepSeek-V3.1提升14%;在成本優(yōu)先模式下,在實(shí)現(xiàn)DeepSeek-V3.1相似效果的條件下,模型的綜合成本最高下降超過70%。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.