![]()
“不談虛的,只做實的!火山引擎模型再升級。
開篇一波多表情小猿發送!百變小猿只需一瞬,多種情緒隨意切換,想獲得這樣的一組圖片,只需在豆包最新發布的圖像創作模型doubao-Seedream-4.0上上傳一張參考圖,然后輸入你想要的不同表情描述即可。
近日,在FORCE LINK AI創新巡展武漢站上,火山引擎總裁譚待發布了最新圖像創作模型doubao-Seedream-4.0、全新升級支持“分檔調節思考長度”的豆包大模型1.6、豆包語音合成模型2.0、聲音復刻模型2.0以及智能模型路由等新產品。
![]()
多功能百變生圖,你的靈魂畫手
豆包最新發布的圖像創作模型doubao-Seedream-4.0大幅提升了文生圖、圖生圖、圖像編輯等能力,可以基于參考圖生成不同風格的圖片,筆者以數據猿logo圖為參考圖進行了一系列試用。
提示詞:根據我給的參考圖設計一個手辦
![]()
(參考圖)
模型出圖:
![]()
豆包幾乎瞬間生成了一張立體手辦圖,保留了參考圖的關鍵元素,將原圖片做了立體設計展示。
接下來筆者繼續嘗試讓豆包根據參考圖生成多表情組圖,只需輸入:“根據我給的參考圖設計八張不同表情的logo圖。”模型就可以在參考圖的基礎上對小猿的表情進行不同情緒的微調展示,生成開篇圖的效果。可以看到豆包在參考圖的基礎上衍生出了開心、驚訝、哭泣、憤怒等多種表情,且圖片沒有出現不合理畸變等,doubao-Seedream-4.0不僅可應用在日常生活場景中,也為IP創作、衍生設計、商業營銷打開了更廣闊的想象空間。
效果與低成本不能兼得?
豆包1.6打破偽命題
在使用大模型時我們可選擇開啟“深度思考”模式,模型輸出效果會大幅提升,但同時成本和模型延遲也會增加,企業用戶考慮到使用成本問題,在是否開啟“深度思考”上往往更加保守。火山引擎調查發現,在實際應用中深度思考模式的使用占比僅有18%。
對所執行任務的判定并不是非黑即白,有很大一部分任務介于簡易與困難之間,屬于沒有被考慮到的中間地帶,不開啟深度思考效果不太夠,開啟深度思考消耗更多tokens又有些浪費。針對這一痛點,豆包大模型1.6全新升級:提供Minimal、Low、Medium、High四種思考長度,平衡企業在不同場景下對模型效果、時延、成本的不同需求,并進一步提升了思考效率。這也是國內首個原生支持“分檔調節思考長度”的模型。
以低思考長度為例,相比模型升級之前的單一思考模式,升級后的豆包1.6模型總輸出tokens下降77.5%、思考時間下降84.6%,模型效果保持不變。
此外,為進一步滿足不同企業的多樣化需求,火山引擎正式推出豆包大模型1.6 lite,相比旗艦版本更輕量、推理速度更快。在效果上1.6 lite超越豆包大模型1.5 pro,在企業級場景測評中較豆包1.5 pro提升14%;在使用量最大的0-32k輸入區間里,綜合使用成本較豆包1.5 pro降低53.3%。
![]()
語音模型家族壯大,實現深度語義理解
豆包語音模型家族不斷壯大,逐步覆蓋了語音合成、語音識別、聲音復刻、實時語音、同聲傳譯等不同領域,語音作為AI應用的核心交互方式已經深入到了大家生活的方方面面,手機喚起語音助手,駕車出行時給AI導航發出指令等,目前豆包語音模型已經覆蓋了超過4.6億臺智能終端,為廣大用戶提供便捷的AI服務。
此次火山引擎最新發布了豆包語音合成模型2.0和聲音復刻模型2.0。全新升級的語音合成模型2.0此次解決了一個業界老大難問題:復雜公式和符號的朗讀,這一點在教育場景中尤其重要。復雜公式里包含了很多特殊符號,一般非專業人士很難把握,大模型也面臨同樣的問題,市面上的同類模型朗讀準確率普遍低于50%,此次發布的語音模型2.0對這一塊進行了針對性優化,目前在小學至高中階段全學科公式的準確率可以達到90%以上。
我們來看一個例子。下圖是一個復雜的化學公式,筆者調用已被遺忘許久的化學知識試圖朗讀失敗。
![]()
接下來我們來看大模型給出的正確讀法:
除了正確朗讀之外,聲音復刻模型2.0還能做到復刻不同音色來朗讀內容,進行更加個性化、多樣化的語音創作。
模型路由,你的模型自動擋
譚待表示,火山引擎一直以來的宗旨是希望不斷地通過技術創新來幫助企業降本增效。市面上有非常多的模型,各個模型又分為不同的版本,側重的功能點各有不同,對于企業來說很難篩選到最匹配自身業務需求的模型,火山引擎針對這個特定需求全國首發智能模型路由方案,可以自動幫助企業選擇模型。模型路由不僅支持豆包全系列的模型,也支持DeepSeek、Kimi、通義千問等主流的開源模型,選擇更加豐富。
目前此功能已經可以在火山方舟平臺進行使用,路由支持不同模式,包括平衡模式、效果優先模式、成本優先模式,用戶可根據執行任務的具體難易程度等因素自主選擇不同模式,以達到效果和成本的最優解。如在智能客服場景下使用DeepSeek-V3.1模型執行任務,當選擇成本優先模式時,對比直接使用模型成本下降71%;選擇效果優先模式時,對比直接使用模型效果提升14%。
持續創造價值的模型不斷前行
去年5月,豆包大模型調用量是每天1200億Tokens,到今年9月漲到了每天30萬億Tokens,同比實現了253倍的高速增長。譚待表示:Tokens還會持續增長,這個趨勢遠遠沒有結束,且Tokens的增長與實際產生的效果并不是線性關系,實際創造價值比Tokens的增長更大。To B端的選擇最能說明問題,企業的每一分錢都要花在刀刃上,愿意花錢買Tokens,就是因為Tokens創造了價值,讓它的品牌更好,讓它的服務效率更高,讓它的成本降低,給業務帶來了更大的增益。
在企業AI持續推進的今天,與模型能力同等重要的,是對用戶的感同身受,從用戶的角度出發去發現問題、解決問題,讓AI真正成為懂用戶的伙伴,成為高效運作的數字員工。真正的智能永不傲慢,持續進步、不斷進化,才是在競爭激烈的AI市場中立于不敗之地的法寶。產品創造價值的同時,也鋪設了一條信任的路徑,構筑了企業發展的基石。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.