文 | 闌夕
今年的火山引擎Force大會,有一個細節的改變,很有意思。
火山引擎的視頻云,以往都會在介紹Title上寫明「抖音同款」,而在這次,取而代之的是一個全新但也眼熟的標簽:「豆包同款」。
![]()
根據奧卡姆剃刀原則,如無必要,火山引擎不會如此費心的去「摳字眼」,這種改動,必然機遇市場風向的變化。
或者更直接的說,客戶對于視頻云的要求,徹底和以前不一樣了。
根據IDC的數據顯示,隨著2022年視頻云的產值首次超過100億美金,以及大模型行業的從無到有,在AI加速融合到云服務的周期里,由多模態模型提供的實時互動場景,以及智能化的媒體生產方案,疊加以前的視頻化、高清化、出海化需求,未來5年的市場增速會高達20以上,相當于中國IT大盤增速的兩倍以上。
于是,就有了「江山代有才人出」的劇本出現。
「抖音同款」的價值倒不是消失了,當它已經成為火山引擎視頻云的標準之后,繼續強調的意義就不大了。
這就像是早年電商平臺的供給參差不齊,一家店鋪只要聲明支持退換貨,就能增強不少競爭力,后來退換貨成了平臺的普遍政策,店鋪也就不再標榜這項服務了。
對視頻云有需求的企業客戶,確實曾經會為「抖音同款」的能力買單,那時的需求,是大規模并發的負載支持、畫面傳輸的清晰度、萬人在線直播的不卡頓這些,而抖音代表著天花板檔位的體驗。
所以,「抖音同款」的言下之意在于,連十億級別活躍用戶的抖音都能被火山引擎視頻云照顧周全,服務一般性產品更是不在話下。
但時代是在變化的,稀缺變得充裕后,自然會產生新的稀缺。
火山引擎的增長歷史,其實重疊了中國互聯網的基礎設施步入完善階段的整個上升過程,在云服務這塊,一個類似深圳之于電子消費品的供應鏈已經成型,產品從落地到上線的支持一應俱全。
比如開發者要做一款直播App,怎么去做轉碼分發、如何適配端云一體的推拉流、全球CDN節點的緩存方案是什么、怎樣搭建防盜鏈系統這些,都可以在云服務的「貨架」上按需采購,一鍵部署。
「抖音同款」意味著一種確定性,任何開發者都能普惠獲得與抖音無異的「后勤保障」。
但在生產力溢出迎上出海新機遇的今天,讓產品跑起來已經只能算是基操了,開發者對云服務的新要求,是為產品賦予更加智能化的價值,甚至是能實現從前不可想象的功能。
一言以蔽之,就是「豆包同款」。
前幾天,豆包的日活突破1億,引起一大波刷屏,尤其是在披露了豆包是字節史上所有日活破億產品里市場投入最低的,卻領先于所有對手達成了里程碑,這更是過于反直覺。
其微笑曲線的出現,取決于進入了大眾應用場景,僅是三宮格P圖這類玩法,就能撬動百萬級自然下載,每一天。
某種意義上,這就是「豆包同款」的市場吸引力,不是說要復刻一個豆包出來,而是豆包調用的AI能力,可不可以「飛入尋常百姓家」?
至少,在多模態的音視頻領域,火山引擎視頻云,確實是拿得出能打的同款。
以AI時代創造的出海機會為例,短劇、電商、虛擬陪伴這些賽道的爆發,其實都有AI云原生的助力,也就是把大模型的能力做成了即插即用的服務。
中國市場上的短劇內容或是消費品可以說是供給極其旺盛,但它們難以「走出國門」的核心原因之一,就是本土化的適配成本不可控,如果要用專門的團隊來做落地,很容易把賺錢的生意做成虧錢。
![]()
而在有了火山引擎視頻云的一站式AI解決方案之后,以極低的成本,短劇儲備能在數天之內完成從對口型到自己翻譯的完整再生,跨境電商也可以自動混剪直播的高光時刻,在一夜之間生成上萬個投流素材。
這就是說,「豆包同款」實際上提供了一個新的標準,那就是讓視頻云從被動的計算工具,升級成了主動的生產容器。
這個時代的云,開始能夠長出業務,甚至是盈利模式。
Google今年打了一場翻盤仗,除了Gemini支棱起來以外,在財務層證明了AI并未影響現有業務、反而有所促進這件事情,更加至關重要。
這推翻了原本的常識性判斷,數據顯示,即便搜索結果里的AI摘要吸引了部分原本會點擊廣告的流量,但因為搜索體驗的提升,一并提高了點擊質量,超額補回了預期中的損耗。
只要創造的是真實價值,回報就一定不會缺席,這是最適合對AI時代寫出的情書開頭。
就像Notion的ARR今年已經突破6億美金,其中一半以上是由AI帶來的,事實上Notion也沒有自研大模型,作為最早全線接入GPT的產品之一,Notion證明了用好AI的經濟回報有多豐富。
與此同時,也已經出海的中國流媒體公司在用AI打造貨幣化的關鍵節點了,最典型莫過于把AI陪伴看劇、答疑解惑、定制化切片放在會員權益里,借此拉動付費率。
而這些都是火山引擎視頻云的標配,開發者只需要聚焦內容價值,在對內容的二次開發、增值創造、服務升級等全場景/全生命周期方面,云上就可以調用各種模型能力,構成低代碼的工作流。
能接這樣的活兒,本質上還是在將字節系核心能力進行復用,火山引擎視頻云的中臺架構升級,用的就是「豆包同款」的AI MediaKit——這可不是修辭——豆包在處理多媒體時用的什么音視頻能力,火山引擎視頻云的客戶用的就是什么音視頻能力。
![]()
換句話說,火山引擎的視頻云,是用AI能力把傳統的音視頻技術重做了一遍,其中最主要的幾處技術升級包括:
AIGC傳輸系統,以前云上是不太負責內容生產的,相當于只做搬運工,但在AI進入工作流后,也需要考慮如何為智能體應用提供穩定、實時、可擴展的多模態數據傳輸能力;
AI MediaKit,是在云成為新的內容生成環境之后,平臺開始為客戶配置的新工具套件,聲影同傳、高光智剪、視頻總結這些原本需要在本地進行二次處理的工作,現在都可以直接放進云上的生產線,由不需要休息的大模型去日夜勞作;
音視頻互動智能體,是全面對齊豆包級的人感——和豆包聊天已經是抖音上的熱門選題了——它為商業客戶賦予了讓內容「活」起來的能力,不再局限于「播放」音視頻素材,使其有了響應、對話、思考甚至輸出情緒價值的服務。
可以發現,這三大升級互為漸進關系,且都是在為下一代AI化產品的架構服務,讓智能如自來水般接入各個細節里。
AI將一切信息都帶到了指數級的增長曲線上,作為消耗資源的大戶,音視頻內容需要的云,也從「保下限」——別卡頓、別變糊、別宕機——演進到了「提上限」,要自帶最先進的基座模型,要能實時化的智能交互,要能用自然語言完成作品交付。
今年8月,風險投資機構A16Z發布了最新一版消費級AI應用百強榜,其中來自中國團隊開發的移動端產品,已經占到了44%,絕大多數都是在海外市場「大殺四方」。
模型中心部署、應用全球分發的模式,似乎是能最大化發揮中國AI產業「長板效應」的最優解,但這也為保障用戶體驗帶來了新的挑戰。
如果一個紐約的用戶在猶豫是否開通會員前可以和一個說著一口流利英語的數字人進行視頻通話并問清楚積分政策,那么他的付費概率,搞不好就會漲幾個百分點。
這只是萬千細小場景的一個片段,在數字化的工業體系里,視頻云的存在感之所以開始趨于全鏈路化,就是為了滿足前所未有的「心智」需求。
火山引擎為視頻云換代,就是想讓產品的每一個交互,都自帶Tokens的用武之地。
如果出海遠航已經從可選項變成了必選項,那么這朵云就相當于船的龍骨,它的質量和創新,決定了滿艙貨物究竟能夠抵達多遠的港口。
這還是讓人想起Notion的創始人Ivan Zhao關于AI的想象空間還沒有真正到來的判斷:
蒸汽機的出現并沒有在一夜之間帶來工業革命,最開始人們只是下意識的將水車替換成蒸汽機,以致于雖然不再需要水動力,蒸汽機往往也都依河而建。
只有在生產裝置被逐一替換之后,在中央軸被分布式電力系統淘汰之后,在以蒸汽機為中心重新設計工廠布局之后,人類才得以最大化的發揮新技術,生產力爆炸。
從歷史的后視鏡來看,火山引擎視頻云就在領跑于這個關鍵的轉型階段,這也才是「豆包同款」的真正含義:
最先進的大模型有的能力,我不許有人沒用上。
對摩拳擦掌的開發者們來說,最感動的聲音不是「你有沒有可樂喝」,而是「你有沒有『豆包同款』用?」
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.