進(jìn)入2025年后,一個(gè)很直觀的變化是,AI 創(chuàng)業(yè)和投資的討論,開(kāi)始明顯從“模型能力有沒(méi)有突破”,轉(zhuǎn)向“這些能力到底在什么場(chǎng)景里被真正用起來(lái)”。
到了年底,各行各業(yè)的AI探索者給了我們答案:AI漫劇正以超快的速度滲透各大內(nèi)容平臺(tái);AI Coding著實(shí)成為開(kāi)發(fā)者的剛需;不同類型的Agent,正加快覆蓋業(yè)務(wù)的速度......
這意味著模型的進(jìn)化在2025年進(jìn)一步被轉(zhuǎn)換為了實(shí)際價(jià)值。
但伴隨場(chǎng)景爆發(fā)而來(lái)的,是創(chuàng)業(yè)者需要解決的問(wèn)題更多了。
什么場(chǎng)景不會(huì)被大廠吃掉?如何在同類產(chǎn)品中做出差異?怎么吸引并留存用戶?出海如何保證合規(guī)?有價(jià)值的具身數(shù)據(jù)如何收集?...
以上種種,是他們2025年問(wèn)題清單中重要的一部分。
在最近一場(chǎng)由火山引擎 V-START 加速器組織的創(chuàng)業(yè)企業(yè)論壇上,我看到21位來(lái)自內(nèi)容、多模態(tài)、Agent、企業(yè)服務(wù)、具身智能等領(lǐng)域的 AI 創(chuàng)業(yè)者和活躍在一線投資人,一起討論了這些問(wèn)題。
![]()
![]()
![]()
![]()
![]()
*滑動(dòng)查看
嘉賓們來(lái)自字節(jié)跳動(dòng)、影眸科技、看見(jiàn)概念—捏Ta、Pokee AI、數(shù)美萬(wàn)物、巨日祿、珀樂(lè)互動(dòng)、芒種星球Mootion、NVIDIA、光輪智能、A2B Labs、Picsart、Brix、明勢(shì)創(chuàng)投、源碼律動(dòng)、錦秋基金、云啟資本。
作為字節(jié)跳動(dòng)的科技創(chuàng)業(yè)平臺(tái),火山引擎 V-START 加速器希望聯(lián)合字節(jié)內(nèi)部和產(chǎn)業(yè)資源,幫助初創(chuàng)公司成長(zhǎng)。這場(chǎng)論壇中的明星創(chuàng)業(yè)公司,大多也是 V-START 加速器“ AI 領(lǐng)航者計(jì)劃”中的成員。(文末有加速器成員名錄)
以下是我對(duì)這21位 AI 探索者的年度 Insight 總結(jié)。
2025年模型側(cè)最大進(jìn)展:推理和多模態(tài)
![]()
推理和多模態(tài)讓應(yīng)用層場(chǎng)景爆發(fā)
2025年,模型側(cè)最重要的進(jìn)展體現(xiàn)在推理和多模態(tài)能力上。前者提升了 Coding 和各類 Agent 的應(yīng)用效果;后者則在下半年爆發(fā),為用戶和企業(yè)開(kāi)拓了更多落地場(chǎng)景。
火山引擎 V-START 加速器負(fù)責(zé)人賈瑞觀察到,2024年,創(chuàng)業(yè)公司在火山引擎上的 Token 消耗主要集中在角色扮演、互動(dòng)等娛樂(lè)場(chǎng)景。但到了今年,隨著模型推理和多模態(tài)能力的提升,編程、Agent、漫劇、硬件等領(lǐng)域涌現(xiàn)出大量?jī)?yōu)秀公司,應(yīng)用場(chǎng)景愈發(fā)多元。
這種多元化也直觀地體現(xiàn)在 Token 調(diào)用量上。2024年,在 V-START 加速器覆蓋的創(chuàng)業(yè)群體中,少數(shù)幾個(gè)互動(dòng)娛樂(lè)應(yīng)用就占據(jù)了 Token 調(diào)用的半壁江山,到了今年,分布在不同業(yè)務(wù)場(chǎng)景中的很多企業(yè),Token 消耗量都很大。
多模態(tài)讓C端用戶更能自我表達(dá)
捏 Ta 是一個(gè) AIOC 平臺(tái),用 AI 生成原創(chuàng)角色,再以角色為核心創(chuàng)作更多的內(nèi)容。公司創(chuàng)始人胡修涵感受到,去年受限于多模態(tài)能力的影響,C 端用戶直接能接觸到的 AI 的 aha moment 比較少。
但今年,字節(jié)的 Seedream、Seedance,海外的 Nano Banana、Sora 2 等一系列突破出現(xiàn)后,多模態(tài)內(nèi)容的連續(xù)性和準(zhǔn)確度大幅提升,給用戶提供了在內(nèi)容里探秘的空間。
專注 AI 早期投資的源碼律動(dòng)管理合伙人黃云剛認(rèn)為,多模態(tài)的進(jìn)步能幫助用戶進(jìn)行更多的個(gè)性化表達(dá)。過(guò)去,如果一個(gè)人特別有想象力,或許只能做一些文字創(chuàng)作,但很難進(jìn)一步把想象力表達(dá)成個(gè)性化的視覺(jué)產(chǎn)品,現(xiàn)在多模態(tài)模型帶來(lái)了變化。
模型還在拓展,應(yīng)用層怎么辦?
![]()
投資人:應(yīng)用層動(dòng)作快才能占領(lǐng)心智
當(dāng)模型進(jìn)展飛速,“殼”是不是更容易被擊穿?
錦秋基金合伙人臧天宇和源碼律動(dòng)管理合伙人黃云剛認(rèn)為,現(xiàn)在模型和應(yīng)用的邊界依然有些模糊,應(yīng)用層多是創(chuàng)業(yè)公司,需要?jiǎng)幼骺觳拍芙儆谧约旱男闹恰?/strong>
錦秋基金已經(jīng)投資了50多家 AI 創(chuàng)業(yè)公司,臧天宇觀察到,創(chuàng)業(yè)公司必須具備極高的進(jìn)化速度與韌性,趕在基座模型內(nèi)化相關(guān)的功能之前,通過(guò)更敏銳的場(chǎng)景理解,快速占據(jù)用戶習(xí)慣。
黃云剛覺(jué)得,單一交互形態(tài)的產(chǎn)品很容易被大模型“吃掉”。比如 AI 搜索,就被 Chat 的形態(tài)“吃”進(jìn)去了。因?yàn)樗慕换ズ?jiǎn)單,功能上只做信息的搜尋、整理、總結(jié),完全在模型能力的射程范圍內(nèi)。
他覺(jué)得應(yīng)用層創(chuàng)業(yè)者應(yīng)轉(zhuǎn)向能獲取更多用戶數(shù)據(jù)的場(chǎng)景,如果是生產(chǎn)力工具,最好有協(xié)作的功能,這樣能加深和用戶、客戶的聯(lián)系。另外,To C 的應(yīng)用層只做工具會(huì)比較卷,由產(chǎn)品延伸做出社區(qū)生態(tài)會(huì)更好。
火山引擎方舟解決方案負(fù)責(zé)人馮書云補(bǔ)充,用戶一旦在一個(gè) APP 培養(yǎng)了習(xí)慣,其實(shí)很難遷移。企業(yè)會(huì)積極建設(shè)自己的知識(shí)庫(kù),但怎樣把客戶的時(shí)間和上下文留下來(lái),是個(gè)很難的問(wèn)題。
創(chuàng)業(yè)者:速度快不是唯一贏的路徑
作為創(chuàng)業(yè)者,胡修涵認(rèn)為,創(chuàng)業(yè)公司的速度具有相對(duì)性,不同賽道可能需要的速度也不同。而且,他還認(rèn)為社區(qū)對(duì)創(chuàng)業(yè)公司也很重要。
捏Ta一直在構(gòu)建自己的 IP 奈塔和社區(qū)。胡修涵說(shuō),社區(qū)的意義更在于構(gòu)建新的生活方式與意義,不會(huì)因?yàn)槟P瓦M(jìn)步而受到巨大影響。他還覺(jué)得,現(xiàn)在的 AI 產(chǎn)品看似只有一條路徑,就是“科技勝利”,也就是誰(shuí)最快就是勝利,但是隨著模型能力的提升,還可以有文化勝利。
一些更獨(dú)特的、復(fù)雜工作流也會(huì)加深應(yīng)用層的壁壘。
數(shù)美萬(wàn)物能幫助用戶把自己的作品制作成實(shí)體手辦等產(chǎn)品。它的聯(lián)合創(chuàng)始人賈榮飛認(rèn)為,應(yīng)用層的壁壘在于踩坑。坑踩得多了,其他人的復(fù)制成本也高了,而先踩坑的公司已經(jīng)在繼續(xù)提升、擴(kuò)大自己的市場(chǎng)。比如制作手辦,可能會(huì)遇到表面光油開(kāi)裂、機(jī)器損耗材料等等問(wèn)題,所有的力度、工藝都需要經(jīng)驗(yàn)積累才能保證履約質(zhì)量,這是長(zhǎng)期建設(shè)的壁壘。
Pokee AI 已經(jīng)服務(wù)一些金融行業(yè)的大客戶——它在打造面向真實(shí)業(yè)務(wù)場(chǎng)景的研究級(jí)智能體與自動(dòng)化工作流。
創(chuàng)始人朱哲清認(rèn)為,企業(yè)端的大客戶普遍傾向于將模型私有化部署,保護(hù)自身數(shù)據(jù),這類需求需要有垂直領(lǐng)域模型+能提供企業(yè)解決方案的公司打通。從合作角度,承接百萬(wàn)級(jí)美金訂單的初創(chuàng)公司去做這“最后一公里”的服務(wù)會(huì)更合適。
“現(xiàn)在非說(shuō)模型公司把其他人吃掉,我覺(jué)得意義不是很大。總有人做the last mile。”朱哲清說(shuō)。
AI漫劇,最熱的方向
![]()
AI漫劇,當(dāng)下最火熱的領(lǐng)域之一。這場(chǎng)論壇中的討論說(shuō)明,它的爆火不是偶然。
AI漫劇爆火:好技術(shù)低成本落在真場(chǎng)景中
抖音集團(tuán)短劇版權(quán)中心-漫劇內(nèi)容合作經(jīng)理殷世銓認(rèn)為,AI 漫劇的興起,核心是技術(shù)契合產(chǎn)業(yè)。
這種契合,首先是多模態(tài) AI 能力突破后,漫劇質(zhì)量提升到了能商業(yè)化的程度。二是在成本上,AI的加入讓漫劇整體成本降低,生產(chǎn)效率提升。最重要的是,AI讓創(chuàng)作門檻降低,讓更多創(chuàng)作者能加入創(chuàng)作行列。
這一趨勢(shì)已經(jīng)在各大平臺(tái)的數(shù)據(jù)中得到驗(yàn)證。比如使用短劇、漫劇 AI 生成工具巨日祿制作的“巨日祿風(fēng)”內(nèi)容,在今年 11 月的抖音動(dòng)態(tài)漫月榜中,包攬了榜單前三名。
在現(xiàn)場(chǎng),巨日祿創(chuàng)始人杰夫同樣認(rèn)為成本的降低是 AI 漫劇的爆發(fā)重要因素。他們半年前計(jì)算過(guò),當(dāng) AI 漫劇每分鐘的整體成本到的一千元左右的時(shí)候,就會(huì)大規(guī)模爆發(fā)。后續(xù)的市場(chǎng)情況,也和這個(gè)測(cè)算數(shù)據(jù)很接近。
同為 AI 漫劇公司,珀樂(lè)互動(dòng)使用AI工具打造了爆款漫劇《明日周一》。它今年8月在抖音平臺(tái)上線僅5天,播放量突破500萬(wàn)。這部50集AI動(dòng)漫短劇,僅用時(shí)45天,制作團(tuán)隊(duì)最初只有5人。
珀樂(lè)互動(dòng)創(chuàng)始人楊晟認(rèn)為漫劇崛起是時(shí)代的進(jìn)程。從真人電影到動(dòng)畫電影,從真人電視劇到動(dòng)畫劇集,如今正是短劇到漫劇的崛起時(shí)刻,“渠道和技術(shù)成熟了,漫劇崛起恰逢其時(shí)”。
接下來(lái)的AI漫劇:質(zhì)量和商業(yè)化還能更好
AI 漫劇的未來(lái)會(huì)怎樣?
投資過(guò) MiniMax、Liblib、Genspark 等明星公司的明勢(shì)創(chuàng)投的合伙人焦騰認(rèn)為,漫劇要進(jìn)一步突破還要依靠更新的分發(fā)機(jī)制、工具以及載體。他提到 AIGC 加上智能眼鏡以及更多的傳感器會(huì)讓漫劇有更沉浸式、更互動(dòng)式的體驗(yàn)。
芒種星球聯(lián)合創(chuàng)始人童超則把視角放到了內(nèi)容層面,他認(rèn)為無(wú)論 AI 漫劇的載體和形式怎樣變化,好的故事仍然是最重要的。IP 依賴于好的故事,故事越多生命周期更長(zhǎng)。芒種星球開(kāi)發(fā)了海外 AI 視頻的創(chuàng)作平臺(tái) Mootion,目前正在尋求與國(guó)內(nèi)內(nèi)容創(chuàng)作方合作,希望用 AI 讓老 IP 有更多好故事,同時(shí)建立起新 IP。
殷世銓同樣認(rèn)為,現(xiàn)在 AI 漫劇的最大痛點(diǎn)是內(nèi)容同質(zhì)化和畫面粗糙。想走向主流,它必須解決角色一致性問(wèn)題,并追求有深度的故事,而非單純拼數(shù)量。
落腳到商業(yè)化層面,珀樂(lè)互動(dòng)創(chuàng)始人楊晟認(rèn)為AI 漫劇光靠?jī)?nèi)容掙錢并不性感,可以借鑒日本“制作委員會(huì)”模式,建立標(biāo)準(zhǔn)管線,從而撬動(dòng)更大的文旅和衍生品市場(chǎng)。芒種星球的童超還提到合規(guī)的數(shù)字形象和資產(chǎn)庫(kù)的建設(shè)非常有價(jià)值,把這些資產(chǎn)開(kāi)放給創(chuàng)作者進(jìn)行商業(yè)創(chuàng)作,能把市場(chǎng)做得更大。
當(dāng)人人都能生成內(nèi)容,IP 會(huì)怎樣
自從 AI 開(kāi)始用于生成形象之后,IP 的爭(zhēng)議就從未停止。當(dāng)多模態(tài)大幅提升內(nèi)容創(chuàng)作效率,IP 又會(huì)怎么變?
巨日祿創(chuàng)始人杰夫認(rèn)為,AI 生產(chǎn)內(nèi)容后,傳統(tǒng)意義的 IP 面臨非常大的挑戰(zhàn)和阻力。
他以寶可夢(mèng)舉例,當(dāng)時(shí)寶可夢(mèng)的成功是因?yàn)榘l(fā)行渠道集中且競(jìng)品匱乏。而現(xiàn)在的 AI 時(shí)代,一個(gè)爆款的出現(xiàn)后,AI 工具能讓競(jìng)爭(zhēng)對(duì)手在3天內(nèi)生成1000個(gè)類似的產(chǎn)品。這意味著認(rèn)知的護(hù)城河難以被建立,傳統(tǒng)意義上的 IP 難以形成。
A2B Labs 的創(chuàng)始人崔瓏翔部分認(rèn)同杰夫。他認(rèn)為隨著生成新 IP 變得越來(lái)越容易,IP 的價(jià)值會(huì)越來(lái)越低,或者說(shuō) IP 積累價(jià)值的能力會(huì)越來(lái)越弱。 現(xiàn)在每個(gè)人都可以向全世界分發(fā)內(nèi)容,每個(gè)人都可以輕松地創(chuàng)建新 IP。未來(lái)可能會(huì)有成千上萬(wàn)個(gè) IP,每個(gè) IP 可能只火一兩天,然后就消失了。
珀樂(lè)互動(dòng)創(chuàng)始人楊晟則認(rèn)為AI 雖然加速了 IP 內(nèi)容的迭代,但并沒(méi)有改變 IP 的內(nèi)核。好的 IP 不僅播得好,更能滲透入商業(yè)化的部分。順著借鑒日本“制作委員會(huì)”模式、建立標(biāo)準(zhǔn)管線的邏輯,更標(biāo)準(zhǔn)化的制作可以促使高商業(yè)價(jià)值的故事成為經(jīng)典 IP。從這個(gè)角度,珀樂(lè)互動(dòng)愿意做內(nèi)容行業(yè)的“補(bǔ)集”:跳出存量?jī)?nèi)容市場(chǎng)競(jìng)爭(zhēng),通過(guò)將內(nèi)容延伸至后鏈路的泛授權(quán)、文旅等領(lǐng)域,拓寬市場(chǎng)邊界。
明勢(shì)創(chuàng)投合伙人焦騰從分發(fā)渠道角度來(lái)理解 IP 的變化。他提到現(xiàn)在整個(gè) IP 分發(fā)渠道已經(jīng)極度打散,原來(lái)的集中式容易產(chǎn)生大 IP,現(xiàn)在的分布式更容易產(chǎn)生新 IP,而新 IP 的本質(zhì),是面對(duì)邊緣人群的小眾需求逐漸成長(zhǎng)為大眾需求。
具身和世界模型
![]()
具身的 Scaling Law 真來(lái)了
具身智能和世界模型是最熱也難度最大的方向。
第一個(gè)問(wèn)題,現(xiàn)場(chǎng)嘉賓們討論了具身領(lǐng)域的 Scaling Law 是否存在。
英偉達(dá)中國(guó)區(qū)機(jī)器人業(yè)務(wù)負(fù)責(zé)人李雨倩認(rèn)為,具身 Scaling Law 已經(jīng)出現(xiàn)。一個(gè)例子是,英偉達(dá)機(jī)器人實(shí)驗(yàn)室 Gear Lab 對(duì) GPU 的消耗是迅速增加的。
但相較于大語(yǔ)言模型,具身大模型架構(gòu)更復(fù)雜,高質(zhì)量具身數(shù)據(jù)集極度匱乏,數(shù)據(jù)量近乎為零。再加上具身本體類型多樣,難跨本體,導(dǎo)致這個(gè)領(lǐng)域的 Scaling Law 有些難度。
她說(shuō),雖然具身大模型的 Scaling Law 已初見(jiàn)端倪,但受行業(yè)復(fù)雜性制約,需依托兩類主體才能實(shí)現(xiàn)突破:一是提供機(jī)器人具身云服務(wù)的廠商,它們?yōu)殚_(kāi)發(fā)者搭建便捷開(kāi)發(fā)工作流。二是能產(chǎn)出高質(zhì)量數(shù)據(jù)集的場(chǎng)景和公司,推動(dòng)具身 Scaling Law 快速 Scale。
具身合成數(shù)據(jù)公司,光輪智能的創(chuàng)始人謝晨同樣認(rèn)為Scaling Law 已經(jīng)到來(lái),標(biāo)志事件就是 Generalist 用27萬(wàn)小時(shí)的數(shù)據(jù)做到了更好的算法表現(xiàn)。
他同樣在客戶處看到了變化。首先是客戶的需求爆發(fā),光輪智能的數(shù)據(jù)服務(wù)從之前的 “刺激客戶需求” 到現(xiàn)在客戶主動(dòng)提出需求,印證了 Scaling Law 驅(qū)動(dòng)下的真實(shí)需求已經(jīng)到來(lái)。
還有一點(diǎn),他們的核心客戶已經(jīng)從機(jī)器人公司轉(zhuǎn)變成了大廠的大模型團(tuán)隊(duì)。因?yàn)榇髲S的大模型團(tuán)隊(duì)現(xiàn)在也在做做具身的基礎(chǔ)大模型/大腦,這就需要做數(shù)據(jù)的生成,數(shù)據(jù)的訓(xùn)練、評(píng)測(cè)、deployment,99% 都在云上,很小一部分在端側(cè)。而且,大廠更追求模型的通用泛化能力,即基座模型無(wú)需微調(diào)就能適配各類 Benchmark,客戶的算力規(guī)模從也從平均 5000 張卡躍升至 5 萬(wàn)+ 張。
最后,他看到具身評(píng)測(cè)的需求也是 Scaling 的。隨著基座模型性能提升,傳統(tǒng)學(xué)術(shù)界的 Benchmark 已無(wú)法滿足具身大模型的評(píng)測(cè)需求,催生了評(píng)測(cè)的新需求。
火山引擎創(chuàng)新總經(jīng)理施凌翔分享了字節(jié)跳動(dòng)的洞察。他提到字節(jié)最近發(fā)布的 VLA 機(jī)器人模型就是通過(guò)強(qiáng)化學(xué)習(xí),以及把更高質(zhì)量的數(shù)據(jù)用于后訓(xùn)練和 Fine-Tuning,在現(xiàn)有的基座之上獲得了更大的泛化和更強(qiáng)的魯棒性。
他還指出當(dāng)前機(jī)器人的小模型和大模型都存在瓶頸,小模型(1B-3B)存在模型“鈣化”問(wèn)題,即便持續(xù)堆疊高質(zhì)量數(shù)據(jù),性能也無(wú)法突破,而大模型很難端側(cè)部署。
他認(rèn)為未來(lái)具身智能的重點(diǎn),一是在模型結(jié)構(gòu)上面做更大的參數(shù),二是解決大模型在端側(cè)的實(shí)時(shí)控制、時(shí)序決策與執(zhí)行落地問(wèn)題。
世界模型會(huì)吃掉VLA
在具身智能領(lǐng)域還有一個(gè)話題備受關(guān)注,世界模型會(huì)吃掉VLA(Vision-Language-Action)嗎?
謝晨直言,他認(rèn)為世界模型是數(shù)據(jù)與合成數(shù)據(jù)的放大器,能夠通過(guò)自身能力泛化出海量高質(zhì)量數(shù)據(jù),而且極有可能 “吃掉” 所有 VLA。
他提出了幾個(gè)佐證:
基礎(chǔ)設(shè)施方面,世界模型的投入遠(yuǎn)超 VLA,大廠世界模型團(tuán)隊(duì)動(dòng)輒投入上千張卡對(duì)VLA進(jìn)行仿真微調(diào),而多數(shù) VLA 團(tuán)隊(duì)仍聚焦小模型研發(fā)。而且,世界模型的短板正在被補(bǔ)齊——世界模型對(duì) Action(動(dòng)作)的理解不足,但頭部團(tuán)隊(duì)已正針對(duì)性補(bǔ)充相關(guān)人才。
另外,他還分享了一個(gè)洞見(jiàn):李飛飛團(tuán)隊(duì)正在試圖用本來(lái)服務(wù)于 VLA 的評(píng)價(jià)體系評(píng)價(jià)世界模型,“如果評(píng)價(jià)標(biāo)準(zhǔn)到最后會(huì)統(tǒng)一,我認(rèn)為兩者到很有可能殊途同歸”。
關(guān)于世界模型,影眸科技的創(chuàng)始人兼CEO吳迪提供了另一種視角。
![]()
影眸科技是一家做 AI 3D 生成的公司,也推出了自己的生成模型 Rodin Gen-2。它正在探索從單個(gè)物體的 3D 生成到環(huán)境、物理世界生成的道路。
影眸科技創(chuàng)始人吳迪認(rèn)為,或許可以生成無(wú)窮無(wú)盡可供訓(xùn)練的 3D 數(shù)據(jù),讓智能體從虛擬跨到現(xiàn)實(shí)。
吳迪說(shuō):“當(dāng)物理世界生成的時(shí)候,我們邁向最遙遠(yuǎn)的未來(lái),就是所謂的世界模型。”
多模態(tài)和全球化
![]()
多模態(tài)是全球 AI 熱點(diǎn),中國(guó)也有不少多模態(tài) AI 公司出海,他們關(guān)心的問(wèn)題不僅有產(chǎn)品還有合規(guī)。
價(jià)格、質(zhì)量和延遲,全球多模態(tài)痛點(diǎn)
A2B Labs 可以幫助博主個(gè)性化地把 AI 內(nèi)容做得更有吸引力,并發(fā)布到各類內(nèi)容平臺(tái)上。公司創(chuàng)始人崔瓏翔認(rèn)為,人們不關(guān)心內(nèi)容是否由 AI 生成,只關(guān)心這是不是一個(gè)好內(nèi)容,“就像 20 年前 Photoshop 剛問(wèn)世時(shí),人們會(huì)說(shuō)這張圖是 P 過(guò)的。 但現(xiàn)在,沒(méi)人會(huì)再這樣說(shuō)了”。
他相信,隨著兩三年內(nèi)無(wú)人在意內(nèi)容是否由AI生成,TikTok、YouTube、Instagram 等平臺(tái)也不會(huì)關(guān)心內(nèi)容是否由 AI 生成。因?yàn)樽鳛槠脚_(tái),只會(huì)關(guān)心用戶是否停留了更長(zhǎng)時(shí)間,廣告是否因此受益。
他還看到,目前創(chuàng)作者的核心訴求是降低成本、提高效率和穩(wěn)定性,希望以不足1美元的成本生成可發(fā)布在 TikTok 或 Instagram 的視頻。當(dāng)前模型難以實(shí)現(xiàn)這一目標(biāo),所以 A2B 和很多同行的解決思路是混合搭配不同公司的模型,快速切換最新、最便宜、最快的模型,以平衡性能與成本。
Picsart 的 Tom 則表示,Picsart 同時(shí)服務(wù)消費(fèi)者與專業(yè)用戶兩類群體,兩類用戶面臨的技術(shù)局限存在差異。消費(fèi)者更關(guān)注價(jià)格,專業(yè)創(chuàng)作者的工作模式正發(fā)生翻天覆地的變化,也就是從掌握精細(xì)的工具技能轉(zhuǎn)向“氛圍設(shè)計(jì)”,所以對(duì)他們而言延遲和質(zhì)量更為關(guān)鍵。因此,Picsart 在采用嚴(yán)格且標(biāo)準(zhǔn)化的評(píng)估標(biāo)準(zhǔn),評(píng)估各種模型,滿足專業(yè)人士的需求。
Brix AI 在做招聘 Agent,聯(lián)合創(chuàng)始人 Carol 說(shuō),目前在就業(yè)或者招聘市場(chǎng)中,視頻面試和視頻展示都很常見(jiàn),同時(shí) Brix AI 還在幫視頻生成公司做數(shù)據(jù)標(biāo)注。
在天使輪投資了 MiniMax 等 AI 公司的「云啟資本」合伙人陳昱表示,當(dāng)前多模態(tài)模型的發(fā)展仍面臨兩項(xiàng)關(guān)鍵挑戰(zhàn):一是時(shí)長(zhǎng)約束。當(dāng)視頻長(zhǎng)度拉長(zhǎng)至 30 秒甚至 60 秒時(shí),模型在角色設(shè)定、場(chǎng)景背景及敘事邏輯上的一致性仍較難穩(wěn)定維持;二是成本問(wèn)題。只有持續(xù)降低推理與生成成本,多模態(tài)應(yīng)用才能具備更清晰、可持續(xù)的商業(yè)化空間。
創(chuàng)業(yè)公司怎么做合規(guī)
AI內(nèi)容的合規(guī)性是全球都在關(guān)注的問(wèn)題。
對(duì)此,崔瓏翔說(shuō),自己的產(chǎn)品除了不能生成一些明令禁止的內(nèi)容,其他都相對(duì)靈活。他拿 OpenAI 舉例,OpenAI 之前推出多模態(tài)模型時(shí)會(huì)有類似吉卜力、迪士尼的風(fēng)格。后續(xù),當(dāng) OpenAI 成長(zhǎng)得非常快,迪士尼反而想加入他們。所以快速成長(zhǎng)是創(chuàng)業(yè)公司需要借鑒的地方。
云啟資本合伙人陳昱也表示,這個(gè)觀點(diǎn)可能會(huì)引發(fā)一些爭(zhēng)議。他認(rèn)為,創(chuàng)業(yè)公司在產(chǎn)品中當(dāng)然需要考慮基礎(chǔ)的安全與合規(guī),但在早期階段,團(tuán)隊(duì)很難有足夠資源把所有問(wèn)題一次性解決。因此,在公司還很弱小的時(shí)候,最重要的事情還是先活下來(lái)、先長(zhǎng)大。
附錄:V-START 加速器往期部分成員:
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.