如果要給 23 年的 AI 市場一個關鍵詞,那肯定是 “大模型”,聚光燈和大家的注意力、錢都投向了那幾家大模型公司;而如果要給 24 年的 AI 市場一個關鍵詞,則一定是 PMF。如果沒有 PMF,AI 就會淪為一個 bubble。所以 PMF 會成為今年,甚至未來幾年越來越重要的關鍵詞。
去年大家投了很多背景優秀的創始人,最后能 deliver 結果和產品的卻很少。很多人開始質疑 AI 到底行不行,市面上到底有沒有有產品、有收入、有留存、有 PMF 的公司?而我們則漸漸開始看到一些 AI PMF 的影子。所以今年我們會開啟一個新系列,每期對話幾位驗證了 PMF 的 AI 公司創始人。
本期是 AI PMF 系列的第一期,我們將介紹 AiPPT、ACE Studio 和 捏Ta 三款產品及其公司。AiPPT 上線半年單月收入達到數百萬人民幣,驗證了國內付費 PMF;ACE Studio 開啟付費半年,目前海外收入單月幾十萬刀,在海外驗證了付費 PMF,而 捏Ta 則是已經有了超出互聯網時代平均水平的用戶留存,驗證了國內的用戶使用行為 PMF。
我們仍然堅信 AI 最重要的時間點就是 24 年和 25 年這兩年,這兩年會跑出來很多有趣的公司和產品,而下一個時代百億美金、千億美金市值的公司也就在這些之中。所以,希望這個系列節目能給這個行業注入一些信心,也給關注 AI 的人帶來一些啟發。
另外,我們的 AI 私董會也在持續報名中,目前已經聚集了一批市場上最好的 AI 創始人,歡迎點擊文章底部的閱讀原文或掃碼,獲取報名鏈接(里面也有 AI 私董會介紹和目前已加入的成員名單,可點擊查看)
一鍵生成 PPT 的 AiPPT
![]()
曲凱:我們先給大家介紹一下 AiPPT 的用法吧。
趙充:AiPPT 目前有兩類使用流程,一種是你說一句話,AI 自動生成大綱和生成 PPT。第二種是你將寫好的Word、PDF、Xmind 等直接導入,然后據此生成 PPT。風格上你可以自己選擇你喜歡的 PPT 模版,簡約的、卡通的、中國風的都有。
另外馬上我們還會上第三個比較傳統的流程,模板庫,我們提供上百萬的 PPT、Excel、Word 模版,用戶可以挑選下載。
曲凱:現在數據大概怎樣?
趙充:去年 8 月上線,11 月過 100 萬訪問量,今年 4 月訪問量在 350 萬左右,大概這個進度。
曲凱:非常快啊,怎么做到的?
趙充:因為它是上來就賺錢的產品,所以只要是 ROI 為正,就可以一直去放量。現在收入大概是幾百萬一個月,之前基本是每月翻倍地在漲。
曲凱:市場上大家經常提的有 PMF 的產品是兩個,一個是 Perplexity,一個是 Character.ai,但其實美國那邊 Gamma 也很火,而且它數據也很好,對吧?
趙充:對,因為這個品類市場更大,微軟收入幾百億美金,國內金山是 1000 多億市值的公司,去年收入大概 46 億人民幣。面對這樣一個更確定的市場,很多人就會覺得巨頭太大了,沒有創業公司的機會,不敢進來。
但事實上這個業務的變現情況不錯,用戶挺愛買單的,我們付費率比之前的工具類產品都要高,和金山的付費率差不多。
曲凱:所以用戶現在確實是對 AI 生成的質量滿意的?
趙充:滿不滿意不好說,但用戶確實是愿意買單的,一是在 Word, Excel, PPT 三件套里,PPT 是最好變現的。它是做價值彰顯的門面嘛,對外匯報、升職加薪,都得用。
二是 AI 打工感也比較強,你看著 AI 在幫你寫大綱,一頁頁地寫 PPT,自然就愿意掏錢了。
曲凱:所以到哪個點你確認,AiPPT 這個產品找到了 PMF,可以持續放量了?
趙充:月收入 100 萬的時候,就感覺可以再加碼了。
曲凱:你主要關注哪些數據?
趙充:付費率、ARPU、流量獲取成本。本質上可以賺錢,就說明可以放量。
曲凱:但 AiPPT 典型的場景和用戶群是哪些?我其實想不到身邊到底誰會用 AiPPT。
趙充:其實我們的核心用戶群跟 Office、金山是岔開的。Office、金山的核心用戶是那些高頻使用 PPT 的人,其中很多是用 PPT 去賺錢的,比如說投行、4A 廣告公司這種需要把 PPT 做得很好,去客戶那兒做 presentation 的。但我們的用戶群并不一定是高頻做 PPT 的人,他可能一年就做個兩三次,甚至很多人這輩子第一次寫 PPT 就是用 AiPPT。因為之前的金山或者 Office 其實使用門檻比較高,而 AI 來了之后,大家寫 PPT 的流程變了,可以用對話的方式直接去做,門檻大幅降低了。
比如我一個朋友剛問我要個 VIP 會員,說要幫孩子寫家庭作業。
曲凱:但你會不會擔心頻次問題?如果你的用戶一年只做兩三次的話。
趙充:其實不擔心,頻次問題可以通過產品矩陣來解決。比如我們 Q2 會上線文生圖、文配圖、文生表、文生文、虛擬人,以及協作功能,這些功能上了之后留存自然就上來了。
曲凱:現在在 AiPPT 里, AI 大概占了產品多大的比重?起了多大的作用?
趙充:10%-20% 吧。現在 AI 主要解決的是大綱的環節,整個后面的 workflow 包括內容全是我們自己的產品。但是沒有 AI,這個事就不成立。因為在用戶體驗上 AI 的打工感貢獻了 50%。
之后 AI 占比還會增加,比如我們未來可能會做各種多模態內容生成,會外掛知識庫,以及 Q3、Q4 會做大模型直接生成 PPT —— 之前我們的邏輯是 AI 生成大綱,然后大綱和內容做匹配生成 PPT,未來可能是跳過大綱,直接生成 PPT。
曲凱:你會擔心未來大模型自己把這個事做掉嗎?
趙充:大模型是個技術,它不是一個產品嘛,核心我們還是解決產品問題。本身我們也有股東是做大模型的,所以自己也能打這個仗。
曲凱:你覺得 AiPPT 的核心競爭力是什么?
它的競爭主要看三個維度:用增、產品 (又包括 AI 和 workflow)、內容版權。所以我們希望在國內一直頂著行業第一的用戶量,用戶量越大,產品矩陣越完整,變現能力越強,然后就有更多資金去做用增,內容供給體系和版權資源也會越強,它是這樣的一個正向循環。
曲凱:版權方面,其實視覺中國是你們的股東,對吧?在版權上能幫到很多。
趙充:對,視覺中國應該是國內最強的一個戰略玩家,我做愛設計這個項目引入的第一個戰略資源就是視覺中國,因為版權上不能出問題,尤其是我們現在的商業模式,除了自己做之外,也會把 API 和版權輸出給很多大廠,大廠最不能容忍的就是你版權上有瑕疵。PPT 配圖上也能用它的庫,所以有視覺中國保駕護航,我們就更容易去跟渠道、合作伙伴去談合作。
曲凱:我這里 challenge 你一個問題,如果未來能直接 AI 生圖,現在已有的這些圖片的版權價值會不會越來越低?
趙充:圖片可以拆成兩類,一種是寫實的,一種是現做的,寫實的部分其實就完全不受影響。而現做的部分 AI 生圖也還是要基于素材庫,視覺中國有很好的原始素材,也能幫我們生成更好的東西。
曲凱:明白。另外你其實已經是一個很成功的連續創業者了,你的上一家公司微夢傳媒做了十幾年,也有十來億的收入,我不知道在你看來,這波 AI 的機會跟你之前十多年移動互聯網創業的經驗比起來,有哪些相同和不同?
趙充:其它行業我不太懂,也不好說,說回到辦公賽道上的話, AI 帶來的最大不同是改變了用戶生成文檔的工作流程,用戶不再需要打開一個白板、拽圖標、做對齊,這就打破了傳統 Office 廠商 1000 個 feature 的優勢,這是一個很大的機會點。所以我們是有機會在一個很大的市場里搶個幾個點的市場份額的——WPS 46 億收入,利潤 13 億,微軟更大,所以只要在這個 4000 億的市場里能搶兩個點,就是一家妥妥的上市公司。
曲凱:在整個 AiPPT 創業過程當中,你覺得做得最對的事情是什么?
趙充:我們很大的一個決策優勢是有炮彈持續能賭吧。
我們其實是從投資視角去打這個仗的,創業的形式也是項目孵化的形式。
首先自己做市場研究,用華為的 “五看三定” 去看項目該不該立,ROI 是多少,包括競品分析、潛在市場規模、用戶調研、如何推廣等等都是先分析好的,有標準的立項流程。只要成功概率大于百分之六七十,這個槍就可以開。
市場調研的工作我做完,然后找到在領域干過 10 年以上的人來當操盤手,相當于我出錢組隊,以阿米巴的方式成立一個個項目組,然后迅速把這些項目跑起來。
一般小團隊可能只有打一槍的機會,但我 22 年投了三四個內部的項目,相當于開了三四槍,每一個項目大概是 500 萬以內的預算。加上本身有個賺錢的公司在,所以相對從容一點,對犯錯的容忍度高一點,這也能給團隊帶來一些可能性。
曲凱:我覺得你還有一件做得特別好的事是非常重視各種渠道資源。因為你其實本身就是做廣告流量相關的,體量也很大,對此應該很有經驗。
趙充:對,中國所有的互聯網大廠,只要到一定市值,都是我們的客戶,所以增長是我們團隊的一個核心能力。國內的整個流量生態的分布在哪兒、誰在管、獲客成本多少,都比較了解,也踩了很多坑,所以我們是先考慮增長渠道,再開始做產品的。
曲凱:你們這些創業了十多年又賺到過錢的人,對現在的創業者就很不友好,完全降維打擊 (笑)。本來一個典型的 AI 創業者,可能 10 個人的小 team,做個半年一年,好好打磨產品,然后上線。上線以后再去想該怎么推,怎么拿到下一輪的錢。下輪能拿到錢可能也就拿個 200 萬刀,但在這個時候可能你都已經把面全都鋪開了,該拿的資源都拿到了,就已經非常以終為始地在做這個事了。
那對你來說,在這個過程中你最關心的問題是什么?花最多精力的問題是什么?
趙充:我其實核心還是從用增視角去看我應該跟誰合作,怎么更好得組織資源去打這個仗。比如我們引入視覺中國,引入大模型廠商,也希望引入一些平臺廠商進來,其實就是出于這個視角。
曲凱:所以聽下來,我覺得你非常擅長找到一個問題的關鍵,而且能搞定這個關鍵資源。我可以這么理解嗎?
趙充:對,但其實就是因為上一次創業沒能整合市場上最好的戰略資源進來。
當時作為一個平臺生態公司,只有平臺進來幫你,才能吃下最大市場。但那時候太年輕了,沒意識到。就做一個獨立第三方,哼哧哼哧干了十年,也就那樣。如果再讓我重新打一次,我肯定做最好的 PPT 去 pitch 下來那個資源。
曲凱:所以你現在做 AiPPT,你覺得是站在上帝視角的嗎?
趙充:我覺得比上一次成熟一點。
曲凱:更接近上帝了?
趙充:不好說,所以為啥要跟這個朋友們多聊一聊,我問了無數朋友這個問題,如果他是 AiPPT 的老大,他打這個仗要怎么打?有上市公司老板,有我們的股東,包括曲老師,對吧?
其實就是產品運營這些執行上的事就交給團隊去弄,我還是搞定最核心的戰略性的合作,這些弄完,仗就贏了一半了。
曲凱:但我再 challenge 你一個問題,就我覺得很多人,尤其是做 VC 的人,大家會先天有一種感覺是說如果一個創始人特別靠資源,就會覺得好像不那么對勁。我不知道你是怎么看這個問題的?
趙充:會這么想的人,都是因為他聽了太多的故事,而這些故事都是某些公司故意立的人設而已。CEO 是解決什么問題的?CEO 你不能把自己降維成一個產品經理,如果你降維成一個產品經理,說明你沒找到一個好的產品 partner 去幫你帶這個事情。CEO 最主要的角色是組織以及鏈接公司內外部資源,而不是說向下補位,去補增長,補產品,補運營。我們內部都是講說你事業部總經理不要去干一個總監的活,你總監不要干一個客戶經理的活。如果你向下降維去做了下一層的事,說明你在招聘這件事上沒有用力,你在這個崗位上沒有招到最好的人。
曲凱:但你在上一家公司剛成立的時候也是這樣的嗎?我在想為什么我們碰到的很多早期創始人不是你這樣的,他們可能就是沒有足夠的本錢去招到那么好的人,必須要自己頂上。
趙充:我覺得是他在招聘上沒有花足夠多的時間。我在研究一個公司的時候,一個公司可能會被我面 50 個人,除了老板都面完。現在我有 10 個 HR,他們都領著任務,我看到哪個目標公司的業務我想打了,就讓 HR 把市面上所有的相關簡歷全部找出來,我全部聊完。我不相信下面人聊的東西,全是我自己聊。
曲凱:這也就是你說的市場調研,對吧?其實你會去聊很多實際做事的人。
趙充:對,比如一個小項目,我會在市面上做 Mapping,找出 10 家公司,每家公司聊 10 個人,做增長的、內容的、產品的、技術的,把這些信息從各個角度拼湊起來之后基本上就是一個商業計劃書,就能判斷這仗能不能打。然后再在這 10 家公司里挑出幾個操盤手,做好資源組合,共創商業計劃。你給他足夠多的信息輸入,他有經驗,也認可你說的資源組合方式和激勵方式,然后就干。
曲凱:你的激勵方式具體是?
趙充:很簡單,比如項目能掙 5,000 萬,那拿 500 萬,大家直接分了就行。我們吸引的這些核心人才都是大廠背景,只要他們能干好,待遇比大廠多一倍、兩倍都有可能。他自己有本事,想追求更高的上限,那加入我們是很合適的。
AI 音樂制作工具 ACE Studio
![]()
曲凱:我們先給大家簡單介紹一下 ACE Studio 吧。
Joe:我們公司叫時域科技,19 年初成立時,我們就想通過 AI 讓每個普通人都能創作音樂。在經過很多產品形態、技術形態的探索后,最終我們在 23 年推出了面向 professional consumer 的 ACE Studio,能讓用戶生成具有出品級質量的 AI 歌聲。未來我們會進一步把它打造成一個 all in one 的 AI 音樂工作棧,讓每一個人都可以在這里創作歌聲、伴奏,把歌曲打磨到出品級質量。
曲凱:現在的 ACE studio 很像一個專業的音樂制作軟件,對吧?我覺得它最有意思的地方是,我不管填了什么詞,都可以選擇一個聲音真的把它唱出來,而且唱得很準。
Joe:對,這個是由真實的用戶需求演化來的。如果有人要做一首歌,歌曲里其它所有要素都可以用一臺電腦完成,唯獨真人演唱環節,要么得這個音樂人自己,要么得找其他人進錄音棚里唱。這是一個非常不優雅的過程,時間、金錢成本也都很高。于是我們發現歌聲可能是 AI 音樂里一個最優、最好的切入點。
曲凱:所以一句話概括,你們現在在做的是「真人歌手的平替」。那你跟 Suno,Udio 這些 AI 音樂軟件的核心區別是什么?
Joe:簡單講,你用 Suno 的時候,剛開始會很嗨,你輸入了一些 prompt,出來一個結果,這個結果很美妙。但當你非常嚴肅地想用它來創作一些好內容的時候,你總會發現其中有 15% 的東西不盡如人意,而你沒辦法對它進行二次修改。你修改一點點 prompt,它的結果就完全不同。
我們希望打造的東西是,有 Suno 的能力,簡單輸入一個 prompt 就能產生一個 85% 好的東西,但此外你還可以繼續對這 85% 進行修改,直到達到你理想中的 100%。
曲凱:對,我們之前有一期播客也在聊 AI+音樂,當時就想用 Suno 生成幾段歌曲用到播客里,但總有各種各樣的問題,試了 100 多首歌才能挑出來一個小節。所以 ACE Studio 就可以精確地修改一個詞,一個音符,一段旋律,而不是不斷地擲色子。
Joe:對。我們比較相信這才是 AIGC 產品的未來。AI 創造的內容不是成品,是人創作的素材,這些素材交到創作者手里做二次加工,之后才能產生更大價值。
拿視頻生成舉例,Sora 生成的只是一些美妙的鏡頭,鏡頭和視頻之間有很多 gap,這些 gap 靠的是敘事,是故事,是創作者注入的 humanity。音樂也是一樣,比如 “你好,我有一個帽衫”,為什么是這個詞曲此時此刻觸動了全網用戶的神經呢?當每一個人都能用 text to music 生成 80 分的、Suno 水平的作品時,那真正能 set apart 的一定是有靈魂的,融合了非常多精妙元素的作品。
所以目前單一模型打遍天下的路子可能很快會結束,未來模型只是產品里的一部分,而產品需要有成熟的創作工作流,這是我們比較相信的未來。
曲凱:現在各種文生圖、文生視頻,其實都有一個鏈條。這個鏈條里大概有三個角色,一是模型本身,它能夠生成內容素材;二是一些專業的創作工具,比如 ACE Studio,剪映等等;三是實際的消費平臺。那么在這個鏈條上,這三個角色誰才是鏈主,誰又會被整合吃掉?
Joe:很好的問題。我們可能得先放下消費平臺這個角色,它跟生產工具之間的關系太曖昧了,什么樣的情況都有。有同時做消費平臺和生產工具的,比如剪映 & 抖音,快手 & 快影,也有獨立做生產工具的,比如 Adobe。
我們只看模型和產品之間的關系,而這個的核心我認為在于模型難度。如果模型是一個城堡,產品就是圍在城堡外面想要攻陷城堡的野蠻人,城堡的城墻越高,維持時間就越持久。
我們可以做一個思想實驗,假設今天的文生圖特別簡單,隨隨便便就能做出 Midjourney 的效果,那接下來是不是應該百花齊放地出現各種各樣的產品創新模式,像妙鴨就是其中一種。但目前因為模型壁壘足夠高,所以產品的創新被抑制了。
而音樂大模型,模型壁壘沒有那么高,我們打聽下來,做出 Suno、Udio 這樣的效果,真正的算力成本可能就在一兩百萬美金的水平——即使有點樂觀了,也就是乘以 2,乘以 3,一個 A 輪創業公司就可以搞定的 level。
未來會不會出現 OpenAI 下場,scaling law 打爆一切的那一天,也懸。因為全世界人類歷史上創作出來的歌曲可能也就幾千萬首,幾百萬小時,這個規模大概是 100 張 A100 迭代一次、兩三天的水平。100 張 A100,租的話可能一個月幾十萬到上百萬人民幣,不便宜,但創業公司也還玩得起。
曲凱:對,所以還是看模型難度。文生視頻和文生文的 LLM 足夠難,所以會出現模型主導產品的情況。但音樂的模型其實不難,大家都能做出來一個類似的東西,更重要的就是后面的工作流。
另外 ACE Studio 的商業化也已經做得非常好了,目前應該是有單月 7 位數人民幣的收入,而且你們商業化時間也就才幾個月,漲得非常快。這是怎么做到的?
Joe:都是血淚史。
我們是 23 年 10 月份正式收費的。之前我們拍腦袋認為,請一個歌手一次 500 塊錢,買了我們軟件一年用兩次就已經回本了,所以定了個 1000 塊錢的年會員價格。
然后我們發現,對我們有需求的用戶很多,但是付費轉化率不高。用戶在掏錢的一瞬間有很多糾結,比如買了不會用怎么辦。最后我們的新增付費率是 1%-1.5%,新來 100 個人有 1-1.5 個人付費,而且月卡買的多,年卡買的少。
于是我們就想,音樂人,或者叫做 music creators,大概是個什么樣的群體?我們自己體感一下,你朋友里面有幾個音樂人?很少。但是全球的音樂人有 1500 萬之多,幾乎相當于 UI 設計師的數量。你想一下你朋友里面有幾個 UI 設計師?挺多的,對吧?至少你肯定認識幾個。
那這些音樂人都在哪兒?答案是都在海外。
我們發現網易云的注冊音樂人有 50 萬,里面還有大量的翻唱歌手,制作人可能只有 10 萬左右。但是 Spotify 里,這個人數是 1000 萬,而海外不僅有 Spotify,還有 YouTube music、Apple music。進一步到 YouTube 上搜類似 music production 的關鍵詞,很多寫歌、做歌的人,有幾十萬或者是大幾百萬的粉絲。你很難想象在中國一個教別人怎么制作音樂的網紅有 100 萬粉絲,這是兩個完全不同的土壤。第一性原理講,那邊大得多。那我們為什么不去那邊吃肉呢?
所以我們就趕緊搞海外市場。我們第一個想法是直接去聯系這類 Youtuber。我們讓 ChatGPT 幫忙梳理了一下,然后用我們非常一般的英文跟他們說,你能推廣一下我們的產品嗎?
聯系了將近 100 多個 Youtuber,沒有一個人回復。當時我們都絕望了,這海外也太難搞了。
但是后來,我們做了一個比較有趣的決定,就是我們想出去看看,看看那一片土壤究竟是怎么回事。其實這個決策是非理性的,但現在事后復盤,這非常重要。
當時我們很緊急地報名參加了全球最大的音樂行業展,叫 NAMM Show。那個時候我們想,就算沒有展臺,自己脖子上掛個板子,也要在那跟人家展示。幸運的是,有一個展臺空出來了。我們花了三天時間制作所有的物料,自己托運,什么優惠券,什么宣傳冊,做得還特像樣,特漂亮。然后在那邊現買電視、買音響,最后搞定了這個展臺。
然后很有趣的事情發生了,在這個展會上經常會出現一些看似貌不驚人的美國人過來跟我們聊,他們無一不是兩個反應:第一個反應就是 I can't believe it,我不相信這是真的,我不相信這是 AI 做的,也就是一種對我們的贊許;第二個反應是 I told you,就是這個人離開后又帶了一個朋友過來,跟他朋友說 I told you,我沒有騙你。他的朋友又 I don't believe it,然后又拉來一個朋友,I told you,開始無限循環。
更驚喜的是,LA 真是音樂大本營,這些人臥虎藏龍。當時大概有 100 個人對我們感興趣并且留了聯系方式,我們事后去查了他們的郵箱和名字,大概能對應出來 20 個以上的格萊美獲獎或提名的人。雖然他們的口口相傳并沒有直接給我們帶來多少新增用戶,因為畢竟也沒有多少人,但是他們給我們帶來了一種被信任的氛圍。
這之后,我們神奇地發現一些 Youtuber 回復了我們之前的郵件說,我的朋友在 NAMM 上看到了你們,我覺得你們很有趣,我們或許可以一起合作;甚至有更大的 Youtuber 主動發郵件給我們。到今天為止,我們也就投出了 5 個 Youtuber 的合作推廣視頻,平均單價在幾百美金到幾千美金不等,但是他們直接把我們的收入從原先幾十萬人民幣頂到了幾百萬人民幣。
曲凱:所以經歷了幾個月時間,你們現在核心的收入和受眾就從國內完全轉到了海外。
Joe:對,今年 1 月份的時候人民幣收入占比還是 90%,現在美金是 90%。西方用戶付費概率確實高很多。每 100 個新增的海外用戶有 15 個人會付費。
曲凱:真的是一個很可怕的數據,基本是國內的 15 倍了。而且海外是訂閱制,還有循環扣款。
面對這些用戶,你們會直接說自己是中國人嗎?
Joe:這個 Chinese exposure 的問題,在資本市場是比較難受的,我們和有些大公司聊合作的時候也還是會有一些問題,但面向 C 端的話我們發現大家并不在乎,頂多音樂節上大家會感嘆一句說,噢,原來你們遠道而來。
曲凱:你們團隊之前都沒有做海外的經驗,但從聯系 Youtuber 到去海外參展做也就是幾個月的時間,現在海外市場就完全起來了,你覺得這是可復制的、大家都可以做到的嗎?
Joe:從具體路徑上講是八仙過海,但是宏觀上是可復制的,我們并沒有更擅長出海,我們就純純一土包子。
曲凱:但我發現身邊很多國內創業者,一提到出海,天然會有些害怕和抵觸,覺得自己不懂。
Joe:確實,每個人都想在舒適圈里呆著,加上如果在國內又有一點點正反饋,可能就出不去了。
我印象很深,當時我沉浸在抖音上搞營銷、賣軟件的時候,跟一哥們聊天,他比我更早出海,他提醒我今天在國內看到的東西可能只是一小部分,出去的話更大。當時我還覺得我在國內搞也挺好的,后來就發現他是對的。
這其實特別像起床,起來,走出去那下特別難,但是起來之后,你會覺得其實挺爽的,早起挺好的,各方面都挺酷的。
我其實之前曾經在舊金山待過半年,但是那次也是啥也不懂,英語也不行,大學四級都沒過,就硬去的,到最后跟投資人談笑風生,在那邊還跟幾個美國人小創了一個業。
曲凱:可以。這期的主題就是四級都不過,也可以賺美國人的錢 (笑)。
所以從出海這件事本身來講,你有沒有什么建議,或者踩過的坑可以跟大家分享。
Joe:第一是要找到你的流量陣地,比如我們這個產品,流量陣地首先是 YouTube,其次是 Instagram。洛杉磯音樂圈兒拿 Instagram 不是當抖音,是當微信的,他們加私信都要加 Instagram。但這個可能就不是出海的大共識,大家之前覺得 Twitter 更重要,因為很多 AIGC 產品都是在 Twitter 上爆的,是我們出去了之后才知道洛杉磯音樂圈兒 Instagram 這么重要。
我們前期都是盲投瞎試,我們還投過搜索廣告,虧得一塌糊涂,ROI 完全為 0。而現在那種 KOL 的視頻, ROI 是100,產品沒有任何變化,就是流量陣地變了。所以你得真的知道那些地方在發生什么,弄明白這件事,知道哪里可以獲得流量。
曲凱:你覺得你們做得最好的幾個點是什么?
Joe:還是要跟自己的用戶待在一起,比如說我們有一個超級重要的功能叫做轉譜,自己哼一段小樣,它就能直接轉成一段樂譜。
曲凱:這個我也有需求,我可能偶爾哼一段,但再過一個小時我就不記得了,因為我也不知道它的譜子。
Joe:對,有一種創作方式就叫哼唱作曲。他們懶得一個一個敲音符,你能更快地幫他提取他哼的譜子,對他的工作流就巨重要。就這一個功能,讓我們的用戶擴了一倍。
曲凱:這樣的話,你覺得整個音樂產業,包括普通人跟音樂的交互最終會變成什么樣子?
Joe:我覺得會像視頻一樣。今天還有音樂制作產業,有很多專業的音樂制作工具。但今天已經沒有視頻制作產業了,每個人都能制作視頻。CapCut,也就是海外的剪映,有 3 億的 MAU,它已經是個相當普適的東西了。
音樂為什么還沒有變成這樣的一個狀態?從需求端我不能 justify。每個人都知道音樂,也幾乎都喜歡音樂,而之所以少有人制作音樂,是因為供給端制作工具的門檻太高了,而今天 AI 可以改變這件事。
二次元角色創建平臺:捏Ta
![]()
曲凱:捏Ta的產品演進路線是怎樣的?
胡修涵:我們自己最早觀察到了一個需求,就是大家想在二次元的場景中去做內容創作。22 年底,我們就發現有一群創作者在用 NovelAI 和 Stable Diffusion 早期模型畫漫畫,那時模型質量還很差,但他們動力很強。所以我們就想能不能給他們做一個漫畫型的工具。而且對于需求側來說,其實二次元的內容需求也一直都是相當大的一個消費場景。
第一版產品是 23 年 4 月份左右上線的。第一階段,我們犯了一個推論上的錯誤。最早我們看到了一些自己做完自己消費的工具型行為,比如把角色做成壁紙美圖,然后我們就想把這個行為往前推進一步,讓用戶做能給別人看的漫畫。但最后發現很難,你無法牽引用戶去做劇情化的表達。
我們看到的用戶分兩類。上層的高階用戶對產出內容的控制力和精確表達能力要求很高,AI 目前還達不到;下層用戶就像剛才說的,他們只愿意消費,不愿意構思劇情。我們原來設想說是不是中間還有一層用戶,他們基于 AI 輔助就能開始構思劇情,但事后證明是不太存在的。
曲凱:那回頭來看,你到底相不相信 AI 能降低創作門檻,讓消費跟創作更好地融合在一起?
胡修涵:我非常相信。
曲凱:那就是說現在創作門檻降得還不夠低?
胡修涵:不,是創作要素拆得不夠好。
內容創作分三個關鍵要素:創作的線索、創作的基本手法、創作的主體內涵。
以抖音為例,它的創作線索是卡點音樂模板,創作手法是拍攝加剪輯,最后的主旨定位是展現美好生活。
其中,創作線索是降低創作門檻的核心,而提供創作線索有一些非常 critical 的要求。一方面,它最終的呈現應該足夠個性化,多樣性,不能像上一代 AI 濾鏡一樣特別固定和局限。但另一方面,它也要保證足夠易用,大家能用最簡單的方式套用這個線索做出自己的東西。這是一對很艱難的 trade off。最開始我們提供的線索有點弱,可能只提供了一些 prompt 碎片,而 prompt 不足以產出更豐富多樣的內容,滿足個性化展現的需求。
再進一步,我們就開始仔細地觀察用戶。雖然我們第一階段跑得不是很順,但我們發現有一群用戶會堅持用捏Ta,而他們堅持用的原因大多是出于對某個角色持續的創作熱情,他們會長期地圍繞著角色進行創作,把它變成自己幻想中的樣子,變成一個能持續成長的東西。
曲凱:所以你們是去年發現有一批人真的在捏Ta上養娃,然后開始改產品。那現在捏Ta的產品形態跟玩法是什么?
胡修涵:我們后來通過 PGC 的方式提前預制了很多模板劇情,用戶會首先基于個性化的方式來塑造一個角色,然后他可以讓角色在這些劇情模板中呈現它的故事,也就是讓角色進入一段段人物奇旅。角色本身的人設和性格會和劇情發生碰撞,一定程度上影響劇情的走向。
最終的產出是,用戶可以在劇情的關鍵點上給角色拍照,這就得到了一段段漫畫形式的人物故事。
曲凱:那 AI 是作用在哪個環節呢?
胡修涵:AI 起兩個作用,一個是充當攝像頭,對出演劇情的角色進行拍照 (AI 生圖),二是 AI 模擬了這個角色本身的特性,它使得劇情中的角色能個性化地做出反應。而且在生成每次的畫面和文字描述的時候,AI 會考慮這個角色原有的背景經歷,用戶會發現這個角色是有自己的故事和記憶的。
曲凱:那會不會遇到劇情收斂的問題?
胡修涵:它是個單線劇情,劇情的主體走向不會隨角色發生很大變化。
曲凱:是因為現在 AI 能力不夠嗎?
胡修涵:不是,是我們決定這樣。因為我們發現用戶希望保持劇情的高質量,其實用戶也可以強行引導來扭曲劇情的結局,但大部分用戶沒有這樣做的動力。
曲凱:我的理解是,角色不會太大程度上影響劇情走向,但他們的臨場反應不一樣,有一定自由度,參與的劇情也會沉淀為它自己的記憶,最終我作為一個用戶會感覺捏出來的角色厚度在增加。
我不得不說,你們試出來了一個非常小眾,之前沒太聽說的需求和場景 (笑)。但可能 AI 時代就是要做出來一個比較新的,大家都想不到原來還可以這么搞的產品。
胡修涵:這個場景其實一點也不小眾。它 literally 就是模擬人生的場景,而模擬人生是一個經久不衰的好游戲。它也是通過規則化的 AI 讓你設定的角色能在一定的故事線上完成出演。所以這絕不是一個我們憑空發現的新場景。
我們自己總結下來,這一代 AI 的 PMF 核心要解決的是內容跨模態組合的問題,或者說跨多個數據來源組合的問題。基本上現在跑通 PMF 的類型都是這樣,比如 Perplexity 是跨多個數據來源的有機組合,Character.ai 把原本角色的人設和用戶的 prompts 做了重新組合。
這一代 AI 做原創的能力其實是不夠的,它無法很好地找到最原始的那個創意。所以我們要讓它從一個 creator 退化為一個 composer,這樣才能產生高質量的內容。
曲凱:就它不是一個能 0-1 的事情,而是把好多素材組合在一起,再產出一些新的東西來。
胡修涵:對,AI 有很強的把素材從不可組合變成可組合的能力,可以利用這一點注入很多個性化要素。
人對個性化的感知其實很容易被 hack, 同樣一句話,用你喜歡的方式重新說一遍,你就會覺得那是你自己的思考。所以我們很多時候是用 AI 的組合能力去 hack 用戶的個性化感受,而不是試圖讓用戶自己每次個性化地輸入新的 prompt,這個成本和門檻太高了。
曲凱:你是什么時候確定自己找到了 PMF 的?
胡修涵:移動互聯網產品有個經典指標叫 421,次留 40%,周留 20%,長留 10%。我們最早發現捏Ta的長留是 OK 的,一部分核心用戶可能還高于 10%,但是次留和周留都很差,說明它的使用模式不高頻,那相應的,它玩法的消耗次數不多,付費空間也就會打折扣。
而當我們把線索,就是剛才說的劇情模板這部分做好之后,每個用戶的消耗次數一下子提升了,留存線全面越過了 421 指標。
此外,分享意愿和付費渴求度也有所提高。這個從用戶投訴和反饋來看特別明顯,最開始都是吐槽創作體驗的,中間一段時間是吐槽原創角色功能的,到十一二月份吐槽社交私信,到今年大家都開始吐槽“體力”不夠。我們的體力其實是自回的,反饋體力不夠說明這段時間他的消費欲望非常強,否則等等就行了。
我一定程度上認可的點是,這一代 AI 產品一開始就要考慮商業化和廣告植入問題,考慮推理成本。但過早對創作行為收費,是一個很抑制創作意愿的事,所以我們只是一直在試驗付費意愿,沒有真正做大規模商業化。目前我們是讓用戶通過點擊廣告等等方式來增加體力。
曲凱:這個體力設置和廣告激勵很有小游戲的感覺。
胡修涵:對,這都是游戲留下的一些經驗。
再到上幾個月已經出現了一些比較明確的續費和復購,我們就比較有信心說找到了 PMF,下一個階段更多就是做增長和推廣。
曲凱:所以你總結一下,捏Ta這一年多以來,哪些地方是做得最對的?
胡修涵:首先我們始終比較聚焦,沒有泛泛地服務所有的創作類型。所以能比較深入地洞察用戶,而不只是淺淺地聊聊天,談談反饋。
第二就是我們會在社媒上用內容給產品探路。因為內容是一個雙邊市場,它在需求端受不受歡迎很重要。可能有些內容,非常專業非常酷炫,但內容其實并沒有特別多的普通內容用戶來消費,更多是科技愛好者去嘗嘗鮮,這是沒有什么生命力的。所以我們社交媒體上的內容會領先產品三個月,用這三個月去提前測試哪些 AI 參與制作的內容有 content market fit,這個比 PMF 的前置效率要高很多。
曲凱:我們講了這么多,你怕不怕大家聽完以后抄一個 捏Ta 出來,你覺得 捏Ta 的核心競爭力是什么?
胡修涵:核心競爭力是,在我們團隊里,從需求洞察到模型側的優化只需要一兩個人就能完成,而其他團隊可能需要三四個不同職能的人。或者也可以說,我們迭代閉環足夠快,感知和行動部分的距離足夠短。
之前影響力很大,我很同意里面的一個點,就是產品經理需要關注最底層的技術變化,因為技術會很大程度上影響你的戰略決策,比如說判斷現在是要去攻克視頻生成能力,還是去優化一個用戶使用的細節。所以只有當一個人,既是一線的業務了解者,又是一線的技術實操者,才能比較準確地判斷用什么方式將技術落進產品里最合適,否則就會帶來很多波折和損耗。
最后,如果你對我們的 AI 私董會感興趣,可點擊閱讀原文或者掃描下方二維碼,獲取報名鏈接(里面也有目前已加入的成員名單,歡迎點擊查看)
AI 私董會活動預告:
42章經
思考事物本質
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.