乍一使用,你很難給Ribbi一個(gè)準(zhǔn)確的定義。
若說這是一個(gè)多模態(tài)內(nèi)容創(chuàng)作工具,Ribbi能做得不止于此。比起一個(gè)“死”的工具,Ribbi更像一個(gè)可以自動(dòng)管理創(chuàng)作全鏈路的“人”。
它能將用戶的創(chuàng)作流程,自動(dòng)沉淀為Skill;也能監(jiān)測社交媒體的數(shù)據(jù)表現(xiàn),總結(jié)復(fù)盤,并自動(dòng)對后續(xù)的創(chuàng)作進(jìn)行優(yōu)化。
![]()
Ribbi官網(wǎng)首頁。
而與你對話的Ribbi,被設(shè)定為一只個(gè)性十足的“青蛙”:愛吐槽,偶爾還能爆點(diǎn)粗口。
![]()
與Ribbi的對話。
這款有些“怪”的產(chǎn)品,卻在上線封測一周內(nèi),收到了全球4萬多用戶的使用申請。用戶群從上線第一天的20人,快速擴(kuò)張成了20個(gè)幾乎滿員的大群。閑魚上,Ribbi的內(nèi)測碼,一度被炒到了200元。
“我們上線Ribbi,本來是為了找100多個(gè)種子用戶做封閉測試,驗(yàn)證PMF(產(chǎn)品-市場適配率),都沒正式開始做營銷和投放。”Ribbi創(chuàng)始人兼CEO Robin告訴我們,用戶通過口碑傳播的裂變速度,遠(yuǎn)超他的預(yù)期。
在4月初和《智能涌現(xiàn)》的交流中,Robin的嗓子已經(jīng)啞了。半個(gè)月內(nèi),他見了多家投資機(jī)構(gòu),官方Linkedin的私信箱,也堆滿了合作邀約。
畢業(yè)于工業(yè)設(shè)計(jì)專業(yè),Robin做過4A和品牌企劃,后續(xù)還在幾家頭部大廠,主導(dǎo)多款明星AI產(chǎn)品的創(chuàng)作功能設(shè)計(jì)、創(chuàng)意Agent落地等工作。
“市面上不少AI設(shè)計(jì)工具,仍然把內(nèi)容創(chuàng)作視作單點(diǎn)環(huán)節(jié)的拼接。但事實(shí)上,創(chuàng)作應(yīng)該是涵蓋創(chuàng)意生成、內(nèi)容生成、發(fā)布、數(shù)據(jù)監(jiān)測、復(fù)盤、優(yōu)化的完整鏈路。”Robin告訴《智能涌現(xiàn)》。
基于這一認(rèn)知,2025年末決定創(chuàng)業(yè)時(shí),Robin做了不少“非共識(shí)”的決定:
不做Multi-Agent(多Agent架構(gòu))的產(chǎn)品,因?yàn)椴煌瑢<褹gent在傳遞過程中,會(huì)造成Context的損耗;
不做單點(diǎn)的內(nèi)容生成,而是用一個(gè)Agent,打通創(chuàng)作、發(fā)布、效果監(jiān)測、復(fù)盤優(yōu)化等創(chuàng)作中所有的鏈路;
不做“畫布類”的產(chǎn)品,而是用Chat作為UI,給Agent更多的自由度;
自訓(xùn)VLM(視覺-語言模型)、自研名為Contxt Layer的Agent架構(gòu),沉淀創(chuàng)作經(jīng)驗(yàn)和反饋,讓AI自主進(jìn)化。
這一切設(shè)計(jì)的最終目標(biāo),Robin告訴我們,是讓Ribbi不僅僅局限于一個(gè)“工具”,而是成為理解完整創(chuàng)作閉環(huán)的“人”。
比如,當(dāng)Coding成為業(yè)內(nèi)共識(shí),不管是大廠,還是“AI六小虎”,都不約而同朝這個(gè)方向沖。
但在看到Taste的確切價(jià)值之前,為審美、品味構(gòu)建模型,是大廠不愿意做的。只有當(dāng)視覺創(chuàng)意生成從非共識(shí),變成共識(shí),才能激發(fā)更多大廠和頂尖人才參與進(jìn)來。
大廠的基模能力很強(qiáng),但模型團(tuán)隊(duì)對業(yè)務(wù)的認(rèn)知有偏差。一旦團(tuán)隊(duì)變大,每個(gè)團(tuán)隊(duì)之間信息傳遞的過程,會(huì)折損大量的Context。
這也是Ribbi團(tuán)隊(duì)只有6個(gè)人的原因。我們只有3個(gè)程序員,他們現(xiàn)在是全棧設(shè)計(jì)師、全棧工程師,什么都能開發(fā),并且可以做得很好。
這就是Claude Code帶來的代碼生產(chǎn)力的進(jìn)化。我相信,Ribbi會(huì)帶來內(nèi)容生產(chǎn)力的進(jìn)化。
我們在宣發(fā)的過程中搞了很多“抽象”,比如“72小時(shí)ARR破億”“一夜百萬用戶”,本質(zhì)上是為了諷刺很多AI產(chǎn)品的虛假宣傳。
只是我們諷刺做得不夠好,很多用戶信以為真了(無奈笑)。
我們在X上的CEO賬號也是虛假的,根本沒有“Robin Bisset”這個(gè)人。賬號上的很多內(nèi)容,包括Robin的外國人形象,都是Ribbi生成的。
![]()
△Ribbi的虛擬老外CEO。圖源:X
我花了很長時(shí)間才研究明白Harness。圈內(nèi)很喜歡造概念,又是“馬鞍”,又是“駕馭”,搞得很玄乎。
其實(shí)Harness很簡單,就是一個(gè)腳本,或者一個(gè)workflow,讓模型不偏離目標(biāo),更好地發(fā)揮價(jià)值。
我們沒有把Ribbi做成畫布類的產(chǎn)品。畫布類的AI產(chǎn)品看起來交互很酷炫,能讓投資人眼前一亮,專業(yè)用戶使用起來也很順手。
但它們有一個(gè)“致命傷”:把模型的可能性提前“鎖死”了。因?yàn)楫嫴嫉谋举|(zhì),是將工作流拆成一個(gè)個(gè)節(jié)點(diǎn),模型只能沿著這條路徑走。
我們一直以來的判斷是,AI時(shí)代的UI應(yīng)該是容器化的,而不是功能化的。產(chǎn)品應(yīng)該給AI創(chuàng)造一個(gè)容器,讓它可以自由決定調(diào)用什么樣的工具、怎么組合工具,甚至按照什么樣的順序執(zhí)行任務(wù)。
在我看來,Chat是一個(gè)足夠簡單,并且靈活兼容一切的容器。
比如豆包DAU跑得很快,其中一個(gè)原因在于,它的移動(dòng)端App設(shè)計(jì)得很輕量。用戶不需要打開新的對話框,只要在一個(gè)session中瘋狂Chat就能生圖、生視頻。它將用戶的交互和AI的行為,統(tǒng)一在一個(gè)非常簡單的框架中。
用戶認(rèn)為Ribbi好用的點(diǎn),就在于他們可以隨時(shí)把X、Instagram、Pinterest等平臺(tái)上的素材,采集、保存在Ribbi中,底層的AI再自主學(xué)習(xí)其中的審美。這其實(shí)就是人與AI Chat的過程。
作為AI產(chǎn)品經(jīng)理,我非常討厭用復(fù)雜的交互去操作AI。AI應(yīng)該很聰明,不用我時(shí)時(shí)刻刻盯著,就把活干了。當(dāng)你產(chǎn)品的交互門檻、使用門檻足夠低的時(shí)候,自然而然就能吸引更多人。
我們設(shè)計(jì)Ribbi功能的出發(fā)點(diǎn),不是為了把功能做全面,而是為了讓創(chuàng)作鏈路的Context完整連通。
互聯(lián)網(wǎng)平臺(tái)的核心是UGC,Ribbi的核心是AGC,Agent Generated Content。創(chuàng)業(yè)前,我就在尋找可以讓“Agent自主進(jìn)化”落地的場景,創(chuàng)作就是一個(gè)很好的答案。
首先,Taste會(huì)自主進(jìn)化,這就是我們設(shè)計(jì)Pond和訓(xùn)練VLM的原因。
Skills也會(huì)隨著用戶的使用自主進(jìn)化。用戶在使用Skill地過程中,會(huì)產(chǎn)生新的場景、需求和Context,這些Context就會(huì)凝練成專屬用戶個(gè)人的Skill。
這些個(gè)人Skill,都會(huì)經(jīng)過Context Layer中的Skill Agent的評估、去重、去隱私化,再貢獻(xiàn)給平臺(tái)全端。因此,平臺(tái)的Skill也會(huì)循環(huán)進(jìn)化,用戶使用越多,Skill就越多,能力也越強(qiáng)。
社交媒體,是Agent在線進(jìn)化落地的核心訓(xùn)練場,將作品發(fā)布到社交媒體,是Agent與真實(shí)世界的一種交互。監(jiān)測數(shù)據(jù)表現(xiàn)后,Ribbi能夠自主迭代和優(yōu)化創(chuàng)作路徑,交付更好的結(jié)果。最終,平臺(tái)就能夠形成一個(gè)自主進(jìn)化的創(chuàng)作閉環(huán)。
Multi-Agent架構(gòu)中,大部分專家Agent的底層能力,都來源于Claude。既然底層模型一樣,為什么還要通過提示詞工程,把模型拆分成不同的Agent?
提示詞工程,本質(zhì)上是對模型能力的約束。任務(wù)在多層Agent架構(gòu)中的傳遞,都會(huì)造成Context的損耗。
我們做Ribbi的時(shí)候,核心觀點(diǎn)是:讓Agent足夠自由。
Agent要在一個(gè)非常豐滿、質(zhì)量足夠高的Context中,發(fā)揮自己的能力。因此,我們的核心架構(gòu)其實(shí)是一條Single-Agent鏈路。
除此之外,我們構(gòu)建了一個(gè)中間層,Context Layer。它由Memory、Taste 、Skills等不同層級構(gòu)成,每一層都有對應(yīng)的Agent。它們的作用不是執(zhí)行任務(wù),而是輔助Single-Agent收集Context。
這兩點(diǎn)在OpenClaw上得到了具體的體現(xiàn)。但我們的產(chǎn)品定義和OpenClaw非常不一樣:
首先我們提出了Context Layer,為Agent提供了很干凈的Context;其次我們不希望為用戶提供一個(gè)部署門檻很高的產(chǎn)品;最后我們整體的功能鏈路都是為內(nèi)容創(chuàng)作服務(wù),所以Ribbi提供了100多個(gè)可以自由組合、循環(huán)進(jìn)化的Skills。
我相信世界上很多人對Agent的想象是一致的。OpenClaw很多的底層思考來源于Claude Code,我們的核心想象也出自Claude Code。
首先,Ribbi是一個(gè)可以自我進(jìn)化的內(nèi)容引擎。其中,“Pond”是它的審美輸入端,Skills是流程的沉淀,主動(dòng)發(fā)布和數(shù)據(jù)監(jiān)控是內(nèi)容創(chuàng)作的最后一公里。
我們希望Ribbi有活人感。如果你和Ribbi對話,就會(huì)發(fā)現(xiàn)ta是一只嘴上嘟囔、但會(huì)認(rèn)真干活的青蛙。
創(chuàng)作過程中最難用語言表達(dá)的,就是審美和品味。
為了解決審美建立的問題,我們?yōu)镽ibbi設(shè)計(jì)了一個(gè)叫做“Pond”的板塊。
用戶在瀏覽Behance、Pinterest等設(shè)計(jì)平臺(tái)時(shí),可以通過Ribbi插件,將喜歡的設(shè)計(jì)采集并保存到Pond中。通過對Pond中資產(chǎn)的學(xué)習(xí),Ribbi可以建立對用戶審美的認(rèn)知,未來創(chuàng)作的設(shè)計(jì)也會(huì)更符合用戶的偏好。
除了學(xué)習(xí)用戶個(gè)體的審美,Ribbi也會(huì)凝練平臺(tái)所有用戶的審美,成為平臺(tái)共識(shí)。這么做的意義在于,讓用戶在不輸入Prompt的情況下,也能獲得高質(zhì)量的設(shè)計(jì)。
支撐Ribbi學(xué)習(xí)、積累、迭代用戶審美的核心,是我們基于開源的千問8B小模型訓(xùn)練的VLM(視覺-語言模型)模型。
對審美的不斷沉淀,也是Ribbi產(chǎn)生用戶粘性的核心。平臺(tái)上,用戶不斷貢獻(xiàn)新的審美Context,這些Context都會(huì)沉淀為Ribbi對你審美的認(rèn)知。
![]()
在Pond中可以上傳個(gè)人資產(chǎn)。
目前,我對Ribbi主要有兩個(gè)不滿意的地方,一方面,穩(wěn)定性還不夠,包括性能和服務(wù)器、API負(fù)載;
我們自主訓(xùn)練的VLM模型,目前多多少少算壁壘。當(dāng)然,技術(shù)壁壘很容易被超越,Claude發(fā)布一個(gè)新模型可能就可以做到。
Ribbi的核心價(jià)值在于,我們不僅希望只做一家應(yīng)用層的公司,而是在未做模型層的探索。訓(xùn)練VLM是現(xiàn)階段探索的開始,包括中間層Context Layer的設(shè)計(jì),都是基于我們對行業(yè)的Know-How和共識(shí)去完成的,
這些事說出來其實(shí)不難,難的是把它想象出來。所有的事最重要的就是想象,而我們是第一個(gè)把技術(shù)領(lǐng)域的AI自主進(jìn)化想象、并且落地的團(tuán)隊(duì)。而且我們對Agent的認(rèn)知一直在往前走,這是我們的想象保持領(lǐng)先性、建立壁壘的前提。
我們的商業(yè)化會(huì)做得比較誠實(shí)。雖然模式還沒完全確定,但一定不會(huì)是積分制。
![]()
不少AI產(chǎn)品會(huì)采用積分發(fā)放的方式。個(gè)人覺得挺繞,用戶還得把積分轉(zhuǎn)化為Token消耗量,不夠清晰。
也有平臺(tái)會(huì)告訴你,“充值一次,無限Token”,但實(shí)際上用戶天天在排隊(duì)。這樣的商業(yè)模式不誠實(shí),而且平臺(tái)還會(huì)虧本。
我最近也在研究一些好的內(nèi)容平臺(tái)的商業(yè)模式。YouTube幾乎是免費(fèi)的,因?yàn)橛凶銐蚨嗟膹V告商在視頻中分發(fā)貼片廣告。
目前,網(wǎng)站上有20多個(gè)Skill,其實(shí)我們內(nèi)部已經(jīng)有100多個(gè)Skill,比如一鍵消除、做PPT等技能。沒有放出來的核心原因在于,我們的設(shè)計(jì)師對審美的要求很高。
所以我們的北極星指標(biāo)是不斷裂變出更多高質(zhì)量、高審美的Skill。
并且我們不希望Ribbi成為一個(gè)工具集。工具聚合網(wǎng)站,更像是一個(gè)個(gè)的小程序,它們之間是相互獨(dú)立、互不連通的狀態(tài)。
但我們的Skill會(huì)在同一個(gè)Single-Agent中連通。這樣的好處是Agent可以在接管創(chuàng)作全流程中,靈活串聯(lián)不同的Skill。
另一點(diǎn),我也希望Ribbi上的工具數(shù)量能不斷增長。目前我們的100多個(gè)Skill,靠的是100多個(gè)工具的不同組合。一旦我們的工具數(shù)量擴(kuò)大到1000多個(gè),Skill會(huì)進(jìn)化產(chǎn)生我們想象不到的價(jià)值。
![]()
△Ribbi上沉淀的Skills。圖源:Ribbi官網(wǎng)
只有自己親身訓(xùn)練和使用,才能知道當(dāng)下模型的限制,以及實(shí)現(xiàn)AI自主進(jìn)化的邏輯路徑。我們現(xiàn)在實(shí)現(xiàn)AI自主進(jìn)化的路徑,是基于Context實(shí)現(xiàn)的。
但未來,自主進(jìn)化一定會(huì)在模型層上實(shí)現(xiàn),并且會(huì)有非常多的人探索。自己訓(xùn)練模型,是為了提前積累經(jīng)驗(yàn)。
我們不會(huì)像某些友商那樣,不斷花錢買量、燒各種補(bǔ)貼。我們不想做一家為估值而奮不顧身的公司。
融資當(dāng)然也很重要。你要確保賬上有足夠的資金,去支撐研發(fā)-獲得用戶反饋-迭代的循環(huán)。
我們現(xiàn)在正在推進(jìn)下一輪融資,并非是有意的,而是如今Ribbi獲得的用戶聲量,遠(yuǎn)超我們的預(yù)期。現(xiàn)在的狀態(tài),有點(diǎn)像時(shí)代推著你往前走。
我們收到了很多投資意向書,但我希望愿意投資我們的機(jī)構(gòu),是真正對AI有價(jià)值判斷的、長期看好AI的自主進(jìn)化,而不是出于FOMO(錯(cuò)失恐慌)。
我們一直在找一個(gè)符號表達(dá)“自主進(jìn)化”的理念。Ribbi LOGO是一只青蛙的原因,是因?yàn)轵蝌竭M(jìn)化為青蛙是一種非線性的變態(tài)發(fā)育,“Ribbi”就是呱呱叫(ribbit)的擬聲詞。
我相信AGI一定會(huì)到來。無論是訓(xùn)練模型,還是做Context Layer,這些看起來“很重”的事,目的都是為了加快AGI到來的進(jìn)程,哪怕只留下一點(diǎn)點(diǎn)痕跡。
假設(shè)某一天,某家模型廠商實(shí)現(xiàn)了AI的自主進(jìn)化,即便功不在我,我愿意貢獻(xiàn)我們對Context Layer自主進(jìn)化的Know-How、開源我們的技術(shù)架構(gòu),幫助模型廠商訓(xùn)練更好的自主進(jìn)化模型。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.