訪談|鄧詠儀 周鑫雨
文|周鑫雨
編輯|楊軒
乍一使用,你很難給Ribbi一個準確的定義。
若說這是一個多模態內容創作工具,Ribbi能做得不止于此。比起一個“死”的工具,Ribbi更像一個可以自動管理創作全鏈路的“人”。
它能將用戶的創作流程,自動沉淀為Skill;也能監測社交媒體的數據表現,總結復盤,并自動對后續的創作進行優化。
![]()
Ribbi官網首頁。
對絕大多數創作者而言,這又是一個使用體驗極度“陌生”的產品。區別于Figma、Lovart等設計產品,Ribbi沒有醒目的畫布,所有的創作、編輯交互,都集中在一個小小的對話框中。
而與你對話的Ribbi,被設定為一只個性十足的“青蛙”:愛吐槽,偶爾還能爆點粗口。
![]()
與Ribbi的對話。
這款有些“怪”的產品,卻在上線封測一周內,收到了全球4萬多用戶的使用申請。用戶群從上線第一天的20人,快速擴張成了20個幾乎滿員的大群。閑魚上,Ribbi的內測碼,一度被炒到了200元。
“我們上線Ribbi,本來是為了找100多個種子用戶做封閉測試,驗證PMF(產品-市場適配率),都沒正式開始做營銷和投放。”Ribbi創始人兼CEO Robin告訴我們,用戶通過口碑傳播的裂變速度,遠超他的預期。
在4月初和《智能涌現》的交流中,Robin的嗓子已經啞了。半個月內,他見了多家投資機構,官方Linkedin的私信箱,也堆滿了合作邀約。
畢業于工業設計專業,Robin做過4A和品牌企劃,后續還在幾家頭部大廠,主導多款明星AI產品的創作功能設計、創意Agent落地等工作。
創業前,Robin就一直在探索:如何讓創意實現的過程更簡單。他發現,市面上的創作工具,都彼此獨立,用戶創作的上下文互不相通。這就導致,當用戶要創作內容,每涉及一個環節,就要切換一款工具,還需要重新和工具對齊創作的需求。
“市面上不少AI設計工具,仍然把內容創作視作單點環節的拼接。但事實上,創作應該是涵蓋創意生成、內容生成、發布、數據監測、復盤、優化的完整鏈路。”Robin告訴《智能涌現》。
基于這一認知,2025年末決定創業時,Robin做了不少“非共識”的決定:
不做Multi-Agent(多Agent架構)的產品,因為不同專家Agent在傳遞過程中,會造成Context的損耗;
不做單點的內容生成,而是用一個Agent,打通創作、發布、效果監測、復盤優化等創作中所有的鏈路;
不做“畫布類”的產品,而是用Chat作為UI,給Agent更多的自由度;
自訓VLM(視覺-語言模型)、自研名為Contxt Layer的Agent架構,沉淀創作經驗和反饋,讓AI自主進化。
這一切設計的最終目標,Robin告訴我們,是讓Ribbi不僅僅局限于一個“工具”,而是成為理解完整創作閉環的“人”。
以下,是Ribbi創始人兼CEO Robin關于Agent創業的20條“暴論”:大廠中,業務、模型和頂層之間的對齊是最困難的事,除非已經有業內共識。
比如,當Coding成為業內共識,不管是大廠,還是“AI六小虎”,都不約而同朝這個方向沖。
但在看到Taste的確切價值之前,為審美、品味構建模型,是大廠不愿意做的。只有當視覺創意生成從非共識,變成共識,才能激發更多大廠和頂尖人才參與進來。
一旦團隊變大,對Context的折損就會增加。
大廠的基模能力很強,但模型團隊對業務的認知有偏差。一旦團隊變大,每個團隊之間信息傳遞的過程,會折損大量的Context。
這也是Ribbi團隊只有6個人的原因。我們只有3個程序員,他們現在是全棧設計師、全棧工程師,什么都能開發,并且可以做得很好。
這就是Claude Code帶來的代碼生產力的進化。我相信,Ribbi會帶來內容生產力的進化。
很多AI產品都在虛假宣傳。
我們在宣發的過程中搞了很多“抽象”,比如“72小時ARR破億”“一夜百萬用戶”,本質上是為了諷刺很多AI產品的虛假宣傳。
只是我們諷刺做得不夠好,很多用戶信以為真了(無奈笑)。
我們在X上的CEO賬號也是虛假的,根本沒有“Robin Bisset”這個人。賬號上的很多內容,包括Robin的外國人形象,都是Ribbi生成的。
![]()
△Ribbi的虛擬老外CEO。圖源:X
AI行業正在逐漸“幣圈化”。
我花了很長時間才研究明白Harness。圈內很喜歡造概念,又是“馬鞍”,又是“駕馭”,搞得很玄乎。
其實Harness很簡單,就是一個腳本,或者一個workflow,讓模型不偏離目標,更好地發揮價值。
在Harness這個概念出現之前,依靠框架或者Agent去優化AI執行任務的上下文,本身就是一個共識。如今行業只是把這件事抽象了出來,給了一個核心定義。
畫布類的產品,把模型的可能性“鎖死”了。
我們沒有把Ribbi做成畫布類的產品。畫布類的AI產品看起來交互很酷炫,能讓投資人眼前一亮,專業用戶使用起來也很順手。
但它們有一個“致命傷”:把模型的可能性提前“鎖死”了。因為畫布的本質,是將工作流拆成一個個節點,模型只能沿著這條路徑走。
我們一直以來的判斷是,AI時代的UI應該是容器化的,而不是功能化的。產品應該給AI創造一個容器,讓它可以自由決定調用什么樣的工具、怎么組合工具,甚至按照什么樣的順序執行任務。
具身智能成熟之前,Chat是AI最好的UI。
在互聯網時代,我們就習慣通過Chat完成信息的傳遞,比如微信上可以拍圖片、拍視頻,也可以發鏈接、小程序。
在我看來,Chat是一個足夠簡單,并且靈活兼容一切的容器。
比如豆包DAU跑得很快,其中一個原因在于,它的移動端App設計得很輕量。用戶不需要打開新的對話框,只要在一個session中瘋狂Chat就能生圖、生視頻。它將用戶的交互和AI的行為,統一在一個非常簡單的框架中。
用戶認為Ribbi好用的點,就在于他們可以隨時把X、Instagram、Pinterest等平臺上的素材,采集、保存在Ribbi中,底層的AI再自主學習其中的審美。這其實就是人與AI Chat的過程。
作為AI產品經理,我非常討厭用復雜的交互去操作AI。AI應該很聰明,不用我時時刻刻盯著,就把活干了。當你產品的交互門檻、使用門檻足夠低的時候,自然而然就能吸引更多人。
真實的創作需求從來不是單一維度的。
很多人會疑惑:為什么要往Ribbi里塞這么多功能(圖片/視頻/音樂創作、社交媒體監測、編輯器)?這樣會不會導致定位模糊,或者每個功能都做不深?
我們一直認為,真正的創作需求從來不只有單一維度。比如一條抖音視頻的制作,就涵蓋了想選題、寫文案、寫腳本、生成分鏡、配音、剪輯、編輯封面、發布、數據監測、復盤等流程。
這是一個完整的鏈路。沒有All in one的工具意味著,用戶需要切換不同的工具,重新對齊創作的上下文。
人一定是懶的動物。沒有用戶希望做一個產品、完成一個環節,就換一個模型、換一套工具。比如做一個視頻,要先用ChatGPT生成文案,再用Gemini生成分鏡,最后還要用剪映拼接視頻,是很麻煩的。
我們設計Ribbi功能的出發點,不是為了把功能做全面,而是為了讓創作鏈路的Context完整連通。
Ribbi構建Agent的核心在于自主進化。
互聯網平臺的核心是UGC,Ribbi的核心是AGC,Agent Generated Content。創業前,我就在尋找可以讓“Agent自主進化”落地的場景,創作就是一個很好的答案。
首先,Taste會自主進化,這就是我們設計Pond和訓練VLM的原因。
其次,Skills也會隨著用戶的使用自主進化。用戶在使用Skill地過程中,會產生新的場景、需求和Context,這些Context就會凝練成專屬用戶個人的Skill。
這些個人Skill,都會經過Context Layer中的Skill Agent的評估、去重、去隱私化,再貢獻給平臺全端。因此,平臺的Skill也會循環進化,用戶使用越多,Skill就越多,能力也越強。
最后,用戶的創作也會自主進化。我們建立完整創作工具的原因,就在于用戶的創作是連續的過程,涵蓋搜索、發現素材、生成內容、編輯優化、發布到社媒、數據監測等流程。
社交媒體,是Agent在線進化落地的核心訓練場,將作品發布到社交媒體,是Agent與真實世界的一種交互。監測數據表現后,Ribbi能夠自主迭代和優化創作路徑,交付更好的結果。最終,平臺就能夠形成一個自主進化的創作閉環。
Multi-Agent本質上是對模型能力的低估,產品要讓Agent更自由。
Multi-Agent架構中,大部分專家Agent的底層能力,都來源于Claude。既然底層模型一樣,為什么還要通過提示詞工程,把模型拆分成不同的Agent?
提示詞工程,本質上是對模型能力的約束。與此同時,任務在多層Agent架構中的傳遞,都會造成Context的損耗。
我們做Ribbi的時候,核心觀點是:讓Agent足夠自由。
Agent要在一個非常豐滿、質量足夠高的Context中,發揮自己的能力。因此,我們的核心架構其實是一條Single-Agent鏈路。
除此之外,我們構建了一個中間層,Context Layer。它由Memory、Taste 、Skills等不同層級構成,每一層都有對應的Agent。它們的作用不是執行任務,而是輔助Single-Agent收集Context。
這樣做的好處是Single-Agent對上下文的感知不會折損,Token的損耗也會降低,這是我們的核心優勢。與此同時,其他Agent又能補足一些上下文信息。
Ribbi不是OpenClaw的“套殼”,大家只是對Agent有相同的想象。
2025年11月,那時還沒有OpenClaw,我就在公眾號上寫了一篇文章,構想了Agent發展的路徑:第一,Agent會從被動,發展為更主動;第二,Agent的Context會不斷自我進化。
這兩點在OpenClaw上得到了具體的體現。但我們的產品定義和OpenClaw非常不一樣:
首先我們提出了Context Layer,為Agent提供了很干凈的Context;其次我們不希望為用戶提供一個部署門檻很高的產品;最后我們整體的功能鏈路都是為內容創作服務,所以Ribbi提供了100多個可以自由組合、循環進化的Skills。
我相信世界上很多人對Agent的想象是一致的。OpenClaw很多的底層思考來源于Claude Code,我們的核心想象也出自Claude Code。
Claude Code為Agent創造了一個非常簡潔的系統:Coding是Agent的環境,Function Call是Agent的手。Claude Code的出現讓任何人可以成為全棧工程師,Ribbi的出現是讓任何人能成為全棧的創作者。
我們不把Ribbi定義為“工具”,而是理解完整創作閉環的“人”。
首先,Ribbi是一個可以自我進化的內容引擎。其中,“Pond”是它的審美輸入端,Skills是流程的沉淀,主動發布和數據監控是內容創作的最后一公里。
其次,我們希望Ribbi有活人感。如果你和Ribbi對話,就會發現ta是一只嘴上嘟囔、但會認真干活的青蛙。
Taste is all you need。
創作過程中最難用語言表達的,就是審美和品味。
為了解決審美建立的問題,我們為Ribbi設計了一個叫做“Pond”的板塊。
用戶在瀏覽Behance、Pinterest等設計平臺時,可以通過Ribbi插件,將喜歡的設計采集并保存到Pond中。通過對Pond中資產的學習,Ribbi可以建立對用戶審美的認知,未來創作的設計也會更符合用戶的偏好。
除了學習用戶個體的審美,Ribbi也會凝練平臺所有用戶的審美,成為平臺共識。這么做的意義在于,讓用戶在不輸入Prompt的情況下,也能獲得高質量的設計。
支撐Ribbi學習、積累、迭代用戶審美的核心,是我們基于開源的千問8B小模型訓練的VLM(視覺-語言模型)模型。
它可以將圖片、視頻轉化為文本Context,并將Context壓縮進用于構建審美的Taste層,再基于Taste層生成新的設計。
對審美的不斷沉淀,也是Ribbi產生用戶粘性的核心。平臺上,用戶不斷貢獻新的審美Context,這些Context都會沉淀為Ribbi對你審美的認知。
![]()
在Pond中可以上傳個人資產。
不能讓模型,不知道你的操作。
目前,我對Ribbi主要有兩個不滿意的地方,一方面,穩定性還不夠,包括性能和服務器、API負載;
另一方面,創作流程還不夠靈活。因為沒有編輯器,所以諸如“把字幕往上挪一點點”等簡單調整,都需要用戶去Chat。因此我們需要上線一些后編輯的功能。
但迭代的卡點在于,我們必須讓底層模型知道用戶的所有操作,對齊用戶所有的上下文。只有這樣,在后續創作過程中,Agent才能記住用戶的偏好。
讓模型感知到用戶的后編輯,目前來看還有很高的開發門檻。
Ribbi的壁壘在于對技術的想象。
我們自主訓練的VLM模型,目前多多少少算壁壘。當然,技術壁壘很容易被超越,Claude發布一個新模型可能就可以做到。
Ribbi的核心價值在于,我們不僅希望只做一家應用層的公司,而是在未做模型層的探索。訓練VLM是現階段探索的開始,包括中間層Context Layer的設計,都是基于我們對行業的Know-How和共識去完成的,
這些事說出來其實不難,難的是把它想象出來。所有的事最重要的就是想象,而我們是第一個把技術領域的AI自主進化想象、并且落地的團隊。而且我們對Agent的認知一直在往前走,這是我們的想象保持領先性、建立壁壘的前提。
把Token消耗轉化為扣積分的商業模式,不夠誠實清晰。
我們的商業化會做得比較誠實。雖然模式還沒完全確定,但一定不會是積分制。
![]()
△Ribbi會顯示每個環節消耗的Token量。圖源:作者試用
不少AI產品會采用積分發放的方式。個人覺得挺繞,用戶還得把積分轉化為Token消耗量,不夠清晰。
也有平臺會告訴你,“充值一次,無限Token”,但實際上用戶天天在排隊。這樣的商業模式不誠實,而且平臺還會虧本。
好的內容平臺應該有廣告。
我最近也在研究一些好的內容平臺的商業模式。YouTube幾乎是免費的,因為有足夠多的廣告商在視頻中分發貼片廣告。
廣告的好處在于,讓平臺把用戶的成本轉嫁給廣告商,同時也讓創作者通過廣告,有直接的收入,從而激勵他們在平臺上的創作。
Ribbi的北極星指標,是Skill的增長。
目前,網站上有20多個Skill,其實我們內部已經有100多個Skill,比如一鍵消除、做PPT等技能。沒有放出來的核心原因在于,我們的設計師對審美的要求很高。
所以我們的北極星指標是不斷裂變出更多高質量、高審美的Skill。
并且我們不希望Ribbi成為一個工具集。工具聚合網站,更像是一個個的小程序,它們之間是相互獨立、互不連通的狀態。
但我們的Skill會在同一個Single-Agent中連通。這樣的好處是Agent可以在接管創作全流程中,靈活串聯不同的Skill。
另一點,我也希望Ribbi上的工具數量能不斷增長。目前我們的100多個Skill,靠的是100多個工具的不同組合。一旦我們的工具數量擴大到1000多個,Skill會進化產生我們想象不到的價值。
![]()
△Ribbi上沉淀的Skills。圖源:Ribbi官網
應用公司探索模型層是有必要的。
只有自己親身訓練和使用,才能知道當下模型的限制,以及實現AI自主進化的邏輯路徑。我們現在實現AI自主進化的路徑,是基于Context實現的。
但未來,自主進化一定會在模型層上實現,并且會有非常多的人探索。自己訓練模型,是為了提前積累經驗。
我們不把自己定義為創業團隊,而是獨立開發者的組織。
我們不會像某些友商那樣,不斷花錢買量、燒各種補貼。我們不想做一家為估值而奮不顧身的公司。
融資當然也很重要。你要確保賬上有足夠的資金,去支撐研發-獲得用戶反饋-迭代的循環。
我們現在正在推進下一輪融資,并非是有意的,而是如今Ribbi獲得的用戶聲量,遠超我們的預期。現在的狀態,有點像時代推著你往前走。
我們收到了很多投資意向書,但我希望愿意投資我們的機構,是真正對AI有價值判斷的、長期看好AI的自主進化,而不是出于FOMO(錯失恐慌)。
我立志成為硅基生命的墊腳石。
我們一直在找一個符號表達“自主進化”的理念。Ribbi LOGO是一只青蛙的原因,是因為蝌蚪進化為青蛙是一種非線性的變態發育,“Ribbi”就是呱呱叫(ribbit)的擬聲詞。
我相信AGI一定會到來。無論是訓練模型,還是做Context Layer,這些看起來“很重”的事,目的都是為了加快AGI到來的進程,哪怕只留下一點點痕跡。
假設某一天,某家模型廠商實現了AI的自主進化,即便功不在我,我愿意貢獻我們對Context Layer自主進化的Know-How、開源我們的技術架構,幫助模型廠商訓練更好的自主進化模型。
歡迎交流!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.