![]()
沒有吹噓,也沒有謙虛。
從創立到出售,差兩個月滿六年。2025 年 10 月,肖涵把 Jina AI 賣給了美國上市公司 Elastic(NYSE: ESTC)。他率領核心團隊加入 Elastic,并擔任 VP of AI。
六年里,AI 技術的發展速度快到令人窒息:微服務架構失寵,ChatGPT 重塑行業,大模型你追我趕,RAG 幾度生死輪回,模型的半衰期僅幾個月。不跑著,技術資產半年后價值歸零。
他跑了六年,中途 Pivot 兩次:砍掉分散精力的項目,裁撤一半的員工,離開歐洲,重心移向硅谷,All in 搜索底座模型。他說:“當沒有壁壘時,極致的聚焦和近乎獨裁的執行力,就是唯一的壁壘。”
他說這是一場魷魚游戲。他活到了最后,但不是沒有遺憾。
與此同時,我也在這家公司經歷著自己的三年。
我叫張颯,2022 年入職 Jina AI,負責產品運營。上個月隨收購從北京搬到新加坡。作為畢業后的第一份工作,Jina AI 是輛剎不住的車。興奮、疲憊、彷徨、慶幸,四擋雙離合。我見過老板凌晨三點還在提交代碼;也記得團隊圍在一起為第一筆 10 美元擊掌相慶;更熟悉那種剛備好的物料因戰略調整而作廢、剛記牢的賣點因產品迭代要推翻重來的無奈。
后來模型被市場認可了,收購消息落定了,我才明白一件事:當時我眼里的折騰,其實是老板在 AI 浪潮里的求生動作。
以下是我和 Jina AI 創始人肖涵 的一次長談,關于他六年創業的得與失。
張颯:六年來,您給這段 Jina AI 創業經歷打幾分?滿分 10 分的話?
肖涵:我覺得 7 分的樣子吧。
從 2020 年疫情期間開始,我從零組建一個團隊,經歷了不少波折,到 2025 年 10 月份成功賣給一個美國上市公司。這段創業經歷算是我到現在為止比較自豪的事情,第一次創業就成功退出,也讓一直跟著我的團隊有了一個比較好的出路。不過多少在一些事情上還是有些遺憾。
張颯:六年算長么,您覺得?
肖涵:跑的時候其實沒感覺,跑完停下來才發現嚯跑了這么久。
張颯:關于 Jina AI 您最早的記憶是什么?
肖涵:記得 2019 年圣誕節前,我在深圳海岸城那邊一個酒店行政酒廊里和投資人第一次 pitch(路演),后來在上海安福路上的 Costa 咖啡廳里,修改 PPT 去給 IC(投委會)講。這大概是我關于 Jina 最早的記憶。
張颯:其實我一直比較好奇,Jina AI 這個名字是怎么來的?
肖涵:我當時是想找一個人工智能的名稱,像鋼鐵俠里 Jarvis 的那種,但同時要滿足幾個條件:
一是要感覺中性化、女性化一些,更加有親和力、少一些侵略性。第二是要讓這個名字在各個語言中讀法都大致相同,三是 SEO 要比較好做一些。
當時 shortlist 里幾個名字,最后選擇了 Jina,簡單、好記也好讀。感覺像是 Jarvis 的女友一樣。另外當時做 SEO 的時候發現 Jina 這個名字只有一些韓國人在用,所以覺得 SEO 做起來也比較容易,可以很輕松的排在 Google 搜索的前面。
中文名稱我叫做 極納,意思是“極深研幾”、“海納百川”,算是搜索和索引擦上邊,同時“極客”也是我們公司文化的一部分。
張颯:Jina 從 2020 年成立到現在,我們做的事情都有哪些?我有些朋友很早關注 Jina,更多朋友最近兩年才關注 Jina,感覺大家對 Jina 的認知并不相同?
肖涵:是的。我們中間有過幾次 pivot 也就是“轉型”,但總體來說都是圍繞 Neural Information Retrieval 這個大的主題中做上下游調整。
2020 年 2 月成立到 2023 年 2 月我們一直在做一套軟件框架,幫助開發者去更快的實現語義搜索。角色上有點像 Elasticsearch 和后來的 Langchain,LlamaIndex 這些,聚焦在工具鏈、糖水代碼和腳手架上。
2023 年是我們比較混亂的一年,因為 2022 年 12 月 ChatGPT 的發布,我當時察覺到之前做的框架不再被社區關注。那時公司內部連續開了好幾次全員會,討論接下來該做什么。
所以在 2023 年一年里嘗試了兩個不同的新方向:一個是走 Wrapper(套殼)路線,通過構建 prompt-based 的生產力工具,我內部稱為 Thin Strategy。還有一個方向是走 Search Model 的路線,從訓練自己的 Embedding 向量模型開始,夯實搜索的基礎技術,我稱為 Fat Strategy。
2024 年 2 月,我停止了所有的 Wrapper 路線的推進,一股腦地押在了搜索模型的研發上,并重塑了新的敘事邏輯:Search Foundation Models(搜索底座模型)。這就是今天大家所看到的 Jina AI——從多語言到多模態,前后四代共 20 個向量模型、重排器、Reader 等搜索側小模型,14 篇會議論文,HuggingFace 上每月五百萬次的下載量以及 API 上每天超 200 billion tokens 的用量。
張颯:所以 2023 年是對 Jina 來說重要的一年?
肖涵:是的,2023 年還有 2024 年年初,這兩個時間點現在回顧起來都非常重要。
2023 年的那一次轉型意味著放棄之前的軟件框架性工作,完全重新審視 ChatGPT 和 Gen AI 對于搜索業務的影響。這個對于公司花了兩年多構建起來的技術棧和文化是一次比較大的沖擊,內部從上到下也有很多人不理解為什么不繼續堅持下去。同時還要去努力想新的出路。
不過 2022 年年底 ChatGPT 的發布對于整個軟件業都應該是一次比較大的沖擊,基本重新定義了 AI 業務。所以如果有初創公司說我在 2023 年沒有任何反思和焦慮我是不相信的,除非你不讀新聞,不聞窗外事,否則很難不對自己所做的工作的價值有所懷疑。FOMO (錯失恐懼癥)是我們 2023 年掛在嘴邊最多的詞。
2024 年 2 月那次轉型是需要為向量模型、重排器等找到 一個統一的敘事邏輯,從而實現公司產品線上的聚焦,所以也非常重要。
張颯:2023 年之前 Jina AI 創業一開始做的那套搜索框架是什么呢?
肖涵:我們公司是 2020 年起來的嘛,2020 年當時很流行 Microservice + Orchestration 這一套云原生的技術棧。所以我們當時用 Python 實現了一套相對完整的微服務部署框架,可以使得多模態搜索中涉及到的每一個模塊,比如向量化、預處理、打分、索引等等都可以被微服務化及自由的擴容。
當時圍繞著這個理念開發了很多開源軟件,比如 DocArray 等,相當于后來的 Pydantic,讓用戶設計自己的多模態文檔結構以方便搜索。還有一些 Docker 容器化的實現,后來也有被 Replit 的一些設計所參考。
其實早在 2021 年我們也有涉及到一些模型層面的研發,不過主要是圍繞 BERT,CLIP 這類模型的微調框架,叫 Finetuner,內置了一些簡單的微調策略和 Training loop 的實現,以糖水代碼為主,最終效果并不保證。功能和定位上有點像今天的 SentenceTransformers 那個庫。
![]()
2022 年年底前我們所有的工程項目,試圖去囊括整個 AI 搜索的 Ops。靠開源社區的增長計算 ROI,純研發零收入,用愛發電也是當時很多商業化開源軟件初創公司的早期打法。
不過總體來說這套框架在 2022 年年底的社區增長開始停滯,我自己也用的越來越少,2023 年之后基本沒有再用過這些框架實現任何東西。當時察覺到社區更需要一種輕量級的搜索開發體驗,方便大家替換 LLM、迭代 prompt 和 Vibe 測試 RAG 的輸出,所以像 Langchain, LlamaIndex 這種就在 2023 年初就非常受歡迎。
張颯:那您后來用過 Langchain, LlamaIndex 開發么?
肖涵:沒,一次都沒。
我自從在 2023 年否定了我們公司自己的框架之后,我就對所有膠水和糖水代碼喪失了興趣,也不看好任何框架。尤其是站在 2025 年的今天去看,當大部分代碼都可以用大模型直接生成時,學習那些膠水代碼和 Opinionated Framework 的必要性也沒有了。
說白了,除非這些框架和硬件特性強綁定,比如 Google SDK 和谷歌云綁定,CUDA和英偉達的 GPU 綁定,不然對于開發者來說,完全沒有必要去花時間學習一個中間層,無論這個中間層的作者是網紅還是誰。
張颯:您說 2023 年的時候曾經嘗試了兩個不同的新方向,為什么選擇最后做模型呢?
肖涵:我們當時內部分成兩組:一部分人在做基于 Prompt 的 AI 的生產力工具,涉及到很多有意思的 Prompt 工程技術。我當時的想法是通過 UI/UX 的方式去呈現一些生產力 API。同時這也第一次開始嘗試商業化和營收。我當時帶著團隊花了不少精力在這些 Webapp 里去嵌入 Paywall,設計 Stripe 支付 API 和用戶轉化漏斗等等。當第一次看到 Slack 里提示 10 美元收入到賬,大家都非常興奮。
我記得我們當時一年做了有五六個 App,雖然這些后來全部被我砍掉了,但是這段商業化的經歷和對 Token Economy 的初探對于我后來在為模型設計 Paywall 有不少借鑒和啟發。
![]()
2023 年我們在迷茫期做的 5 個 Gen AI 向的 Web 端應用,旨在通過 Prompt 提高生產力。這些 App 多少帶來了新生用戶和營收,不過在 2024 年都被一股腦砍掉了。
之所以后來沒有繼續做這個方向,主要是發現公司內部的基因不太適合做帶有 UI 的產品,大家雖然是在每天開發,但每天去用這些 App 的基本沒有。我覺得要做到一個好的 App,UI/UX 的設計和細節非常重要,因為它承載了產品的敘事邏輯。如果自己開發的 App 自己不用,那么很多設計和邏輯問題就很難被發現和優化。
總而言之,ToC 端 App 的基因和文化在我們公司并不存在,這個和我們招聘對象有關。
第二就是這些 App 雖然多多少少有些營收,但他們之間缺乏一個統一的敘事邏輯。因此從外面看來感覺非常散,弱化了 Jina AI 這個品牌形象,對于一個 startup 來說這是非常致命的。
張颯:您選擇了模型這條路而砍掉 Wrapper Apps 這條路,這個決定在內部執行起來是不是很難?
肖涵:有不少阻力。
一方面,Wrapper Apps 這邊開發迭代速度快,還各自帶著一定營收,對于一個沒怎么接觸過商業化的團隊來說是一個鼓勵和教學作用。但問題在于 Wrapper Apps 之間缺乏統一敘事邏輯,看上去像是打一槍換一個地方。
另一方面,模型側講究慢工出細活,開發速度要比 Wrapper Apps 慢很多,所以兩個團隊在文化和節奏上很不同。我們在 2023 年 10 月份開源的 jina-embeddings-v2 因為其 8K 長文本和比肩 OpenAI text-ada002 的性能在 Hacker News 上一夜爆火,出乎我的預料,同時也給了模型團隊很大的信心。
2023 年末我們公司的一個宣傳單,可以看到 Embeddings 的產品線已經初成,但我并沒有完全轉向模型,而是仍然在推廣 PromptPerfect 和 SceneXplain 這兩個 AIGC 的 App,原因大概有二:一是搜索底座模型的敘事邏輯尚未形成,二是 AIGC 的有一定營收舍不得放棄。
但同時維護兩個方向對于一個初創來說并不是一個好故事。最終在 2024 年 2 月,在我到了美國灣區之后,決定完全停止 App 的開發,重新整理團隊,優化人員從而完全聚焦在模型層的研發。
那幾個月里,我把公司從 60 多人砍到 30 多人,網站上移除了所有 App 的信息,目的只有一個:聚焦。
張颯:從外部看來,感覺 Jina AI 從 2024 年起像變了一個公司,所以您覺得是因為什么呢?是因為您在美國的原因么?
肖涵:我會說從 2024 年起 Jina AI 變得非常 lean & mean, based, no bullshit。
有了之前 2020-2022 年框架沒人愛,2023 年的 App 過于分散的教訓,我意識到初創公司的敘事邏輯非常重要:框架有 Bug 可以改,模型落后了可以追,App 活躍度下降了可以營銷,但如果整個公司缺乏一個清晰的敘事邏輯,那崩潰就早已注定。而且邏輯越簡單越好,不要搞什么二階高階邏輯。
這其中有不少我在美國灣區時受到的影響和反思。這也離不開 2023 年圣誕節時我看的幾本書:Richard Koch 的《80/20 法則》, Al Ries 的《22 條商規》和Richard Sutton的《苦澀的教訓》。
我意識到公司需要從內到外實現一次重新的聚焦,要去除掉 80% 的方向、管理、人員、營銷去認真尋找那最關鍵的 20%。在灣區時我走訪了很多優秀的初創公司,對于他們非常 lean 的團隊文化也非常有感觸。
再加上整個灣區 2024 年初開始在 Elon、Trump、Peter Thiel 還有 Marc Andreessen 的影響下,文化上已經開始偏右和加速主義,我記得當時在灣區聽得最多的一個詞是 e/acc (有效加速主義)。整個 24 年我還特意把這個 e/acc 作為我 Twitter 和 Slack 的簽名檔,提醒自己不要被一些虛頭巴腦的東西所拖累和浪費時間,要專注有效的創新。不過在 2025 年的今天提 e/acc 詞的人要少了很多,估計是大家已經被加速到麻了。
總而言之,從 2024 年以來,我就在公司組織上把架構壓到最扁平,去除掉所有的 message-passer 和無效管理層,全員 Heads Down 和 Hands On。
我的目標是把 Jina AI 重新打造成一個搜索領域的 Premium Brand,比如我們要堅持慢工出細活,每發布一個模型的同時要發表一篇學術論文;在研究的靜默期,用高質量的 Blog 去代替一些短平快賺噱頭的網絡營銷。
張颯:可是訓練模型容易么?應該比做應用更難吧?
肖涵:確實難,所以做的人少。
尤其是當我們聚焦在高質量的搜索小模型上時,其實競爭對手就變得非常清晰了:Voyage, Google, Cohere, Mixbread, Nomic AI 基本就這么幾家。
Voyage 和 Cohere 都是閉源模型,Google 和 Cohere 又在想打大模型的仗所以沒有 100% 聚焦在搜索小模型上。Mixbread 和 Nomic AI 社區相對比我們小一點,但也提供非常優秀的開源向量模型和重排器。
我覺得理清競對關系很重要。初創公司絕對不能逃避和害怕競爭,而要直面競爭。但上場前一定要選對競爭對手,不然瞄準錯誤的對手一頓瘋狂輸出,完全是浪費精力。
從開源社區的角度,千問團隊也算是競爭對手之一,他們今年出的開源的 qwen-embedding 和 qwen-reranker 在開源社區中對我們有不小影響。雖說千問并不靠這些模型來賺錢(而我們靠),但在開源社區中還是從我們這拿走了不少關注度。無論是千問還是北京智源的 bge,對我們屬于亦敵亦友:有競爭,也有很多被我們學習和借鑒的地方。
張颯:既然千問也可以做向量模型,Gemini 也可以做向量模型,那 Jina 這種專注從零到一做搜索小模型的公司和大模型公司相比優勢又在哪呢?
肖涵:我一直信一句話:當一個公司沒有任何的上下游供應鏈優勢和技術壁壘時,唯一的壁壘來自于其自身高效的運營。這就是我悲觀的“壁壘底線”:如果我們什么都不行,那么就通過最大化聚焦和近乎獨裁的管理方式讓團隊跑步前進。
我已經準備好了最悲觀的打法,但實際情況也沒有那么悲觀:
第一我們多年以來積累了不少高質量的標注數據,團隊內部有不少歐洲人,所以對于歐洲多語言召回模型的手工評測和標注有比較多的積累。
第二我們有不少的客戶群體,這其中包括 Jina Reader 帶來的將近 1 萬大大小小的付費客戶,他們每天貢獻了將近 200 billion tokens 的 API 使用量,每天我們收到不少付費客戶的反饋和建議,都有效的幫助我們改進模型性能和 API 設計。
第三就是多年來在搜索模型訓練上的經驗積累和對技術進展的敏感度,知道什么時候該 early stop,什么時候該深挖進去,最近有哪些新技術方向,有哪些是噪音。
我覺得今天一個模型的“半衰期”差不多是五六個月,也就是說每半年這個模型的價值就減半。一年后這個模型基本就沒啥應用價值了,會有更好的模型取代它。所以這個競爭優勢也是一個動態變化的過程。
我覺得爭第一固然很重要,能爭到第一是最好的,但 Be always part of the game 不放棄,也非常重要:比如我 24 年給團隊定的目標是當“百事可樂”,當行業老二,讓人記住先。
最后一點對于很多技術人員來說可能有點玄乎,就是 模型的調性和品牌價值。在模型日新月異的今天,培養用戶在品牌上的忠誠度就非常重要,這就是品牌價值。而簡單來講,品牌價值 = 技術 + 營銷(比如技術博客、學術論文)+ 客戶體驗(網站、API)。
比如很多人都說保時捷卡宴就是換殼的大眾途銳和奧迪 Q7,因為底盤都差不多。可大家還是喜歡保時捷多一些,因為多年來保時捷偏向運動的底盤發動機調教風格,以及其宣傳下的賽車血統的傳承和稀缺性。
2024 年年底我們發布的年刊《Re·Search》,意在 Rethink Search,也有 Research 的意思。其中精選了我們 24 年發表的技術博客。這本“小紅書”因為其設計風格和扎實的內容給用戶留下了很深刻的印象,也強化了 Jina AI 品牌的調性。
張颯:2024 年秋天我記得當時您接受 Paperweekly 有篇采訪是關于搜索小模型的未來,您覺得那些觀點今天還適用么?
肖涵:那是去年九月份的吧,到現在一年多,其實大部分仍然適用。
比如我當時說 小模型并不是天生小,而是從大模型中蒸餾和剪裁出來的,這就意味著那些大模型廠商如果做起小模型會有不少優勢,因為他們知道原廠模型的 vibe,該剪哪裁哪。結果今年就應驗了,千問和 Gemini 果然就這么做了。
和去年那篇觀點不同的是,在 Agentic search、DeepResearch 這種 2025 年新的設計模式的影響下,很多傳統的向量召回模型(包括重排器)的使用場景發生了變化。
之前這些召回模型更多的是面向數據庫的 I/O,動輒數百億的量。今天可能更多的是被當做小工具在上下文窗口中做 Context Engineering,比如去重、過濾、壓縮 token。這就需要模型的參數量更小速度更快,也需要模型在一些之前被忽視的任務上(比如 STS 任務,專門為去重)去做優化。
張颯:我們聊聊這次收購吧,最開始您是怎么接觸到買方的?
肖涵:我應該是 23 年底第一次和 Elastic 合作。當時他們看到我們的 jina-embeddings-v2 不錯,想做個 API Integration,我們就共建了個 Slack Channel 開始互通。
24 年我來灣區后,在他們三番辦公室見了他們的管理層,隨便聊了聊工作生活的話題。今年夏天在美國時,又和他們的管理層聊了不少次,在三番辦公室里給他們的創始人、CEO、CPO 等做了幾個小時的演講,覺得相互之間的技術都高度互補,Elastic 的高層對我個人非常友好和信任,于是就開始了這個收購案。
總體來說,前期鋪墊、信任基礎、方向互補和一定的運氣 都是促成收購非常重要的條件。
張颯:其實我們很多人對收購沒有概念,您能簡單講講這個過程么?
肖涵:收購非常復雜和繁瑣,尤其當買方是美國上市公司,法律規范非常多,真是收購一次掉層皮。一般來講,這種收購是需要請一個專業投行 M&A 團隊去操作,我卻比較 lean/吝嗇,完全靠自己“手搓”,結果還真搓了出來,也算是一段難忘的經歷。
對于 Jina AI 而言,這其中包含很多的復雜的因素,包括美國和中國之間的地緣政治(當然還有德國),多個買方之間的博弈,買賣兩方的博弈,投資人之間的博弈,還有內部員工之間的博弈。而且由于買方是上市公司,所以收購時間線上還和他們的季度財報和 Analyst Meeting 的舉辦綁定。
所以從我 7 月份簽署 LOI (Letter of intent) 到 8 月份準備 data room 做 SPA(股權收購協議),到 9 月份去開始協調 SPA 上各方簽署,簽署完要馬不停蹄的執行交割先決條件,員工或 Relocate 或重簽 Offer,再到最終 10 月份在美國紐約的官宣。這幾個月來我和我的律師殫精竭慮、跨時區一天好幾個會議的溝通,當然買方律師也是一樣。其實直到今天,仍然有不少 Post Acquisition 的工作在做,主要是因為 Jina 這幾年來在多個國家設有辦公室,所以需要一個一個處理。
總體而言,我覺得 Jina AI 從架構上 Overengineer 了很多,我們一個不到 30 個人的公司,因為公司架構設計得過于復雜,導致收購起來跟買一個幾百人的跨國公司似的。
然而最累的是處理在收購過程中展現出的一些人性問題,在巨大的時間壓力下我一個人代表公司去和內外多方博弈,也是我多年以來承受壓力最大的一次經歷。
張颯:所以您覺得 Model as Product 的公司的終局就是被收購么?
肖涵:差不多。要么 pivot 去做產品和應用。要么去做通用大模型去拿融資去上市。
如果只是做特定領域的小模型,比如搜索,無論是 Voyage 還是 Jina,其實最終都走到了被收購這條路。原因也很簡單:小模型的人才不比大模型人才便宜,畢竟我們要做的是頂尖的小模型,所以人才的錢不能省。現有的 token 計價經濟還不足以支撐 GPU 上的推理成本,所以利潤很薄。
現在回看 24 年年初當我大刀闊斧的砍掉 App 專注小模型時,在那一刻,Jina 的終局也就收斂到被收購這一條路上(當然還有倒閉這條路),剩下的就是留給我的時間和能否成功的問題。
如果刻意的不暴露營收(因為一旦暴露營收那么估值就基本定了),那就只能通過把故事講大去拿融資。可是小模型的故事就講不大,就如同街邊麻辣燙和海底撈,小模型就像麻辣燙,一下班很多人在那買。不是說他沒市場,投資人也知道街邊麻辣燙香,但投資人還是喜歡投海底撈(大模型)。
張颯:既然終局是被收購,那您做收入又有什么意義呢?
肖涵:收入還是要做,我覺得有幾點。
第一就是 PMF 的驗證,看看市場到底需不需要這類模型,以及在競爭中是否可以脫穎而出。2023 年之前我們曾追蹤過很多社區指標,包括下載量、Github 關注度、社交媒體討論度等等。后來發現這些指標大多捕風捉影,和 PMF 弱相關,完全沒有真金白銀來得實在。畢竟用戶說你好給你點個贊是一回事兒,肯花錢買你的模型是完全另一回事兒。
第二點是培養團隊對 Token Economy 的理解:訓練時的語料一共是多少 tokens,每個 batch 是多少 token,推理時 token/s 是多少,最大 token 長度是多少,用戶輸入的 token 中位值是多少,第一個 token 返回的時間是多少,每分鐘允許請求的最大 token 數量是多少,多模態如圖片時怎么計算 token 才合理。只有當公司里每個人對這些數據手到擒來,才能明白 token 的價值到底是多少,整個模型的訓練、推理才能更加高效和專業。我們 2024 年初剛開始做 Model API 的 Paywall 時,很多人對免費 Token 的數量和定價完全沒有概念,內部曾說免費送十萬的 Token 太多了,用戶根本用不完。這就是缺乏對 Token Economy 的理解。如今我們每個新 API Key直接送一千萬的 Token,保證了用戶在進行多模態圖片輸入和長文本輸入時的消費體驗。付費階梯也根據多次優化和重新設計,從而保證推理服務的利潤率為正。
最后也算是我的一點個人的堅持,我覺得既然是創業做公司,那目的就是要盈利。燒投資人的錢發工資并不是一個特別值得驕傲的事情。我既然把公司轉型到了 Model as Product 的模式上,那我就希望竭盡所能的去探究這個模式的極限在哪,它的實際利潤到底如何。如果一個團隊僅僅是為了純做技術和社交媒體上的影響力,那還不如在高校里做。
張颯:那您覺得這幾年來,您在 Jina 做對了什么,又做錯了什么呢?
肖涵:現在回頭看,我做對的幾點包括:
從第一天就構建一個國際化的團隊,這對 Jina 在后期的人才招聘、市場和收購案上都奠定了一個比較好的基礎。
第二就是身先士卒,事必躬親。我幾年來在 Jina 寫的代碼數量應該是所有員工里最多的。我曾在內部開玩笑的說,如果哪天 Jina 倒閉了,那絕對不是因為 CEO 寫代碼太少了,而是因為寫代碼太多了。
其實無論是工程研發還是商業化、市場運營、銷售客服這些事情我都會親身參與進來。我覺得無論多少年,創始人必須要保持一個最大的熱情。如果一個公司的創始人每天開始打卡躺平,無所事事,那公司就徹底玩完。
在商業化的探索上,我從 2023 年的零收入開始一點一點做起,到被收購時做到兩百萬美元的 ARR,作為一個純 Model as Product 靠賣 API 的初創,在零廣告營銷全靠口碑自然增長的情況下,我認為這個結果還勉強說的過去。至少從零到 Million ARR 的路我一路蹚了出來,坑踩了個遍,也算后事之師。
最后就是持續的學習和思變,根據大環境對公司的及時調整和優化,包括幾次在公司組織上和敘事邏輯上的重塑。這些都是我認為正確且必須由創始人牽頭的。
我做錯的地方:
首先我覺得前幾年我沒有能夠讓團隊足夠的聚焦,尤其是在 A 輪融資過后,團隊方向過于分散,因此浪費了時間和金錢去追逐了很多沒有意義的技術和市場營銷。
第二,在方向不夠聚焦時我選擇了擴張團隊,希望通過空降 leader 來解決內部產品線和聚焦問題,結果收效甚微。如果這六年來我給公司的所有 leader 打分,10 分我給 2 分:很多 leader 在生存壓力和技術快速變化的環境下無法及時跟進和發揮。我沒有找到很好的 leader,也沒有培養出很好的 leader。
這就引出了我這幾年創業來的最大遺憾:就是我并沒有想明白團隊的 Scaling Law。從 2020 年到 2023 年,團隊一直在擴張,可是產出和品牌力卻在下降。從 2024 年起,我一直走在精簡團隊的路上,從 60 人裁撤到 30 人,團隊效率和品牌價值得到了顛覆性的提升。
但按照這個邏輯推到底,團隊人數和品牌價值根本呈反比!
“小而美”并不應該是終局:如果每家公司都以小為榮,越做越精簡,這世上就不會有谷歌和微軟這樣的巨頭。所以如何去 Scale 一個 AI 團隊,去把生意做大,這個是我近六年遺憾沒能做成的事情。
Growth without revenue is disaster, revenue without growth is boring. 我把公司從盲目擴張的 disaster 里撈了出來,之后一直在小心翼翼地避免滑入 boring。
雖說強者不抱怨環境,可我覺得我另一個錯誤就是 對歐洲和德國抱有太多的期待和幻想。直到 2024 年我來到美國灣區后,我發現自己在一個過分平庸的地方浪費了很多寶貴的時間。
對于整個德國和歐洲社會的左和保守,對 AI 紙上談兵和杞人憂天,勞動法對創業者缺乏理解尊重,及對優秀人才的冷漠無視,這些都讓我在 2023 年后對歐洲和德國無比失望。我曾在 2023 年在公司里叫上幾個德國同事一起去做一些 lobby 游說,希望多參與到歐洲議會和德國政界來獲取關注和資源,一年下來活動參加不少,進展為零。直到有一天我也看明白了,他們邀請我去參加這些議會、黨代會完全是把我看做一個 Diversity Guest:他們不需要我的 Expertise,只需要那張 Asian Face。
![]()
2025 年春我接受了《華爾街日報》的采訪,表達了我對德國和歐洲的徹底失望。歐洲總以為他們在 AI 的落后是孤立現象,其實不然,是整個社會和經濟環境造成的。報道發表后,引起了不少討論。但在歐洲這些討論最終能有多少付諸實踐,我不抱以任何期望。
很多人總說 American Dream 怎么怎么樣,但很多事情確實是我來到美國之后才有了實質的進展。無論塑造 lean & mean 的公司文化,還是 Jina 品牌的重新樹立,再到最后被美國上市公司收購:這個地方不僅激勵了我,也確實獎勵了我的付出。
無論如何殘酷的競爭與合作,AI 的發展絕對是中美兩國的事情,就像鳴人和佐助一樣相愛相殺。而歐洲就像小櫻——說白了就沒她啥事兒。
張颯:您還會創業嗎?
肖涵:創業是刻在骨子的事情,我覺得未來還會。但目前還是需要再積累一下,把事情再琢磨透一些。比如我們都看到這波 AI 帶來了生產力上的提升,很多工程師感覺可以創個業變現一波生產力。可是 生產力的提高 ≠ 價值捕獲能力提升,不代表可以落地生財。
有些人可能會說,我今年因為熟練使用 Cursor/Claude Code 做了好幾個項目被老板發獎金表揚了。在公司里領工資時,生產力提升能變現,是因為公司已經解決了價值捕獲的問題:有現成的客戶、銷售渠道、品牌信任。你多產出 10%,公司的變現機器能把這 10% 轉化成收入,你分到一部分。
而在創業獨立面對市場時,AI 只增強了供給側(你能做更多、更快),卻沒有同步增強需求側(找客戶、建立信任、完成交易)。說白了,生產力是“造東西”的能力,不是“賣東西”的能力。
如果所有人都將成倍的生產力直接投放在市場中時,供給集體上升,單位價格反而下降。最后反而也賺不到什么錢。
張颯:那您現在有什么看好的創業方向么?
肖涵:我去年曾說過我對 AI + 原創游戲挺感興趣,我覺得在原創游戲中各種多模態的落地場景明確:無論是素材、故事線、NPC 邏輯,都可以隨著大模型能力的提升而水漲船高。游戲本身就是一個成熟的商業模型:付費下載、內購、訂閱。AI提升的生產力(更豐富的素材、更擬人的 NPC、更個性化的劇情)直接轉化成玩家體驗,而體驗是可以被明碼標價的。
卡點在于如何塑造一個受歡迎的 IP:經典的 IP 都把握在游戲大廠手里,獨立開發者從零塑造一個 IP 又談何容易。這個就要談到 OC 圈(Original Character, 原創角色),我之前投過的米球島就是做這個方向的。你可以把它想象成一個去中心化的 IP 孵化池,用戶本身就在為角色賦予情感價值和傳播勢能。如果 AI 能讓 OC 創作的門檻更低、表達更豐富,某種意義上是在加速“ IP 民主化”,不再只有大廠能造 IP。米球島這個切入點挺聰明的。
這兩個月興起的 AI Trading,比如 AlphaArena 拿各種大模型在二級市場中做量化交易,或是在一級市場中為 Sell-side 做投研分析。我覺得也是一個不錯的方向。這個方向最硬核的地方在于:回報是可量化的、實時的、無需說服任何人的。你的模型比市場聰明一點點,你就賺到了。不需要品牌、不需要銷售、不需要用戶增長。市場本身就是最高效的裁判。
尤其是 Buy-side 的交易信號捕獲,相當于 完全跳過 AI 生產力這一敘事邏輯,而將 AI 的“認知能力”直接映射成 alpha。這可能是 AI 變現路徑里摩擦最小的場景之一。我最近在和一個出自伯克利和斯坦福的項目 Tauric Research 聊,他們開始用 Jina Reader API 做信息獲取和輿情分析,然后輸入到一個他們自己訓練的推理模型中去得到交易信號,這比“提升生產力”的故事要硬得多,因為下游直接是錢。
當然 AI Trading 的競爭也更殘酷。因為所有人都在同一個市場里博弈,你的 alpha 就是別人的負 alpha。
張颯:最后您能給未來的創業者一些建議么?
肖涵:要專注,要強調公司的敘事邏輯。
創始團隊一定要精簡,不要為了顯得好看而湊人頭。如果你自己很強,那就一個人開干。如果你自己不強或沒思路,那我建議就先別創業。
要盡最大努力找到那些聰明的人和 High Achiever,并且和他們在一起工作。這些人對第一性原則,80/20 等熟記于心,做事干凈利落,殺伐果斷,從不后悔。這是創業團隊所需要的。
今年年初,一個 MIT 本科生來柏林找我們實習。烏克蘭女生,Sheldon 式的人物,不太擅長社交,但聰明得驚人。我問她:為什么大老遠跑來柏林?(潛臺詞是:你 MIT 的學生,美國機會那么多)她秒答:因為父母在柏林,她想和父母團聚;她投過亞馬遜柏林,但對方不肯透露實習內容;而 Jina 明確告訴她是做小模型,正好是她喜歡的方向。于是她就來了。整個回答沒有一秒猶豫。
后來我又問她:18歲,一個女生,獨自從烏克蘭去波士頓,會不會害怕?她的回答我至今記得——
“我不怕。害怕的應該是我的父母,因為他們還生活在戰爭里。”
她在柏林待了三個月,訓練出一個超強的jina-code-embeddings,寫了篇論文,中了 NeurIPS Workshop,然后轉身離開。整個過程干凈利落,像她說話的方式一樣。
12月在 San Diego 舉辦的 NeurIPS 她也會參加,有在會場的朋友可以替我和她打個招呼。
最后,一定要避免和平庸的人在一起消磨時間。他們的特征很明顯:做事拖泥帶水,決策猶猶豫豫;競爭來了繞著走,壓力來了往回縮。
也別想著“我來培養他”或“我再給他點時間看看”,創業是九死一生的游戲,不是大學。你沒有時間把一個 60 分的人打磨成 90 分,你只能找到那些本來就是 90 分的人,然后一起拼命。所以:
Don’t pray for an easy life, pray to be a stronger one.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.