![]()
喬琳的技術根基,始于復旦大學計算機科學專業的系統培養。本科與碩士階段的深耕,讓她吃透了計算機科學的底層邏輯;隨后赴美深造,在加州大學圣巴巴拉分校(UC Santa Barbara)斬獲計算機科學博士學位,更讓她站上了全球AI科研的前沿陣地。這段橫跨中外的學術經歷,不僅賦予她扎實的理論功底,更培養了她“從科研到落地”的全局思維——這也成為她日后打破“技術實驗室壁壘”的核心競爭力。
然而真正讓喬琳躋身全球AI核心玩家行列的,是她在Meta主導PyTorch生態建設的經歷。彼時,PyTorch尚是科研圈的小眾工具,而喬琳帶領300余人的工程團隊,開啟了一場“框架革命”:她主導重構PyTorch的底層架構,使其突破“僅能在實驗室運行”的局限,成功適配Meta的數據中心、移動端及AR/VR設備,構建起從模型研發到生產部署的全鏈路平臺。最終,PyTorch從“小眾工具”蛻變為支撐全球數百萬開發者的行業標桿,成為AI模型訓練與推理的“基礎設施”,而喬琳也因此成為全球AI框架生態的核心奠基人之一。
離開Meta后,喬琳選擇以創業延續技術理想,創立Fireworks AI,將突破點瞄準了大模型推理的“效率痛點”。她帶領團隊研發的兩大核心技術,直接擊中行業關鍵瓶頸:其一,Fire Attention推理引擎通過無損量化壓縮技術,在幾乎不損失精度的前提下,將模型運行精度從16位降至8位甚至4位,讓資源消耗大幅銳減;其二,推測執行引擎打破“逐字生成”的傳統模式,通過一次預測多個詞序列再反向驗證,徹底突破推理速度瓶頸。這兩項技術的疊加,讓Llama、DeepSeek等主流開源模型的推理速度較行業標桿vLLM提升12倍,同時成本降低53%,為大模型的“普惠化”掃清了關鍵障礙。
![]()
圖片來源:
Fireworks
從Meta帶出來的“改代碼習慣”,像一把鑰匙,打開了Fireworks AI進入行業的大門,讓英偉達從最初的A輪投資方,慢慢變成了既要合作又要警惕的競爭對手。而喬琳自己,從復旦大學機房里啃饅頭改算法的姑娘,長成了AI推理服務賽道上,最懂“把復雜技術做簡單”的華人女性創業者。
一、從PyTorch到Fireworks:24年技術生涯里的“問題清單”
喬琳的辦公桌上,始終擺著一個磨破封面的筆記本。翻開第一頁,是1995年復旦大學計算機系的課堂筆記,頁眉處用紅筆寫著:“數據庫索引能不能更輕?”再往后翻,2001年加州大學圣巴巴拉分校的博士論文草稿里,畫著密密麻麻的“拆分箭頭”——把大型計算任務拆成小節點分布式處理,導師當年笑稱“像把大象拆成積木,卻拼得更靈活”。
這本“問題清單”,記了24年。從IBM做研究員時記下“企業級AI服務成本太高”,到LinkedIn標注“用戶數據與模型訓練的矛盾”,再到Meta主導PyTorch框架開發時,貼滿開發者的吐槽便簽:“大模型好用但跑一次要花半個月預算”“開源模型便宜卻調不通”。
![]()
圖片來源:
PyTorch
2019年某個深夜,喬琳在Meta的實驗室里改代碼到凌晨。一位初創公司的開發者抱著電腦找到她,眼圈通紅:“我們想用PyTorch做電商推薦模型,可租不起GPU,跑一次數據就要花掉三個月經費。”那天她陪著對方坐了3小時,把原本100億參數的模型拆成三個小模塊,按用戶行為分階段調用算力,最后成本降了60%。開發者走時反復說:“要是能有現成的‘輕量+定制’服務就好了。”
這句話像顆種子,落在了“問題清單”的最后一頁。2021年,喬琳翻完17本筆記,突然在白板上畫了個交叉圖:橫軸是“開源/閉源”,縱軸是“輕量/定制”,交點處寫著“Fireworks”,這一個個簡短的關鍵詞就是喬琳從始至終所追求的企業新定位——Fireworks應該同時具備開源的靈活性與閉源的易用性,并希望在以“輕量”為優勢的同時,做到與其他模型相當的定制化。
![]()
圖片來源:
chatgpt
![]()
圖片來源:
fireworks
二、雷德伍德市的創業:不買服務器的“算力調度師”
2022年春天,喬琳帶著六位Meta時期的老同事,在雷德伍德市租下一間小辦公室。創業第一天,她沒講估值藍圖,而是把大家分成三組,每組認領一個從“問題清單”里抄來的痛點:“怎么整合閑置GPU”“怎么讓API像點外賣一樣簡單”“怎么幫客戶調模型不花錢”。
“別盯著參數做模型,要注重開發者的難處。”這是喬琳在公司成立大會上說的第一句話。她太清楚中小企業的困境——想做AI,卻買不起英偉達服務器,更養不起頂尖算法團隊。所以Fireworks AI從一開始就走了條“反常規”的路:不直接購買硬件,而是做“算力調度師”。
就像拼車軟件整合私家車,喬琳團隊把全球散落在科技公司、高校實驗室的閑置GPU資源“擰成一股繩”。客戶不用自己找服務器,只要通過Fireworks的API上傳數據,就能直接調用這些整合后的算力。AI編程助手Cursor是最早的客戶之一,創始人曾笑著說:“原本要花200萬美元買服務器,現在用他們的API,每月只花15萬,推理速度還快了3倍。”
![]()
圖片來源:
Fireworks
但真正讓Fireworks AI站穩腳跟的,是喬琳藏在背后的“技術殺器”——FireAttention推理引擎。2023年夏天,一家醫療公司找過來,想把基因測序數據的AI分析成本再降30%。喬琳帶著技術總監在辦公室睡了兩晚,給FireAttention加了個“動態參數開關”:根據基因數據的復雜度自動調整模型參數,不用從頭跑130億參數的大模型,80億參數加專有數據微調,精度反而提升了2%,成本直接砍了一半。
“這就是我們的護城河。”喬琳指著測試報告說。那時Fireworks的年化營收ARR剛突破1億美元,但80%的客戶都在復購時追加了“微調服務”——比如Perplexity把70%的推理業務遷過來,只因FireAttention能讓搜索響應快0.3秒;阿里Qwen團隊用它做模型壓縮,原本需要兩周的調試,現在3天就能完成。
2023年11月14日凌晨兩點,Fireworks AI的技術實驗室突然爆發出一陣掌聲。喬琳盯著監控屏上跳動的數字——自研的FireAttention推理引擎,將GPU算力利用率從行業平均的65%硬生生拽到了92%,這意味著客戶的AI模型推理成本能直接砍半。不過在此之后,喬琳將企業的新方向轉至——企業模型微調。
就是這個在算力突破當晚拍板的決定,讓Fireworks AI在半年后估值沖刺40億美元,吸引Lightspeed、Index等資本爭相入局;也讓英偉達從A輪投資方,悄悄將這家初創公司標為“重點關注競爭對手”。而站在白板前的喬琳,指尖還沾著馬克筆的墨漬,恍惚間想起20年前在Meta調試PyTorch框架時,也是這樣憑著一行代碼的突破,推翻過既定的技術路線——這位從復旦機房走出來的華人女性,似乎總能在技術與市場的交叉點上,踩準改變命運的節拍。
三、當英偉達成為競爭對手,喬琳卻微笑選擇共贏——要一起把“蛋糕”做大
![]()
圖片來源:
Fireworks
2023年A輪融資時,英偉達的投資經理坐在喬琳對面,拋出一個尖銳的問題:“如果我們自己做推理服務,你們怎么辦?”
喬琳沒回避,遞過去一份客戶清單——上面全是醫療、金融行業的“小而精”需求:幫銀行調信用評估模型,要符合合規要求;幫藥廠做分子模擬,要適配特殊實驗數據。“你們做的是算力水電網,我們做的是水電網上的‘定制水龍頭’。”她指著清單上的微調需求,“這些活兒,巨頭不愿做,小企業做不了,剛好是我們的位置。”
這句話讓英偉達投了錢,也讓雙方的關系變得微妙。2024年3月,英偉達收購推理服務商Lepton,推出自己的GPU云市場,從硬件供應商直接變成了下游服務競爭者。消息傳來那天,喬琳反而在團隊例會上笑了:“這證明我們選的賽道對了。”
她早有準備。在Fireworks AI的技術路線圖上,“反哺硬件優化”成了新方向——通過FireAttention引擎積累的千萬次微調數據,反向給英偉達提GPU優化建議。比如針對金融模型的稀疏計算需求,他們和英偉達聯合開發了專用算力調度插件,讓GPU在處理這類任務時,效率再提15%。“競爭不是你死我活,是一起把蛋糕做大。”喬琳說。
這種“差異化共存”的智慧,藏在她的“問題清單”里。早在Meta時期,她就記下過:“巨頭的優勢在規模,我們的機會在細分。”如今Fireworks AI的客戶里,有70%是英偉達云服務覆蓋不到的中小企業,這些客戶需要的不是“通用算力”,而是“懂行業的微調方案”——就像有家做AI教育的初創公司,用Fireworks的服務把題庫模型調了12版,最終實現“學生錯一道題,模型馬上推同類考點”,這種定制化能力,正是英偉達暫時給不了的。
四、AI界的實干派,把“用不起”改成“用得好”
![]()
圖片來源:
Fireworks
在硅谷的華人AI創業者圈里,喬琳不算最張揚的。當別人忙著在行業論壇上講“大模型參數競賽”時,她在跑客戶;當資本追著“通用AI”概念跑時,她在改FireAttention的代碼。
“華人創業者的優勢,從來不是跟風,是把技術‘磨’到落地。”喬琳想起剛到美國時,導師讓她做一個分布式計算項目,她花了三個月,把一個復雜算法拆成20個小模塊,每個模塊的運行時間精確到毫秒。導師說:“你有把‘大象拆成積木’的耐心。”
這種耐心,現在成了Fireworks AI的標簽。2024年,當公司估值沖向40億美元,年化營收逼近3億美元時,喬琳依舊把大部分時間泡在技術團隊。有次為了修復一個API漏洞,她陪著工程師改代碼到凌晨,餓了就像在復旦機房時那樣,啃兩口抽屜里的餅干。
“AI不是地殼式重組嗎?重組的不是技術,是每個行業的做事方式。”喬琳在最新的“問題清單”上寫下這句話。現在她的辦公桌上,擺著兩樣東西:Meta時期的PyTorch代碼本,和Fireworks AI客戶的“微調需求清單”。前者記著“怎么把模型做輕”,后者寫著“怎么把模型用對”。
當華人創業的AI公司估值總額超過300億美元,喬琳知道,自己不是孤身一人。從Scale AI的 Alexandr Wang,到Pika的郭文景,華人創業者正在用“技術務實”改寫AI行業的規則。而Fireworks AI的故事,更像一個縮影——不是靠概念造勢,不是靠參數競賽,而是把每個客戶的“用不起”,改成“用得好”,一錘一錘鑿出屬于自己的護城河。
2024年深秋,喬琳在公司官網更新了slogan:“讓每個企業都能‘用對’AI。”這句話的筆跡,和她1995年在復旦“問題清單”上寫的“把每個算法都做輕”幾乎一樣——工整里帶著點“軸”,就像她這個人:從江南小城到硅谷賽場,從改代碼的姑娘到40億獨角獸的掌舵者,變的是舞臺大小,不變的是那份“把復雜問題做簡單”的初心。
在AI創業的熱潮里,有人追風口,有人造泡沫,而喬琳用Fireworks AI證明:真正的獨角獸,從來不是估值堆出來的,是像打磨FireAttention引擎那樣,在技術與市場的縫隙里,把每個“痛點”磨成“亮點”,慢慢長出來的。
Reference
搜狐|復旦才女創業
AI
推理,估值超
5
億美元
https://www.sohu.com/a/803134078_403354
[2]36
氪|
288
億,復旦女學霸
3
年干出一個獨角獸
https://m.36kr.com/p/3407737936137857
[3]Google PyTorch
https://www.google.com.hk/search?q=pytorch&rlz=1C9BKJA_enHK1179HK1179&hl=zh-CN&sourceid=chrome-mobile&ie=UTF-8
[4]Google Fireworks
https://fireworks.ai/
[5]DeepTech
深科技|一年飆升
7
倍,復旦校友、前
PyTorch
負責人創辦的
AI
云服務初創估值沖刺
40
億美元
https://zhuanlan.zhihu.com/p/1933586626916881606
[6]
頭條|
AI
創業圈又沖出一個
288
億獨角獸
https://m.toutiao.com/article/7538640901263016457/?webview_progress_bar=1&show_loading=0&upstream_biz=doubao&push_animated=1&theme=light
[7]
頭條|當華人女性按下
AI
加速鍵:
Fireworks AI
與她的
獨角獸
征程
https://m.toutiao.com/article/7536116477800268297/?show_loading=0&webview_progress_bar=1&push_animated=1&upstream_biz=doubao&theme=light
歡迎掃碼加群參與討論
我們相信認知能夠跨越階層,
致力于為年輕人提供高質量的科技和財經內容。
稿件經采用可獲邀進入Z Finance內部社群,優秀者將成為簽約作者,00后更有機會成為Z Finance的早期共創成員。
我們正在招募新一期的實習生
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.