昨天,馬斯克旗下 xAI 宣布裁員 500 名數據標注員,已經占到該團隊的 1/3,這個團隊主要負責 Grok 標注與整理訓練數據的核心部分。
此次裁員的背后原因,是行業整體的需求已經從通用 Generalist AI Tutors 轉向專業 Specialist AI Turtors,涵蓋 STEM、金融、醫學、安全等。
這種需求也反映在 Mercor 的快速增長中,3 月份的時候 Mercor 的年化收入剛突破 1 億美金《》。
今天,Mercor CEO Brendan 說,Mercor 的年化收入(Revenue Run Rate)已經突破 5 億美金了,從 100 萬美金到 5 億美金只用了 17 個月時間。而且增長速度仍然在加速,7 月份,其平均周環比增長 11%,8 月份周環比增長 18%,9 月份周環比增長 19%。
Brendan 說,推動這一迅猛增長的趨勢在于:經濟正在變成一個強化學習(RL)的環境模擬器(the Economy is Becoming an RL Environment Machine)。而強化學習變得如此高效,以至于智能體(Agent)能攻克任何基準測試,但前提仍需人類來定義獎勵函數,以期實現萬物自動化。
當每個人都擔心失業時,我們正在以前所未有的速度創造一種新的知識型工作,未來的工作將集中在培訓 Agent 上。Mercor 現在每天向平臺上的人們支付超過 100 萬美金,并迅速招聘幾乎所有領域的專家:軟件工程師、醫生、律師、顧問、銀行家等等。
![]()
他專門寫了一篇文章談這個趨勢,Brendan 說,每次技術革命都引發了人們對失業的恐懼。工業革命用機器取代了家庭手生產者,計算機革命用電子表格和數據庫取代了手工文書工作。
然而,如今的失業率卻低于這些革命發生前后——而它們都催生了全新的工作類別。關于 AI 對就業市場的討論中,一種新的工作類別正在出現,那就是訓練 AI Agent。
技術發展的歷史是一部普及 access 的史詩:印刷機傳播思想,工業規模化勞動力,計算機數字化知識。每次革命都催生了整個新興產業。如今,AI 正在讓人類能力本身變得可共享。
人類工作的價值將發生轉變。嘗試試比較一下自己報一次稅,與教會 AI 模型如何永遠替你報稅的區別。前者是變動成本,由個人和企業反復支付;后者是固定成本,一旦知識被編碼,就能無限次應用。
公司規模化的關鍵不是靠一人包攬一切,而是建立流程并培訓他人執行。同樣,隨著人類教會 AI 智能體自動化每個工作流,經濟也將實現規模化。
強化學習(RL)已變得如此高效,足以攻克任何評測基準,但學術指標并不能反映消費者和企業關心的真實結果。我們的基準存在“模擬-現實差距”:報稅是否最小化了稅負?醫療建議是否改善了患者結局?教案是否真正幫助學生學到東西?
![]()
真實世界擁有更豐富的數據室、更復雜的應用與工具環境,以及來自程序員和會計師的雙重要求。模型評估的前沿在于構建更豐富的環境:模擬 Google Drive 工作空間的數據室,復刻你筆記本電腦或手機上的多種應用的腳手架,以及能評估你在現實世界中近乎無限行動可能性的獎勵函數。
模型還需接受更長周期任務和協作環境的評估:由醫師委員會評審的縱向患者案例、并購交易中的多方談判、市場周期波動中的風險對沖。
我們需要為經濟中的每項工作、工具和任務創建環境,而這無一不需要人類勞動來構建、驗證和完善——這才是工作的真正未來。
人類訓練模型的市場規模,取決于人類能做而智能體尚不能完成的任務量。許多相信 ASI 必然實現的研究者輕視人類數據的作用,認為一旦 AI 在所有任務上超越人類,人類數據就將失去價值,能貢獻于模型改進的人群將會大幅縮減。
他說他們曾開展過一個項目,讓 100 人團隊尋找前沿智能體使用工具時犯的錯誤,并制定評估模型錯誤的準則。起初,人人都能輕易難倒頻繁出錯的模型;六個月后,只有 20 人還能找出它的漏洞——這似乎印證了人類數據懷疑論的觀點。
但當他們為智能體增加更多可訪問工具,并開始推送需人類耗時十小時以上的長周期任務時,模型突然在這些挑戰中頻頻失敗,100 名參與者再次全部為項目做出了有意義貢獻。因此,只要經濟中還存在人類能完成而智能體無法勝任的任務,我們就將繼續需要人類創建評估體系和訓練智能體。
長遠來看,Brandan 認為,所有人都聚焦于 AI 可能淘汰的工作(如文案撰寫、律師助理、醫療記賬),卻極少關注它將創造的產業——由那些塑造 AI 判斷、設計訓練環境、確保輸出符合人類標準的人群推動。
我們正進入“經驗時代”,模型學習在真實世界中優化獎勵。正如人類通過他人指導學習,AI 也需要強大反饋。教授設計考試和評分標準以幫助我們進步,經理通過績效評估跟蹤我們的工作表現。下一代 AI 模型同樣需要這類腳手架。
工業革命創造了設計機器并保持其運行的新階層;AI 革命也將創造新階層,其任務是引導機器并普及其能力。這是一個巨大的悖論:AI 的未來,終將歸于人類。
雖然核心已經聚焦到 RL 訓練這塊,但 Mercor 目前對自己的定位還是一個 AI 招聘平臺。
華人團隊做的 AI 招聘這塊,之前我介紹過主要聚焦于匹配的產品已經做到了 100 萬美金 ARR《》,而由另一個由華人團隊做的 AI 面試工具,不到 2 年時間已經做到了超過 1000 萬美金的 ARR。
與 Mercor 專注于為 AI 企業提供 RL 人才不同,它解決的是一個比較通用、簡單但也很剛需的點,也就是當你做線上面試時,AI 可以給你……
全 文 共3473 字
后續內容為付費會員專屬,會員掃碼登錄直接閱讀
Memo: Signal, not noise!
訂閱 Memo Pro
Memo(vcsmemo.com)是一個基于付費訂閱模式的創投內容平臺,已得到大量 VC、企業 CEO 以及高管的支持,我們希望幫助你捕捉最具價值的行業信號、過濾噪音(Signal,Not Noise)。
訂閱 Memo Pro
你將獲得:
1.解鎖未來一年以及之前的所有會員專屬內容
2.郵件訂閱功能:付費內容+最新行業快訊+...
3.優先體驗 Memo 新產品和新功能
限時 799 元/年(原價 999 元/年),掃碼立即訂閱
1.
2.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.