網易首頁 > 網易號 > 正文申請入駐

AI 什么時候才算能用？3 億估值團隊給出兩個字：“驗收”

2025-12-26 08:11:20　來源: AI深度研究員

上海舉報

分享至

全文 3,000字 | 閱讀約 8 分鐘

（對話 Axiom Math 創始人：AI 最重要的品質）

2025 年，幾乎每一場 AI 發布會都在說“我們能做什么”。

但企業真正卡住的，是另一個問題：AI 做出來的結果，怎么證明是對的？

很多 AI 產品上線前 demo 演示得很好，一上線就出問題：

錯誤定位不了，

責任追不清楚，

結果復現不了。

最后只能說：沒法驗收。

Axiom Math，一家總部在舊金山的 AI 初創公司，換了個思路：不是追求 AI 能做什么，而是證明它做對了什么。

這家剛在 2025 年 10 月完成種子輪融資（6400 萬美元，估值 3 億美元，B Capital 領投）的公司，在做一個 AI 數學家，能獨立給出答案，也能自己驗證對錯。

也因此，這個團隊吸引了一批技術背景極深的人： Meta FAIR、Google Brain的前核心研究員，還有創始人Carina Hong 在 MIT 的導師、知名數學家Ken Ono。

Carina Hong，24歲。

2025 年 12 月 21日，有媒體問她如何招人，她的回答很簡單：

問題夠難，人自然會聚過來。

這不是空話。她的方法就是找到一個值得花十年去解的難題，然后等那些真正的高手主動找上門。

24 歲，6400 萬美元，估值 3 億。

她在賭的不是一個產品，而是 AI 的下一個及格線。

第一節｜24歲，3億估值，她要讓 AI 學會自證

她叫 Carina Hong，出生在廣州。

小時候做奧數題的時候，她并不知道未來會站在硅谷講 AI。但她記得，每解決一道題，就像小孩通關游戲，停不下來。

她一路從廣州考到MIT，再拿到羅德獎去牛津學神經科學，最后跑去斯坦福讀數學博士+法學博士聯合項目。

在MIT，她修了 20 門研究生數學課程，發表了9篇論文，還研究過神經網絡如何理解函數。在牛津，她待在UCL蓋茨比研究所（DeepMind 的誕生地），第一次近距離看到 AI 在解決真實問題：圖像、序列、控制模型。

她開始問自己：如果 AI 能玩游戲、能寫代碼，為什么不能做數學？

真正的轉折發生在硅谷。

她在斯坦福念博時，常去一家咖啡館寫論文。一次偶然的機會，她認識了 Meta FAIR團隊的 AI 科學家Shubho Sengupta。

一個是數學家，想讓 AI 理解數學。

一個是工程師，想找到 AI 真正值得解決的問題。

他們聊了兩個小時，沒談項目，也沒講融資。只是圍繞一個假設展開：能不能造一個AI 數學家？

那次對話之后，她開始認真思考這件事。不久后，她退學了。

她說：有些問題，在學校解決太慢了。

她要做的，不是聊天機器人，也不是代碼助手，而是一個能驗證定理、甚至提出新猜想的 AI 系統。

這個系統叫 Axiom，公理的意思，也就是數學理論最基本的起點。

從這個起點出發，開發一整套系統，讓 AI 也能探索數學的邊界。

第二節｜Putnam考試9/12，但重點不是分數

大多數人理解 AI 學數學，想到的可能是考試、給答案。

但 Carina說，那只是第一步。真正重要的，是它知不知道自己答得對不對。

這不僅是數學問題，也是工程問題。 AI 的答案如果不能被驗證，就沒法用在關鍵場景。

人類做數學題，有個天然優勢：我們能回頭檢查，證明有沒有邏輯漏洞，推理有沒有跳步，細節前后一不一致。

Carina 把這個檢查的過程，叫做“驗收”。

但大模型不行。

它們會生成很多內容，卻很難自己確認這些內容是不是對的。尤其在數學里，哪怕多一個字母出錯，整個結論就不成立。

要解決這個問題，就要靠形式化語言。

Carina 的團隊用的是一種叫 Lean 的數學編程語言。所有的公式、步驟、證明，必須像程序一樣寫清楚，而且要能被機器驗證通過。

這意味著，不是 AI 說對就對，而是它每走一步都要留下可檢查的痕跡，最后像軟件測試一樣通過驗證。

為了證明這套方法可行，他們做了個測試。

2025 年 12月，美國 Putnam 數學競賽剛結束，這是全美最難的本科生數學競賽，參賽者約 4000 人。Carina 團隊在 X 上發布結果：AxiomProver 自主解決了其中 9 道題，在 Lean 語言中給出形式化證明，并全部通過了驗證。

這不僅僅是做對了 9 題，而是 AI 自己做題、自己檢查、自己確認通過。

Carina 說：

“我們不是追求一個能抄答案的 AI，而是一個能完成所有數學細節的合作者。”

驗收的真正含義是什么？

就是 AI 不僅要給出答案，還要證明答案是對的。

在芯片設計、科學研究、金融系統這些容錯率低的場景里，模糊的答案沒有任何價值。AI 得能給出過程、解釋思路、接受檢查。

能被驗收，才意味著能被信任。

第三節｜Meta、Google的人為什么離職來這里

要做到這一點，需要什么樣的團隊？

這個團隊不大，現在也只有 17 人，但每一個加入的人，都是各自領域的頂尖研究者。

CTO Shubho Sengupta，是 Carina 在斯坦福附近的咖啡館偶遇的。他原本在Meta FAIR，帶隊開發過OpenGo和CrypTen，也參與過早期的CUDA GPU架構。他知道大模型的問題，也知道數學領域為什么難。

但在大公司，目標太分散。他想找一個地方，專注解決一個極限難題。

另一位核心成員 Fran?ois Charton，早在 2019 年就在研究怎么用 Transformer解決積分問題。他不放過任何一個細節，不看大模型能寫出多少，而是看它會不會走錯哪一步。

還有Hugh Leather，做的是深度學習與編譯器的結合。他不是傳統意義上的數學家，但在用代碼表達復雜邏輯上，他有深厚的積累。

他們都從 Meta、Google 這樣的地方走出來，放棄了更穩定的研究路徑。

Carina 提供的不是職位，而是一種愿景：用 AI 做出可驗證的數學成果，每一步清晰，每個結論都能站得住。

而這個愿景吸引來的，不只是業界的 AI 研究員。

2025 年 12 月初，57 歲的數學家 Ken Ono 也辭掉了弗吉尼亞大學的終身教職，全職加入 Axiom 。

他曾是 Carina 的導師，領導過多個數學奧林匹克研究項目，是拉馬努金理論的專家，也上過超級碗的廣告，是個把數論帶進大眾文化的人。

他說，作為純數學家，他很少有機會參與改變世界的事。這一次，他不想錯過，帶著家人搬到硅谷，成了 Axiom 的第15位成員，身份是創始數學家。

他的任務不是寫代碼，而是設計難題，測試模型推理的極限。

Carina 說，這些人之所以愿意來，并不是為了趕熱潮，而是想做一件真正值得做的事

“我們不是在做一個產品，是在定義一套新標準：每個公式都可檢查，每道推理過程都可追溯。AI 不是生成一個答案，而是展示完整的思考過程。”

這就是他們 17 個人正在做的事。

第四節｜不是解題，而是教 AI 提問

定義新標準，只是 Carina 的第一步。

她真正想做的，是讓 AI 學會發現問題本身。

他們最近在研究一個數學界著名的未解難題：Collatz 猜想。這個問題簡單得像小學生游戲，卻困住了研究者幾十年。

Axiom 的研究員用 Transformer 模型去學這個問題，模型沒能直接給出證明，但展現出了另一種能力：

它在預測 Collatz 序列時，對萬億級數字的準確率達到了99.8%。

更重要的是，它為什么錯、錯在哪，都能被清楚地解釋。這些錯誤背后有明確的規律，而不是隨機的幻覺。

這意味著什么？

意味著 AI 不是在記憶答案，而是在學習數學思維。

在 Carina 看來，他們不是讓 AI 找已知答案，而是訓練它像一個真正的數學家一樣去思考，去探索。

她所說的探索，主要分成三個階段：

第一步，用形式語言表達定理，模仿已有的邏輯結構。
第二步，驗證舊問題的不同解法，提出新的證明路線。
第三步，提出新猜想，創造從未出現過的問題并給出數學依據。

整個過程，不是 ChatGPT 式的隨機對話，而是在證明空間里有規則地探索，不斷嘗試，直到找到新的路徑。

這種探索為什么重要？

因為數學是人類最嚴密的語言，也是現實世界運轉的底層邏輯。每一個數學突破，都可能帶來這些領域的飛躍。

Carina 相信，數學研究曾經以十年一進展的速度運行，現在 AI 可以把這個周期縮短到幾個月。

而 AI 數學家未來能做的，不只是解題，更是和人一起重新定義問題本身。

這不只是數學領域的事。無論是密碼學、芯片結構、物理建模，背后都依賴于能被精確描述與檢驗的數學原理。一旦 AI 能做到可驗證，它就能從“只能試試看”的輔助工具，變成“可以放心用”的合作者。

這，正是 Carina 在押注的那條線：

AI 的下一個及格線，不是能力，是可信度。

結語｜能被驗收的，才叫AI

Carina 的想法很簡單。

她只給出一個判斷標準：AI 說得對不對，不是看有沒有人信，而是看它能不能自己交代清楚。

Axiom Math 在做的，就是讓 AI 必須講明白。不是讓模型更像人，而是讓它能被信任。

真正能用的 AI，不靠 Demo，靠驗收。

這個標準一旦成立，AI 走進科研、金融、芯片、法律，才算真正開始。

而她，只是把這扇門推開了一點點。

識自AI

本文由AI深度研究院出品，內容基于Carina Hong公開采訪視頻翻譯整理，并結合公開報道進行分析解讀。翻譯力求準確傳達原意，分析內容為編輯部觀點。未經授權，不得轉載。

星標公眾號，點這里 1. 點擊右上角 2. 點擊"設為星標" ← AI深度研究員 ? ← 設為星標

https://www.youtube.com/watch?v=b_UMhn8E8lI&t=264s

https://e.vnexpress.net/news/tech/personalities/building-math-ai-startup-how-24-year-old-stanford-dropout-carina-hong-is-attracting-big-tech-talent-4993367.html

https://www.businessinsider.com/axiom-math-stanford-dropout-meta-ai-researchers-startup-2025-12

https://www.turingpost.com/p/carina

來源：官方媒體/網絡新聞，

排版：Atlas

編輯：深思

主編：圖靈

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.