全文 3,000字 | 閱讀約 8 分鐘
![]()
(對話 Axiom Math 創始人:AI 最重要的品質)
2025 年,幾乎每一場 AI 發布會都在說“我們能做什么”。
但企業真正卡住的,是另一個問題:AI 做出來的結果,怎么證明是對的?
很多 AI 產品上線前 demo 演示得很好,一上線就出問題:
錯誤定位不了,
責任追不清楚,
結果復現不了。
最后只能說:沒法驗收。
Axiom Math,一家總部在舊金山的 AI 初創公司,換了個思路:不是追求 AI 能做什么,而是證明它做對了什么。
這家剛在 2025 年 10 月完成種子輪融資(6400 萬美元,估值 3 億美元,B Capital 領投)的公司,在做一個 AI 數學家,能獨立給出答案,也能自己驗證對錯。
也因此,這個團隊吸引了一批技術背景極深的人: Meta FAIR、Google Brain的前核心研究員, 還有創始人Carina Hong 在 MIT 的導師、知名數學家Ken Ono。
Carina Hong,24歲。
2025 年 12 月 21日,有媒體問她如何招人,她的回答很簡單:
問題夠難,人自然會聚過來。
這不是空話。她的方法就是找到一個值得花十年去解的難題,然后等那些真正的高手主動找上門。
24 歲,6400 萬美元,估值 3 億。
她在賭的不是一個產品,而是 AI 的下一個及格線。
第一節|24歲,3億估值,她要讓 AI 學會自證
她叫 Carina Hong,出生在廣州。
小時候做奧數題的時候,她并不知道未來會站在硅谷講 AI。但她記得,每解決一道題,就像小孩通關游戲,停不下來。
她一路從廣州考到MIT,再拿到羅德獎去牛津學神經科學, 最后跑去斯坦福讀數學博士+法學博士聯合項目。
在MIT,她修了 20 門研究生數學課程,發表了9篇論文,還研究過神經網絡如何理解函數。在牛津,她待在UCL蓋茨比研究所(DeepMind 的誕生地),第一次近距離看到 AI 在解決真實問題:圖像、序列、控制模型。
她開始問自己:如果 AI 能玩游戲、能寫代碼,為什么不能做數學?
真正的轉折發生在硅谷。
她在斯坦福念博時,常去一家咖啡館寫論文。 一次偶然的機會,她認識了 Meta FAIR團隊的 AI 科學家Shubho Sengupta。
一個是數學家,想讓 AI 理解數學。
一個是工程師,想找到 AI 真正值得解決的問題。
他們聊了兩個小時,沒談項目,也沒講融資。只是圍繞一個假設展開:能不能造一個AI 數學家?
那次對話之后,她開始認真思考這件事。不久后,她退學了。
她說:有些問題,在學校解決太慢了。
她要做的,不是聊天機器人,也不是代碼助手,而是一個能驗證定理、甚至提出新猜想的 AI 系統。
這個系統叫 Axiom,公理的意思,也就是數學理論最基本的起點。
從這個起點出發,開發一整套系統,讓 AI 也能探索數學的邊界。
第二節|Putnam考試9/12,但重點不是分數
大多數人理解 AI 學數學,想到的可能是考試、給答案。
但 Carina說,那只是第一步。真正重要的,是它知不知道自己答得對不對。
這不僅是數學問題,也是工程問題。 AI 的答案如果不能被驗證,就沒法用在關鍵場景。
人類做數學題,有個天然優勢:我們能回頭檢查, 證明有沒有邏輯漏洞,推理有沒有跳步,細節前后一不一致。
Carina 把這個檢查的過程,叫做“驗收”。
但大模型不行。
它們會生成很多內容,卻很難自己確認這些內容是不是對的。尤其在數學里,哪怕多一個字母出錯,整個結論就不成立。
要解決這個問題,就要靠形式化語言。
Carina 的團隊用的是一種叫 Lean 的數學編程語言。 所有的公式、步驟、證明,必須像程序一樣寫清楚,而且要能被機器驗證通過。
這意味著,不是 AI 說對就對,而是它每走一步都要留下可檢查的痕跡,最后像軟件測試一樣通過驗證。
為了證明這套方法可行,他們做了個測試。
2025 年 12月,美國 Putnam 數學競賽剛結束,這是全美最難的本科生數學競賽,參賽者約 4000 人。Carina 團隊在 X 上發布結果:AxiomProver 自主解決了其中 9 道題,在 Lean 語言中給出形式化證明,并全部通過了驗證。
這不僅僅是做對了 9 題,而是 AI 自己做題、自己檢查、自己確認通過。
Carina 說:
“我們不是追求一個能抄答案的 AI,而是一個能完成所有數學細節的合作者。”
驗收的真正含義是什么?
就是 AI 不僅要給出答案,還要證明答案是對的。
在芯片設計、科學研究、金融系統這些容錯率低的場景里,模糊的答案沒有任何價值。AI 得能給出過程、解釋思路、接受檢查。
能被驗收,才意味著能被信任。
第三節|Meta、Google的人為什么離職來這里
要做到這一點,需要什么樣的團隊?
這個團隊不大,現在也只有 17 人,但每一個加入的人,都是各自領域的頂尖研究者。
CTO Shubho Sengupta,是 Carina 在斯坦福附近的咖啡館偶遇的。 他原本在Meta FAIR,帶隊開發過OpenGo和CrypTen,也參與過早期的CUDA GPU架構。他知道大模型的問題,也知道數學領域為什么難。
但在大公司,目標太分散。他想找一個地方,專注解決一個極限難題。
另一位核心成員 Fran?ois Charton,早在 2019 年就在研究怎么用 Transformer解決積分問題。他不放過任何一個細節,不看大模型能寫出多少,而是看它會不會走錯哪一步。
還有Hugh Leather,做的是深度學習與編譯器的結合。 他不是傳統意義上的數學家,但在用代碼表達復雜邏輯上,他有深厚的積累。
他們都從 Meta、Google 這樣的地方走出來,放棄了更穩定的研究路徑。
Carina 提供的不是職位,而是一種愿景: 用 AI 做出可驗證的數學成果,每一步清晰,每個結論都能站得住。
而這個愿景吸引來的,不只是業界的 AI 研究員。
2025 年 12 月初,57 歲的數學家 Ken Ono 也辭掉了弗吉尼亞大學的終身教職,全職加入 Axiom 。
他曾是 Carina 的導師,領導過多個數學奧林匹克研究項目,是拉馬努金理論的專家,也上過超級碗的廣告,是個把數論帶進大眾文化的人。
他說,作為純數學家,他很少有機會參與改變世界的事。 這一次,他不想錯過,帶著家人搬到硅谷, 成了 Axiom 的第15位成員, 身份是創始數學家。
他的任務不是寫代碼, 而是設計難題,測試模型推理的極限。
Carina 說,這些人之所以愿意來,并不是為了趕熱潮,而是想做一件真正值得做的事
“我們不是在做一個產品,是在定義一套新標準:每個公式都可檢查,每道推理過程都可追溯。AI 不是生成一個答案,而是展示完整的思考過程。”
這就是他們 17 個人正在做的事。
第四節|不是解題,而是教 AI 提問
定義新標準,只是 Carina 的第一步。
她真正想做的,是讓 AI 學會發現問題本身。
他們最近在研究一個數學界著名的未解難題:Collatz 猜想。 這個問題簡單得像小學生游戲,卻困住了研究者幾十年。
Axiom 的研究員用 Transformer 模型去學這個問題, 模型沒能直接給出證明, 但展現出了另一種能力:
它在預測 Collatz 序列時,對萬億級數字的準確率達到了99.8%。
更重要的是,它為什么錯、錯在哪,都能被清楚地解釋。這些錯誤背后有明確的規律,而不是隨機的幻覺。
這意味著什么?
意味著 AI 不是在記憶答案,而是在學習數學思維。
在 Carina 看來,他們不是讓 AI 找已知答案,而是訓練它像一個真正的數學家一樣去思考,去探索。
她所說的探索,主要分成三個階段:
第一步,用形式語言表達定理,模仿已有的邏輯結構。
第二步,驗證舊問題的不同解法,提出新的證明路線。
第三步,提出新猜想,創造從未出現過的問題并給出數學依據。
整個過程,不是 ChatGPT 式的隨機對話,而是在證明空間里有規則地探索,不斷嘗試,直到找到新的路徑。
這種探索為什么重要?
因為數學是人類最嚴密的語言,也是現實世界運轉的底層邏輯。每一個數學突破,都可能帶來這些領域的飛躍。
Carina 相信,數學研究曾經以十年一進展的速度運行, 現在 AI 可以把這個周期縮短到幾個月。
而 AI 數學家未來能做的,不只是解題,更是和人一起重新定義問題本身。
這不只是數學領域的事。無論是密碼學、芯片結構、物理建模,背后都依賴于能被精確描述與檢驗的數學原理。一旦 AI 能做到可驗證,它就能從“只能試試看”的輔助工具,變成“可以放心用”的合作者。
這,正是 Carina 在押注的那條線:
AI 的下一個及格線,不是能力,是可信度。
結語|能被驗收的,才叫AI
Carina 的想法很簡單。
她只給出一個判斷標準:AI 說得對不對,不是看有沒有人信,而是看它能不能自己交代清楚。
Axiom Math 在做的,就是讓 AI 必須講明白。 不是讓模型更像人,而是讓它能被信任。
真正能用的 AI,不靠 Demo,靠驗收。
這個標準一旦成立,AI 走進科研、金融、芯片、法律,才算真正開始。
而她,只是把這扇門推開了一點點。
識自AI
本文由AI深度研究院出品,內容基于Carina Hong公開采訪視頻翻譯整理,并結合公開報道進行分析解讀。翻譯力求準確傳達原意,分析內容為編輯部觀點。未經授權,不得轉載。
星標公眾號, 點這里 1. 點擊右上角 2. 點擊"設為星標" ← AI深度研究員 ? ← 設為星標
https://www.youtube.com/watch?v=b_UMhn8E8lI&t=264s
https://e.vnexpress.net/news/tech/personalities/building-math-ai-startup-how-24-year-old-stanford-dropout-carina-hong-is-attracting-big-tech-talent-4993367.html
https://www.businessinsider.com/axiom-math-stanford-dropout-meta-ai-researchers-startup-2025-12
https://www.turingpost.com/p/carina
來源:官方媒體/網絡新聞,
排版:Atlas
編輯:深思
主編:圖靈
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.