<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI 什么時候才算能用?3 億估值團隊給出兩個字:“驗收”

      0
      分享至

      全文 3,000字 | 閱讀約 8 分鐘


      (對話 Axiom Math 創始人:AI 最重要的品質)

      2025 年,幾乎每一場 AI 發布會都在說“我們能做什么”。

      但企業真正卡住的,是另一個問題:AI 做出來的結果,怎么證明是對的?

      很多 AI 產品上線前 demo 演示得很好,一上線就出問題:

      錯誤定位不了,

      責任追不清楚,

      結果復現不了。

      最后只能說:沒法驗收。

      Axiom Math,一家總部在舊金山的 AI 初創公司,換了個思路:不是追求 AI 能做什么,而是證明它做對了什么。

      這家剛在 2025 年 10 月完成種子輪融資(6400 萬美元,估值 3 億美元,B Capital 領投)的公司,在做一個 AI 數學家,能獨立給出答案,也能自己驗證對錯

      也因此,這個團隊吸引了一批技術背景極深的人: Meta FAIR、Google Brain的前核心研究員, 還有創始人Carina Hong 在 MIT 的導師、知名數學家Ken Ono。

      Carina Hong,24歲。

      2025 年 12 月 21日,有媒體問她如何招人,她的回答很簡單:

      問題夠難,人自然會聚過來。

      這不是空話。她的方法就是找到一個值得花十年去解的難題,然后等那些真正的高手主動找上門。

      24 歲,6400 萬美元,估值 3 億。

      她在賭的不是一個產品,而是 AI 的下一個及格線。

      第一節|24歲,3億估值,她要讓 AI 學會自證

      她叫 Carina Hong,出生在廣州。

      小時候做奧數題的時候,她并不知道未來會站在硅谷講 AI。但她記得,每解決一道題,就像小孩通關游戲,停不下來。

      她一路從廣州考到MIT,再拿到羅德獎去牛津學神經科學, 最后跑去斯坦福讀數學博士+法學博士聯合項目。

      在MIT,她修了 20 門研究生數學課程,發表了9篇論文,還研究過神經網絡如何理解函數。在牛津,她待在UCL蓋茨比研究所(DeepMind 的誕生地),第一次近距離看到 AI 在解決真實問題:圖像、序列、控制模型。

      她開始問自己:如果 AI 能玩游戲、能寫代碼,為什么不能做數學?

      真正的轉折發生在硅谷。

      她在斯坦福念博時,常去一家咖啡館寫論文。 一次偶然的機會,她認識了 Meta FAIR團隊的 AI 科學家Shubho Sengupta。

      一個是數學家,想讓 AI 理解數學。

      一個是工程師,想找到 AI 真正值得解決的問題。

      他們聊了兩個小時,沒談項目,也沒講融資。只是圍繞一個假設展開:能不能造一個AI 數學家?

      那次對話之后,她開始認真思考這件事。不久后,她退學了。

      她說:有些問題,在學校解決太慢了。

      她要做的,不是聊天機器人,也不是代碼助手,而是一個能驗證定理、甚至提出新猜想的 AI 系統。

      這個系統叫 Axiom,公理的意思,也就是數學理論最基本的起點。

      從這個起點出發,開發一整套系統,讓 AI 也能探索數學的邊界。

      第二節|Putnam考試9/12,但重點不是分數

      大多數人理解 AI 學數學,想到的可能是考試、給答案。

      但 Carina說,那只是第一步。真正重要的,是它知不知道自己答得對不對。

      這不僅是數學問題,也是工程問題。 AI 的答案如果不能被驗證,就沒法用在關鍵場景。

      人類做數學題,有個天然優勢:我們能回頭檢查, 證明有沒有邏輯漏洞,推理有沒有跳步,細節前后一不一致。

      Carina 把這個檢查的過程,叫做“驗收”。

      但大模型不行。

      它們會生成很多內容,卻很難自己確認這些內容是不是對的。尤其在數學里,哪怕多一個字母出錯,整個結論就不成立。

      要解決這個問題,就要靠形式化語言。

      Carina 的團隊用的是一種叫 Lean 的數學編程語言。 所有的公式、步驟、證明,必須像程序一樣寫清楚,而且要能被機器驗證通過。

      這意味著,不是 AI 說對就對,而是它每走一步都要留下可檢查的痕跡,最后像軟件測試一樣通過驗證。

      為了證明這套方法可行,他們做了個測試。

      2025 年 12月,美國 Putnam 數學競賽剛結束,這是全美最難的本科生數學競賽,參賽者約 4000 人。Carina 團隊在 X 上發布結果:AxiomProver 自主解決了其中 9 道題,在 Lean 語言中給出形式化證明,并全部通過了驗證。

      這不僅僅是做對了 9 題,而是 AI 自己做題、自己檢查、自己確認通過。

      Carina 說:

      “我們不是追求一個能抄答案的 AI,而是一個能完成所有數學細節的合作者。”

      驗收的真正含義是什么?

      就是 AI 不僅要給出答案,還要證明答案是對的。

      在芯片設計、科學研究、金融系統這些容錯率低的場景里,模糊的答案沒有任何價值。AI 得能給出過程、解釋思路、接受檢查。

      能被驗收,才意味著能被信任。

      第三節|Meta、Google的人為什么離職來這里

      要做到這一點,需要什么樣的團隊?

      這個團隊不大,現在也只有 17 人,但每一個加入的人,都是各自領域的頂尖研究者。

      CTO Shubho Sengupta,是 Carina 在斯坦福附近的咖啡館偶遇的。 他原本在Meta FAIR,帶隊開發過OpenGo和CrypTen,也參與過早期的CUDA GPU架構。他知道大模型的問題,也知道數學領域為什么難。

      但在大公司,目標太分散。他想找一個地方,專注解決一個極限難題。

      另一位核心成員 Fran?ois Charton,早在 2019 年就在研究怎么用 Transformer解決積分問題。他不放過任何一個細節,不看大模型能寫出多少,而是看它會不會走錯哪一步。

      還有Hugh Leather,做的是深度學習與編譯器的結合。 他不是傳統意義上的數學家,但在用代碼表達復雜邏輯上,他有深厚的積累。

      他們都從 Meta、Google 這樣的地方走出來,放棄了更穩定的研究路徑。

      Carina 提供的不是職位,而是一種愿景: 用 AI 做出可驗證的數學成果,每一步清晰,每個結論都能站得住。

      而這個愿景吸引來的,不只是業界的 AI 研究員。

      2025 年 12 月初,57 歲的數學家 Ken Ono 也辭掉了弗吉尼亞大學的終身教職,全職加入 Axiom 。

      他曾是 Carina 的導師,領導過多個數學奧林匹克研究項目,是拉馬努金理論的專家,也上過超級碗的廣告,是個把數論帶進大眾文化的人。

      他說,作為純數學家,他很少有機會參與改變世界的事。 這一次,他不想錯過,帶著家人搬到硅谷, 成了 Axiom 的第15位成員, 身份是創始數學家。

      他的任務不是寫代碼, 而是設計難題,測試模型推理的極限。

      Carina 說,這些人之所以愿意來,并不是為了趕熱潮,而是想做一件真正值得做的事

      “我們不是在做一個產品,是在定義一套新標準:每個公式都可檢查,每道推理過程都可追溯。AI 不是生成一個答案,而是展示完整的思考過程。”

      這就是他們 17 個人正在做的事。

      第四節|不是解題,而是教 AI 提問

      定義新標準,只是 Carina 的第一步。

      她真正想做的,是讓 AI 學會發現問題本身。

      他們最近在研究一個數學界著名的未解難題:Collatz 猜想。 這個問題簡單得像小學生游戲,卻困住了研究者幾十年。

      Axiom 的研究員用 Transformer 模型去學這個問題, 模型沒能直接給出證明, 但展現出了另一種能力:

      它在預測 Collatz 序列時,對萬億級數字的準確率達到了99.8%。

      更重要的是,它為什么錯、錯在哪,都能被清楚地解釋。這些錯誤背后有明確的規律,而不是隨機的幻覺。

      這意味著什么?

      意味著 AI 不是在記憶答案,而是在學習數學思維。

      在 Carina 看來,他們不是讓 AI 找已知答案,而是訓練它像一個真正的數學家一樣去思考,去探索。

      她所說的探索,主要分成三個階段:

      • 第一步,用形式語言表達定理,模仿已有的邏輯結構。

      • 第二步,驗證舊問題的不同解法,提出新的證明路線。

      • 第三步,提出新猜想,創造從未出現過的問題并給出數學依據。

      整個過程,不是 ChatGPT 式的隨機對話,而是在證明空間里有規則地探索,不斷嘗試,直到找到新的路徑。

      這種探索為什么重要?

      因為數學是人類最嚴密的語言,也是現實世界運轉的底層邏輯。每一個數學突破,都可能帶來這些領域的飛躍。

      Carina 相信,數學研究曾經以十年一進展的速度運行, 現在 AI 可以把這個周期縮短到幾個月。

      而 AI 數學家未來能做的,不只是解題,更是和人一起重新定義問題本身。

      這不只是數學領域的事。無論是密碼學、芯片結構、物理建模,背后都依賴于能被精確描述與檢驗的數學原理。一旦 AI 能做到可驗證,它就能從“只能試試看”的輔助工具,變成“可以放心用”的合作者。

      這,正是 Carina 在押注的那條線:

      AI 的下一個及格線,不是能力,是可信度。

      結語|能被驗收的,才叫AI

      Carina 的想法很簡單。

      她只給出一個判斷標準:AI 說得對不對,不是看有沒有人信,而是看它能不能自己交代清楚。

      Axiom Math 在做的,就是讓 AI 必須講明白。 不是讓模型更像人,而是讓它能被信任。

      真正能用的 AI,不靠 Demo,靠驗收。

      這個標準一旦成立,AI 走進科研、金融、芯片、法律,才算真正開始。

      而她,只是把這扇門推開了一點點。

      識自AI

      本文由AI深度研究院出品,內容基于Carina Hong公開采訪視頻翻譯整理,并結合公開報道進行分析解讀。翻譯力求準確傳達原意,分析內容為編輯部觀點。未經授權,不得轉載。

      星標公眾號, 點這里 1. 點擊右上角 2. 點擊"設為星標" ← AI深度研究員 ? ← 設為星標

      https://www.youtube.com/watch?v=b_UMhn8E8lI&t=264s

      https://e.vnexpress.net/news/tech/personalities/building-math-ai-startup-how-24-year-old-stanford-dropout-carina-hong-is-attracting-big-tech-talent-4993367.html

      https://www.businessinsider.com/axiom-math-stanford-dropout-meta-ai-researchers-startup-2025-12

      https://www.turingpost.com/p/carina

      來源:官方媒體/網絡新聞,

      排版:Atlas

      編輯:深思

      主編:圖靈

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      女人這兩件事,99%不會告訴男人,100%的男人都不知道

      女人這兩件事,99%不會告訴男人,100%的男人都不知道

      青蘋果sht
      2026-01-20 05:45:59
      奇才總裁溫格:交易走阿夫迪亞絕非失誤,23歲的他年紀有點大

      奇才總裁溫格:交易走阿夫迪亞絕非失誤,23歲的他年紀有點大

      懂球帝
      2026-01-23 16:53:07
      英國衛報披露驚人內幕:馬杜羅被捕前,副總統和她的兄弟暗通美國

      英國衛報披露驚人內幕:馬杜羅被捕前,副總統和她的兄弟暗通美國

      荊楚寰宇文樞
      2026-01-23 22:47:37
      國家下狠手了!體制內大地震,少爺、公主們的“天”,要塌了

      國家下狠手了!體制內大地震,少爺、公主們的“天”,要塌了

      霹靂炮
      2026-01-19 22:24:13
      1996年, 施瓦辛格在家中無事,和35歲200斤女傭發生不當關系

      1996年, 施瓦辛格在家中無事,和35歲200斤女傭發生不當關系

      南權先生
      2026-01-20 15:49:53
      上海男籃30分大勝,弗格36分大爆發,鄒陽空砍18分6籃板4搶斷!

      上海男籃30分大勝,弗格36分大爆發,鄒陽空砍18分6籃板4搶斷!

      中國籃壇快訊
      2026-01-23 21:32:46
      劉少林落選米蘭冬奧!歸化奧運冠軍竹籃打水一場空?

      劉少林落選米蘭冬奧!歸化奧運冠軍竹籃打水一場空?

      阿晞體育
      2026-01-23 18:17:08
      吳京再次失手,新片上映8天票房1200萬,投資血本無歸

      吳京再次失手,新片上映8天票房1200萬,投資血本無歸

      糊咖娛樂
      2026-01-23 18:45:31
      菲律賓飛機闖黃巖島遭中方驅離,日菲勾連終是徒勞!

      菲律賓飛機闖黃巖島遭中方驅離,日菲勾連終是徒勞!

      楊風
      2026-01-22 22:02:03
      小舅子群里安排過年聚餐,我秒回:房已賣,正和你姐飛馬爾代夫

      小舅子群里安排過年聚餐,我秒回:房已賣,正和你姐飛馬爾代夫

      曉艾故事匯
      2026-01-10 09:09:29
      68分創賽季最低!青島慘負寧波 韋瑟斯龐29分下半場僅5分

      68分創賽季最低!青島慘負寧波 韋瑟斯龐29分下半場僅5分

      醉臥浮生
      2026-01-23 22:05:28
      原子彈炸后百年內寸草不生,今廣島卻住滿了人,看看專家怎么說?

      原子彈炸后百年內寸草不生,今廣島卻住滿了人,看看專家怎么說?

      浩渺青史
      2026-01-23 05:38:56
      馬斯克自稱是外星人混進人類潛伏地球

      馬斯克自稱是外星人混進人類潛伏地球

      界面新聞
      2026-01-23 16:46:04
      斯諾克戰報!吳宜澤7勝1負奪冠,趙心童2連亞后退賽,147先生陪跑

      斯諾克戰報!吳宜澤7勝1負奪冠,趙心童2連亞后退賽,147先生陪跑

      劉姚堯的文字城堡
      2026-01-23 06:41:42
      永遠不可能被抹殺的歷史:四野部隊里的那三萬日籍士兵

      永遠不可能被抹殺的歷史:四野部隊里的那三萬日籍士兵

      深度報
      2026-01-21 21:25:16
      長時間加班到深夜,26歲外派工程師家中熟睡中猝死,妻子:公司不愿走工傷認定,僅收到3萬元撫恤金

      長時間加班到深夜,26歲外派工程師家中熟睡中猝死,妻子:公司不愿走工傷認定,僅收到3萬元撫恤金

      極目新聞
      2026-01-23 19:32:11
      演員王傳君發文宣布退出

      演員王傳君發文宣布退出

      喬話
      2026-01-22 17:43:06
      春節臨近胖東來水果熱銷:200元榴蓮開盒不飽滿全退,買1箱車厘子附贈1盒防止壞果,不好吃可直接退款

      春節臨近胖東來水果熱銷:200元榴蓮開盒不飽滿全退,買1箱車厘子附贈1盒防止壞果,不好吃可直接退款

      極目新聞
      2026-01-23 14:33:33
      拖欠工資!云南這些用人單位被曝光

      拖欠工資!云南這些用人單位被曝光

      云南網絡廣播電視臺
      2026-01-23 21:00:11
      6小時特大地磁暴爆發!星鏈衛星大量墜落,我國航天員怎么應對

      6小時特大地磁暴爆發!星鏈衛星大量墜落,我國航天員怎么應對

      甜檸聊史
      2026-01-22 10:27:23
      2026-01-24 06:48:49
      AI深度研究員 incentive-icons
      AI深度研究員
      AI時代剛剛到來,一切才剛開始,我們正當其時!
      367文章數 158關注度
      往期回顧 全部

      科技要聞

      TikTok守住了算法"靈魂" 更握緊了"錢袋子"

      頭條要聞

      疑在達沃斯受挫 79歲的特朗普轉發超80條帖子發泄怒氣

      頭條要聞

      疑在達沃斯受挫 79歲的特朗普轉發超80條帖子發泄怒氣

      體育要聞

      杜蘭特鏖戰44分鐘累癱 轟36+7卻致命失誤

      娛樂要聞

      演員孫濤澄清閆學晶言論 落淚維護妻子

      財經要聞

      2026年,消費沒有新故事?

      汽車要聞

      主打家庭大六座 奕境首款SUV將北京車展亮相

      態度原創

      本地
      教育
      家居
      旅游
      手機

      本地新聞

      云游中國|格爾木的四季朋友圈,張張值得你點贊

      教育要聞

      中國家庭普遍做錯的教育行為是什么?吳軍:追求同質化的教育,孩子的培養不需要盲目跟風

      家居要聞

      在家度假 160平南洋混搭宅

      旅游要聞

      古橋不古,卻堪稱是沙溪古鎮的心臟,可惜我錯過了這里的晨霧

      手機要聞

      iPhone日歷增強指南:一鍵加入每日天氣、倒數日、調休補班等信息

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 精东A片成人影视| 成人视频AAA| 亚洲色诱惑| 精品国产免费人成在线观看| 粉嫩av蜜臀一区二区三区| 特黄aaaaaaaaa毛片免费视频| 久草网址| 亚洲人妻人| 国产成人亚洲日韩欧美婷婷亚片| 国产欧美在线一区二区三区| 久久婷婷国产精品香蕉| 日韩亚洲中文图片小说| 亚洲欧美成人一区二区三区| 玖玖免费视频在线观看| 色综合色天天久久婷婷基地| 人妖网址| 9999国产精品欧美久久久久久| 亚洲精品之国产av| 精品1卡二卡三卡四卡老狼| 国产啪视频免费观看视频| 波多野结衣久久一区二区| 九九热视频在线免费观看| 麻豆aⅴ精品无码一区二区| 日本最新免费二区三区| 97精品久久久久中文字幕 | 无码午夜福利片| 欧美劲爆第一页| 亚洲日韩中文字幕在线播放| 人妻综合网| 国产乱人对白| 丁香婷婷综合激情五月色| 国产色在线观看网站| 亚洲一区精品视频在线| 久草91这里只有精品 | 亚洲Va中文字幕久久无码一区| 国产精品久久久久9999吃药| 91国内精品久久精品一本| 无码国产精品成人| 美女少妇高潮一区二区| 中文字幕一区二区人妻| 咸丰县|