<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI人工智能正在改變我們撰寫形式化證明的方式——萊昂納多?德?莫拉(Leonardo de Moura)

      0
      分享至

      置頂zzllrr小樂公眾號(主頁右上角)數學科普不迷路!

      AI 將深度參與下一代證明輔助工具的構建,但工具優劣的核心標準不變:高表達類型、易讀規范、強自動化、可編程生態、優質工具鏈、可擴展性;技術迭代是進步的標志,目標是推動形式化數學的實用化與普及化。


      作者:萊昂納多?德?莫拉(Leonardo de Moura)2026-2-18

      譯者:zzllrr小樂(數學科普公眾號)2026-3-1

      作者簡介


      萊昂納多?德?莫拉(Leonardo de Moura)是亞馬遜云科技(AWS)自動化推理小組的高級首席應用科學家。在業余時間,他投身于非營利組織 Lean FRO 的工作,擔任首席架構師一職 —— 該組織由他與塞巴斯蒂安?烏爾里希(Sebastian Ullrich)共同創立,他對此深感自豪。他同時還受聘擔任 Lean FRO 的董事會成員,積極為該組織的發展壯大貢獻力量。

      2023年加入亞馬遜云科技之前,自2006年起,他曾在微軟研究院(Microsoft Research)的 RiSE 研究小組任職長達 17 年,擔任高級首席研究員。更早之前,他曾就職于美國斯坦福國際研究院(SRI International),擔任計算機科學家。

      他的研究領域包括自動化推理、定理證明、決策過程以及可滿足性問題(SAT)與可滿足性模理論(SMT)。他是多款自動化推理工具的主要架構師,其中包括 Lean、Z3、Yices 1.0 以及 SAL。

      萊昂納多在自動化推理領域的研究成果斬獲了多項頗具聲望的獎項,其中包括計算機輔助驗證大會(CAV)獎、海法獎、埃爾布朗獎,此外,他還憑借 Z3 與 Lean 兩次榮獲美國計算機協會編程語言專業組(ACM SIGPLAN)編程語言軟件獎。他的研究成果也被《紐約時報》,以及《連線》、《量子雜志》、《自然新聞》、《科學美國人》等眾多科普期刊報道。

      如今,語言模型只需極少的人工指導,就能生成數千行經過驗證的數學證明代碼,且相關成本還在持續下降。這一突破令人振奮,同時也引出一個自然而然的問題:當人工智能承擔更多證明工作時,證明輔助工具的選擇會起到怎樣的作用?

      我認為答案是:它的重要性非但沒有降低,反而愈發凸顯。

      證明輔助工具絕非僅服務于人工智能的工具,它更是人類與人工智能協同工作的核心環境。人類需要在其中查閱定義、理解定理表述、指導證明策略,并基于已驗證的結論進行拓展;人工智能則需要高效生成證明、從反饋中學習,并借助自動化能力提升效率。一款設計精良的證明輔助工具能夠同時滿足雙方的需求,而隨著人工智能在證明工作中占據更大比重,那些促成這種高效協作的設計選型,其影響也會變得愈發關鍵。

      人工智能放大基礎架構的價值

      當人工智能生成證明時,它會在目標系統的約束框架內運行。如果該系統具備表達力強的類型系統、強大的自動化功能和易讀的符號體系,人工智能就能充分利用這些優勢。就連錯誤提示的設計也至關重要:結構化、可操作的診斷信息能幫助人工智能高效修正錯誤,這與優質的錯誤提示對人類用戶的幫助如出一轍。系統的表示形式決定了人工智能能否簡潔地表達數學思想,而當我們的目標是將形式化證明拓展至整個數學領域、而非局限于某一本教科書時,簡潔性的重要性不言而喻。

      不妨這樣理解:計算器的出現并未讓數學變得無足輕重,它幫我們省去了繁瑣的算術運算,讓我們得以專注于真正的問題本身。但計算器的實用價值,完全取決于你所采用的數學框架——表示形式至關重要。

      這一道理同樣適用于人工智能與證明輔助工具的關系。若語言模型基于的系統具備依賴類型、類型類和設計良好的策略語言,它就能在恰當的抽象層級上表達數學思想。由此生成的證明更簡短、結構更清晰,人工智能也能在更高的抽象層面開展工作。這是一種會不斷疊加的優勢。

      可擴展性是真正的試金石

      將拓撲學的一個章節進行形式化,已是一項令人贊嘆的成果。但構建一個包含數十萬條定理、且能長期維護的庫,則是全然不同的挑戰。這本質上是一個工程問題,而工程問題的解決效果,對設計選型的細節高度敏感。


      簡潔、結構良好的證明,是訓練人工智能的優質數據;基于這些數據訓練出的人工智能,又能生成更出色的證明;優質的證明反過來會提升庫的實用性,進而吸引更多用戶和貢獻者。這是一個良性循環的飛輪,而證明輔助工具正是驅動飛輪轉動的核心。越來越多的證據印證了這一點:谷歌深度思維(Google DeepMind)研發的強化學習系統AlphaProof,在2024年國際數學奧林匹克競賽中斬獲銀牌,其底層正是基于一款擁有龐大且結構良好的庫的證明輔助工具。正如谷歌深度思維的普什米特·科利(Pushmeet Kohli)所指出的,該系統的“可擴展性與驗證能力”是取得突破的關鍵支撐。無獨有偶,Harmonic公司(https://harmonic.fun )研發的Aristotle系統,在2025年國際數學奧林匹克競賽中達到金牌水準,同樣基于這一技術基礎;字節跳動的SEED Prover系統也在該賽事中獲得銀牌,底層框架亦別無二致。三支獨立的團隊,在最高水平的賽事中攻克同一難題,卻不約而同地選擇了具備表達力強的類型系統、龐大的庫和可編程生態的證明輔助工具。不止這三家:Axiom Math(https://axiommath.ai )、Math Inc(https://www.math.inc )、Logical Intelligence(https://logicalintelligence.com )等公司,也都在同一技術基礎上開展研發。可見,底層工具的選擇,是它們取得成功的關鍵因素,絕非偶然。

      快速的證明校驗速度也同樣重要。當人工智能在反饋循環中探索數千種證明方案時,內核的運算速度會直接決定單位時間內人工智能的學習效率。這是一個現實存在的工程約束,證明輔助工具的研發者應當重視這一點。但僅有校驗速度是遠遠不夠的:一個運算速度快、卻缺乏自動化功能和高效類型系統的內核,只能快速校驗冗長繁瑣的證明;而設計精良的系統生成的證明足夠簡潔,校驗速度往往不會成為瓶頸。這兩方面的優化是相輔相成的。

      正是強大的自動化能力、表達力強的類型系統和清晰的定義歸約機制,才讓簡潔的證明成為可能。它們是支撐人類與人工智能在恰當抽象層級開展工作的基礎設施。

      從理論走向實踐

      理論上,任何數學內容都可以在集合論或其他具備足夠表達力的基礎框架中實現形式化。這一點毋庸置疑,就像任何程序都能在圖靈機上運行一樣。

      但從“理論上可形式化”到“實踐中可落地”的鴻溝,恰恰是證明輔助工具設計需要攻克的核心問題。依賴類型讓抽象代數、范疇論和現代代數幾何的形式化成為現實,避免了陷入繁瑣的編碼冗余;類型類則讓龐大的數學庫具備可導航性和可組合性。證明輔助工具絕非僅僅是一個校驗證明的內核,它是一整套完整的環境,決定了大規模場景下哪些數學內容的表達和維護具備實際可行性。

      易讀的規范說明:人類的信任契約

      證明輔助工具能保證證明的正確性,但正確性本身還不夠。必須有人去閱讀定理的表述,并確認其準確捕捉了我們想要表達的數學思想。這是一份無論自動化程度多高都無法規避的人類契約。

      能夠編寫讓數學家可以審閱和理解的定義與定理表述,是證明輔助工具的核心要求。這一點直接取決于類型系統的表達力和符號機制的設計質量。現代工具進一步強化了這一能力:集成開發環境(IDE)支持鼠標懸停查看術語類型、跳轉至定義、交互式探索庫內容,這些功能讓那些不會親自撰寫證明,但能夠閱讀和驗證表述的人,也能接觸到形式化數學。學習閱讀形式化規范說明,遠比學習撰寫它們容易,而優質的工具讓閱讀過程變得更加便捷。當定義清晰易懂、工具易用性高時,數學家就能直接參與到形式化庫的使用和驗證中;反之,若定義被冗余的編碼所掩蓋,無論驗證了多少定理,非形式化數學與形式化數學之間的鴻溝都將始終存在。

      當人工智能負責生成證明時,這一點就更為關鍵。如果一個定理的形式化表述你完全無法解讀,那么即便它的證明經過了驗證,對你而言也毫無價值。你需要信任的,不僅是證明本身,還有規范說明。

      有人可能會提出,人工智能可以在形式化表述與自然語言之間進行翻譯,這樣無論底層采用何種形式化框架,人類都能閱讀通俗易懂的版本。但這種做法恰恰會在最需要保證正確性的環節,引入新的潛在錯誤源。形式化表述才是信任的基石。試想一個對抗性場景:有人聲稱證明了一項重要成果,此時你需要審閱的是真實的形式化表述,而非人工智能生成的摘要。易讀的形式化規范說明并非人工智能可以替代的便利功能,而是信任的基礎。

      自動化作為“博弈步驟”

      我認為有一種理解證明自動化的方式十分實用:證明器所具備的每一種策略或決策過程,都相當于博弈中的一步棋。如果一個系統只有基礎的操作步驟(如應用引理、重寫術語、展開定義),那么即便是常規的推理過程,也需要冗長的步驟序列才能完成;而具備強大自動化能力的系統,則能提供“一步到位”的操作,實現原本需要數百步才能完成的推理。


      這對人工智能而言意義重大。用語言模型去完成數百步低層級的證明推導,就如同用語言模型去計算復雜的算術表達式——雖然理論上可以做到,但使用專用工具顯然效率更高。強大的策略能讓人工智能省去繁瑣的常規工作,專注于數學上真正具有挑戰性的決策:高層級的證明策略、引理的選擇、關鍵的分支劃分。工具應當負責其擅長的領域,人類和人工智能則聚焦于更核心的創造性工作。

      正因如此,投入研發證明自動化技術(決策過程、簡化器、通用策略),對人類用戶而言絕非只是提升使用體驗的改進,它還能直接提升人工智能生成證明的質量與效率。你為系統添加的每一種強大策略,都是人工智能可以利用的新能力。

      理想的自動化工具應當兼具強大性與可控性。能一步完成目標證明的策略固然有價值,但更具價值的是那些可以交互式運行的策略,讓人工智能能夠逐步指導決策過程。這賦予了人工智能選擇權:當簡單操作足夠時,可將策略作為單一的強力步驟使用;當問題復雜時,則可采取更精細的控制方式。不透明的自動化工具或許有用,但透明且可操控的自動化工具,才能帶來革命性的改變。

      可編程的生態系統

      一款同時兼具編程語言屬性的證明輔助工具,其疊加優勢往往容易被低估。當策略、自動化組件、元程序和經過驗證的代碼都采用同一種語言編寫時,所有模塊都會相互賦能、形成合力。任何人(包括人工智能)都能編寫新的自動化組件,無需切換開發環境或編程語言。“使用系統”與“擴展系統”之間的界限將不復存在。


      這一點對人工智能的集成尤為重要。當人工智能不僅能撰寫證明,還能編寫新的策略、構建定制化決策過程、拓展系統功能時,就會形成一個正向反饋循環:系統越完善,越能助力人工智能;人工智能越強大,越能反過來優化系統。

      展望未來

      下一代頂尖的證明輔助工具,很可能會在人工智能的大規模協助下構建。在Lean FRO(https://lean-lang.org )團隊,我們早已將人工智能納入開發流程。它帶來了顛覆性的改變,如今我們已經無法想象脫離人工智能去開發Lean系統。在我們的代碼倉庫中,隨處可見由人工智能參與撰寫的提交記錄。這一趨勢只會愈演愈烈:人工智能將協助我們進行系統設計、生成核心庫、編寫自動化組件,并測試系統的人機交互體驗。但評判一款證明輔助工具優劣的標準從未改變——它仍需具備表達力強的類型系統、易讀的規范說明、強大的自動化能力、可編程的生態系統、優質的工具鏈和卓越的可擴展性。人工智能改變的是我們構建證明輔助工具的方式,而非衡量其優劣的核心標準。

      當下已有的各類系統、它們的庫、設計決策,以及在實踐中積累的成敗經驗,都將成為構建下一代系統的訓練數據和設計藍本。過往的努力絕非徒勞,而是奠定未來發展的堅實基礎。

      沒有任何技術能夠永遠存在,這恰恰是進步的標志,而非失敗。我們的目標并非構建一個能永久存續的系統,而是推動形式化數學的發展進程,讓形式化數學、經過驗證的軟硬件變得切實可行、易于獲取且具備實用價值,讓下一代技術能站在更高的起點上出發。如果未來出現了真正更優越的系統,那就意味著我們的使命已經達成。

      我所關心的是,這一發展進程始終由真正的技術進步驅動。在人工智能時代,評判優質證明輔助工具的標準已然清晰,且其重要性正前所未有地凸顯。

      參考資料

      https://leodemoura.github.io/blog/2026/02/18/proof-assistants-in-the-age-of-ai.html

      https://lean-lang.org

      https://harmonic.fun

      https://axiommath.ai

      https://www.math.inc

      https://logicalintelligence.com

      小樂數學科普近期文章

      ·開放 · 友好 · 多元 · 普適 · 守拙·

      讓數學

      更加

      易學易練

      易教易研

      易賞易玩

      易見易得

      易傳易及

      歡迎評論、點贊、在看、在聽

      收藏、分享、轉載、投稿

      查看原始文章出處

      點擊zzllrr小樂

      公眾號主頁

      右上角

      置頂★加星

      數學科普不迷路!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      18歲康克清嫁43歲朱德,沒生半個親骨肉,晚年究竟憑啥讓十幾個子孫承歡膝下?

      18歲康克清嫁43歲朱德,沒生半個親骨肉,晚年究竟憑啥讓十幾個子孫承歡膝下?

      歷史回憶室
      2026-04-23 22:43:15
      從金球先生到只剩6歐元!半數球星退役5年就破產,原因不在亂花錢

      從金球先生到只剩6歐元!半數球星退役5年就破產,原因不在亂花錢

      草莓解說體育
      2026-04-23 12:09:25
      火箭又傷一人!核心前鋒舊傷未愈,腳踝又添新傷!場均26分難補齊

      火箭又傷一人!核心前鋒舊傷未愈,腳踝又添新傷!場均26分難補齊

      熊哥愛籃球
      2026-04-24 11:38:20
      騎士兩敗因出爐,哈登錯誤明顯!米切爾沒借口,湖人舊將早該棄用

      騎士兩敗因出爐,哈登錯誤明顯!米切爾沒借口,湖人舊將早該棄用

      魚崖大話籃球
      2026-04-24 11:06:48
      破防!馬蹄露哭著說,謝謝大家讓我能交上電費,滿屏都是露姐別哭

      破防!馬蹄露哭著說,謝謝大家讓我能交上電費,滿屏都是露姐別哭

      一個小豹子
      2026-04-24 05:48:39
      出軌為何注定崩塌:一個反直覺的心理機制

      出軌為何注定崩塌:一個反直覺的心理機制

      晚風也遺憾
      2026-04-23 10:21:05
      八阿哥死前才悟透,康熙的那句“辛者庫賤婦”,其實是“判決書”

      八阿哥死前才悟透,康熙的那句“辛者庫賤婦”,其實是“判決書”

      文史達觀
      2026-04-21 15:46:24
      老外剛造出巴掌帽,義烏當天量產十萬單,國內外售價相差整整10倍

      老外剛造出巴掌帽,義烏當天量產十萬單,國內外售價相差整整10倍

      趣味萌寵的日常
      2026-04-23 18:31:49
      壓哨勝出,麥考爾雙喜臨門!

      壓哨勝出,麥考爾雙喜臨門!

      體育哲人
      2026-04-24 11:20:53
      伊朗“內鬼”竟是路由器!美國科技巨頭集體沉默,中國早有防備

      伊朗“內鬼”竟是路由器!美國科技巨頭集體沉默,中國早有防備

      跳跳歷史
      2026-04-23 10:51:17
      炸裂!女子剛分手就獻身異性,男友尾隨當場抓獲,情夫赤裸一臉懵

      炸裂!女子剛分手就獻身異性,男友尾隨當場抓獲,情夫赤裸一臉懵

      李晚書
      2026-04-21 16:43:59
      NBA官宣:懷特收獲體育道德風尚獎 綠軍后衛連續兩年獲獎

      NBA官宣:懷特收獲體育道德風尚獎 綠軍后衛連續兩年獲獎

      醉臥浮生
      2026-04-24 01:02:42
      扎心了!21歲大一女生月開銷曝光!網友驚問:畢業后能掙這么多嗎

      扎心了!21歲大一女生月開銷曝光!網友驚問:畢業后能掙這么多嗎

      慧翔百科
      2026-04-24 08:58:31
      26歲女子因常年腳冷,習慣穿著襪子睡覺,腳趾甲變“千層糕”,最終不得不接受拔甲治療

      26歲女子因常年腳冷,習慣穿著襪子睡覺,腳趾甲變“千層糕”,最終不得不接受拔甲治療

      觀威海
      2026-04-24 09:12:16
      距離謝娜演唱會開唱,還有10余天,我已經笑死在評論區了!

      距離謝娜演唱會開唱,還有10余天,我已經笑死在評論區了!

      娛樂圈筆娛君
      2026-04-22 14:35:22
      張雪遺憾落敗僅4天,人民日報發文,沒有夸贊,卻讓張雪口碑暴漲

      張雪遺憾落敗僅4天,人民日報發文,沒有夸贊,卻讓張雪口碑暴漲

      老吳教育課堂
      2026-04-23 18:58:07
      李小冉的顏值被嚴重低估了!董潔、湯唯和她合影,都黯然失色了

      李小冉的顏值被嚴重低估了!董潔、湯唯和她合影,都黯然失色了

      八斗小先生
      2026-04-23 16:31:41
      污染源找到,負責人被處理!但河北地下水變紅的關鍵問題還未解決

      污染源找到,負責人被處理!但河北地下水變紅的關鍵問題還未解決

      社會日日鮮
      2026-04-24 07:10:17
      告別大屏反人類設計!工信部下令:7月起新車必須配這19個實體鍵

      告別大屏反人類設計!工信部下令:7月起新車必須配這19個實體鍵

      劉哥談體育
      2026-04-23 02:31:36
      最好的安排!同積分同凈勝球,第一聯賽排面拉滿,曼城槍手拼到底

      最好的安排!同積分同凈勝球,第一聯賽排面拉滿,曼城槍手拼到底

      濤哥侃球
      2026-04-24 12:20:01
      2026-04-24 12:59:00
      小樂數學科普 incentive-icons
      小樂數學科普
      zzllrr小樂,小樂數學科普,讓前沿數學流行起來~
      324文章數 7關注度
      往期回顧 全部

      科技要聞

      剛剛,DeepSeek-V4 預覽版發布 百萬上下文

      頭條要聞

      特朗普:不會對伊朗動用核武器 已從軍事上拿下了伊朗

      頭條要聞

      特朗普:不會對伊朗動用核武器 已從軍事上拿下了伊朗

      體育要聞

      里程碑之戰拖后腿,哈登18分8失誤

      娛樂要聞

      王思聰被綠!戀愛期間女友被金主包養

      財經要聞

      19家企業要"鋁代銅",格力偏不

      汽車要聞

      全景iDrive 續航近800km 新款寶馬7系/i7亮相

      態度原創

      親子
      數碼
      旅游
      本地
      公開課

      親子要聞

      春天“長高食譜”大戰:是喂養孩子,還是喂養育兒焦慮?

      數碼要聞

      專訪巴可王紅波:顯示行業競爭下半場,深耕八大垂直行業與構建共贏生態

      旅游要聞

      達州大竹:農文旅融合添活力 “農事親子樂園”火爆出圈

      本地新聞

      云游中國|逛世界風箏都 留學生探秘中國傳統文化

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 男女激情一区二区三区| 国内精品人妻| 黄色99| 丰满人妻熟妇乱又伦精品软件| 久久人人爽人人爽人人片av高清 | 欧美一区二区三区性视频| 日本丰满白嫩大屁股ass| 欧美成人秋霞久久aa片| 欧美另类性爱| 亚洲av午夜福利精品一区二区| 91黄色视频在线观看| 熟女中文字幕| 米林县| 亚洲第一极品精品无码久久| 啦啦啦WWW日本高清免费观看| 99热都是精品久久久久久| 国产成人精品二三区波多野 | 免费无码成人AV片在线| 中文字幕网红自拍偷拍视频| 99这里只有精品6| 东京热A?V无码| 精品无码av无码专区| 国产成人午夜高潮毛片| 亚洲中文字幕无码一久久区| 多人乱p视频在线免费观看 | 国产香蕉97碰碰久久人人| 国产无吗一区二区三区在线欢| 亚洲鲁丝片一区二区三区| 深夜福利啪啪片| 久久国模| 在线毛片免费| 日韩欧美+自拍| 国产精品一区二区无线| 亚洲精品无码国产片| 亚洲国产一区二区三区久| 色99999| 91你懂的| 亚洲第一二三区日韩国产| 国产精品七七在线播放| 国产精品99久久久久久董美香| 国产对白老熟女正在播放|