
隨著人工智能科技的不斷發(fā)展,其在邏輯推理能力上的表現(xiàn)也在不斷給人留下深刻的印象。知名數(shù)學(xué)家陶哲軒對(duì)AI在數(shù)學(xué)中的應(yīng)用早已從懷疑轉(zhuǎn)向擁抱。
而這一次被震驚的科學(xué)家是理論計(jì)算機(jī)科學(xué)界的知名科學(xué)家Scott Aaronson(斯考特阿倫森),他在最近的中提到自己在證明一個(gè)與量子復(fù)雜性理論相關(guān)的問題時(shí),使用GPT-5輔助完成了一個(gè)關(guān)鍵步驟的證明。
“This is the first paper I’ve ever put out for which a key technical step in the proof of the main result came from AI—specifically, from GPT5-Thinking."
“這是我發(fā)表的首篇主要結(jié)論的證明有AI參與的論文,證明中的核心步驟由AI——即GPT5-Thinking——所給出。”
![]()
▲圖片來源:https://scottaaronson.blog/?p=9183
當(dāng)然,GPT-5也并非聰明到可以獨(dú)自完成該項(xiàng)研究,事實(shí)上它在最初的幾次回復(fù)中也出現(xiàn)了明顯的錯(cuò)誤。
![]()
▲圖片來源:https://chatgpt.com/share/68db5e26-78bc-8011-b484-2422836e94f4
但在與其多次溝通后() ,GPT-5也成功給出了令Scott Aasonson滿意的結(jié)果。
“...there’s not the slightest doubt that, if a student had given it to me, I would’ve called it clever."
“……毫無疑問,如果是一個(gè)學(xué)生交給我這個(gè)證明,那我肯定會(huì)稱贊其巧妙。”
什么是QMA?
在介紹Scott嘗試解決的具體問題前,我們有必要簡(jiǎn)單的科普一下什么是QMA(Quantum Merlin-Arthur)。
也許有些讀者聽說過與黎曼猜想、龐加萊猜想同屬于千禧年七大難題之一的“P =NP?”問題。其中,P和NP是理論計(jì)算機(jī)科學(xué)中按照問題難易程度對(duì)可計(jì)算問題劃分出的兩個(gè)類別。
簡(jiǎn)單來說,如果一個(gè)問題屬于P類問題,那么我們可以“高效”地得到其答案,這里的“高效”是指我們可以將解決該問題所需要的計(jì)算時(shí)間寫成以該問題規(guī)模為自變量的一個(gè)多項(xiàng)式。而如果一個(gè)問題屬于NP類問題,那么我們可以“高效”地驗(yàn)證一個(gè)該問題的解的正確性。
因此我們也許會(huì)好奇“對(duì)于一個(gè)問題,如果我們能高效地驗(yàn)證其解的正確性,那么是否存在一種方法能夠使我們高效地得到它的一個(gè)解呢?”,雖然目前大部分科學(xué)家們認(rèn)為這種假設(shè)不成立,也即P不等于NP,但是目前尚未有人成功地證明或證偽該命題。
而QMA類問題在量子計(jì)算復(fù)雜性中的角色可以類比于NP類問題在經(jīng)典計(jì)算復(fù)雜性中的角色。
![]()
▲圖片來源:知乎答主“Climber.pl”(https://zhuanlan.zhihu.com/p/20562470)
我們可以想象這樣的一個(gè)虛構(gòu)法庭:在法庭上一位擁有量子計(jì)算能力的巫師(Merlin) 正在試圖向一位國(guó)王(Arthur)證明一個(gè)命題的真實(shí)性,在雙方的辯論中,Merlin會(huì)向Arthur提交證據(jù)(一個(gè)量子態(tài))。如果一個(gè)問題屬于QMA類問題,那么Arthur將能夠高效的驗(yàn)證Merlin提交的證據(jù)的正確性,并且
·完備性:若Merlin提交了正確的證據(jù),那么Arthur采納它的概率不低于2/3
·可靠性:如果Merlin提交了錯(cuò)誤的證據(jù),那么Arthur采納它的概率不超過1/3
Scott用GPT做了什么?
在Scott的研究中,他將GPT-5(具體為GPT-5-Thinking模型)運(yùn)用到了證明使用黑盒放大對(duì)QMA進(jìn)行增強(qiáng)的極限在哪里,即通過黑盒放大這種方法是否能使得當(dāng)Merlin提交正確證據(jù)時(shí)Arthur采納的概率等于1。
![]()
在證明的過程中,有一個(gè)步驟涉及到分析一個(gè)實(shí)參數(shù)三角多項(xiàng)式構(gòu)成的厄米矩陣的最大特征滿足的某些性質(zhì)。實(shí)際上,該步驟的證明對(duì)于頂級(jí)科學(xué)家而言,并不非常困難,Scott花上一兩周進(jìn)行嘗試亦可獨(dú)立完成。在其博客的評(píng)論區(qū),也有人提出了更好的函數(shù)構(gòu)造。但令Scott驚訝的點(diǎn)在于:一年前的GPT尚不能在類似的問題上取得令人滿意的回答,然而現(xiàn)在它已經(jīng)能涉足人類智力活動(dòng)中最精妙的領(lǐng)域之一。
這并不令人驚訝,在AI產(chǎn)品種類越來越多的當(dāng)下,使用AI輔助工作已經(jīng)成為隨處可見的日常。從搜集信息到推導(dǎo)公式、編程,AI早已悄悄從我們印象里前兩年的那個(gè)會(huì)在初等算數(shù)上犯錯(cuò)的”小學(xué)生“,變成了只要加以適當(dāng)?shù)闹笇?dǎo)便能完成復(fù)雜任務(wù)的“大學(xué)生”。
雖然目前的AI尚不能獨(dú)立完成整個(gè)研究工作,但是目前它完全可以充當(dāng)一個(gè)聽話的“小助手”,讓它幫你完成一些小任務(wù);而你則可以充當(dāng)一個(gè)“導(dǎo)師”,為其分解任務(wù)并驗(yàn)證其結(jié)果的正確性。當(dāng)然,前提是你得對(duì)該領(lǐng)域有基礎(chǔ)的了解,否則遇到AI胡編亂造的結(jié)論你也難以辨別真?zhèn)巍5钦l又知道距離下一次AI能力的突變還有多久呢?連Scott也開玩笑稱還好自己早已拿到終生教職。
"I guess I should be grateful that I have tenure."
“我想,我應(yīng)該慶幸我已經(jīng)有終生教職了。”
![]()
▲圖片來源:https://scottaaronson.blog/?p=9183
總的來說,人與AI的交互目前已經(jīng)進(jìn)入了某種程度上的”蜜月期“,只要掌握好方法,哪怕是在計(jì)算理論這種高難度的領(lǐng)域也能助你一臂之力。對(duì)于我們的讀者,如果你仍然覺得AI距離實(shí)用仍有一段距離,那么不妨嘗試在你的日常工作中使用AI來幫你完成一些小任務(wù)。也許體驗(yàn)過后,你也能理解為什么連著名的理論計(jì)算機(jī)科學(xué)家也會(huì)為之震驚。
![]()
▲圖片來源:小編罷工的deepseek
*本文部分內(nèi)容由A1生成與校驗(yàn)(笑)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.