
【 精彩觀點整理 】
本文為 基于胡泳 訪談的文字整理
我們可能無法完全量化人工智能對人類整體智力的影響,但是認知卸載導致特定認知技能下降的擔憂,比如個體記憶能力的減退,則是完全合理的。
人機協作有潛在的危險,就是喪失人類的思想主體性。就像“駱駝擠進帳
篷”,等到駱駝整個身軀都擠進來以后,人就被完全頂出帳篷了。
就當下發展來看,大模型還遠遠不能夠達到我們作為一個“人”所擁有的那種全部智能和意識…(大模型的智能)幾乎只集中在語言智能和部分邏輯推理智能上。
使用人工智能需要有一個前提條件:TA必須是一個具備超高信息素養的人。
我們的教育體系應該培養會用人工智能工具或者任何工具生產出東西的能力。再往上是溝通協作、批判性思維、創造力,還有自信心,這些是在人工智能時代所需要的關鍵技能。
人工智能時代到來之后,應該設想一個概念,叫做“無分數學習”,把評分體系或者說成績體系,置換到更具有挑戰性的學習任務,并且讓學生的注意力回歸到更有意義的事情上面。
要做到“人的歸人,機器的歸機器”,不要混淆兩者的邊界。
我們不該只問“人工智能能為人類做什么”,還要問“人工智能正在對人類做什么”。
在個體層面上,人工智能是可以幫助個體拓展想象空間的。然而在群體層面,當前生成式系統是否能夠產生具有顛覆性的范式創新想法,目前仍是一個尚未明確的問題。
人工智能缺少的,是作為一個“人”真正的激情和痛苦。生活中有深刻的個人體驗,而這些體驗其實是人類創作深刻作品的基礎。
如果沒有了人文社科,我們并不能發現我們自己到底是誰,也就無法與人工智能相處了。
文/胡泳 北京大學新聞與傳播學院教授
本文轉載自公眾號“騰訊研究院”
![]()
![]()
AI之于人類,就像“駱駝擠進帳篷”
AI是否導致人類降智?要討論這個問題,首先要定義何為“智力”。
但智力是一個復雜的因素,單一歸為某個概念都難以說服他人。相對于“降智”,現在更常用的說法是“認知卸載”,就是說我們一方面承認AI能夠接手某些認知能力,但是另一方面它也一定會使你越來越懶于思考。比如AI幫助你寫文章、做項目,同時它就會讓你不那么積極地動腦,一遇到問題就求助于AI。如果從長期來看,這的確會對認知的發展或是批判性思維能力造成影響。因此,我們所討論問題的核心就是,當AI接管了更多的任務以后,人類獨立完成這一任務的能力就會下降。也就是說,我們可能無法完全量化人工智能對人類整體智力的影響,但是認知卸載導致特定認知技能下降的擔憂,比如個體記憶能力的減退,則是完全合理的。
除了很多經過嚴謹驗證的學術的例子,同樣有一些生活的例子可以參考。譬如在日常生活中,如果你過度依賴GPS,空間記憶能力就會很差。批判性思維層面的例子也很多。例如,有研究把參與者分成年長者和年輕者作為對照組。結果發現,年長者的批判性得分反而是高于年輕人的,因為他們對AI工具的依賴程度沒有那么高。我們可以發現,頻繁使用人工智能與較低的批判性思維能力之間,存在著顯著關聯性。
從另一個角度講,AI在提高工作效率的同時,也會抑制個體的批判性思維。這可能產生兩個結果,第一個結果是,一旦你在工作中喪失了AI支持,就發現自己不會干活了,因為沒有AI支持的情況下,你解決問題的能力是會顯著下降的;第二,你會發現你很難適應一個沒有AI的環境,就像我們對網絡過度依賴,突然斷網就有可能讓你無所適從。如果各種事情都是AI來做,一旦沒有了AI,你的適應性是非常差的。從這些維度來衡量,可以說,我們對AI已經產生了一種過度依賴性。而過度依賴性,是跟認知水平、思想規范性、記憶功能以及思維能力的下降顯著相關。
從社會平均水平的角度,AI對于智力而言可能是一個利好因素,但是對個體的智力水平來說則不然。
針對智商測量有一個概念,叫“弗林效應”,是由詹姆斯·R.弗林 (James R. F lynn) 在20世紀80年代系統研究并命名的。他經過研究發現,20世紀30年代以來,全球多個高生活水平國家連續幾代人的平均智商在持續提升。換句話說,人類變得越來越聰明了。但在最近幾年,弗林效應其實是在減緩的,甚至在某地方是在逆轉的,換句話說,我們的平均智商現在開始下降。在許多地區,學生的科學、數學和閱讀成績都呈下降趨勢。下降的背后,意味著年輕人注意力的長時間持續性在縮短,批判性思維能力在變弱。造成這種現狀的原因有很多。比如社交媒體,就是人類注意力的“大殺器”,它毫無疑問是智力下降的一大誘因。也就是說,我們不能單純地把人工智能當作“替罪羊”,盡管它必然是其中的一個因素。因為智力因素是非常復雜的,受到多種變量的影響。所以從這個意義上來說,也不能輕易斷言人類的智力水平在整體上升。我們應該從長期來看人工智能的影響,而不能從短期或者局限地來看。
“認知卸載”更多地強調的是,由于現在人工智能的發展,人類本身擁有的一些能力在下降。其核心指向是,我們自古以來都在用各種各樣的方式實現能力的外包或者是卸載。例如,你通過記筆記來減輕認知負荷,其實就是一個典型案例。不是說“認知卸載”或者“外包”就不好,而是人工智能它大大加速了卸載能力的上升。從“記筆記”這種簡單的卸載,到現在人工智能開始影響更深層次的東西,例如解決問題的能力或者批判性思維,這些思維能力是人本身就有的,而現在通過工具的發展就會有所喪失。
當然,從文字到互聯網,幾乎每一次都有“降智”的類似擔憂。之前電視媒介剛產生的時候,文化精英主義者非常反對電視,覺得電視就是一個導致人類智能下降的罪魁禍首,后來證明,電視這種媒介其實也并沒有那么可怕。但盡管如此,我仍需強調一下:人工智能的技術和過往的技術相比,有本質上的不同。例如蒸汽機或者電力的發明,它們和人工智能的量級完全不匹配。
首先,人工智能的確會直接替代我們的認知功能。我們以前使用計算器來輔助計算,但是現在生成式AI正在直接替代或者執行傳統上屬于人類的判斷、思考和創造等等這些核心的認知活動,并具有強烈的替代可能。這種替代從某種意義上來說,不是簡單的工具輔助,而是在很多層面發生了質的飛越。
其次,我們會意識到AI的滲透速度是極其快的,它的覆蓋面也是極其廣的。AI的技術應用對人們之后的工作、生活,以及心理和精神上的技術性依賴風險要比其他技術高得多。
第三,人工智能仍然具有極大的迷惑性,就是它會模擬真實。人類對于“何為真實”的認知本身就是一筆糊涂賬,現在AI生成的這種模擬真實性,會給人類造成很多未知的認知風險。所以,我認為現在固然不可以高唱技術悲觀論,也無需陷入道德恐慌中,但AI的一些獨特性質也在提醒我們:這種技術是前所未有的,它必須得到嚴肅全面的審視和管理。
人機協作或者人機共存是一個美好的愿望,我也認為這是一個應當的發展方向。但是此中有潛在的危險,就是喪失掉人類的思想主體性。用寓言“得寸進尺的駱駝進帳篷”(The Camel’s Nose)來說,你先讓駱駝的鼻子伸進來,之后是脖子和前腿,等到駱駝整個龐大身軀全部都擠進來以后,人就被完全頂出帳篷。我覺得這種風險是現實存在的。
![]()
不要對人類智能妄自菲薄
現在很多大模型能夠通過法律考試,MBA考試,包括SAT,甚至是醫學考試,并且還真能取得不錯的成績。但是,這只能證明它是一個通用型的語言處理器,這在系統設計層面,要承認這是了不起的科技成果。另一方面,盡管現在聲稱是“人工智能”,但其本質還是一個概率問題,而非真正的理解或推理。最好的例子就是,人工智能就算可以應付醫學考試,但是它并沒有臨床直覺。如果真的讓人工智能去做臨床,那是風險系數非常高的,因為它本身沒有具身認知能力。同時,大模型還不存在原生的學習過程。因為,人類是有學習動力的。人類會一邊學習也會一邊反思;同樣地,還會把反思不斷內化到自己的學習過程當中。而大模型完全不具備這種能力。
機器智能跟人類智慧有什么區別?或者只說人類的智能到底是什么東西?答案必然是見仁見智的。今天人們看見人工智能做得好,可能會歡呼說它超越了人類智能。而另一種截然不同的觀點則認為,機器智能并不能超越人類智能。在這種羅生門下,當前人工智能領域的研究者時常面臨一種“永遠往后移的球門柱”的困境:當他們終于突破某項技術瓶頸而歡呼超越了人類智能時,外界隨即就會指出其成果距離真正的人類智能水平仍有差距。
智商 (IQ) 確實能衡量人類的某些智能,但一個人智商高,不代表他的全部智能水平就高。所以霍華德·加德納 (Howard Gardner) 意識到這個問題,他認為我們不能只依賴考試成績或傳統智商測試來評估人類的智力。經過多年的研究,他總結出了八種智能類型。如果用這八種智能來評估大模型,就會發現人工智能在語言智能方面表現是一流的。不論是表達、閱讀、寫作還是講故事,生成式AI都是極其超前的。它在邏輯推理或者數學智能上表現也很優秀,盡管在復雜推理時有時會不穩定。但是,人工智能在視覺空間智能上表現很差,以前想象中的多模態模型,實際后來也沒有太大動靜。之后發展到的具身智能、人形機器人,它們的性能表現其實也比較一般。因為,它們實際上無法很好地控制自己的身體,也不能保證身體的協調能力,可能它的身體動覺連三歲小孩都不如。同樣,人機智能或許可以模擬我們的同理心,但是它并不能真正理解他人的情感、動機或關系。
另一個爭論點是AI到底有沒有意識,有人相信它們已經有了自我意識。但是,這一點也是有反對的聲音的,反對者堅定不移地認為其實人工智能根本并沒有意識。
其實,就當下發展來看,大模型還遠遠不能夠達到我們作為一個“人”所擁有的那種全部智能和意識。人們之所以會感到恐慌,是因為目前的人工智能發展走偏了。它幾乎只集中在語言智能和部分邏輯推理智能上,而在其他類型的智能上幾乎沒有進展。甚至,它可能因為過度投入這兩個方向,而阻礙了其他智能的發展。現有的人工智能在結構上完全無法與人類匹配,尤其是在具身性、情感性、經驗性這些方面。因此,我對“人工智能就意味著出現了一個新的物種”這種說法非常不以為然。他們并沒有真正理解人類智能,而且對人類智能妄自菲薄,導致對目前的人工智能過度夸大。
生成式AI現在面臨的最大障礙是幻覺問題。幻覺的存在讓人們不能夠百分之百地把它當成知識停止點系統。在這點上,我的觀點也不是靜態的。不知道隨著人工智能的發展,幻覺是否會減少,而且幻覺的減少程度和權重是我們目前不能夠預測的。比如, 我的使用經驗是 DeepSeek的幻覺就比其他大模型高。我們不能說這個模式不對,因為不同AI的發展模式是不一樣的。而且,有可能“幻覺”對于人類來說也是非常重要的。在知識層面,幻覺是有問題的,但從創意的角度來說,幻覺當然是合適的,盡管也可能造成很多矛盾。那么接下來的問題會是,只要有幻覺存在,AI到底是否可以成為知識停止點系統?我持懷疑態度。幻覺是“內生于大模型”的。從這個意義來說,我也不是說就不能用人工智能作為知識來源,而是認為,這對于人的AI素養以及相關能力要求是非常高的,關鍵在于是否能識別幻覺的根本性。因此,我們必須要在使用人工智能時,養成“人在回路中”的使用習慣。最重要的是,使用人工智能需要有一個前提條件:TA必須是一個具備超高信息素養的人。
![]()
AI時代更需要“無分數學習”
人工智能的出現,的確給整個社會系統特別是教育系統帶來了非常多的沖擊和不確定性。現在的考試很多時候其實都是大模型在應試,學生用這些人工智能工具來完成作業和論文,教授們也在使用人工智能來寫論文或者做項目,很難去遏制這種趨勢的發生。事實上,我們必須思考應在何種程度上延續以往的教育。
我想把這個思考落實到績點上。在我們中國,凡是受教育的人,都很熟悉的一句順口溜就是:“考考考,老師的法寶;分分分,學生的命根。”學生們在接受教育的過程中會認為,考試和分數都是天經地義的。正因如此,我們其實沒有想過到底什么是分數,以及去追根溯源它的成因。而現在,人工智能正在挑戰我們很多習以為常的一些事情,它也帶來了一個好處;打破了一些過去的認知體系。
譬如,分數到底是干什么的?從老師角度來講,分數是教師評估和報告學生表現的一種方式。這種制度從學生的小學到研究生再到就業,都是在用一個看似精確的分數來表達這個學生的學業表現。一旦這些成績被記錄下來,往往會對一個人的人生產生長期而深遠的影響。家長為孩子的分數時刻焦慮,成績就變成了“指揮棒”,指揮一切。
究其源流,進入現代社會以后,需要一種量化的手段和對學生分類的機制,因此分數本質上是個現代性的制度。而這個現代性制度的背后,就是因為教育普及后產生的現代生產機制,需要大量的合格勞工來支持。因此,大眾的教育就一定會被官僚化,不然就沒有辦法評判一個人。長此以往,這個機制就催生了普遍性的分數系統。但這個系統是很難反饋出學生的真實水平的。這個過程中,我們很容易舍本逐末,到底是學生真正掌握了相關知識而獲得好成績,還是僅僅是因為刷題刷得好獲得好成績,這個事情是有待考究的。
人工智能時代到來之后,應該設想一個概念,叫做“無分數學習”。我希望我們可以把評分體系或者說成績體系,置換到更具有挑戰性的學習任務,并且讓學生的注意力回歸到更有意義的事情上面。
今天的教育需要思考構建一種全新的評估體系。在21世紀,還要繼續用分數來衡量一個學生嗎?還是可以探索一種不依賴分數,卻能有效表達知識、促進交流的方式?這樣的體系肯定不容易建立,但我認為有必要去做。不僅是大學,而是整個教育系統都應該朝這個方向改革。在生成式AI的時代,我們要用新的系統,去取代過去那套建立在現代性評估標準和大學錄取標準之上的舊體系。這個新體系還必須能夠與社會接軌,因為雇主仍然需要區分和評估不同的學生。從雇主的角度來說,越來越傾向于看應聘的人會不會使用人工智能工具,但其實工具并不重要,而是要看使用工具的那個人是怎么樣的。也就是說,你是不是一個善于運用人工智能來進行優秀的溝通,或者善于用人工智能來進行深度的思考和創新的復合型人才?當你深度思考之后再用人工智能去創新,其實核心不是單純掌握工具的能力。最簡單的層面,比如用AI來制作內容,這背后考驗的其實是綜合能力:溝通、寫作、批判性思維、創造力,甚至個人特質,比如自信心。
我們現在的小孩都是從“內容為王”的教育系統中教育出來的。我們學基礎內容都學得很好,但解決問題的能力就相對較差。那么我們的教育體系應該培養什么能力?我覺得是會用人工智能工具或者任何工具能夠生產出東西的能力。再往上是溝通協作、批判性思維、創造力,還有自信心,這些是在人工智能時代所需要的關鍵技能,也是跟以往標準成績單有所不同的地方。我們應該創造一個服務于學生的成長和發展的新系統,而這個新的系統背后也不僅僅是評分本身,而是歸結于學習的價值和評價的正義性。
![]()
“文科有用”:
人文通識教育變得前所未有的重要
我始終認為人類的某些智能,是機器目前無法獲得、也無法取代的。這些能力是讓我們成為“人”的關鍵部分。為了讓這些能力更好地發展,我們必須推廣和提升更注重智慧、創造力與人文關懷的教育。在這個意義上,我認為AI時代,人文學科的作用會變得更加重要。
我的核心觀點有兩點:第一,要做到“人的歸人,機器的歸機器”,不要混淆兩者的邊界。第二,我們不該只問“人工智能能為人類做什么”,還要問“人工智能正在對人類做什么”。AI對我們已經造成了許多影響,而應對這些影響的辦法,是讓人變得更有人性,更加努力地去發揮那些機器目前無法實現的能力,比如創造力、批判性思維和直覺。
機器和我們人類的創造力是完全不能等同的。現在的人工智能非常擅長干出產內容這種事,不管是寫東西還是藝術創作,但它的寫作也被批判為沒有靈魂。這就產生兩個問題,第一個是多樣性的問題。所謂的千篇一律,是我們語言和表達方式的多樣性在下降。第二個,如果我們不討論多樣性,單純討論創造力,我們會意識到說,如果有一個類似于具備“百科全書”般能力的機器來幫你產生創意,那么的確會比在單獨思考的時候產生更多創意。
在個體層面上,人工智能是可以幫助個體拓展想象空間的。然而在群體層面,當前生成式系統所產生的創意本質上是源于單一模型框架來發展的。這種單一性源于訓練數據分布與概率引導的機制,并且它非常善于排列組合。然而,關于此類系統是否能夠產生具有顛覆性的范式創新想法,目前仍是一個尚未明確的問題。當然關于這一點也見仁見智,可能有的人會認為它有很多創新想法,那么我們需要討論的就是在何等層級上界定何為顛覆性范式創新。
在顛覆性范式上,我認為我們需要討論的層級是“行星層級”的問題。比如說,全球氣球變化造成的問題,經濟的不平等或者說迄今為止人類還無法消除的暴力。我不覺得人工智能可以在這些層面產生顛覆性范式的創新想法。如果我們用行星層級的創造力來衡量它,我覺得人工智能是做不到的。因此,我傾向于相信我們仍然需要一種更好的、可以提升人性的教育。我覺得越到這個時候,越需要去強調通識教育的重要性。
人工智能給我們帶來很多東西是硬技能,而通識教育培育的是軟技能。我也意識到,很多人現在用人工智能來寫作。如果人們用它來寫散文或者小說,會發現它寫的散文或者小說是非常程式化的。人工智能缺少的,是作為一個“人”真正的激情和痛苦。生活中有深刻的個人體驗,而這些體驗其實是人類創作深刻作品的基礎。如果沒有了人文社科,那么就會暴露兩點:第一是,人們會馬上發現目前人工智能還不能做到的事,例如揭示痛苦。第二,我們并不能發現我們自己到底是誰,也就無法與人工智能相處了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.