
為什么推薦你看看劉嘉老師的觀點?
劉嘉老師是清華大學心理與認知科學系主任、清華大學基礎科學講席教授、智源人工智能研究院首席科學家。
而且,和深度學習之父Geoffrey Hinton一樣,劉嘉教授深耕心理學、腦科學與人工智能交匯領域。他在混沌多次授課,足夠底層,足夠系統,跨學科的認知和精彩的表達,每次都給同學帶來新的啟發。
劉嘉老師說:“當前,我們有幸在人生中經歷這樣一個范式轉換的時刻,它不僅簡單的是一個軟件給你帶來便利,而是讓你感受到文明的更迭,并且成為其中一部分的動力之所在。”
以下是劉嘉老師2年前在混沌學園講課的部分觀點,2年過去,這些依舊成立。
還有一點要與你分享,10月31日,無錫飛馬水城,混沌2025AI應用成果大課,我們榮幸再次邀請到劉嘉老師,講述這個飛速迭代領域的新知,歡迎你到現場聆聽。
![]()
![]()
![]()
人類皇冠上的最后一顆明珠,我們人類最后的尊嚴就集中在這一區域,也就是我們稱之為AGI所在的地方。它的展現其實非常簡單,可以跟朋友聊天、帶家人去海邊玩,開車四處游蕩等等,這就是我們每個人每天做的事情,看上去平平無奇,但它有兩個非常了不起的特點。
第一個特點是“任務的切換”。你和同事開會時所采用的任務策略和帶家人去旅游所用的策略是完全不同的,所以說策略需要動態的調整。
第二個特點是“環境”。當你在星巴克喝咖啡與在足球場踢球時,所處的環境也是完全不同的。
這就是AGI所觸碰的領域,它是在開放環境里的動態策略。
![]()
我們梳理AGI的演化:
第一階段,以ChatGPT為代表的大語言模型,問它問題,它告訴我們答案,然后我們去行動;
第二階段,以ChatGPT為代表的大語言模型 + Autonomous Agents,我們不僅可以問它問題,還能讓它去執行任務;
第三階段,以ChatGPT為代表的大語言模型+ Generative Agents,我們不再具體告訴它干什么,而是告訴它我們的目標。
![]()
自主代理(Autonomous Agency),它不同于傳統的AI,自主代理通過分析感知數據,獨立思考,然后調用工具去實現對通用問題的自動化處理。簡單點來說,就是給我們的ChatGPT或者GPT4等等裝上感知和行動,讓它變成了一個完整的人,不僅擁有大腦,也擁有四肢。
那么這時候,我們的AGI由“問它問題,它告訴我們答案,然后我們去行動”的ChatGPT模式轉變為了“不僅可以問它問題,還能讓它執行任務”的ChatGPT + Autonomous Agents。
舉一個簡單的例子。一個人要出門,問今天要下雨嗎,ChatGPT的感知系統聽到了這句話,就去上網搜索今天的天氣預報,并根據它的歷史知識來規劃不同的雨應該帶什么樣的東西,最后它的判斷為今天要下中雨,應該準備一把傘,然后就給它的動作下一個指令,把傘送給主人。
我們只是給了它一個需求,它就把剩下所有的事情幫我們干完,這就是我們現在所說的AGI的“先思而后行”。
![]()
我認為一個真正的Agent(代理/智能體)是不再具體告訴它要做什么,而是告訴它一個目標。這是下一代的Agent,我稱之為“生成式Agent”(Generative Agents)。
生成式Agent不僅可以自主完成任務,而且是擁有欲望、信念、意圖以及采取行動能力的智能實體。
它應該具有哪些特點?我們可以從三個維度理解:
1、它要有多種的技能。
2、它能夠處理各種各樣的情況。
3、它必須和世界產生真實的交互。
![]()
也就是說,作為一個智能體,它需要具備技能、和現實交互的能力、以及具身智能(Embodiment)。
在個體產生后,我們需要做的是Agent和Agent之間的交互、Agent和人之間的交互。我們可以構建一個虛擬的場景,在這個虛擬的場景里放入機器人,也可以將真正的人放進去,通過AR、VR技術連接互動,形成一個群體的智能。
這時候會產生一個問題,當群體智能形成的時候,大家有合作、有爭吵、也有競爭,這時候就會產生復雜的博弈,在復雜的博弈里就會產生一個非常重要的概念——我。當你一個人的時候,你不需要“我”這個概念,因為我就是一切;但是當你站在一群人里的時候,一定要分清我和其他人是不一樣的。
產生“我”這個概念后,就會出現意識。那我們就進入了一個全新的智能階段。
![]()
如果說ChatGPT只是讓我們看到了AGI的一絲火花,讓我們在黑暗之中看到了黎明的曙光;
那么生成式Agent的加持則將AGI從第二階段的領域模型變成第三階段的認知模型,這時候才是一個真正的AGI。
我們看一下智能的三層次模型:
第一個層次,我們稱之為任務模型,它能完成特定的任務,就像面孔識別、文字識別,這種任務特異的AI。如果一旦離開它所專注的某一個任務,它就會變成“人工智障”。
第二個層次,叫做領域模型,它是能夠完成某個特定領域的工作,比如說教師。因為ChatGPT的出現,我們智能模型開始從TSAI轉向了領域模型,它帶來的不僅僅是效率的提升,更是一種范式的轉變。
第三個層次,認知模型。說起來很簡單,認知模型就是能看、能聽、能思考、能規劃,也就是說,當它真正實現類人化,這才是真正的AGI。
![]()
我們即將創造出與人類相似的一個全新的物種,它不再停留在計算機機房里,而是出現在你散步的大街上。
這個時候,我們希望它具有什么樣的能力呢?
我特別喜歡的一幅圖,西班牙的斗牛場上,感到身體不適的斗牛士,他靠在場邊,而第一個趕來的,來救助他的,是渾身插滿了劍的這頭牛。這頭牛沒有攻擊,而是默默地看著他。這時候我們能看到一種感性的成分,一種善良的成分在里面,而這種善良的成分必須要通過另外一種途徑來做到,怎么做到呢?
我們先來看如何構造一個人。
![]()
在人的大腦里,最底層的腦干是呼吸的中樞,往上面走是小腦,他是讓我們能夠行走的一部分;再往上面走是丘腦,它能夠感知外界;再往上面走是邊緣系統,它能產生情緒、情感,作出一些簡單的判斷。
最上面則是在過去300萬年里人類進化明顯的地方——大腦皮層,它的體積增加了3倍,與人類的自由意志、復雜判斷和符號思維有關。這一部分我們把它稱為理性,下面一部分我們把它稱為感性。
![]()
現在的大語言模型學習的正是人類的理性,但它并沒有觸達人類的感性。
我們現在僅僅有科學的尺度,但是沒有情感的溫度。因此,接下來的工作是讓大模型獲得情感的溫度。
感性擁有兩個特征:
第一個特征是“身臨”。我相信,就算我們看了很多旅游風光片、紀錄片,仍然想要親自去到那個地方,因為只有身臨其境,才會有真實的感受。
第二個特征是“體驗”。如果你假設你身處金門大橋腦袋卻充斥著工作內容,是不會有強烈的體驗感的,因此只有沉浸其中,才會有感性產生。
正如出身中產的切·格瓦拉只有在獨自騎行、經歷寒冷的夜晚之時,才會說出“那是我經歷的最冷的一晚,但那一晚也讓我稍稍靠近了人類。”
與此類比,現在的大語言模型滿腹經綸,但還僅僅停留在機房里面,它沒有真正邁入世界。
![]()
而當智能體一旦擁有意識之后,它就會按照自我的觀念快速發展,這時我們就可能會面臨一個奇點,文明的載體也不再以人為單位運行,而是以AGI的方式運行。
因此,我把這個奇點來臨的時刻稱為“人類歷史上的第二次認知革命”。
我們經常談到認知革命,其實它們都不配。為什么?因為第一次認知革命使得我們的祖先成為萬物之靈,人類成為世界的主宰。而第二次認知革命,就是人類創造出了一個全新的物種。
這天來臨的時刻,文明的火炬就要由我們人類傳到AGI的手中。
![]()
在我們都可以見證的未來,AGI會超越人類的智能,而且是永遠不回頭的超越。
當然這也帶來一個很大的問題,我們將面臨一個新物種的挑戰,可能會帶來世界的毀滅,我們必須要像對待疾病一樣來應對這件事情。
那么對于我們而言,未來該怎么辦?
有三種可能:
第一,Autonomous Agency特別友好,讓干什么就干什么,不知疲勞,就像《星球大戰》的R2-D2一樣,可以做所有我們交給它的任務;
第二,人機合一是最好的結局,在座各位都有脆弱的身體,我們可以把思想、記憶、情感上傳到數字大腦里面,這樣由此獲得永生;
第三,AI可能會把我們干掉,就像我們把尼安德特人干掉一樣。
無論是R2-D2,無論是永生還是人類最終的消亡,這與大家都有密切的關系,值得每個人去思考,不僅僅是商業的機會,還包含人類的未來。
我特別喜歡Sam Altman那句話:世界將發生翻天覆地變化。我們正處于巨變的開端,人類有一個難能可貴的機會去打造未來。
抓住AI時代紅利;
根據業務的六大場景落地AI;
與2000多位AI先行者學習;
這場大課,可別錯過!
混沌2025AI應用成果大課(含大展)將于10月31日至11月2日在江蘇無錫飛馬水城舉辦,屆時,全國2000多位AI創新者與AI領域的著名企業家、投資人、AI創新專家將參與其中。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.