![]()
![]()
內容來源| 本文摘編中信出版社 出版
書籍《深度學習:智能時代的核心驅動力量》《大語言模型》
[美] 特倫斯·謝諾夫斯基 著
責編| 柒排版| 沐言
第 9287篇深度好文:5452字 | 11 分鐘閱讀
人工智能已經成為當今最熱門的話題之一,然而很多人仍然覺得它遙不可及,事實上它早已悄然融入我們的生活,默默為我們的衣食住行提供助力。這種既遠又近的感覺,恰恰是人工智能最特別的地方。
中央電視臺·央視頻特別節目《AI1001課》與中信出版集團共同邀約到國內外兩位人工智能領域的知名專家學者:阿里云創始人王堅教授和《大語言模型》作者特倫斯·謝諾夫斯基教授,與我們共同走進人工智能的世界,看看它如何影響當下塑造未來。
![]()
一、人工智能的真正革命
是讓“不可能”變得“觸手可及”
1.大語言模型、三體與平權
王堅:談到人工智能,其實很多人最開始認識到它,應該是從一些科幻電影或者一些科幻小說當中。
可能大家比較熟悉的就是《黑客帝國》。如果你記不得它是人工智能,但這個電影里邊肯定有個畫面大家不會忘掉,就是一串像代碼一樣的字符往下掉。
這是那個時代最科幻的,甚至把那個時代的顏色也體現出來了——綠綠的,白白的,那樣就是未來。所有跟綠色有關都有自帶一種科技感和未來感。
最近幾年大家覺得比較科幻的就是《三體》,它反映了人們對一些今天還未知的、不存在的東西的追求。但實際上今天人工智能已經開始深入到我們的生活,它不再是一個未來式的東西。
尤其是今年年初DeepSeek給我們帶來巨大的驚喜。這半年以來有非常非常多的人工智能應用上線。
除此之外,很多人都知道芯片是人工智能最基本的東西,如果我們沒有芯片,可能人工智能就沒法運作。可是很少人知道另外一句話:在如今,如果沒有人工智能,芯片也造不出來。
所以如今芯片的復雜度已經到了沒有人工智能做不了芯片。
如果去看谷歌這些企業就發現,他們花了很多精力在講人工智能怎么幫助我們設計下一代芯片。
所以其實人類發展到今天,我們碰到的事情復雜度已經非常非常大了,如果沒有一些更加先進的工具來幫助我們,事實上我們很難做一些事情。
另外比如去年的這個巴黎奧運會,我當時跟奧委會開會聊奧林匹克的人工智能的議程的時候,我跟他們說過這樣一句話:其實觀眾是沒有真正看到奧運會精彩的鏡頭的,觀眾只看到了導演認為的精彩的鏡頭,其實大部分的鏡頭可能從來沒人看過。
所以去年奧運會大家看到了很多因為有了人工智能才見到的精彩鏡頭。所以人工智能其實比我們想象的有更多應用場景。
在過去的一年的時間里面,媒體上不斷地出現各種各樣跟人工智能相關的詞語,比如像云計算、深度學習、神經網絡、大語言模型。
第一個最關鍵的問題就是計算和智能的關系。
人工智能是離不開計算的。云計算是今天為人工智能提供計算的最好的方式。
![]()
聯合國去年寫過報告,認為云計算現在不能夠讓所有人平權地去訪問,依舊是我們打造一個更具包容性的人工智能生態最大的障礙。
所以我想直接一點,如果沒有今天的云計算,可能就不會有今天的人工智能,盡管是兩個不同的技術,但是它們之間真是唇齒相依的關系。
第二件事情,我想先說大語言模型。
大語言模型是普通老百姓真正認識到人工智能就在身邊,是觸手可及的一個非常重要的機會。因為大語言模型你每天都可以用。可以理解成今天的人工智能就是以大語言模型為代表。
人工智能有很長的過去,只有很短的歷史,大語言模型就是今天的人工智能。 大語言模型也讓今天的人工智能跟以前的人工智能劃了一條分水嶺,是徹底不一樣了。
當然中間有兩個非常重要的過渡。在技術發展的歷史上,那大語言模型依賴于神經網絡的架構。
通俗來講,就是受大腦啟發出來的東西那就是神經網絡本身的東西。中間又有一個很重要的問題是怎么能夠把數據很好地應用,那深度學習就出來了。
所以從這個角度,深度學習和神經網絡是建立在云計算的基礎上,為大語言模型做最重要的一個技術的儲備。
在過去用神經網絡和深度學習其實醞釀了不同的技術的,但是很多沒有走到我們今天的大語言模型。所以這也是為什么大語言模型是有它獨立存在的條件。
如果再總結一下,云計算是所有東西的基礎,像基礎設施一樣的存在,神經網絡和深度學習是一個非常重要的基礎的方法,這個方法可能可以促成很多不同的新的東西誕生。
但是其中最重要一個東西的誕生就是我們今天說的人工智能,叫大語言模型。但是大語言模型又不是人工智能的全部的表現形式。
如果用汽車做個類比,大語言模型就是人工智能的引擎,至于你是造個跑車還是轎車,那大家都有各自的方法。
人工智能在今年破圈,或者是說在最近幾年里面集中式的爆發,最重要是它真的做到了足夠好,它真的實現了通過了圖靈測試。
這背后的事實上有個很重要的契機是互聯網的發展,大語言模型是把整個互聯網裝到了一個模型里面。
過去我們做搜索也是在互聯網上找東西,在過去幾十年互聯網積累的上面所有的東西被大語言模型裝到了一個口袋里,使得我們今天有機會真的能夠看到一個像人類智能一樣東西的出現。所以我想這可能是它發展背后的一個非常非常重要的原因。
所以我想這樣其實是讓我們對技術的未來會更有信心,當然倒過來講這樣的技術嘗試對推動我們本身的發展有非常大的作用。
所以今天我們談到人工智能的時候我們經常跟另外一個詞叫“平權”放在一起。其實它是一個分享的過程。
如果我們不是站在自己的角度而是站在社會創造力的角度,我們在這個地球上的每一個人的創造力才能被充分地發揮出來,所以我想“三體”這個命名也有這個含義。
2.如何防止人工智能毀滅人類?“母愛”
特倫斯·謝諾夫斯基:我們希望理解人類智能,而情緒顯然在其中發揮著作用,但并非所有人類情緒都是積極的,比如憤怒或者嫉妒。
要知道我們未必希望在人工智能身上復制人類所有的特質,無論是好的還是壞的。
杰弗里?辛頓是我多年的好友兼合作伙伴,他最近提出了一個問題是我們該如何防止人工智能毀滅人類,他建議我們可以將“母愛”這一情感融入人工智能。
核心思路是嬰兒出生后母親會將注意力集中在嬰兒身上,而這種情感源于激素調節與情緒作用。
他認為這種情感是非常值得融入人工智能的積極情緒。總體而言“人工智能”這一概念的誕生很大程度上正是受到了人類大腦結構的啟發。
二、我們與AI的互動方式
正在重新定義“智能”的邊界
1.對AI禮貌有用嗎?大語言模型是否存在幻覺?
特倫斯·謝諾夫斯基:
我寫了兩本書:《深度學習》和《大語言模型》。當年寫《深度學習》的時候花了大約2年時間才完成,但最新一本關于《大語言模型》的書只用了1年就寫完了。
![]()
首先我將 ChatGPT 用作實例,換句話說我實際用它做實驗進行測試。并且在書中每一項測試都配有專屬的標注框,這樣讀者就能清楚區分哪些內容是 ChatGPT 的輸出。哪些是我本人的表述。
除此之外我還做了一件比較特別的事,目前我還沒在其他地方看到有人這么做:在每章的結尾我會把整章內容發給 ChatGPT,然后要求它為普通讀者總結本章內容,結果非常出色。
說實話它總結得比我自己寫得還要好,而且這本書的審稿人也反饋對他們而言這些總結比章節原文更容易理解。
我可以向大家分享一些關于提示詞的使用技巧。
當你與 ChatGPT 或者 DeepSeek或其他任何大型語言模型交互時,必須明確告訴它要扮演什么角色。
因為這些模型已經吸收了各類作者、各行業從業者,比如醫學、法律領域的角色特質。理論上你可以向它提出任何領域的問題,所以你得明確指令。
比如你現在是全球頂尖的癌癥醫學專家,請針對這個醫學問題給出解答。你需要清晰地說明自己的問題以及對回答的預期,越明確越好。
其次有一點讓我特別意外,這是我從一篇文章里看到的,你會驚喜地發現如果你很禮貌,你得到的回復質量會高很多。
這就像與人交流一樣,如果你的態度生硬,在模型這個角度還有很多的可能性,得到的回應也會很敷衍。
但如果你能積極反饋表達認可,那對方給出的回應質量也會顯著提升。
有部分人覺得這樣做會占用過多的 tokens( 詞元 )反而可能影響回答質量,但我認為,用占用過多 tokens來解釋這個問題是不準確的。
其實當你對人工智能表現禮貌時,本質上是激活了它更多的功能模塊,就像人類大腦一樣不同區域負責不同功能,而社交互動是人類大腦的重要功能之一,我們的前額葉皮層就負責處理人際交互相關的活動。
有意思的是研究發現大語言模型也存在類似人類前額葉皮層的功能模塊,所以如果你希望像與人交流一樣與人工智能互動,就需要用對待人的方式去對待它。
![]()
對于大語言模型存在的“幻覺”情況,首先我認為從某種意義上來說幻覺這個詞用得并不恰當,它會給人錯誤的印象。并不是說大語言模型像服用了致幻藥物一樣產生了意識混亂,完全不是這樣的。
所謂的“幻覺輸出”實際上邏輯性非常強,表述也很精準,同時還具備很強的創造性。
就像我之前說的你可以讓它寫一首詩,這首詩里會包含新穎的元素。順便提一句現在很多作家也在借助它來輔助創作,如果它沒有創造性,作家們就不會對它感興趣了。
王堅:我和謝諾夫斯基的想法很接近。今天幾乎所有在批評語言模型那些詞,以前都是用在人的身上,這說明人也是有這些弱點,但人的弱點不是人不該有的東西,而只是他弱點。所以我一直覺得其實這個事情不值得大驚小怪。
另外如果這樣的一個特性在人工智能上表現出來,事實上給了我們更多的機會去研究它。如果在人的身上可能還不太好研究,但是因為在這個人工智能上,我們有更多機會去了解它。
盡管我不能完全贊同這個“幻覺”就是創造力,因為在心理學里面這是兩個不同的事情。但是不管怎么樣我覺得這是一個非常有意思的現象,我覺得至少是不值得擔心的一個現象。
關于數據這件事情,我覺得非常有意思。謝諾夫斯基教授也在說數據質量的問題,可是我們還是要承認數據本身無所謂質量的好壞,可是數據最后的質量是人決定的,也是人決定了用什么樣的數據去確認模型。
2.AI時代孩子應該學什么?
王堅:首先孩子比我們學得快,孩子對這個問題怎么想可能是超出我們想象,甚至超過創造技術的這些人的想象。
所以我覺得這個可能很難有一個很好的答案。但我們還是可以回到一個最基本的面上去討論。
圖靈曾經說過一句話,他就說人的大腦,加上一張紙、一支筆和一個橡皮擦,再加上一定的規則,就是一臺通用機器。
所以大家可以設想一下,其實我們的大腦如果沒有一張紙、一支筆的話,其實我們的創造力是釋放不出來的。
今天我們有了人工智能,有了像大語言模型這樣的東西,是另外意義上的一張紙一支筆,把我們人的創造力給釋放出來。我們真正怎么把小孩的創造力給釋放出來,可能就會變成一非常重要的問題。
有了紙和筆以后,可能有的小孩字還是寫歪的,有的字還是寫潦草。有人能寫出一篇很好的詩,可能有的人解一個很好的算術題。
我想可能人工智能幫助我們也是從這個角度幫助,它不會讓人變得更加一樣,而會讓創造力變得更加不一樣,創造出不同的價值。
特倫斯·謝諾夫斯基:我想接著聊聊“多樣性”這個概念。如果你觀察整個生物學領域,就會發現沒有兩個人是完全相同的,你身體里也沒有兩個完全相同的細胞。
生物學本質上是一門研究多樣性的科學,而孩子們也具有很強的多樣性。任何一個有兩個孩子的家長都會意識到這一點。
每個學生使用人工智能的方式都會有所不同,我們不能用統一的模式去要求他們,必須給孩子足夠的空間。
他們天生好奇,會主動接觸各種事物,像玩玩具一樣探索,還擁有豐富的想象力,我認為人工智能本質上會為他們提供新的工具、新的與世界互動的方式,幫助他們產生更好的想法。
我舉個例子,現在有一些國際象棋程序水平已經能達到人類頂尖棋手的級別,甚至能和國際象棋世界冠軍抗衡。
在我這一代最偉大的國際象棋冠軍是一位成長于小鎮的挪威人叫馬格努斯?卡爾森。
![]()
2017年5月在中國烏鎮柯潔對戰AlphaGo
過去國際象棋大師通常在大城市的象棋俱樂部里對弈,那他是如何成為世界冠軍的呢?他的方法是和國際象棋程序對弈。
這確實這讓國際象棋變得 “大眾化” 了。也就是說你不必身處紐約、莫斯科或北京這樣的大城市,也能通過與程序對弈提升棋藝。
現在這種情況也會發生在孩子們身上,他們會和人工智能互動探索,無論他們身處世界的哪個角落,不管是在這里還是在非洲。
王堅:謝諾夫斯基講的是國際象棋其實很有意思的。其實中國下圍棋的人很多了,對很多小孩他一生是沒有機會跟九段的棋手下棋的,但是有了圍棋的這個程序以后,他就會有機會跟一個九段的棋手下棋。
所以這個其實幫助了人類很多東西,它的意義不是它比人下得好下得壞,而是它給所有的人創造出很多不同的機會,會讓更多的小孩飛速進步。
三、送給年輕人:
深入思考,勇于相信不可能
王堅:我覺得我們還是需要深度的思考,今天我們所有的面臨的技術好像讓我們就不需要思考了,但事實上深度思考還是非常重要的。
我記得互聯網剛出來的時候《大西洋月刊》曾經寫過一篇文章,說互聯網的出現會不會讓人變得更加淺薄?
事實上我今天不好說有沒有這個答案,但是我想這樣的問題會一直伴隨著我們技術的發展,所以我想我們還是應該更加深入地思考問題。更加有批判性。批判性思維是最重要。
特倫斯·謝諾夫斯基:我 建議相信自己的直覺,當專家告訴你某件事不可能時,不要輕易相信。因為在20世紀80年代我們就處于這樣的境地,當時也有人說我們正在嘗試的事情是不可能實現的。
*文章為作者獨立觀點,不代表筆記俠立場。
好文閱讀推薦:
“子彈筆記”是筆記俠的矩陣公眾號,聚焦職場效率追求、人際關系與高潛成長者,幫你3分鐘吃透核心觀點和方法論。歡迎關注~
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.