![]()
2016年,圍棋天才李世石惜敗AlphaGo,但他使出“神之一手”,被譽(yù)為人類智慧最后的榮光。僅僅一年后,AlphaGo Zero以100:0的絕對(duì)碾壓,將曾戰(zhàn)勝李世石的“前輩”徹底擊潰。更令人震驚的是,它達(dá)到這個(gè)水平只用了3天,沒學(xué)習(xí)任何一盤人類棋譜。
這背后揭示了一個(gè)殘酷的真相:“人類引以為傲的千年經(jīng)驗(yàn),在真正的智能進(jìn)化面前,可能非但不是資產(chǎn),反而成了認(rèn)知的枷鎖。”元理智能創(chuàng)始人張帆一語(yǔ)道破。張帆,前智譜AI COO,親歷百模大戰(zhàn),曾主導(dǎo)數(shù)十億大模型項(xiàng)目落地。如今再創(chuàng)業(yè),目標(biāo)是解決AI時(shí)代最難、也最關(guān)鍵的命題:如何將智能轉(zhuǎn)化為核心生產(chǎn)力?
今天,智能仍在一路狂飆。你剛學(xué)會(huì)的應(yīng)用,下個(gè)月可能就過(guò)時(shí)了;你剛掌握的工具,下一波迭代又來(lái)了。還有什么能抓住的嗎?張帆老師提供了一個(gè)思路,那就是掌握“大模型思維”。它不是又一個(gè)時(shí)髦詞匯,而是一種全新的認(rèn)知范式:
別人還在優(yōu)化現(xiàn)有知識(shí),它已直指事物本質(zhì)規(guī)律;
別人還在追求確定性,它已精通概率與不確定性的藝術(shù);
別人還在囤積數(shù)據(jù),它已懂得真正的價(jià)值在于智能的轉(zhuǎn)化與釋放。
“工業(yè)時(shí)代的贏家是‘控制者’,”張帆說(shuō),“而今天的贏家,是那些掌握大模型思維、懂得概率管理的人。”你企業(yè)的核心競(jìng)爭(zhēng)力,不再是你擁有多少數(shù)據(jù),而在于你能消耗多少智能、轉(zhuǎn)化多少智能。這將是未來(lái)十年最殘酷也最公平的競(jìng)爭(zhēng)。
上周六,張帆老師在混沌APP的深度大課《大模型時(shí)代的第一性原理:智能涌現(xiàn)的底層邏輯與商業(yè)范式重塑》中,從三場(chǎng)人機(jī)對(duì)弈出發(fā),剖析智能進(jìn)化的底層邏輯,最終聚焦于每個(gè)企業(yè)與個(gè)人最迫切的課題:如何重塑思維,抓住未來(lái)。
本文為課程內(nèi)容精編,僅占全部?jī)?nèi)容十分之一,完整版在混沌APP。
![]()
![]()
人機(jī)對(duì)弈,智能進(jìn)化
回顧過(guò)去兩三年,技能迭代速度極為迅速,也因此引發(fā)了各類焦慮情緒。我認(rèn)為在高速變化的時(shí)代,更為重要的是找到其中不變的核心要素,那就是大模型思維。什么是大模型思維?我們可以在智能領(lǐng)域找一個(gè)合適的研究樣本。機(jī)器誕生以來(lái),人類就一直在探索如何讓機(jī)器與人進(jìn)行對(duì)弈,我們將以此為人機(jī)博弈最小樣本,梳理智能發(fā)展的簡(jiǎn)要?dú)v程。
![]()
第一個(gè)階段,“深藍(lán)”擊敗卡斯帕羅夫
1997年的人機(jī)對(duì)弈,“深藍(lán)”最終擊敗卡斯帕羅夫,是機(jī)器首次在高級(jí)博弈領(lǐng)域戰(zhàn)勝人類世界冠軍。卡斯帕羅夫當(dāng)時(shí)也難以接受機(jī)器能夠擊敗自己的事實(shí),甚至懷疑機(jī)器背后有人在操控。
“深藍(lán)”背后的核心原理,是符號(hào)主義的巔峰應(yīng)用,其本質(zhì)邏輯是“規(guī)則+窮舉”。具體而言,就是將人類棋手的歷史經(jīng)驗(yàn)總結(jié)為一系列下棋博弈的規(guī)則,再讓計(jì)算機(jī)以每秒2億次的速度進(jìn)行推演。這一過(guò)程中也融入了剪枝邏輯,確保計(jì)算機(jī)無(wú)需嘗試所有棋局,以高效方式完成博弈。
“深藍(lán)”擊敗人類冠軍的消息令人震驚,當(dāng)時(shí)大家普遍認(rèn)為,圍棋很快也會(huì)被機(jī)器攻克。然而,從國(guó)際象棋被攻克到圍棋被攻克,機(jī)器用了20年時(shí)間。核心原因在于“維度的詛咒”。圍棋與國(guó)際象棋屬于完全不同維度的搜索空間。圍棋棋盤為19x19規(guī)格,其搜索空間約達(dá)到10的170次方。在這20年間,即便計(jì)算機(jī)性能提升1萬(wàn)倍,面對(duì)圍棋極為龐大的搜索空間,也只是杯水車薪,無(wú)法從根本上解決問(wèn)題。
![]()
第二個(gè)階段,“神奇的37手”和“神奇的78手”
進(jìn)入第二個(gè)階段,人機(jī)博弈的核心邏輯從“暴力計(jì)算”轉(zhuǎn)向“數(shù)據(jù)暴力”。彼時(shí)的機(jī)器采用了神經(jīng)網(wǎng)絡(luò)技術(shù),不再依賴傳統(tǒng)的規(guī)則邏輯,而是模擬人類的直覺,通過(guò)神經(jīng)網(wǎng)絡(luò),將歷史上所有人類圍棋棋局作為訓(xùn)練數(shù)據(jù),讓機(jī)器形成降維表達(dá),以類似人類直覺的方式作出判斷。
正是基于這一邏輯,2016年,機(jī)器擊敗了當(dāng)時(shí)的圍棋世界冠軍李世石。李世石的心態(tài)從對(duì)弈前的輕蔑,逐漸轉(zhuǎn)變?yōu)閷?duì)弈后的絕望,因?yàn)樗庾R(shí)到,自己已無(wú)法戰(zhàn)勝眼前的機(jī)器對(duì)手。
這一局精彩的對(duì)弈,出現(xiàn)了兩個(gè)極具標(biāo)志性的節(jié)點(diǎn):“神奇的37手”和“神奇的78手”。
![]()
在37手時(shí),AI走出了一步超出人類預(yù)期的棋。當(dāng)時(shí)的直播解說(shuō)甚至懷疑,是擺棋人員出現(xiàn)了失誤,認(rèn)為這一步不符合圍棋邏輯,甚至可能是程序漏洞。這步棋在短期局面中造成一定損失,但隨著棋局的推進(jìn),AI最終贏得了這一局。事后復(fù)盤發(fā)現(xiàn),AI放棄了局部最優(yōu)解,轉(zhuǎn)而追求全局勝率的最大化。 這一現(xiàn)象讓人類感到震驚:機(jī)器首次在遵循人類規(guī)則的基礎(chǔ)上,突破了人類規(guī)則的局限,走出了人類認(rèn)知邊界之外的棋法。
78手同樣具有重要意義。在78手這一節(jié)點(diǎn),李世石下出了一個(gè)完全超出機(jī)器預(yù)判范圍的位置,導(dǎo)致其無(wú)法進(jìn)行有效推理。機(jī)器在這一步之后出現(xiàn)明顯混亂,并在隨后數(shù)十步內(nèi)持續(xù)處于失序狀態(tài)。因此,這一手被不少人稱為“人類最后的榮光”。
這一現(xiàn)象背后的邏輯,與AlphaGo的核心架構(gòu)密切相關(guān)。AlphaGo基于蒙特卡洛樹搜索框架。其中最具價(jià)值的部分,是基于人類三千萬(wàn)局棋譜訓(xùn)練得到的兩個(gè)核心網(wǎng)絡(luò):一個(gè)是策略網(wǎng)絡(luò),一個(gè)是價(jià)值網(wǎng)絡(luò)。
![]()
策略網(wǎng)絡(luò)的作用,是在當(dāng)前盤面下篩選出少數(shù)具有潛在價(jià)值的落子點(diǎn)。通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方式進(jìn)行大規(guī)模剪枝,大幅縮窄搜索空間。在鎖定少數(shù)高價(jià)值點(diǎn)位后,再由蒙特卡洛樹搜索進(jìn)行深度推演。每一步落子后,價(jià)值網(wǎng)絡(luò)會(huì)對(duì)當(dāng)前局勢(shì)進(jìn)行評(píng)估,判斷己方獲勝概率是上升還是下降。
李世石78手為何能夠奏效?因?yàn)槠洳呗跃W(wǎng)絡(luò)本質(zhì)上建立在人類經(jīng)驗(yàn)之上,它會(huì)對(duì)各個(gè)點(diǎn)位的概率進(jìn)行評(píng)估,判斷人類在不同位置的落子可能性。而李世石下出的,是一個(gè)在模型評(píng)估中概率極低、幾乎不在常規(guī)考慮范圍內(nèi)的落子,完全超出了策略網(wǎng)絡(luò)預(yù)設(shè)的搜索范圍,從而直接打亂了機(jī)器的整體決策節(jié)奏。
從“深藍(lán)”到AlphaGo,關(guān)鍵變化在于:前者站在人類顯性規(guī)則的肩膀上,由人類將經(jīng)驗(yàn)提煉為固定規(guī)則;后者則將顯性規(guī)則轉(zhuǎn)化為基于海量棋譜的直覺式判斷,并以此戰(zhàn)勝人類。盡管最終AlphaGo以4比1戰(zhàn)勝李世石,在這一階段,人類仍具備與機(jī)器博弈,甚至局部突破的能力。
第三個(gè)階段,AlphaGo Zero
2017年,更具顛覆性的形態(tài)出現(xiàn):AlphaGo Zero。其核心邏輯是完全不再依賴人類知識(shí),僅通過(guò)自我對(duì)弈完成學(xué)習(xí)。自我對(duì)局、自我總結(jié),從零基礎(chǔ)開始,完全依靠自我博弈完成智能進(jìn)化。
一個(gè)通過(guò)自我博弈進(jìn)行訓(xùn)練的模型,僅用三天時(shí)間,便以100:0的絕對(duì)優(yōu)勢(shì)擊敗了曾戰(zhàn)勝李世石的AlphaGo Lee;在后續(xù)幾天的訓(xùn)練中,戰(zhàn)斗力持續(xù)攀升,直至第40天,該模型的戰(zhàn)斗力基本超越了所有現(xiàn)有模型。人類積累上千年的圍棋經(jīng)驗(yàn),在模型的自我博弈訓(xùn)練面前,被徹底超越。
從算力消耗來(lái)看,AlphaGo Lee的訓(xùn)練需要由1200個(gè)CPU與176個(gè)GPU組成的龐大算力集群。而采用自我博弈模式的AlphaGo Zero,僅需4個(gè)TPU即可完成訓(xùn)練。兩者的算力消耗不在同一維度。這一現(xiàn)象表明,人類積累的經(jīng)驗(yàn)不僅未對(duì)模型訓(xùn)練起到正向推動(dòng)作用,反而可能成為一種負(fù)擔(dān),限制了模型的發(fā)展空間。
數(shù)據(jù)層面的差異同樣顯著:AlphaGo Lee的訓(xùn)練依賴3000萬(wàn)份人類圍棋棋譜。而Alpha Go Zero的訓(xùn)練未使用任何一份棋譜、任何一點(diǎn)人類圍棋經(jīng)驗(yàn)。
結(jié)合ELO評(píng)分來(lái)看,人類棋手的最高峰值約為3800分,AlphaGo Lee的評(píng)分約為4000分。但在AlphaGo Zero面前,人類智慧的優(yōu)勢(shì)似乎完全消失,其ELO評(píng)分直接突破5000分。這也印證了柯潔的觀點(diǎn):在AlphaGo Zero這類模型面前,人類幾乎不可能再取得圍棋對(duì)戰(zhàn)的勝利。
這一現(xiàn)象背后的核心邏輯是:人類長(zhǎng)期被自身積累的經(jīng)驗(yàn)束縛,陷入了局部最優(yōu)解的困境。而AI模型無(wú)需依賴人類經(jīng)驗(yàn),僅通過(guò)“自我對(duì)戰(zhàn)—結(jié)果反饋—經(jīng)驗(yàn)總結(jié)”的閉環(huán)模式,在三天內(nèi)完成了490萬(wàn)盤圍棋對(duì)戰(zhàn)的學(xué)習(xí),積累了遠(yuǎn)超人類的圍棋知識(shí)。
![]()
AI時(shí)代最核心的思維方向
總結(jié)來(lái)說(shuō),圍棋博弈的對(duì)戰(zhàn)歷史,正是人類對(duì)智能與知識(shí)認(rèn)知不斷迭代的過(guò)程:最初,我們把人類智慧視為至高無(wú)上;后來(lái),我們基于人類規(guī)則研究,卻發(fā)現(xiàn)知識(shí)本身存在偏差與局限;于是轉(zhuǎn)向依靠海量人類數(shù)據(jù)訓(xùn)練模型,從“計(jì)算暴力”走向“數(shù)據(jù)暴力”,但仍未跳出人類認(rèn)知框架;最終,我們意識(shí)到,人類數(shù)據(jù)并非必需,AI可以完全脫離人類經(jīng)驗(yàn),實(shí)現(xiàn)自我迭代與突破。這一過(guò)程,本質(zhì)是對(duì)人類數(shù)據(jù)價(jià)值的不斷反思與重估。
什么是AI時(shí)代最核心的思維方向?
如何學(xué)習(xí)AI思維?
文章僅為課程1/10,請(qǐng)前往APP看課
![]()
智能的本質(zhì)
當(dāng)下AI的核心邏輯,是探尋事物本質(zhì)規(guī)律,而非僅僅優(yōu)化人類現(xiàn)有知識(shí)。人類數(shù)據(jù)自帶偏見,在不同階段,它可能是資產(chǎn),也可能是噪音,甚至是認(rèn)知枷鎖。由此,我們必須重新思考三個(gè)關(guān)鍵問(wèn)題:如何定義智能、如何定義知識(shí)、如何有效沉淀。這正是AI時(shí)代最核心的思維方向。
知識(shí)的本質(zhì)即“有損壓縮”。
目前學(xué)界較為共識(shí)的結(jié)論是,全宇宙的原子總數(shù)約為10的80次方。若宇宙是可計(jì)算系統(tǒng),其求解空間之大,人類永遠(yuǎn)無(wú)法窮盡。在龐大的搜索空間中,剔除無(wú)價(jià)值的冗余信息,剔除所有無(wú)意義的噪點(diǎn),僅保留少量極具價(jià)值的核心內(nèi)容——“遺忘”,這就是知識(shí)的核心邏輯。
知識(shí)并非對(duì)世界的簡(jiǎn)單復(fù)制,而是對(duì)世界抽象后的高維投影,“做減法”才是知識(shí)的本質(zhì)所在。這也印證了“全知即無(wú)知”的觀點(diǎn):當(dāng)我們擁有所有可能的答案時(shí),反而無(wú)法獲得真正有價(jià)值的答案。信息的價(jià)值不在于數(shù)量的多少,而在于其有序性。
“壓縮機(jī)理解”正是解決這一問(wèn)題的關(guān)鍵。當(dāng)我們對(duì)同一事物進(jìn)行大規(guī)模采樣,便會(huì)獲得大量的觀測(cè)數(shù)據(jù)。這些觀測(cè)數(shù)據(jù)本身并非知識(shí),只是對(duì)終極真理的采樣結(jié)果。源于對(duì)這些采樣數(shù)據(jù)的“壓縮機(jī)理解”,將大量分散的觀測(cè)結(jié)果歸納為一套簡(jiǎn)潔的規(guī)則,且這套規(guī)則能夠預(yù)判未來(lái)的采樣結(jié)果,此時(shí),這些規(guī)則便成了知識(shí)。
![]()
用一個(gè)簡(jiǎn)單案例理解知識(shí)的形成:盛滿水的杯子倒置,水必然灑出,重復(fù)多次結(jié)果始終一致。通過(guò)反復(fù)觀察采樣,會(huì)歸納出結(jié)論——盛水的杯子倒置會(huì)灑水,這便是知識(shí)。知識(shí)具備穩(wěn)定可驗(yàn)證性,通過(guò)壓縮后的規(guī)律,我們能預(yù)判不同顏色、不同樣式水杯倒置的結(jié)果,這就是知識(shí)在大腦中的泛化。我們不必記住每一次倒水的細(xì)節(jié),只需抽象出通用規(guī)則,就能在未知場(chǎng)景中做出預(yù)判。
知識(shí)的價(jià)值不在于驗(yàn)證觀測(cè)對(duì)象的絕對(duì)真實(shí)性,而在于通過(guò)對(duì)信息的歸納,形成可預(yù)測(cè)的有序規(guī)律。例如,我們無(wú)需實(shí)際觸摸開水,便能通過(guò)已有的知識(shí)預(yù)判“觸摸開水會(huì)被燙傷”這一結(jié)果。這種無(wú)需直接采樣便能實(shí)現(xiàn)的預(yù)判,正是知識(shí)的核心功能。
頓悟:損失值下降與泛化突變
接下來(lái)我們探討:觀測(cè)到的信息如何轉(zhuǎn)化為知識(shí)?從數(shù)學(xué)與人類認(rèn)知的角度來(lái)看,這一過(guò)程可概括為“頓悟”。比如學(xué)騎自行車,初學(xué)者可能多次摔倒,積累了大量嘗試經(jīng)驗(yàn),卻始終無(wú)法掌握平衡;直到某一時(shí)刻,突然突破瓶頸,掌握了騎行技巧。這種“豁然開朗”的瞬間便是頓悟。
我們可以通過(guò)“損失值(loss)”來(lái)理解這一過(guò)程:損失值本質(zhì)上是對(duì)觀測(cè)樣本預(yù)測(cè)準(zhǔn)確性的量化評(píng)估。在未提煉出規(guī)律之前,我們的認(rèn)知往往處于“死記硬背”的階段,本質(zhì)上是對(duì)觀測(cè)樣本的機(jī)械記錄,而非知識(shí)的形成。
![]()
隨著觀測(cè)樣本的不斷積累、泛化范圍的持續(xù)擴(kuò)大,當(dāng)積累達(dá)到一定閾值時(shí),便會(huì)出現(xiàn)“頓悟”——比如在多次計(jì)算各類乘法后,突然領(lǐng)悟到“九九乘法表”的規(guī)律。這一規(guī)律能將上千個(gè)乘法樣本壓縮為一套簡(jiǎn)潔的規(guī)則,不僅能解釋已有的所有樣本,還能精準(zhǔn)預(yù)測(cè)第1001個(gè)乃至更多未知的乘法結(jié)果。與機(jī)械記憶上千個(gè)樣本相比,九九乘法表的存儲(chǔ)規(guī)模極小,而泛化能力卻極大提升。
頓悟,本質(zhì)上就是損失值的快速下降——當(dāng)規(guī)律被提煉出來(lái)的瞬間,原本無(wú)法預(yù)測(cè)的場(chǎng)景變得可預(yù)測(cè),原本零散的觀測(cè)樣本被整合為有序的知識(shí)。這也正是知識(shí)的本質(zhì):通過(guò)對(duì)觀測(cè)采樣的壓縮與規(guī)律提煉,實(shí)現(xiàn)對(duì)未知場(chǎng)景的精準(zhǔn)預(yù)判。而在人工智能領(lǐng)域,這一突變體現(xiàn)為損失值(loss)的急劇下降;在人類學(xué)習(xí)過(guò)程中,則表現(xiàn)為突然掌握認(rèn)知規(guī)律、理解事物本質(zhì)的狀態(tài)。
所有知識(shí)的頓悟本質(zhì)上都會(huì)帶來(lái)泛化能力的提升——頓悟前僅能解決已知的舊問(wèn)題,頓悟后則能夠解決未知的新問(wèn)題。
智能的不可能三角
隨之而來(lái)的問(wèn)題是:知識(shí)的壓縮是否存在衡量標(biāo)準(zhǔn)?如何衡量其優(yōu)劣?這就需要建立一套針對(duì)智能的衡量標(biāo)準(zhǔn),而智能的衡量存在一個(gè)“不可能三角”。
智能的不可能三角包含三個(gè)核心維度:其一為壓縮率,即把龐大的知識(shí)體量壓縮至多大范圍;其二為損耗率,即知識(shí)壓縮后能否還原,以及還原后的結(jié)果與原始信息的預(yù)測(cè)準(zhǔn)確度;其三為算力損耗,包括知識(shí)壓縮過(guò)程與解壓(應(yīng)用)過(guò)程中的算力消耗。
![]()
類比將4K高清照片壓縮至720P的過(guò)程。在傳統(tǒng)的解壓方式中,通常采用插值法,這種方式雖能擴(kuò)大圖像尺寸,但會(huì)導(dǎo)致圖像模糊,即損耗率升高。
人類的大腦(當(dāng)前大模型的模式也類似)“解壓”的方式則不同:若給予人類一張低分辨率照片,人類大腦的“腦補(bǔ)”過(guò)程并非簡(jiǎn)單的插值,而是將自身對(duì)物理世界的經(jīng)驗(yàn)認(rèn)知映射到圖像中。還原后的圖像分辨率優(yōu)于傳統(tǒng)插值方式,但還原過(guò)程中補(bǔ)充的細(xì)節(jié)可能存在偏差,不過(guò)這種偏差并不影響整體認(rèn)知——這正是損耗的本質(zhì):知識(shí)壓縮過(guò)程中,必然會(huì)丟棄部分信息,即“遺忘”,我們通過(guò)遺忘被判定為“噪聲”的信息,實(shí)現(xiàn)知識(shí)的壓縮。這種“遺忘”并非錯(cuò)誤,而是高維信息向低維信息轉(zhuǎn)化過(guò)程中必然的維度簡(jiǎn)化;而后續(xù)的“腦補(bǔ)”(即大模型的生成或人類的聯(lián)想),本質(zhì)上就是對(duì)壓縮后信息的還原,這一過(guò)程所產(chǎn)生的偏差,即我們所說(shuō)的“幻覺”。
簡(jiǎn)單來(lái)說(shuō),將低分辨率的信息通過(guò)主觀補(bǔ)全轉(zhuǎn)化為高分辨率信息時(shí),其中會(huì)產(chǎn)生原本不存在的信息,這些被創(chuàng)造出來(lái)的信息即為幻覺。由此可見,只要存在知識(shí),就必然伴隨幻覺,這是知識(shí)的本質(zhì)屬性。而這種信息補(bǔ)全過(guò)程中產(chǎn)生的差值,同時(shí)也會(huì)催生新的創(chuàng)造力,這是我們?cè)谥R(shí)壓縮過(guò)程中必須承擔(dān)的代價(jià)。
此處需要明確的是,知識(shí)沒有絕對(duì)真理。我們所有的知識(shí)都基于采樣,而采樣又基于特定的投影平面。因此,所有知識(shí)都存在邊界。人類的認(rèn)知邊界,在認(rèn)知發(fā)展的過(guò)程中不斷向外擴(kuò)展。我們需要回歸知識(shí)的底層第一性:不存在絕對(duì)正確的知識(shí),只存在明確的認(rèn)知范圍、范圍內(nèi)的投影面,以及投影面內(nèi)的相對(duì)真理。智能既壓縮,生成既理解。只有當(dāng)我們能夠生成信息時(shí),才能真正實(shí)現(xiàn)對(duì)知識(shí)的理解。
![]()
如何實(shí)現(xiàn)知識(shí)的有效傳遞知識(shí)的載體演變
知識(shí)載體主要分為三類,分別是規(guī)則、語(yǔ)言以及腦神經(jīng)(即直覺)。
規(guī)則的設(shè)計(jì)目的是便于衡量與傳播,因此必然具備極高的壓縮比,同時(shí)也存在明顯的知識(shí)損耗。比規(guī)則維度更高的知識(shí)載體是語(yǔ)言。語(yǔ)言的維度遠(yuǎn)高于規(guī)則。語(yǔ)言的高表達(dá)力使其具備了泛化與推理能力。比語(yǔ)言維度更高的知識(shí)載體,是高維本體,即人類的腦神經(jīng)。當(dāng)這些知識(shí)被轉(zhuǎn)化為語(yǔ)言時(shí),必然會(huì)產(chǎn)生損耗。
![]()
知識(shí)的傳播過(guò)程,本質(zhì)上是從腦神經(jīng),映射到語(yǔ)言,再映射到規(guī)則的過(guò)程。但腦神經(jīng)載體的最大局限是無(wú)法直接傳播。
人工智能的兩個(gè)流派,分別是符號(hào)主義與連接主義。符號(hào)主義的核心是學(xué)習(xí)規(guī)則體系,而連接主義則是模擬人類腦神經(jīng)的工作機(jī)制。
連接主義不再依賴人工定義規(guī)則,而是構(gòu)建高維特征空間。這便是機(jī)器學(xué)習(xí)的本質(zhì)。連接主義中一項(xiàng)關(guān)鍵技術(shù)是Embedding(向量化)。這首次將離散的文本詞匯映射為連續(xù)的可計(jì)算向量。語(yǔ)言的語(yǔ)義首次具備了可計(jì)算性。語(yǔ)言的核心在于Transformer架構(gòu)。能夠?qū)㈦x散的語(yǔ)言映射到更高維度的向量空間,把整句話表示為一個(gè)矩陣。語(yǔ)言處理從規(guī)則推導(dǎo)轉(zhuǎn)變?yōu)閿?shù)學(xué)計(jì)算。
Scaling Law的核心邏輯是:既然我們采用的是連接主義思路,那么模型規(guī)模越大,就像人腦神經(jīng)網(wǎng)絡(luò)一樣,其存儲(chǔ)容量和表達(dá)能力會(huì)呈指數(shù)級(jí)提升。每增加一個(gè)參數(shù),表達(dá)空間至少會(huì)成倍擴(kuò)展。我們不再需要像過(guò)去那樣,精心設(shè)計(jì)更完善、更精巧的規(guī)則,只需要提供足夠大的模型空間和足夠多的數(shù)據(jù)樣本,讓模型自主擬合出底層規(guī)律,使損失函數(shù)降到最低,實(shí)現(xiàn)最優(yōu)的信息壓縮。
語(yǔ)言為什么是AGI的開端?
我們前面已經(jīng)提道:語(yǔ)言的本質(zhì),是人類認(rèn)知的操作系統(tǒng)。語(yǔ)言是人類腦神經(jīng)活動(dòng)的一個(gè)降維鏡像。它把大腦中極其復(fù)雜、難以直接描述的神經(jīng)活動(dòng),轉(zhuǎn)化為一種可記錄、可沉淀、可表達(dá)、可計(jì)算、可推理的符號(hào)體系。
![]()
可以說(shuō),語(yǔ)言處在一個(gè)中間位置:規(guī)則是高度人工的,人腦是高度自然的,而語(yǔ)言正是人工與自然的交匯點(diǎn)。它既是思維的投影,也是交流的工具;更進(jìn)一步,語(yǔ)言是思維的腳手架。
正如哲學(xué)家所言:語(yǔ)言的邊界,就是我思考的邊界。通過(guò)語(yǔ)言,腦神經(jīng)活動(dòng)轉(zhuǎn)化為文字、進(jìn)行描述,傳遞給他人。由此,知識(shí)開始具備可積累、可沉淀、可推理的特性,能夠模擬大腦的思考過(guò)程。這就是語(yǔ)言的本質(zhì)。掌握語(yǔ)言,本質(zhì)上就是掌握了推理能力。這正是語(yǔ)言模型與以往模型最核心的區(qū)別。
語(yǔ)言模型帶來(lái)的另一個(gè)關(guān)鍵突破,是顯空間與隱空間的區(qū)分。我們的大腦可以理解為一個(gè)高維隱空間。而語(yǔ)言,就是這個(gè)高維隱空間對(duì)應(yīng)的顯空間。人類所有的交互、討論、溝通、學(xué)習(xí),本質(zhì)上都是:將個(gè)人大腦的隱空間坍縮為顯空間,再通過(guò)語(yǔ)言把顯空間傳遞給他人,對(duì)方再將其升維重構(gòu)為自身的隱空間。語(yǔ)言真正實(shí)現(xiàn)了兩個(gè)高維認(rèn)知空間的映射與交流。
綜上,今天大語(yǔ)言模型能夠成為AGI開端,本質(zhì)源于語(yǔ)言本身的特性:它是大腦的映射,具備思考能力,更具備推理能力。大語(yǔ)言模型對(duì)世界的建模,本質(zhì)上包含三個(gè)環(huán)節(jié):
第一環(huán):預(yù)訓(xùn)練——為知識(shí)建模。把人類世界的全部知識(shí),極致壓縮到基座模型中。
第二環(huán):為生產(chǎn)力建模——模型的“解壓”。我們把知識(shí)“壓縮”進(jìn)模型,目的是“解壓”與預(yù)測(cè)——用壓縮后的知識(shí),去預(yù)測(cè)物理世界的演化,最終轉(zhuǎn)化為現(xiàn)實(shí)生產(chǎn)力。
第三環(huán):為學(xué)習(xí)建模——在觀測(cè)視角中尋找最優(yōu)。
因此,預(yù)訓(xùn)練模型的本質(zhì)可以總結(jié)為:預(yù)測(cè)即生成,生成即理解。
機(jī)器無(wú)法直接高效觀測(cè)物理世界,于是以人類為媒介:人類數(shù)千年與世界交互、觀察、沉淀,形成書籍、文字與知識(shí)體系。我們的工作,就是把這些人類知識(shí)極致壓縮,在向量空間中訓(xùn)練,使其具備遷移與泛化能力。大模型的核心邏輯,就是預(yù)測(cè)下一個(gè)詞。基于前文不斷預(yù)測(cè)后續(xù)token,最小化預(yù)測(cè)誤差,當(dāng)這個(gè)過(guò)程被放大到極致,就涌現(xiàn)出了智能。
基座模型最本質(zhì)的邏輯是什么?
大語(yǔ)言模型成為AGI開端的根本原因?
文章內(nèi)容僅為課程1/10,請(qǐng)前往APP看課
![]()
CEO、高管一定要有大模型思維
我們從圍棋盤上的勝負(fù),一路追問(wèn)至語(yǔ)言與智能的本質(zhì)。現(xiàn)在,帶上這套全新的“大模型思維”,回到商業(yè)的戰(zhàn)場(chǎng)。你會(huì)發(fā)現(xiàn)它不僅僅是技術(shù)原理,更是一套即將重塑所有競(jìng)爭(zhēng)規(guī)則的商業(yè)底層操作系統(tǒng)。
從確定化管理到“概率管理”
我們反復(fù)強(qiáng)調(diào)AI思維的本質(zhì)與第一性原理,核心就是要明確:AI的核心是不確定性,不確定性孕育智能,因此AI思維本質(zhì)上是概率導(dǎo)向的。
必須清晰地認(rèn)識(shí)到,確定性已不復(fù)存在,不能再用程序思維去解決當(dāng)下的問(wèn)題。在傳統(tǒng)模式中,我們編寫代碼追求絕對(duì)確定性,絕對(duì)確定性必然導(dǎo)致缺乏泛化能力。缺乏泛化能力就無(wú)法產(chǎn)生智能,這是一條無(wú)法突破的局限路徑。
打個(gè)比方,傳統(tǒng)企業(yè)思維模式如同精密的機(jī)械鐘表,每一步運(yùn)行都有強(qiáng)烈的業(yè)務(wù)邏輯聯(lián)動(dòng),一旦設(shè)計(jì)成型,運(yùn)行軌跡便固定不變。企業(yè)運(yùn)營(yíng)的所有環(huán)節(jié)都遵循百分之百可執(zhí)行的標(biāo)準(zhǔn)(SOP)。當(dāng)前,這種確定性邏輯不再適用了,它脫離了AI思維的核心內(nèi)涵。這也解釋了為何當(dāng)概率思維融入確定性的SOP體系時(shí),組織會(huì)天然產(chǎn)生排異反應(yīng)。
每一位企業(yè)家的思考鏈路,都必須從機(jī)械確定論轉(zhuǎn)變?yōu)楦怕收摚?b>通過(guò)調(diào)整參數(shù)、優(yōu)化概率來(lái)實(shí)現(xiàn)預(yù)期結(jié)果,既要保證一定的確定性,又要保留創(chuàng)造力。
工業(yè)時(shí)代的贏家是“控制狂”;AI時(shí)代的贏家是“概率管理大師”。拿提示詞(prompt)舉例:若將提示詞的定義得過(guò)于細(xì)致、流程設(shè)計(jì)過(guò)長(zhǎng),甚至通過(guò)填表式的方式限定輸出結(jié)果,用確定性流程去控制概率,輸出結(jié)果必然難以達(dá)到預(yù)期。因?yàn)檫^(guò)度細(xì)分的限制,割裂了其泛化能力,使其只能機(jī)械執(zhí)行既定指令,無(wú)法發(fā)揮智能的價(jià)值。
概率管理的核心邏輯是,通過(guò)調(diào)整方向、引導(dǎo)趨勢(shì)、聚焦核心,真正實(shí)現(xiàn)概率導(dǎo)向的智能應(yīng)用,既能保證創(chuàng)造力的發(fā)揮,也能收獲超出預(yù)期的成果。
智力通縮與杰文斯悖論
另一個(gè)需要重點(diǎn)關(guān)注的商業(yè)邏輯,是智力通縮與杰文斯悖論。許多人擔(dān)憂AI模型成本過(guò)高,大規(guī)模使用會(huì)導(dǎo)致虧損,但事實(shí)上,token的綜合成本較行業(yè)初期已下降近萬(wàn)倍。
過(guò)去,專家智力如同奢侈品,企業(yè)會(huì)盡量減少使用。當(dāng)下,智力已如同電力一般,Token成本的下降速度遠(yuǎn)超傳統(tǒng)摩爾定律,這是不可逆轉(zhuǎn)的趨勢(shì)。很多人過(guò)度關(guān)注模型降價(jià),但模型降價(jià)是模型公司的核心任務(wù),對(duì)于企業(yè)家而言,更應(yīng)關(guān)注模型的性價(jià)比——若能跑通一個(gè)應(yīng)用場(chǎng)景,實(shí)現(xiàn)性能的提升,便無(wú)需擔(dān)憂成本問(wèn)題,因?yàn)閠oken價(jià)格會(huì)持續(xù)下降,每半年至一年就會(huì)有顯著變化,屆時(shí)企業(yè)的增長(zhǎng)飛輪便會(huì)自然運(yùn)轉(zhuǎn)。
企業(yè)的核心競(jìng)爭(zhēng)力,在于消耗智能、轉(zhuǎn)化智能的能力。誰(shuí)能率先將智力轉(zhuǎn)化為高價(jià)值的用戶體驗(yàn),誰(shuí)就能成為行業(yè)贏家。當(dāng)前不應(yīng)過(guò)度關(guān)注成本,而應(yīng)聚焦于智能的上限與價(jià)值的上限。
![]()
核心資產(chǎn):場(chǎng)景>數(shù)據(jù)
除此之外,商業(yè)領(lǐng)域的另一重大思維轉(zhuǎn)變,在于資產(chǎn)定義的重構(gòu)。傳統(tǒng)認(rèn)知中,數(shù)據(jù)被視為核心資產(chǎn),許多企業(yè)宣稱自身?yè)碛写罅繑?shù)據(jù),并認(rèn)為將這些數(shù)據(jù)用于模型訓(xùn)練就能形成自身優(yōu)勢(shì)。但客觀而言,當(dāng)前市場(chǎng)上99%的企業(yè)數(shù)據(jù)都屬于無(wú)效數(shù)據(jù)。
很多企業(yè)擔(dān)憂數(shù)據(jù)上傳后被竊取——事實(shí)上,很多數(shù)據(jù)只是業(yè)務(wù)流程中的日志記錄,一旦業(yè)務(wù)流程發(fā)生變化,這些數(shù)據(jù)便失去了存在意義。若將數(shù)據(jù)視為資產(chǎn),首先要明確這些數(shù)據(jù)是否能轉(zhuǎn)化為生產(chǎn)力;若不能,其所謂的“資產(chǎn)價(jià)值”便無(wú)從談起。
當(dāng)前,真正具備價(jià)值的數(shù)據(jù)僅存在于少數(shù)場(chǎng)景,例如抖音的推薦算法、百度的搜索體系等。絕大多數(shù)對(duì)數(shù)據(jù)安全過(guò)度敏感的企業(yè),其數(shù)據(jù)本身往往無(wú)法被有效利用。利用牛頓的實(shí)驗(yàn)筆記和數(shù)據(jù),能得出愛因斯坦的理論結(jié)論嗎?在相對(duì)論時(shí)代,過(guò)度留存“牛頓”的實(shí)驗(yàn)數(shù)據(jù),并無(wú)實(shí)際價(jià)值。
與其擔(dān)憂數(shù)據(jù)被竊取,不如加快數(shù)據(jù)的應(yīng)用。企業(yè)不應(yīng)有數(shù)據(jù)囤積癖,不應(yīng)將歷史數(shù)據(jù)視為不可突破的護(hù)城河。我們沒法用馬車的數(shù)據(jù)訓(xùn)練出特斯拉一樣,傳統(tǒng)數(shù)據(jù)的清洗成本、存儲(chǔ)成本,甚至?xí)蔀槠髽I(yè)發(fā)展的阻礙,堪稱“反向潤(rùn)滑油”,固化企業(yè)思維、阻礙企業(yè)創(chuàng)新。
數(shù)據(jù)的定義正在快速迭代,唯有應(yīng)用場(chǎng)景是相對(duì)穩(wěn)定的核心。只要定義出具體的應(yīng)用場(chǎng)景(如同圍棋的棋盤)和價(jià)值評(píng)判標(biāo)準(zhǔn)(如同圍棋的勝負(fù)規(guī)則,即獎(jiǎng)勵(lì)模型),數(shù)據(jù)便可以源源不斷地產(chǎn)生。
總之,在應(yīng)用初期,無(wú)需過(guò)度考慮數(shù)據(jù)安全,核心在于誰(shuí)能率先跑通場(chǎng)景、啟動(dòng)增長(zhǎng)飛輪,待企業(yè)發(fā)展到一定規(guī)模、數(shù)據(jù)產(chǎn)生實(shí)際價(jià)值后,再考慮數(shù)據(jù)安全防護(hù),才是合理的發(fā)展路徑。誰(shuí)能掌握新數(shù)據(jù)的生產(chǎn)場(chǎng)景,誰(shuí)能在初期啟動(dòng)增長(zhǎng)飛輪,誰(shuí)就能定義行業(yè)的未來(lái)。
![]()
后記:
我的觀點(diǎn)未必完全正確,但核心目的是為大家植入一種新的思維提示,引導(dǎo)大家建立對(duì)AI思維的認(rèn)知與感知。如果我們僅學(xué)習(xí)提示詞寫法、工作流用法、某個(gè)軟件的操作技巧,這些內(nèi)容每六個(gè)月就可能有90%失效。既然我們處于混沌學(xué)習(xí)的場(chǎng)景中,就應(yīng)采用混沌的核心方法——摒棄歸納法,堅(jiān)持演繹法,深入理解底層邏輯,將這種思維能力內(nèi)化于心。希望每一位參與者都能從中獲得啟發(fā),實(shí)現(xiàn)自身對(duì)未來(lái)知識(shí)判斷、知識(shí)加工方式的一點(diǎn)點(diǎn)轉(zhuǎn)變。當(dāng)前,我們正處于一個(gè)“電燈取代蠟燭”的時(shí)代,從“蠟燭思維”轉(zhuǎn)變?yōu)椤半姛羲季S”,是必修課。
從管理層來(lái)看,CEO如何轉(zhuǎn)變?
為什么組織不應(yīng)該是機(jī)械體,應(yīng)該是生物體?
文章內(nèi)容僅為課程1/10,請(qǐng)前往APP看課
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.