網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

還把“歷史數(shù)據(jù)”當(dāng)護(hù)城河？靠牛頓的筆記算不出相對(duì)論

2026-03-25 20:32:32　來(lái)源: 混沌學(xué)園官方

北京舉報(bào)

分享至

2016年，圍棋天才李世石惜敗AlphaGo，但他使出“神之一手”，被譽(yù)為人類智慧最后的榮光。僅僅一年后，AlphaGo Zero以100:0的絕對(duì)碾壓，將曾戰(zhàn)勝李世石的“前輩”徹底擊潰。更令人震驚的是，它達(dá)到這個(gè)水平只用了3天，沒學(xué)習(xí)任何一盤人類棋譜。

這背后揭示了一個(gè)殘酷的真相：“人類引以為傲的千年經(jīng)驗(yàn)，在真正的智能進(jìn)化面前，可能非但不是資產(chǎn)，反而成了認(rèn)知的枷鎖。”元理智能創(chuàng)始人張帆一語(yǔ)道破。張帆，前智譜AI COO，親歷百模大戰(zhàn)，曾主導(dǎo)數(shù)十億大模型項(xiàng)目落地。如今再創(chuàng)業(yè)，目標(biāo)是解決AI時(shí)代最難、也最關(guān)鍵的命題：如何將智能轉(zhuǎn)化為核心生產(chǎn)力？

今天，智能仍在一路狂飆。你剛學(xué)會(huì)的應(yīng)用，下個(gè)月可能就過(guò)時(shí)了；你剛掌握的工具，下一波迭代又來(lái)了。還有什么能抓住的嗎？張帆老師提供了一個(gè)思路，那就是掌握“大模型思維”。它不是又一個(gè)時(shí)髦詞匯，而是一種全新的認(rèn)知范式：

別人還在優(yōu)化現(xiàn)有知識(shí)，它已直指事物本質(zhì)規(guī)律；

別人還在追求確定性，它已精通概率與不確定性的藝術(shù)；

別人還在囤積數(shù)據(jù)，它已懂得真正的價(jià)值在于智能的轉(zhuǎn)化與釋放。

“工業(yè)時(shí)代的贏家是‘控制者’，”張帆說(shuō)，“而今天的贏家，是那些掌握大模型思維、懂得概率管理的人。”你企業(yè)的核心競(jìng)爭(zhēng)力，不再是你擁有多少數(shù)據(jù)，而在于你能消耗多少智能、轉(zhuǎn)化多少智能。這將是未來(lái)十年最殘酷也最公平的競(jìng)爭(zhēng)。

上周六，張帆老師在混沌APP的深度大課《大模型時(shí)代的第一性原理：智能涌現(xiàn)的底層邏輯與商業(yè)范式重塑》中，從三場(chǎng)人機(jī)對(duì)弈出發(fā)，剖析智能進(jìn)化的底層邏輯，最終聚焦于每個(gè)企業(yè)與個(gè)人最迫切的課題：如何重塑思維，抓住未來(lái)。

本文為課程內(nèi)容精編，僅占全部?jī)?nèi)容十分之一，完整版在混沌APP。

人機(jī)對(duì)弈，智能進(jìn)化

回顧過(guò)去兩三年，技能迭代速度極為迅速，也因此引發(fā)了各類焦慮情緒。我認(rèn)為在高速變化的時(shí)代，更為重要的是找到其中不變的核心要素，那就是大模型思維。什么是大模型思維？我們可以在智能領(lǐng)域找一個(gè)合適的研究樣本。機(jī)器誕生以來(lái)，人類就一直在探索如何讓機(jī)器與人進(jìn)行對(duì)弈，我們將以此為人機(jī)博弈最小樣本，梳理智能發(fā)展的簡(jiǎn)要?dú)v程。

第一個(gè)階段，“深藍(lán)”擊敗卡斯帕羅夫

1997年的人機(jī)對(duì)弈，“深藍(lán)”最終擊敗卡斯帕羅夫，是機(jī)器首次在高級(jí)博弈領(lǐng)域戰(zhàn)勝人類世界冠軍。卡斯帕羅夫當(dāng)時(shí)也難以接受機(jī)器能夠擊敗自己的事實(shí)，甚至懷疑機(jī)器背后有人在操控。

“深藍(lán)”背后的核心原理，是符號(hào)主義的巔峰應(yīng)用，其本質(zhì)邏輯是“規(guī)則+窮舉”。具體而言，就是將人類棋手的歷史經(jīng)驗(yàn)總結(jié)為一系列下棋博弈的規(guī)則，再讓計(jì)算機(jī)以每秒2億次的速度進(jìn)行推演。這一過(guò)程中也融入了剪枝邏輯，確保計(jì)算機(jī)無(wú)需嘗試所有棋局，以高效方式完成博弈。

“深藍(lán)”擊敗人類冠軍的消息令人震驚，當(dāng)時(shí)大家普遍認(rèn)為，圍棋很快也會(huì)被機(jī)器攻克。然而，從國(guó)際象棋被攻克到圍棋被攻克，機(jī)器用了20年時(shí)間。核心原因在于“維度的詛咒”。圍棋與國(guó)際象棋屬于完全不同維度的搜索空間。圍棋棋盤為19x19規(guī)格，其搜索空間約達(dá)到10的170次方。在這20年間，即便計(jì)算機(jī)性能提升1萬(wàn)倍，面對(duì)圍棋極為龐大的搜索空間，也只是杯水車薪，無(wú)法從根本上解決問(wèn)題。

第二個(gè)階段，“神奇的37手”和“神奇的78手”

進(jìn)入第二個(gè)階段，人機(jī)博弈的核心邏輯從“暴力計(jì)算”轉(zhuǎn)向“數(shù)據(jù)暴力”。彼時(shí)的機(jī)器采用了神經(jīng)網(wǎng)絡(luò)技術(shù)，不再依賴傳統(tǒng)的規(guī)則邏輯，而是模擬人類的直覺，通過(guò)神經(jīng)網(wǎng)絡(luò)，將歷史上所有人類圍棋棋局作為訓(xùn)練數(shù)據(jù)，讓機(jī)器形成降維表達(dá)，以類似人類直覺的方式作出判斷。

正是基于這一邏輯，2016年，機(jī)器擊敗了當(dāng)時(shí)的圍棋世界冠軍李世石。李世石的心態(tài)從對(duì)弈前的輕蔑，逐漸轉(zhuǎn)變?yōu)閷?duì)弈后的絕望，因?yàn)樗庾R(shí)到，自己已無(wú)法戰(zhàn)勝眼前的機(jī)器對(duì)手。

這一局精彩的對(duì)弈，出現(xiàn)了兩個(gè)極具標(biāo)志性的節(jié)點(diǎn)：“神奇的37手”和“神奇的78手”。

在37手時(shí)，AI走出了一步超出人類預(yù)期的棋。當(dāng)時(shí)的直播解說(shuō)甚至懷疑，是擺棋人員出現(xiàn)了失誤，認(rèn)為這一步不符合圍棋邏輯，甚至可能是程序漏洞。這步棋在短期局面中造成一定損失，但隨著棋局的推進(jìn)，AI最終贏得了這一局。事后復(fù)盤發(fā)現(xiàn)，AI放棄了局部最優(yōu)解，轉(zhuǎn)而追求全局勝率的最大化。這一現(xiàn)象讓人類感到震驚：機(jī)器首次在遵循人類規(guī)則的基礎(chǔ)上，突破了人類規(guī)則的局限，走出了人類認(rèn)知邊界之外的棋法。

78手同樣具有重要意義。在78手這一節(jié)點(diǎn)，李世石下出了一個(gè)完全超出機(jī)器預(yù)判范圍的位置，導(dǎo)致其無(wú)法進(jìn)行有效推理。機(jī)器在這一步之后出現(xiàn)明顯混亂，并在隨后數(shù)十步內(nèi)持續(xù)處于失序狀態(tài)。因此，這一手被不少人稱為“人類最后的榮光”。

這一現(xiàn)象背后的邏輯，與AlphaGo的核心架構(gòu)密切相關(guān)。AlphaGo基于蒙特卡洛樹搜索框架。其中最具價(jià)值的部分，是基于人類三千萬(wàn)局棋譜訓(xùn)練得到的兩個(gè)核心網(wǎng)絡(luò)：一個(gè)是策略網(wǎng)絡(luò)，一個(gè)是價(jià)值網(wǎng)絡(luò)。

策略網(wǎng)絡(luò)的作用，是在當(dāng)前盤面下篩選出少數(shù)具有潛在價(jià)值的落子點(diǎn)。通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方式進(jìn)行大規(guī)模剪枝，大幅縮窄搜索空間。在鎖定少數(shù)高價(jià)值點(diǎn)位后，再由蒙特卡洛樹搜索進(jìn)行深度推演。每一步落子后，價(jià)值網(wǎng)絡(luò)會(huì)對(duì)當(dāng)前局勢(shì)進(jìn)行評(píng)估，判斷己方獲勝概率是上升還是下降。

李世石78手為何能夠奏效？因?yàn)槠洳呗跃W(wǎng)絡(luò)本質(zhì)上建立在人類經(jīng)驗(yàn)之上，它會(huì)對(duì)各個(gè)點(diǎn)位的概率進(jìn)行評(píng)估，判斷人類在不同位置的落子可能性。而李世石下出的，是一個(gè)在模型評(píng)估中概率極低、幾乎不在常規(guī)考慮范圍內(nèi)的落子，完全超出了策略網(wǎng)絡(luò)預(yù)設(shè)的搜索范圍，從而直接打亂了機(jī)器的整體決策節(jié)奏。

從“深藍(lán)”到AlphaGo，關(guān)鍵變化在于：前者站在人類顯性規(guī)則的肩膀上，由人類將經(jīng)驗(yàn)提煉為固定規(guī)則；后者則將顯性規(guī)則轉(zhuǎn)化為基于海量棋譜的直覺式判斷，并以此戰(zhàn)勝人類。盡管最終AlphaGo以4比1戰(zhàn)勝李世石，在這一階段，人類仍具備與機(jī)器博弈，甚至局部突破的能力。

第三個(gè)階段，AlphaGo Zero

2017年，更具顛覆性的形態(tài)出現(xiàn)：AlphaGo Zero。其核心邏輯是完全不再依賴人類知識(shí)，僅通過(guò)自我對(duì)弈完成學(xué)習(xí)。自我對(duì)局、自我總結(jié)，從零基礎(chǔ)開始，完全依靠自我博弈完成智能進(jìn)化。

一個(gè)通過(guò)自我博弈進(jìn)行訓(xùn)練的模型，僅用三天時(shí)間，便以100:0的絕對(duì)優(yōu)勢(shì)擊敗了曾戰(zhàn)勝李世石的AlphaGo Lee；在后續(xù)幾天的訓(xùn)練中，戰(zhàn)斗力持續(xù)攀升，直至第40天，該模型的戰(zhàn)斗力基本超越了所有現(xiàn)有模型。人類積累上千年的圍棋經(jīng)驗(yàn)，在模型的自我博弈訓(xùn)練面前，被徹底超越。

從算力消耗來(lái)看，AlphaGo Lee的訓(xùn)練需要由1200個(gè)CPU與176個(gè)GPU組成的龐大算力集群。而采用自我博弈模式的AlphaGo Zero，僅需4個(gè)TPU即可完成訓(xùn)練。兩者的算力消耗不在同一維度。這一現(xiàn)象表明，人類積累的經(jīng)驗(yàn)不僅未對(duì)模型訓(xùn)練起到正向推動(dòng)作用，反而可能成為一種負(fù)擔(dān)，限制了模型的發(fā)展空間。

數(shù)據(jù)層面的差異同樣顯著：AlphaGo Lee的訓(xùn)練依賴3000萬(wàn)份人類圍棋棋譜。而Alpha Go Zero的訓(xùn)練未使用任何一份棋譜、任何一點(diǎn)人類圍棋經(jīng)驗(yàn)。

結(jié)合ELO評(píng)分來(lái)看，人類棋手的最高峰值約為3800分，AlphaGo Lee的評(píng)分約為4000分。但在AlphaGo Zero面前，人類智慧的優(yōu)勢(shì)似乎完全消失，其ELO評(píng)分直接突破5000分。這也印證了柯潔的觀點(diǎn)：在AlphaGo Zero這類模型面前，人類幾乎不可能再取得圍棋對(duì)戰(zhàn)的勝利。

這一現(xiàn)象背后的核心邏輯是：人類長(zhǎng)期被自身積累的經(jīng)驗(yàn)束縛，陷入了局部最優(yōu)解的困境。而AI模型無(wú)需依賴人類經(jīng)驗(yàn)，僅通過(guò)“自我對(duì)戰(zhàn)—結(jié)果反饋—經(jīng)驗(yàn)總結(jié)”的閉環(huán)模式，在三天內(nèi)完成了490萬(wàn)盤圍棋對(duì)戰(zhàn)的學(xué)習(xí)，積累了遠(yuǎn)超人類的圍棋知識(shí)。

AI時(shí)代最核心的思維方向

總結(jié)來(lái)說(shuō)，圍棋博弈的對(duì)戰(zhàn)歷史，正是人類對(duì)智能與知識(shí)認(rèn)知不斷迭代的過(guò)程：最初，我們把人類智慧視為至高無(wú)上；后來(lái)，我們基于人類規(guī)則研究，卻發(fā)現(xiàn)知識(shí)本身存在偏差與局限；于是轉(zhuǎn)向依靠海量人類數(shù)據(jù)訓(xùn)練模型，從“計(jì)算暴力”走向“數(shù)據(jù)暴力”，但仍未跳出人類認(rèn)知框架；最終，我們意識(shí)到，人類數(shù)據(jù)并非必需，AI可以完全脫離人類經(jīng)驗(yàn)，實(shí)現(xiàn)自我迭代與突破。這一過(guò)程，本質(zhì)是對(duì)人類數(shù)據(jù)價(jià)值的不斷反思與重估。

什么是AI時(shí)代最核心的思維方向？

如何學(xué)習(xí)AI思維？

文章僅為課程1/10，請(qǐng)前往APP看課

智能的本質(zhì)

當(dāng)下AI的核心邏輯，是探尋事物本質(zhì)規(guī)律，而非僅僅優(yōu)化人類現(xiàn)有知識(shí)。人類數(shù)據(jù)自帶偏見，在不同階段，它可能是資產(chǎn)，也可能是噪音，甚至是認(rèn)知枷鎖。由此，我們必須重新思考三個(gè)關(guān)鍵問(wèn)題：如何定義智能、如何定義知識(shí)、如何有效沉淀。這正是AI時(shí)代最核心的思維方向。

知識(shí)的本質(zhì)即“有損壓縮”。

目前學(xué)界較為共識(shí)的結(jié)論是，全宇宙的原子總數(shù)約為10的80次方。若宇宙是可計(jì)算系統(tǒng)，其求解空間之大，人類永遠(yuǎn)無(wú)法窮盡。在龐大的搜索空間中，剔除無(wú)價(jià)值的冗余信息，剔除所有無(wú)意義的噪點(diǎn)，僅保留少量極具價(jià)值的核心內(nèi)容——“遺忘”，這就是知識(shí)的核心邏輯。

知識(shí)并非對(duì)世界的簡(jiǎn)單復(fù)制，而是對(duì)世界抽象后的高維投影，“做減法”才是知識(shí)的本質(zhì)所在。這也印證了“全知即無(wú)知”的觀點(diǎn)：當(dāng)我們擁有所有可能的答案時(shí)，反而無(wú)法獲得真正有價(jià)值的答案。信息的價(jià)值不在于數(shù)量的多少，而在于其有序性。

“壓縮機(jī)理解”正是解決這一問(wèn)題的關(guān)鍵。當(dāng)我們對(duì)同一事物進(jìn)行大規(guī)模采樣，便會(huì)獲得大量的觀測(cè)數(shù)據(jù)。這些觀測(cè)數(shù)據(jù)本身并非知識(shí)，只是對(duì)終極真理的采樣結(jié)果。源于對(duì)這些采樣數(shù)據(jù)的“壓縮機(jī)理解”，將大量分散的觀測(cè)結(jié)果歸納為一套簡(jiǎn)潔的規(guī)則，且這套規(guī)則能夠預(yù)判未來(lái)的采樣結(jié)果，此時(shí)，這些規(guī)則便成了知識(shí)。

用一個(gè)簡(jiǎn)單案例理解知識(shí)的形成：盛滿水的杯子倒置，水必然灑出，重復(fù)多次結(jié)果始終一致。通過(guò)反復(fù)觀察采樣，會(huì)歸納出結(jié)論——盛水的杯子倒置會(huì)灑水，這便是知識(shí)。知識(shí)具備穩(wěn)定可驗(yàn)證性，通過(guò)壓縮后的規(guī)律，我們能預(yù)判不同顏色、不同樣式水杯倒置的結(jié)果，這就是知識(shí)在大腦中的泛化。我們不必記住每一次倒水的細(xì)節(jié)，只需抽象出通用規(guī)則，就能在未知場(chǎng)景中做出預(yù)判。

知識(shí)的價(jià)值不在于驗(yàn)證觀測(cè)對(duì)象的絕對(duì)真實(shí)性，而在于通過(guò)對(duì)信息的歸納，形成可預(yù)測(cè)的有序規(guī)律。例如，我們無(wú)需實(shí)際觸摸開水，便能通過(guò)已有的知識(shí)預(yù)判“觸摸開水會(huì)被燙傷”這一結(jié)果。這種無(wú)需直接采樣便能實(shí)現(xiàn)的預(yù)判，正是知識(shí)的核心功能。

頓悟：損失值下降與泛化突變

接下來(lái)我們探討：觀測(cè)到的信息如何轉(zhuǎn)化為知識(shí)？從數(shù)學(xué)與人類認(rèn)知的角度來(lái)看，這一過(guò)程可概括為“頓悟”。比如學(xué)騎自行車，初學(xué)者可能多次摔倒，積累了大量嘗試經(jīng)驗(yàn)，卻始終無(wú)法掌握平衡；直到某一時(shí)刻，突然突破瓶頸，掌握了騎行技巧。這種“豁然開朗”的瞬間便是頓悟。

我們可以通過(guò)“損失值（loss）”來(lái)理解這一過(guò)程：損失值本質(zhì)上是對(duì)觀測(cè)樣本預(yù)測(cè)準(zhǔn)確性的量化評(píng)估。在未提煉出規(guī)律之前，我們的認(rèn)知往往處于“死記硬背”的階段，本質(zhì)上是對(duì)觀測(cè)樣本的機(jī)械記錄，而非知識(shí)的形成。

隨著觀測(cè)樣本的不斷積累、泛化范圍的持續(xù)擴(kuò)大，當(dāng)積累達(dá)到一定閾值時(shí)，便會(huì)出現(xiàn)“頓悟”——比如在多次計(jì)算各類乘法后，突然領(lǐng)悟到“九九乘法表”的規(guī)律。這一規(guī)律能將上千個(gè)乘法樣本壓縮為一套簡(jiǎn)潔的規(guī)則，不僅能解釋已有的所有樣本，還能精準(zhǔn)預(yù)測(cè)第1001個(gè)乃至更多未知的乘法結(jié)果。與機(jī)械記憶上千個(gè)樣本相比，九九乘法表的存儲(chǔ)規(guī)模極小，而泛化能力卻極大提升。

頓悟，本質(zhì)上就是損失值的快速下降——當(dāng)規(guī)律被提煉出來(lái)的瞬間，原本無(wú)法預(yù)測(cè)的場(chǎng)景變得可預(yù)測(cè)，原本零散的觀測(cè)樣本被整合為有序的知識(shí)。這也正是知識(shí)的本質(zhì)：通過(guò)對(duì)觀測(cè)采樣的壓縮與規(guī)律提煉，實(shí)現(xiàn)對(duì)未知場(chǎng)景的精準(zhǔn)預(yù)判。而在人工智能領(lǐng)域，這一突變體現(xiàn)為損失值（loss）的急劇下降；在人類學(xué)習(xí)過(guò)程中，則表現(xiàn)為突然掌握認(rèn)知規(guī)律、理解事物本質(zhì)的狀態(tài)。

所有知識(shí)的頓悟本質(zhì)上都會(huì)帶來(lái)泛化能力的提升——頓悟前僅能解決已知的舊問(wèn)題，頓悟后則能夠解決未知的新問(wèn)題。

智能的不可能三角

隨之而來(lái)的問(wèn)題是：知識(shí)的壓縮是否存在衡量標(biāo)準(zhǔn)？如何衡量其優(yōu)劣？這就需要建立一套針對(duì)智能的衡量標(biāo)準(zhǔn)，而智能的衡量存在一個(gè)“不可能三角”。

智能的不可能三角包含三個(gè)核心維度：其一為壓縮率，即把龐大的知識(shí)體量壓縮至多大范圍；其二為損耗率，即知識(shí)壓縮后能否還原，以及還原后的結(jié)果與原始信息的預(yù)測(cè)準(zhǔn)確度；其三為算力損耗，包括知識(shí)壓縮過(guò)程與解壓（應(yīng)用）過(guò)程中的算力消耗。

類比將4K高清照片壓縮至720P的過(guò)程。在傳統(tǒng)的解壓方式中，通常采用插值法，這種方式雖能擴(kuò)大圖像尺寸，但會(huì)導(dǎo)致圖像模糊，即損耗率升高。

人類的大腦（當(dāng)前大模型的模式也類似）“解壓”的方式則不同：若給予人類一張低分辨率照片，人類大腦的“腦補(bǔ)”過(guò)程并非簡(jiǎn)單的插值，而是將自身對(duì)物理世界的經(jīng)驗(yàn)認(rèn)知映射到圖像中。還原后的圖像分辨率優(yōu)于傳統(tǒng)插值方式，但還原過(guò)程中補(bǔ)充的細(xì)節(jié)可能存在偏差，不過(guò)這種偏差并不影響整體認(rèn)知——這正是損耗的本質(zhì)：知識(shí)壓縮過(guò)程中，必然會(huì)丟棄部分信息，即“遺忘”，我們通過(guò)遺忘被判定為“噪聲”的信息，實(shí)現(xiàn)知識(shí)的壓縮。這種“遺忘”并非錯(cuò)誤，而是高維信息向低維信息轉(zhuǎn)化過(guò)程中必然的維度簡(jiǎn)化；而后續(xù)的“腦補(bǔ)”（即大模型的生成或人類的聯(lián)想），本質(zhì)上就是對(duì)壓縮后信息的還原，這一過(guò)程所產(chǎn)生的偏差，即我們所說(shuō)的“幻覺”。

簡(jiǎn)單來(lái)說(shuō)，將低分辨率的信息通過(guò)主觀補(bǔ)全轉(zhuǎn)化為高分辨率信息時(shí)，其中會(huì)產(chǎn)生原本不存在的信息，這些被創(chuàng)造出來(lái)的信息即為幻覺。由此可見，只要存在知識(shí)，就必然伴隨幻覺，這是知識(shí)的本質(zhì)屬性。而這種信息補(bǔ)全過(guò)程中產(chǎn)生的差值，同時(shí)也會(huì)催生新的創(chuàng)造力，這是我們?cè)谥R(shí)壓縮過(guò)程中必須承擔(dān)的代價(jià)。

此處需要明確的是，知識(shí)沒有絕對(duì)真理。我們所有的知識(shí)都基于采樣，而采樣又基于特定的投影平面。因此，所有知識(shí)都存在邊界。人類的認(rèn)知邊界，在認(rèn)知發(fā)展的過(guò)程中不斷向外擴(kuò)展。我們需要回歸知識(shí)的底層第一性：不存在絕對(duì)正確的知識(shí)，只存在明確的認(rèn)知范圍、范圍內(nèi)的投影面，以及投影面內(nèi)的相對(duì)真理。智能既壓縮，生成既理解。只有當(dāng)我們能夠生成信息時(shí)，才能真正實(shí)現(xiàn)對(duì)知識(shí)的理解。

如何實(shí)現(xiàn)知識(shí)的有效傳遞知識(shí)的載體演變

知識(shí)載體主要分為三類，分別是規(guī)則、語(yǔ)言以及腦神經(jīng)（即直覺）。

規(guī)則的設(shè)計(jì)目的是便于衡量與傳播，因此必然具備極高的壓縮比，同時(shí)也存在明顯的知識(shí)損耗。比規(guī)則維度更高的知識(shí)載體是語(yǔ)言。語(yǔ)言的維度遠(yuǎn)高于規(guī)則。語(yǔ)言的高表達(dá)力使其具備了泛化與推理能力。比語(yǔ)言維度更高的知識(shí)載體，是高維本體，即人類的腦神經(jīng)。當(dāng)這些知識(shí)被轉(zhuǎn)化為語(yǔ)言時(shí)，必然會(huì)產(chǎn)生損耗。

知識(shí)的傳播過(guò)程，本質(zhì)上是從腦神經(jīng)，映射到語(yǔ)言，再映射到規(guī)則的過(guò)程。但腦神經(jīng)載體的最大局限是無(wú)法直接傳播。

人工智能的兩個(gè)流派，分別是符號(hào)主義與連接主義。符號(hào)主義的核心是學(xué)習(xí)規(guī)則體系，而連接主義則是模擬人類腦神經(jīng)的工作機(jī)制。

連接主義不再依賴人工定義規(guī)則，而是構(gòu)建高維特征空間。這便是機(jī)器學(xué)習(xí)的本質(zhì)。連接主義中一項(xiàng)關(guān)鍵技術(shù)是Embedding（向量化）。這首次將離散的文本詞匯映射為連續(xù)的可計(jì)算向量。語(yǔ)言的語(yǔ)義首次具備了可計(jì)算性。語(yǔ)言的核心在于Transformer架構(gòu)。能夠?qū)㈦x散的語(yǔ)言映射到更高維度的向量空間，把整句話表示為一個(gè)矩陣。語(yǔ)言處理從規(guī)則推導(dǎo)轉(zhuǎn)變?yōu)閿?shù)學(xué)計(jì)算。

Scaling Law的核心邏輯是：既然我們采用的是連接主義思路，那么模型規(guī)模越大，就像人腦神經(jīng)網(wǎng)絡(luò)一樣，其存儲(chǔ)容量和表達(dá)能力會(huì)呈指數(shù)級(jí)提升。每增加一個(gè)參數(shù)，表達(dá)空間至少會(huì)成倍擴(kuò)展。我們不再需要像過(guò)去那樣，精心設(shè)計(jì)更完善、更精巧的規(guī)則，只需要提供足夠大的模型空間和足夠多的數(shù)據(jù)樣本，讓模型自主擬合出底層規(guī)律，使損失函數(shù)降到最低，實(shí)現(xiàn)最優(yōu)的信息壓縮。

語(yǔ)言為什么是AGI的開端？

我們前面已經(jīng)提道:語(yǔ)言的本質(zhì)，是人類認(rèn)知的操作系統(tǒng)。語(yǔ)言是人類腦神經(jīng)活動(dòng)的一個(gè)降維鏡像。它把大腦中極其復(fù)雜、難以直接描述的神經(jīng)活動(dòng)，轉(zhuǎn)化為一種可記錄、可沉淀、可表達(dá)、可計(jì)算、可推理的符號(hào)體系。

可以說(shuō)，語(yǔ)言處在一個(gè)中間位置：規(guī)則是高度人工的，人腦是高度自然的，而語(yǔ)言正是人工與自然的交匯點(diǎn)。它既是思維的投影，也是交流的工具；更進(jìn)一步，語(yǔ)言是思維的腳手架。

正如哲學(xué)家所言：語(yǔ)言的邊界，就是我思考的邊界。通過(guò)語(yǔ)言，腦神經(jīng)活動(dòng)轉(zhuǎn)化為文字、進(jìn)行描述，傳遞給他人。由此，知識(shí)開始具備可積累、可沉淀、可推理的特性，能夠模擬大腦的思考過(guò)程。這就是語(yǔ)言的本質(zhì)。掌握語(yǔ)言，本質(zhì)上就是掌握了推理能力。這正是語(yǔ)言模型與以往模型最核心的區(qū)別。

語(yǔ)言模型帶來(lái)的另一個(gè)關(guān)鍵突破，是顯空間與隱空間的區(qū)分。我們的大腦可以理解為一個(gè)高維隱空間。而語(yǔ)言，就是這個(gè)高維隱空間對(duì)應(yīng)的顯空間。人類所有的交互、討論、溝通、學(xué)習(xí)，本質(zhì)上都是：將個(gè)人大腦的隱空間坍縮為顯空間，再通過(guò)語(yǔ)言把顯空間傳遞給他人，對(duì)方再將其升維重構(gòu)為自身的隱空間。語(yǔ)言真正實(shí)現(xiàn)了兩個(gè)高維認(rèn)知空間的映射與交流。

綜上，今天大語(yǔ)言模型能夠成為AGI開端，本質(zhì)源于語(yǔ)言本身的特性：它是大腦的映射，具備思考能力，更具備推理能力。大語(yǔ)言模型對(duì)世界的建模，本質(zhì)上包含三個(gè)環(huán)節(jié)：

第一環(huán)：預(yù)訓(xùn)練——為知識(shí)建模。把人類世界的全部知識(shí)，極致壓縮到基座模型中。

第二環(huán)：為生產(chǎn)力建模——模型的“解壓”。我們把知識(shí)“壓縮”進(jìn)模型，目的是“解壓”與預(yù)測(cè)——用壓縮后的知識(shí)，去預(yù)測(cè)物理世界的演化，最終轉(zhuǎn)化為現(xiàn)實(shí)生產(chǎn)力。

第三環(huán)：為學(xué)習(xí)建模——在觀測(cè)視角中尋找最優(yōu)。

因此，預(yù)訓(xùn)練模型的本質(zhì)可以總結(jié)為：預(yù)測(cè)即生成，生成即理解。

機(jī)器無(wú)法直接高效觀測(cè)物理世界，于是以人類為媒介：人類數(shù)千年與世界交互、觀察、沉淀，形成書籍、文字與知識(shí)體系。我們的工作，就是把這些人類知識(shí)極致壓縮，在向量空間中訓(xùn)練，使其具備遷移與泛化能力。大模型的核心邏輯，就是預(yù)測(cè)下一個(gè)詞。基于前文不斷預(yù)測(cè)后續(xù)token，最小化預(yù)測(cè)誤差，當(dāng)這個(gè)過(guò)程被放大到極致，就涌現(xiàn)出了智能。

基座模型最本質(zhì)的邏輯是什么？

大語(yǔ)言模型成為AGI開端的根本原因？

文章內(nèi)容僅為課程1/10，請(qǐng)前往APP看課

CEO、高管一定要有大模型思維

我們從圍棋盤上的勝負(fù)，一路追問(wèn)至語(yǔ)言與智能的本質(zhì)。現(xiàn)在，帶上這套全新的“大模型思維”，回到商業(yè)的戰(zhàn)場(chǎng)。你會(huì)發(fā)現(xiàn)它不僅僅是技術(shù)原理，更是一套即將重塑所有競(jìng)爭(zhēng)規(guī)則的商業(yè)底層操作系統(tǒng)。

從確定化管理到“概率管理”

我們反復(fù)強(qiáng)調(diào)AI思維的本質(zhì)與第一性原理，核心就是要明確：AI的核心是不確定性，不確定性孕育智能，因此AI思維本質(zhì)上是概率導(dǎo)向的。

必須清晰地認(rèn)識(shí)到，確定性已不復(fù)存在，不能再用程序思維去解決當(dāng)下的問(wèn)題。在傳統(tǒng)模式中，我們編寫代碼追求絕對(duì)確定性，絕對(duì)確定性必然導(dǎo)致缺乏泛化能力。缺乏泛化能力就無(wú)法產(chǎn)生智能，這是一條無(wú)法突破的局限路徑。

打個(gè)比方，傳統(tǒng)企業(yè)思維模式如同精密的機(jī)械鐘表，每一步運(yùn)行都有強(qiáng)烈的業(yè)務(wù)邏輯聯(lián)動(dòng)，一旦設(shè)計(jì)成型，運(yùn)行軌跡便固定不變。企業(yè)運(yùn)營(yíng)的所有環(huán)節(jié)都遵循百分之百可執(zhí)行的標(biāo)準(zhǔn)（SOP）。當(dāng)前，這種確定性邏輯不再適用了，它脫離了AI思維的核心內(nèi)涵。這也解釋了為何當(dāng)概率思維融入確定性的SOP體系時(shí)，組織會(huì)天然產(chǎn)生排異反應(yīng)。

每一位企業(yè)家的思考鏈路，都必須從機(jī)械確定論轉(zhuǎn)變?yōu)楦怕收摚?b>通過(guò)調(diào)整參數(shù)、優(yōu)化概率來(lái)實(shí)現(xiàn)預(yù)期結(jié)果，既要保證一定的確定性，又要保留創(chuàng)造力。

工業(yè)時(shí)代的贏家是“控制狂”；AI時(shí)代的贏家是“概率管理大師”。拿提示詞（prompt）舉例：若將提示詞的定義得過(guò)于細(xì)致、流程設(shè)計(jì)過(guò)長(zhǎng)，甚至通過(guò)填表式的方式限定輸出結(jié)果，用確定性流程去控制概率，輸出結(jié)果必然難以達(dá)到預(yù)期。因?yàn)檫^(guò)度細(xì)分的限制，割裂了其泛化能力，使其只能機(jī)械執(zhí)行既定指令，無(wú)法發(fā)揮智能的價(jià)值。

概率管理的核心邏輯是，通過(guò)調(diào)整方向、引導(dǎo)趨勢(shì)、聚焦核心，真正實(shí)現(xiàn)概率導(dǎo)向的智能應(yīng)用，既能保證創(chuàng)造力的發(fā)揮，也能收獲超出預(yù)期的成果。

智力通縮與杰文斯悖論

另一個(gè)需要重點(diǎn)關(guān)注的商業(yè)邏輯，是智力通縮與杰文斯悖論。許多人擔(dān)憂AI模型成本過(guò)高，大規(guī)模使用會(huì)導(dǎo)致虧損，但事實(shí)上，token的綜合成本較行業(yè)初期已下降近萬(wàn)倍。

過(guò)去，專家智力如同奢侈品，企業(yè)會(huì)盡量減少使用。當(dāng)下，智力已如同電力一般，Token成本的下降速度遠(yuǎn)超傳統(tǒng)摩爾定律，這是不可逆轉(zhuǎn)的趨勢(shì)。很多人過(guò)度關(guān)注模型降價(jià)，但模型降價(jià)是模型公司的核心任務(wù)，對(duì)于企業(yè)家而言，更應(yīng)關(guān)注模型的性價(jià)比——若能跑通一個(gè)應(yīng)用場(chǎng)景，實(shí)現(xiàn)性能的提升，便無(wú)需擔(dān)憂成本問(wèn)題，因?yàn)閠oken價(jià)格會(huì)持續(xù)下降，每半年至一年就會(huì)有顯著變化，屆時(shí)企業(yè)的增長(zhǎng)飛輪便會(huì)自然運(yùn)轉(zhuǎn)。

企業(yè)的核心競(jìng)爭(zhēng)力，在于消耗智能、轉(zhuǎn)化智能的能力。誰(shuí)能率先將智力轉(zhuǎn)化為高價(jià)值的用戶體驗(yàn)，誰(shuí)就能成為行業(yè)贏家。當(dāng)前不應(yīng)過(guò)度關(guān)注成本，而應(yīng)聚焦于智能的上限與價(jià)值的上限。

核心資產(chǎn)：場(chǎng)景＞數(shù)據(jù)

除此之外，商業(yè)領(lǐng)域的另一重大思維轉(zhuǎn)變，在于資產(chǎn)定義的重構(gòu)。傳統(tǒng)認(rèn)知中，數(shù)據(jù)被視為核心資產(chǎn)，許多企業(yè)宣稱自身?yè)碛写罅繑?shù)據(jù)，并認(rèn)為將這些數(shù)據(jù)用于模型訓(xùn)練就能形成自身優(yōu)勢(shì)。但客觀而言，當(dāng)前市場(chǎng)上99%的企業(yè)數(shù)據(jù)都屬于無(wú)效數(shù)據(jù)。

很多企業(yè)擔(dān)憂數(shù)據(jù)上傳后被竊取——事實(shí)上，很多數(shù)據(jù)只是業(yè)務(wù)流程中的日志記錄，一旦業(yè)務(wù)流程發(fā)生變化，這些數(shù)據(jù)便失去了存在意義。若將數(shù)據(jù)視為資產(chǎn)，首先要明確這些數(shù)據(jù)是否能轉(zhuǎn)化為生產(chǎn)力；若不能，其所謂的“資產(chǎn)價(jià)值”便無(wú)從談起。

當(dāng)前，真正具備價(jià)值的數(shù)據(jù)僅存在于少數(shù)場(chǎng)景，例如抖音的推薦算法、百度的搜索體系等。絕大多數(shù)對(duì)數(shù)據(jù)安全過(guò)度敏感的企業(yè)，其數(shù)據(jù)本身往往無(wú)法被有效利用。利用牛頓的實(shí)驗(yàn)筆記和數(shù)據(jù)，能得出愛因斯坦的理論結(jié)論嗎？在相對(duì)論時(shí)代，過(guò)度留存“牛頓”的實(shí)驗(yàn)數(shù)據(jù)，并無(wú)實(shí)際價(jià)值。

與其擔(dān)憂數(shù)據(jù)被竊取，不如加快數(shù)據(jù)的應(yīng)用。企業(yè)不應(yīng)有數(shù)據(jù)囤積癖，不應(yīng)將歷史數(shù)據(jù)視為不可突破的護(hù)城河。我們沒法用馬車的數(shù)據(jù)訓(xùn)練出特斯拉一樣，傳統(tǒng)數(shù)據(jù)的清洗成本、存儲(chǔ)成本，甚至?xí)蔀槠髽I(yè)發(fā)展的阻礙，堪稱“反向潤(rùn)滑油”，固化企業(yè)思維、阻礙企業(yè)創(chuàng)新。

數(shù)據(jù)的定義正在快速迭代，唯有應(yīng)用場(chǎng)景是相對(duì)穩(wěn)定的核心。只要定義出具體的應(yīng)用場(chǎng)景（如同圍棋的棋盤）和價(jià)值評(píng)判標(biāo)準(zhǔn)（如同圍棋的勝負(fù)規(guī)則，即獎(jiǎng)勵(lì)模型），數(shù)據(jù)便可以源源不斷地產(chǎn)生。

總之，在應(yīng)用初期，無(wú)需過(guò)度考慮數(shù)據(jù)安全，核心在于誰(shuí)能率先跑通場(chǎng)景、啟動(dòng)增長(zhǎng)飛輪，待企業(yè)發(fā)展到一定規(guī)模、數(shù)據(jù)產(chǎn)生實(shí)際價(jià)值后，再考慮數(shù)據(jù)安全防護(hù)，才是合理的發(fā)展路徑。誰(shuí)能掌握新數(shù)據(jù)的生產(chǎn)場(chǎng)景，誰(shuí)能在初期啟動(dòng)增長(zhǎng)飛輪，誰(shuí)就能定義行業(yè)的未來(lái)。

后記：

我的觀點(diǎn)未必完全正確，但核心目的是為大家植入一種新的思維提示，引導(dǎo)大家建立對(duì)AI思維的認(rèn)知與感知。如果我們僅學(xué)習(xí)提示詞寫法、工作流用法、某個(gè)軟件的操作技巧，這些內(nèi)容每六個(gè)月就可能有90%失效。既然我們處于混沌學(xué)習(xí)的場(chǎng)景中，就應(yīng)采用混沌的核心方法——摒棄歸納法，堅(jiān)持演繹法，深入理解底層邏輯，將這種思維能力內(nèi)化于心。希望每一位參與者都能從中獲得啟發(fā)，實(shí)現(xiàn)自身對(duì)未來(lái)知識(shí)判斷、知識(shí)加工方式的一點(diǎn)點(diǎn)轉(zhuǎn)變。當(dāng)前，我們正處于一個(gè)“電燈取代蠟燭”的時(shí)代，從“蠟燭思維”轉(zhuǎn)變?yōu)椤半姛羲季S”，是必修課。

從管理層來(lái)看，CEO如何轉(zhuǎn)變？

為什么組織不應(yīng)該是機(jī)械體，應(yīng)該是生物體？

文章內(nèi)容僅為課程1/10，請(qǐng)前往APP看課

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.