網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

《方略》| 對(duì)話大模型第一股智譜CEO：AI 不是取代人，而是加速人進(jìn)化

2026-03-07 09:32:24　來(lái)源: 雪球

北京舉報(bào)

分享至

在人工智能技術(shù)快速迭代、大模型成為產(chǎn)業(yè)焦點(diǎn)的背景下，全球AI競(jìng)爭(zhēng)格局逐漸清晰，技術(shù)多樣性與商業(yè)化落地成為行業(yè)的核心議題。在這一背景下，中國(guó)大模型企業(yè)的技術(shù)選擇、組織路徑與長(zhǎng)期判斷，逐漸成為觀察全球AI競(jìng)爭(zhēng)格局的重要樣本。

在雪球出品的投資類專業(yè)對(duì)話欄目《方略》第三季第二期中，雪球創(chuàng)始人、董事長(zhǎng)方三文對(duì)話智譜CEO張鵬，圍繞AI發(fā)展歷程、AI應(yīng)用的邊界、智譜商業(yè)模式等核心話題展開(kāi)。張鵬表示，模型體系的多樣性是技術(shù)持續(xù)進(jìn)步的重要?jiǎng)恿ΑＲ韵率菍?duì)話精選：

大眾對(duì)AI的問(wèn)題沒(méi)有超越圖靈九問(wèn)

方三文：什么是AI？

張鵬：AI是一個(gè)縮寫，它叫做Artificial Intelligence，直譯過(guò)來(lái)就是人工智能。最簡(jiǎn)單直白的一個(gè)描述就是，用技術(shù)的方法，不管是計(jì)算機(jī)還是其他的方法，去模擬人類的智能，進(jìn)而來(lái)服務(wù)人。

方三文：圖靈在1950年的論文《計(jì)算機(jī)器與智能》里面提出了智能這個(gè)概念，后來(lái)在達(dá)特茅斯會(huì)議里面直接定義了人工智能。我們今天談?wù)摰腁I，和圖靈說(shuō)的智能或者是1956年提出的人工智能之間有什么關(guān)系？

張鵬：如果按照邏輯學(xué)或數(shù)學(xué)的概念來(lái)描述，智能是更大的一個(gè)圈，人工智能是智能當(dāng)中的一部分，就是我們?cè)趺慈ツM人類的智能。所以現(xiàn)在我們說(shuō)的AI或者人工智能，其實(shí)就是1956年達(dá)特茅斯會(huì)議上提出來(lái)的那個(gè)定義。但是，隨著時(shí)間不斷演進(jìn)，技術(shù)和市場(chǎng)的變化，AI的內(nèi)涵在不斷變化。現(xiàn)在的人工智能包含的事情比當(dāng)年范圍更廣，但核心目標(biāo)沒(méi)變。

方三文：大模型和AI，是一回事嗎？

張鵬：大模型只是我們實(shí)現(xiàn)人工智能的技術(shù)方法中的一種。

方三文：從1950年代到現(xiàn)在，AI發(fā)展經(jīng)歷了什么重要的節(jié)點(diǎn)？

張鵬：從1950年代到現(xiàn)在大概70多年，不到80年。這幾十年來(lái)，AI的發(fā)展并不是一帆風(fēng)順的。大家公認(rèn)的有三次人工智能浪潮，或者嚴(yán)格劃分也可以說(shuō)現(xiàn)在是第四次。為什么會(huì)起起落落？我覺(jué)得這也是一個(gè)歷史的必然規(guī)律。一件事情的發(fā)展不會(huì)永遠(yuǎn)是增長(zhǎng)的曲線，過(guò)程中會(huì)碰到各種挑戰(zhàn)、困難，結(jié)合當(dāng)時(shí)的社會(huì)經(jīng)濟(jì)情況，會(huì)有起伏，都很正常。

方三文：1958年提出的感知機(jī)是什么？

張鵬：感知機(jī)是一個(gè)數(shù)學(xué)上的方法，簡(jiǎn)單理解就是嘗試在數(shù)據(jù)的空間中找到所謂的“超平面”，把這個(gè)空間一分為二，平面的一側(cè)是我們想要的結(jié)果，另一側(cè)是不想要的，這其實(shí)是個(gè)分類問(wèn)題。感知機(jī)就是找到這個(gè)“超平面”的一種方法，通過(guò)機(jī)器設(shè)定一個(gè)模型，讓它通過(guò)數(shù)據(jù)迭代的方式準(zhǔn)確定位超平面。它對(duì)AI的作用是奠定了一個(gè)基礎(chǔ)，通過(guò)機(jī)器學(xué)習(xí)，讓機(jī)器從數(shù)據(jù)中學(xué)習(xí)的方法去解決具體問(wèn)題。就像人通過(guò)學(xué)習(xí)解決問(wèn)題，不斷實(shí)踐，通過(guò)數(shù)據(jù)反饋來(lái)迭代求解，而不是設(shè)定一個(gè)公式算一遍就結(jié)束。這個(gè)和現(xiàn)在的大模型、深度學(xué)習(xí)的思想完全一致。可以說(shuō)它是機(jī)器學(xué)習(xí)的源頭、鼻祖。

方三文：1966年MIT開(kāi)發(fā)了第一個(gè)真正意義上的聊天機(jī)器人，叫Eliza。你看現(xiàn)在大家特別熱衷的ChatGPT，都在聊天。為什么人工智能跟聊天有這么密切的關(guān)系？

張鵬：我覺(jué)得最重要的還是回歸到人工智能的本質(zhì)目標(biāo)，就是用機(jī)器或技術(shù)的方法實(shí)現(xiàn)類人的智能。但你如何確定你做出來(lái)的東西具備類人的智能？它需要一個(gè)檢驗(yàn)方式。對(duì)于人來(lái)說(shuō)最自然的檢驗(yàn)方式就是聊天，看我能不能識(shí)別出你是不是個(gè)人。所以從最開(kāi)始的出發(fā)點(diǎn)，就影響到后續(xù)很多工作。

方三文：1973年出了一個(gè)萊特希爾報(bào)告，提出AI的局限性，導(dǎo)致AI投資下降。當(dāng)時(shí)AI局限性主要指什么？

張鵬：萊特希爾報(bào)告里舉出的AI局限性有幾個(gè)方面。首先最明顯的是當(dāng)時(shí)整個(gè)AI研究界樂(lè)觀情緒占上風(fēng)，在那個(gè)年代就喊出口號(hào)說(shuō)未來(lái)20年要實(shí)現(xiàn)通用人工智能。大家的理想很好，目標(biāo)遠(yuǎn)大，但路徑中困難太大。那時(shí)計(jì)算機(jī)的計(jì)算能力很差。第二，當(dāng)時(shí)對(duì)數(shù)據(jù)也沒(méi)有很好的整理。第三，早期的人工智能方法基本上都基于符號(hào)學(xué)派，它能解決的問(wèn)題非常局限，比如數(shù)學(xué)物理這種能用完備符號(hào)系統(tǒng)表達(dá)的，稍微擴(kuò)大到知識(shí)、常識(shí)就不行了。所以導(dǎo)致大家重新冷靜審視AI的投入，引起第一次AI寒冬。

方三文：是不是任何科學(xué)的終極目標(biāo)或愿望，和現(xiàn)在可用的資源、路徑總是存在著較大差距？

張鵬：這是一個(gè)行業(yè)或技術(shù)往前發(fā)展的源動(dòng)力。就像物理化學(xué)里的滲透壓，兩邊濃度不同會(huì)產(chǎn)生滲透動(dòng)力，來(lái)自于不均衡。當(dāng)你遠(yuǎn)大目標(biāo)和當(dāng)下?lián)碛械馁Y源、技術(shù)能達(dá)到的效果之間有差距時(shí)，這個(gè)差距會(huì)刺激大家不斷研究、找到新方法、投入新資源。這很正常，只是看差距有多大。

方三文：這個(gè)滲透壓達(dá)成的平衡是不是一個(gè)相對(duì)動(dòng)態(tài)的平衡？

張鵬：是，肯定是動(dòng)態(tài)平衡。就像AI的發(fā)展起起落落，為什么第一次寒冬后會(huì)有第二波？因?yàn)榇蠹抑匦驴吹搅藙?dòng)態(tài)平衡的可能性，有新資源加入，滲透壓變化，好像能克服或利用這個(gè)差距，于是投入新方法、新資源去做。所以它永遠(yuǎn)是動(dòng)態(tài)變化的。

方三文：1981年產(chǎn)生了第一臺(tái)帶GPU的電腦。GPU是什么？它今天很熱，跟AI是什么關(guān)系？

張鵬：GPU跟CPU相對(duì)。CPU是計(jì)算機(jī)的核心處理單元，中央處理器。GPU叫圖形處理器，當(dāng)時(shí)專門設(shè)計(jì)出來(lái)幫CPU分擔(dān)圖形處理能力。GPU和AI的關(guān)系挺有意思。因?yàn)樗鰣D像處理時(shí)更偏重浮點(diǎn)計(jì)算，CPU偏重整數(shù)計(jì)算。GPU專門加強(qiáng)了浮點(diǎn)數(shù)計(jì)算的能力。這一點(diǎn)恰恰跟AI或科學(xué)計(jì)算類似，科學(xué)計(jì)算里有大量浮點(diǎn)計(jì)算。有些科學(xué)家就說(shuō)，能不能用硬件加速的方法來(lái)加速科學(xué)計(jì)算的算法程序？英偉達(dá)敏銳捕捉到這點(diǎn)，黃仁勛當(dāng)時(shí)給很多科學(xué)家送GPU卡，唯一要求是把算法在上面跑，收集效果來(lái)宣傳。

方三文：1980年代末1990年代初，AI又進(jìn)入第二次寒冬。這個(gè)中間發(fā)生了什么？和第一次有什么區(qū)別？

張鵬：第二次AI起來(lái)是因?yàn)榇蠹艺业搅艘粋€(gè)新方法——專家系統(tǒng)。在第一代感知機(jī)等方法基礎(chǔ)上，通過(guò)結(jié)構(gòu)化知識(shí)表示，讓計(jì)算機(jī)具備像專家一樣的專業(yè)知識(shí)來(lái)解答問(wèn)題。這是第二代人工智能成功的點(diǎn)。但到一定程度后發(fā)現(xiàn)，雖然理論上比第一代好，有完備方法論，可以把人類規(guī)則用if/else方式寫下來(lái)交給機(jī)器用。但這種方式到一定規(guī)模后，知識(shí)能不能窮舉？比如醫(yī)療領(lǐng)域所有病癥和治療方案能不能窮舉？把所有知識(shí)寫出來(lái)，可能是天文數(shù)字。這是實(shí)現(xiàn)成本和周期的問(wèn)題。第二，雖然計(jì)算能力增加了，但巨大量的專家知識(shí)輸入后，計(jì)算量是指數(shù)級(jí)爆炸增長(zhǎng)，仍然不能滿足需求。水位永遠(yuǎn)是動(dòng)態(tài)的，看到計(jì)算能力提升投入新方法，加了很多東西后計(jì)算能力又不夠了。所以是動(dòng)態(tài)互相促進(jìn)的過(guò)程。

方三文：1997年深藍(lán)擊敗國(guó)際象棋世界冠軍，有什么意義？

張鵬：這是非常標(biāo)志性的事件。大家會(huì)覺(jué)得聊天簡(jiǎn)單，下棋比聊天復(fù)雜，智能水平高很多。如果機(jī)器在下棋上勝過(guò)人類，說(shuō)明智力水平到一定程度了。深藍(lán)戰(zhàn)勝卡斯帕羅夫的意義就在這。

方三文：后來(lái)過(guò)了將近20年，2016年AlphaGo擊敗李世石。AlphaGo和深藍(lán)在技術(shù)上不同？

張鵬：實(shí)現(xiàn)路徑上不一樣。深藍(lán)主要是搜索式的方法，在已知棋譜或當(dāng)前棋盤狀態(tài)中搜索下一步，可能往前搜索幾步，用蒙特卡洛樹(shù)搜索剪枝，不搜索所有空間，只搜索一部分，預(yù)測(cè)有限步數(shù)，在有限時(shí)間內(nèi)找到最接近最好的解法。AlphaGo也沿著這個(gè)路徑，但實(shí)現(xiàn)方式不同，用了神經(jīng)網(wǎng)絡(luò)，用大量數(shù)據(jù)訓(xùn)練來(lái)逼近搜索和預(yù)測(cè)算法。目標(biāo)都是搜索空間預(yù)測(cè)最好方法，但預(yù)測(cè)方式不同。可以理解為AlphaGo是端到端的方法，深藍(lán)更多是基于規(guī)則、一環(huán)套一環(huán)的工作流水線。

方三文：簡(jiǎn)單說(shuō)說(shuō)深度學(xué)習(xí)是什么？

張鵬：深度學(xué)習(xí)指有比較深的算法層次。比如一層神經(jīng)元或基本計(jì)算單元，能解決非常簡(jiǎn)單的問(wèn)題。復(fù)雜問(wèn)題就疊很多層，一層一層往上疊，層數(shù)越多能模擬的情況越多，計(jì)算越復(fù)雜。

方三文：就是函數(shù)套函數(shù)？

張鵬：對(duì)，一層套一層，不斷壘起來(lái)。

方三文：從終端角度看，1995年前后PC普及，2000年前后互聯(lián)網(wǎng)普及，把機(jī)器和數(shù)據(jù)連起來(lái)。這對(duì)深度學(xué)習(xí)發(fā)展有關(guān)系嗎？

張鵬：深度學(xué)習(xí)需要非常大的計(jì)算能力。剛才講GPU就是因?yàn)樗↑c(diǎn)計(jì)算能力強(qiáng)，所以火起來(lái)。計(jì)算設(shè)備能力的提升是深度學(xué)習(xí)快速發(fā)展的前提條件，算力相當(dāng)于發(fā)動(dòng)機(jī)，越強(qiáng)大輸出馬力越大。數(shù)據(jù)相當(dāng)于燃料，要有優(yōu)良、大量的燃料才能讓發(fā)動(dòng)機(jī)跑更長(zhǎng)時(shí)間，輸出更大功率。PC和互聯(lián)網(wǎng)提供了大量數(shù)據(jù)。

方三文：Google 2016年發(fā)表了Transformer論文，論文發(fā)表后短時(shí)間內(nèi)OpenAI發(fā)布了ChatGPT，這兩個(gè)事情有聯(lián)系嗎？

張鵬：肯定有聯(lián)系。OpenAI真正轉(zhuǎn)做大模型就在這篇論文發(fā)布之后。OpenAI 2015年成立，到2018年左右一直不是走這條路，而是走強(qiáng)化學(xué)習(xí)路線。Transformer論文后不久，2018年開(kāi)始，以伊利亞為首的科學(xué)家果斷轉(zhuǎn)向，基于它做GPT相關(guān)研究。

方三文：第一個(gè)版本ChatGPT出來(lái)時(shí)你關(guān)注了嗎？

張鵬：分兩個(gè)階段。2018年他們開(kāi)始做GPT，沒(méi)引起太大關(guān)注，效果不太好。從GPT-2開(kāi)始有一定關(guān)注，學(xué)界有討論，褒貶不一，有人說(shuō)它只是大力出奇跡，不是算法革新，也有人說(shuō)是好范式。那時(shí)關(guān)注到討論，在國(guó)外比較多，國(guó)內(nèi)相對(duì)少。得益清華環(huán)境，接觸國(guó)外學(xué)術(shù)圈方便。真正讓大家覺(jué)得很牛是2020年GPT-3發(fā)布。從GPT-3發(fā)布我們就關(guān)注到，并且認(rèn)知到它可能就是未來(lái)的范式變化轉(zhuǎn)折點(diǎn)。

方三文：為什么做出這種判斷？當(dāng)時(shí)出現(xiàn)什么現(xiàn)象或重要突破？

張鵬：之前我們用傳統(tǒng)機(jī)器學(xué)習(xí)方法做NLP任務(wù)，包括對(duì)話、QA等，一直沒(méi)做到讓人滿意。傳統(tǒng)NLP方法需要很長(zhǎng)算法流水線處理句子，找到結(jié)構(gòu)、名詞、動(dòng)詞，理解句子。但GPT出現(xiàn)后，發(fā)現(xiàn)不用這么做，只要把句子扔進(jìn)去，它就能答，而且答得很好。這就是端到端解決，不需要復(fù)雜拆解。效果很多時(shí)候碾壓傳統(tǒng)流水線方法。所以大家看到這個(gè)方法有優(yōu)勢(shì)，覺(jué)得這可能就是下個(gè)階段的技術(shù)范式。

方三文：DeepSeek-R1的發(fā)布，好像顛覆了大家認(rèn)知。你認(rèn)為從原理和效果上它有什么突破？

張鵬：DeepSeek引起行業(yè)內(nèi)重大關(guān)注，但它還是沿著這條路走，沒(méi)有像GPT相對(duì)于傳統(tǒng)機(jī)器學(xué)習(xí)有那樣迥異的方法論。它不是方法論級(jí)別的，更多是在怎么降低成本、怎么把工程優(yōu)化，把原來(lái)“力大磚飛”簡(jiǎn)單堆參數(shù)量或數(shù)據(jù)量的邏輯拉回來(lái)，告訴大家不用堆那么多，可以在算法上優(yōu)化，把成本壓下來(lái)，效果同時(shí)提升。更重要的原因是，它在那個(gè)時(shí)間點(diǎn)用開(kāi)源方式把技術(shù)全部交給社區(qū)、研究界、工業(yè)界，讓大家無(wú)償免費(fèi)使用最新技術(shù)，對(duì)當(dāng)時(shí)的市場(chǎng)沖擊很大。

方三文：AI發(fā)展涉及算力、數(shù)據(jù)、算法。現(xiàn)在這三個(gè)因素哪個(gè)最卡住AI發(fā)展？哪個(gè)突破可能帶來(lái)進(jìn)一步發(fā)展？

張鵬：不同時(shí)間段認(rèn)知不一樣。最早大家覺(jué)得算法重要，可以直達(dá)AGI。過(guò)一段時(shí)間模型參數(shù)量大，又覺(jué)得互聯(lián)網(wǎng)上能拿到的數(shù)據(jù)不夠了，擔(dān)心數(shù)據(jù)用盡、預(yù)訓(xùn)練撞墻。然后大家琢磨解決數(shù)據(jù)問(wèn)題，到現(xiàn)在數(shù)據(jù)問(wèn)題也能解決掉，又擔(dān)心算力不夠。后來(lái)技術(shù)進(jìn)步，英偉達(dá)拼命生產(chǎn)，算力也能搞到。大家又會(huì)覺(jué)得算法本身有問(wèn)題，效率不高，災(zāi)難性遺忘等問(wèn)題解不了，很多人預(yù)測(cè)Transformer也要被革新。所以它是個(gè)動(dòng)態(tài)循環(huán)、螺旋式上升的過(guò)程。

方三文：你覺(jué)得AGI是抽象目標(biāo)還是具體目標(biāo)？是最終可以實(shí)現(xiàn)還是只能無(wú)限接近？

張鵬：AGI定義不像AI那么清晰，它的內(nèi)涵外延從沒(méi)有非常明確權(quán)威的定義。但AGI能不能實(shí)現(xiàn)？只要我們能把這個(gè)目標(biāo)定義好，不太離譜的定義，大概率能實(shí)現(xiàn)，時(shí)間長(zhǎng)短問(wèn)題。智譜從成立第一天目標(biāo)就是AGI，我們有自己定義。

方三文：對(duì)普羅大眾來(lái)說(shuō)，AGI是不是有點(diǎn)像科學(xué)中的終極真理，不容易具體化？

張鵬：終極真理很難描繪，因?yàn)檎l(shuí)也不知道。但科學(xué)界有多種方法描繪，比如圖靈測(cè)試用行為學(xué)定義智能。AGI很多時(shí)候大家也用行為學(xué)定義，比如有一派說(shuō)，AI取得人各項(xiàng)能力的平均水平就叫AGI。有了行為定義，倒推技術(shù)要做到哪些事情，匹配人的水平。所以跟定義方式有關(guān)，實(shí)現(xiàn)路徑參照這個(gè)一步步走上去。

方三文：今天大眾對(duì)AI爭(zhēng)論，有沒(méi)有超出圖靈提出的那九個(gè)反問(wèn)？

張鵬：基本上沒(méi)有超出那個(gè)范圍。AI行業(yè)70多年，起起伏伏好幾次，但問(wèn)題回到原點(diǎn)，哲學(xué)上的思考很早就有了，不是新鮮東西。我們不斷演進(jìn)的是用什么路徑、方法去接近當(dāng)初定義的最高目標(biāo)。

AI應(yīng)用的邊界

方三文：大模型具體是什么東西？

張鵬：首先“模型”大家可能容易理解，是一種算法的載體。傳統(tǒng)機(jī)器學(xué)習(xí)里也有模型，不稀奇。關(guān)鍵是前面加了“大”字。為什么叫大模型？回到深度神經(jīng)網(wǎng)絡(luò)，你可以想象它是一個(gè)非常大的計(jì)算矩陣，矩陣?yán)锩總€(gè)元素是一個(gè)參數(shù)，輸入數(shù)據(jù)經(jīng)過(guò)矩陣乘加得到結(jié)果。中間這個(gè)矩陣就是模型核心。大模型的矩陣規(guī)模非常大，體現(xiàn)在參數(shù)量非常大。傳統(tǒng)感知機(jī)可能只有兩三個(gè)參數(shù)，大模型可能有幾千萬(wàn)、幾億、幾十億、上千億參數(shù)，所以叫大模型。

方三文： 業(yè)余人士也大概知道大模型有分類：一種通用大模型，類似ChatGPT、Grok、Gemini、智譜GLM；還有一些在特定領(lǐng)域的特定場(chǎng)景模型。是不是可以分成這兩大類？

張鵬： ChatGPT火起來(lái)后國(guó)內(nèi)爭(zhēng)論過(guò)，有沒(méi)有通用模型和專業(yè)/垂直模型這個(gè)分類？我們回到第一性原理，為什么要分這兩類？原因是什么？我們是通用模型派。當(dāng)時(shí)有人說(shuō)通用模型拿通用數(shù)據(jù)訓(xùn)練，參數(shù)量大成本高，但不能解決專業(yè)問(wèn)題。另一派說(shuō)訓(xùn)練參數(shù)量小點(diǎn)的，用專用數(shù)據(jù)訓(xùn)練，解決專業(yè)問(wèn)題。這叫垂直或?qū)I(yè)模型。但后來(lái)發(fā)現(xiàn)有個(gè)悖論：如果你能拿到專業(yè)數(shù)據(jù)，為什么不把它加到通用模型里訓(xùn)練？它是不是也能解決專業(yè)問(wèn)題？為什么要單獨(dú)弄專業(yè)模型？第二個(gè)問(wèn)題，專業(yè)小模型用少量數(shù)據(jù)訓(xùn)練，能力就一定會(huì)比通用模型強(qiáng)嗎？通用模型加專業(yè)數(shù)據(jù)后能力超過(guò)專業(yè)模型。所以專業(yè)模型存在的兩個(gè)根本起點(diǎn)塌了，從實(shí)踐中大家看到這是個(gè)偽命題。

方三文：那導(dǎo)向一個(gè)可怕結(jié)論：所有大模型公司都在通用大模型業(yè)務(wù)模式下競(jìng)爭(zhēng)。最后競(jìng)爭(zhēng)格局會(huì)是怎樣？會(huì)始終存在很多通用大模型，還是會(huì)越來(lái)越少？

張鵬：收斂是肯定的。首先做這個(gè)事情成本挺高，算力、數(shù)據(jù)、人力需求非常高。如果大家都從零開(kāi)始做，是資源重復(fù)投入。從資源最優(yōu)化角度，一定會(huì)收斂到頭部那幾家，其他家做別的事。這是大勢(shì)。現(xiàn)在越來(lái)越細(xì)分，不一定是應(yīng)用，還有模型的基礎(chǔ)設(shè)施、平臺(tái)、具體細(xì)分場(chǎng)景的應(yīng)用、服務(wù)等，形成大的生態(tài)。但大模型本身的參與門檻不是一般公司能參與的。

方三文：世界上通用大模型主要玩家大概四五家，主要在中美兩國(guó)，歐洲有Mistral。你覺(jué)得會(huì)不會(huì)最后只剩一家？

張鵬：我直覺(jué)上認(rèn)為不會(huì)只剩一家。因?yàn)榧夹g(shù)發(fā)展需要多樣性，尤其在早中期，技術(shù)革新可能性多，研究方向多，大家會(huì)有差異，各自有生存空間。加上市場(chǎng)很大，蓬勃發(fā)展，空間足夠大，不會(huì)快速收斂。早中期會(huì)有多樣化生態(tài)，不會(huì)因?yàn)橐患胰〉脙?yōu)勢(shì)就一家通吃。只剩下一家的情況只會(huì)出現(xiàn)在技術(shù)相對(duì)穩(wěn)定的狀態(tài)，技術(shù)革新不快速時(shí)，會(huì)有馬太效應(yīng)。現(xiàn)在階段暫時(shí)不會(huì)出現(xiàn)一家通吃，目前也看不到一家通吃的前景。

方三文：造成各家大模型差異的主要是算力、數(shù)據(jù)還是算法？

張鵬：我覺(jué)得都有。算力是資源投入，能獲取什么樣的算力、多大量、什么成本，決定了后續(xù)投入效率、速度、創(chuàng)新比例。數(shù)據(jù)也一樣，能獲取什么樣的高質(zhì)量數(shù)據(jù)，在細(xì)分方面就有優(yōu)勢(shì)。算法更根本，誰(shuí)算法創(chuàng)新更快更持續(xù)，行業(yè)排位就更靠前。

方三文：有人認(rèn)為，對(duì)普通人來(lái)說(shuō)AI除了方便信息獲取整理，沒(méi)引起生活太大變化。你認(rèn)為這個(gè)變化會(huì)不會(huì)發(fā)生？

張鵬：它一定會(huì)發(fā)生，而且正在發(fā)生。日常辦公、工作、生活場(chǎng)景中，AI已經(jīng)能幫我們做很多事。我不太喜歡逛商場(chǎng)，很多事情希望AI幫我一鍵做完。我們發(fā)布AutoGLM產(chǎn)品就是這個(gè)目的。手機(jī)上有電商平臺(tái)，我要買東西，可能有個(gè)想法，讓AI幫我挑幾樣?xùn)|西扔到購(gòu)物籃，要求挑最便宜或性價(jià)比最好的，我只要最后確認(rèn)付款。類似這樣的事已經(jīng)在生活中慢慢發(fā)生。

方三文：能否舉一些AI已經(jīng)改變行業(yè)的案例？

張鵬：有些大家看不到的地方，比如工業(yè)界、醫(yī)藥行業(yè)。原來(lái)發(fā)明一款藥周期非常長(zhǎng)，要篩選很多化合物，做實(shí)驗(yàn)，成本高。現(xiàn)在可以用AI幫助藥物設(shè)計(jì)，篩選分子。比如蛋白質(zhì)結(jié)構(gòu)要找小分子契合，大量篩選工作通過(guò)AI做。還有AlphaFold，人體內(nèi)蛋白質(zhì)結(jié)構(gòu)原來(lái)靠實(shí)驗(yàn)一點(diǎn)點(diǎn)拼湊，現(xiàn)在AlphaFold可以根據(jù)歷史數(shù)據(jù)快速預(yù)測(cè)，用計(jì)算方法找出候選方案，再實(shí)驗(yàn)確定。這些領(lǐng)域發(fā)生很大變化，最終會(huì)給普通人帶來(lái)很大變化，以后藥可能沒(méi)那么貴。

方三文：醫(yī)生環(huán)節(jié)，AI有幫助或替代作用嗎？

張鵬：肯定有。國(guó)內(nèi)外都有。國(guó)外有大量研究文獻(xiàn)、臨床數(shù)據(jù)，用AI分析研判，幫助醫(yī)生解決疑難雜癥，或給醫(yī)學(xué)研究提供知識(shí)支持。國(guó)內(nèi)也有醫(yī)療機(jī)構(gòu)和商業(yè)化公司在做類似產(chǎn)品，幫助基層醫(yī)生提供知識(shí)輔助、培訓(xùn)等。

方三文：輔助駕駛或自動(dòng)駕駛是不是AI的應(yīng)用方向？

張鵬：自動(dòng)駕駛做了十幾年，替代人駕駛有可能做到，但跟AGI類似，首先得定義我們希望達(dá)到的完全自動(dòng)駕駛的本質(zhì)是什么，要解決什么問(wèn)題。描繪清楚才知道現(xiàn)有方法能做到什么程度，缺陷是什么，下一步方法是什么。取決于定義。只能不斷逼近已知認(rèn)知的部分，從行為學(xué)定義上越來(lái)越像它。但本質(zhì)沒(méi)拆解開(kāi)，不知道智能怎么形成的，所以沒(méi)法確保100%做到。

方三文：如果一個(gè)東西是模仿游戲，它就是不斷接近？

張鵬： 對(duì)，不斷逼近。

方三文：如果完全破解了它，知道演繹過(guò)程，就可以無(wú)限制復(fù)制？

張鵬：就是黑盒、白盒的區(qū)別。AI演化過(guò)程，第一、二代都是白盒，但發(fā)現(xiàn)白盒走得很累。到第三代深度學(xué)習(xí)出現(xiàn)，慢慢向黑盒轉(zhuǎn)換，因?yàn)榘缀薪鉀Q問(wèn)題太多不知道怎么弄。有人說(shuō)不用管里面原理，人的大腦也是黑盒，用黑盒對(duì)黑盒，從輸入輸出結(jié)果看，效果出奇的好，大家就轉(zhuǎn)到端到端。

方三文：黑盒雖然無(wú)限接近，但要說(shuō)它能無(wú)限制準(zhǔn)確復(fù)制不一定？

張鵬：有兩個(gè)事情。第一，如果把黑盒模型無(wú)限接近人，那它是可復(fù)制的，就是一坨數(shù)據(jù)，復(fù)制就好。但不可復(fù)制的是你沒(méi)辦法把它拆解開(kāi)，說(shuō)它為什么能做到，它某部分能力能不能單獨(dú)拆出來(lái)，用白盒方式復(fù)現(xiàn)。所以問(wèn)題分兩面。

方三文：人和AI到底是什么關(guān)系？很多人說(shuō)AI越能干，我失業(yè)了。你怎么看？

張鵬：挺復(fù)雜的，這是所有人都要面對(duì)的問(wèn)題。這一代AI跟之前不一樣，它終于有能力跟人平等對(duì)話，知識(shí)水平可能超出一般人。這就帶來(lái)很大問(wèn)題，人只跟人打過(guò)交道，沒(méi)跟AI打過(guò)交道，不知道怎么和諧相處。但我不覺(jué)得人類智能會(huì)停滯，人類適應(yīng)和進(jìn)化能力非常強(qiáng)。歷史上技術(shù)變革、社會(huì)變革，都討論過(guò)人類面臨巨大危機(jī)，會(huì)被取代，但都挺過(guò)來(lái)了，過(guò)得越來(lái)越好。人本身也在進(jìn)步進(jìn)化。所以AI未必是絕對(duì)危機(jī)，可能刺激人類進(jìn)化加速。

方三文：人這種生物或智能，跟計(jì)算機(jī)智能最大的區(qū)別可能是什么？

張鵬：我們?cè)袮GI路徑分為L(zhǎng)1到L5：知識(shí)學(xué)習(xí)壓縮、推理、自我學(xué)習(xí)、初步意識(shí)、完整意識(shí)。現(xiàn)在大模型大概發(fā)展到自我學(xué)習(xí)這個(gè)中間階段。差別在于后面兩個(gè)階段：人有自我意識(shí)，知道自己是我，AI目前顯然做不到。

方三文：全球AI行業(yè)最大競(jìng)爭(zhēng)體是美國(guó)和中國(guó)。你覺(jué)得它們?cè)诟?jìng)爭(zhēng)什么？

張鵬：個(gè)人感覺(jué)是兩種AI發(fā)展路徑或思路的競(jìng)爭(zhēng)。

方三文：美國(guó)思路是什么？中國(guó)思路是什么？

張鵬：美國(guó)在AI發(fā)展上求極致創(chuàng)新，追求高度，通過(guò)頭部玩家、資本聚集，在小范圍內(nèi)大量投入，不斷追求極限創(chuàng)新。中國(guó)不一樣，中國(guó)很難像美國(guó)那樣集中巨大資源在少數(shù)玩家砸出來(lái)。中國(guó)很多事情要求確定性和普惠。所以中國(guó)路徑是穩(wěn)扎穩(wěn)打，首先技術(shù)創(chuàng)新要跟上，不能太落后；其次過(guò)程中追求現(xiàn)有成果不斷轉(zhuǎn)化成生產(chǎn)力、經(jīng)濟(jì)價(jià)值，改善生活。政策制定者強(qiáng)調(diào)AI+千行百業(yè)，AI賦能，改善民生經(jīng)濟(jì)。中國(guó)不是一味脫開(kāi)，而是沿途下蛋，每個(gè)階段結(jié)果在各行各業(yè)落地。這個(gè)過(guò)程效率驅(qū)動(dòng)、ROI驅(qū)動(dòng)，更強(qiáng)調(diào)成本效益收益核算。

方三文：跟過(guò)去很多行業(yè)一樣，中國(guó)更側(cè)重落地、應(yīng)用、產(chǎn)業(yè)化、商業(yè)化，講究用戶體驗(yàn)和商業(yè)效率。之后很長(zhǎng)一段時(shí)間AI競(jìng)爭(zhēng)都會(huì)這樣分工？

張鵬：可能會(huì)這樣，至少我們國(guó)家還會(huì)這樣做下去，歷史文化決定的。美國(guó)頭部公司在搞0到1，中國(guó)在搞10到100，更看重1到10和10到100，因?yàn)檫@畢竟是普惠的，更大范圍的。

智譜的商業(yè)模式與護(hù)城河

方三文：智譜是AI落地、產(chǎn)業(yè)化、商業(yè)化的一個(gè)案例。簡(jiǎn)單說(shuō)說(shuō)智譜的商業(yè)模式？

張鵬：智譜思考得比較清晰。2020、2021年左右我們?cè)谧聊ミ@件事。技術(shù)不起源于我們，但我們追得很快。那時(shí)我們想這個(gè)技術(shù)怎么變成一門生意，商業(yè)化路徑是什么。我們提出MaaS，Model as a Service，把模型本身變成一種服務(wù)，讓大家能理解、使用，嵌入到產(chǎn)品、系統(tǒng)、生活中。這就是我們的商業(yè)模式。

方三文：這個(gè)模式是創(chuàng)立時(shí)定的還是慢慢摸索的？

張鵬：慢慢摸索的。2019年公司成立早期做學(xué)術(shù)運(yùn)用，探索一些服務(wù)。后來(lái)有一個(gè)體外獨(dú)立團(tuán)隊(duì)探索MaaS商業(yè)化，服務(wù)更多類型客戶。到一定階段，我們認(rèn)為模式是正確的，就合并進(jìn)來(lái)一起做。現(xiàn)在做得很大，增長(zhǎng)很好，也證明了這種模式是當(dāng)下大模型商業(yè)化比較靠譜的路徑。

方三文：現(xiàn)在這種模式是階段性最優(yōu)解，還是長(zhǎng)期穩(wěn)定形態(tài)？

張鵬：目前MaaS模式在相當(dāng)長(zhǎng)一段時(shí)間會(huì)比較穩(wěn)定，但絕不是終局。終局變數(shù)多，有待驗(yàn)證。大模型未來(lái)有個(gè)確定性方向是越來(lái)越向基礎(chǔ)設(shè)施演進(jìn)，像水電燃?xì)猓蔀樯鐣?huì)運(yùn)轉(zhuǎn)所需的智能基礎(chǔ)設(shè)施。基礎(chǔ)設(shè)施必須標(biāo)準(zhǔn)化、便宜、易于獲取的。MaaS符合這種形態(tài)。另一個(gè)方向是模型作為基礎(chǔ)設(shè)施以外，從應(yīng)用角度會(huì)有不同形態(tài)，加上硬件，在手機(jī)或終端里，形成不同產(chǎn)品。就像電和電器，兩端都有大市場(chǎng)前景。

方三文：一邊是基礎(chǔ)大模型，一邊是基于大模型的應(yīng)用。你們比較確定做后面這個(gè)？

張鵬：也不是后面，兩件事同時(shí)做。更主要的是MaaS這個(gè)基礎(chǔ)模型部分。上面的應(yīng)用我們也有一些。

方三文：請(qǐng)舉一個(gè)具體例子，你們?yōu)槟銈兊目蛻鬗aaS提供什么服務(wù)，解決什么問(wèn)題？

張鵬：挺多例子。主要客戶像中國(guó)前十互聯(lián)網(wǎng)公司，九個(gè)是我們的客戶。有一個(gè)客戶，去年發(fā)生國(guó)際事件，某海外社交平臺(tái)大批用戶遷移到國(guó)內(nèi)一個(gè)社交平臺(tái)，但語(yǔ)言不通，外國(guó)人看不懂中文，國(guó)內(nèi)用戶看不懂外文。我們就用模型輔助解決大量?jī)?nèi)容翻譯工作。第二個(gè)例子，我們跟三星合作，把模型能力植入手機(jī)終端，在端側(cè)可以用，解決數(shù)據(jù)隱私問(wèn)題，聊天記錄、圖片不用傳到云上，本地可搜索、編輯。這些都是解決現(xiàn)實(shí)世界的問(wèn)題。

方三文：你覺(jué)得AI應(yīng)用市場(chǎng)規(guī)模多大？

張鵬：Gartner預(yù)計(jì)在萬(wàn)億美金級(jí)別，有報(bào)告說(shuō)到2033年全球AI市場(chǎng)規(guī)模4.8萬(wàn)億美金。國(guó)內(nèi)至少萬(wàn)億以上。

方三文：你們目前業(yè)務(wù)主要競(jìng)爭(zhēng)對(duì)手是什么人？

張鵬：我們是獨(dú)立通用大模型廠商，這類玩家國(guó)內(nèi)不多。但大廠也在做同樣的事，做基礎(chǔ)模型和AI相關(guān)業(yè)務(wù)，他們是我們的友商、競(jìng)爭(zhēng)對(duì)手、合作伙伴。

方三文：相對(duì)這些競(jìng)爭(zhēng)對(duì)手，你們公司長(zhǎng)期持續(xù)的優(yōu)勢(shì)是什么？

張鵬：我們足夠聚焦。第一，對(duì)AI的認(rèn)知從第一天就領(lǐng)先市場(chǎng)平均水平。第二，我們把自己定位成通用大模型廠商，目標(biāo)AGI，其他事可以選擇不做，聚焦在這。這是最大優(yōu)勢(shì)。依靠這種定位和專注，在技術(shù)創(chuàng)新、產(chǎn)品迭代上創(chuàng)造市場(chǎng)，創(chuàng)造更多商業(yè)化機(jī)會(huì)。通用模型能力不是虛的，不同階段有切實(shí)的落地。最近我們聚焦在編程能力上，這是個(gè)通用能力，聚焦后產(chǎn)生的技術(shù)、產(chǎn)品、商業(yè)化價(jià)值很大。來(lái)源于我們對(duì)這事認(rèn)知夠早、夠準(zhǔn)，技術(shù)能力能達(dá)到最頂尖水平。

方三文：優(yōu)勢(shì)在模型本身還是落地應(yīng)用？

張鵬：這兩件事分不開(kāi)。這次AI革命，從算法研究到工程實(shí)現(xiàn)、產(chǎn)品化、應(yīng)用反饋整個(gè)閉環(huán)壓縮得非常緊密。不像以前實(shí)驗(yàn)室發(fā)論文，幾年后才做成Demo、產(chǎn)品、迭代。大模型這波從算法創(chuàng)新到類似ChatGPT上線只用了五年，用戶一下過(guò)幾億。時(shí)間周期和閉環(huán)壓縮得很厲害。你說(shuō)把算法研究到頂尖再考慮交付，做不到。這是一體化的。我們一邊研究一邊輸出，讓大家用反饋，往好用方向加深。

方三文：通用大模型廠商會(huì)越來(lái)越少，但把大模型能力放到具體企業(yè)應(yīng)用場(chǎng)景的玩家會(huì)不會(huì)越來(lái)越多？

張鵬：把模型能力變成客戶需求、產(chǎn)品特性，最后這一公里。這個(gè)肯定會(huì)越來(lái)越多，因?yàn)槭袌?chǎng)需求大。這就是生態(tài)趨勢(shì)。

方三文：如果很多玩家進(jìn)來(lái)，會(huì)不會(huì)把市場(chǎng)利潤(rùn)率玩得很低？比如圖像識(shí)別能力應(yīng)用到不同場(chǎng)景，很多廠商做，利潤(rùn)率很低。

張鵬：那種情況是在技術(shù)接近天花板時(shí)發(fā)生，比如人臉識(shí)別到97%、98%，再往上沒(méi)意義，技術(shù)穩(wěn)定，大家蜂擁而上壓成本，導(dǎo)致價(jià)格越來(lái)越低。但大模型還在技術(shù)快速增長(zhǎng)階段，技術(shù)溢價(jià)高，創(chuàng)新活躍，不太會(huì)出現(xiàn)低價(jià)競(jìng)爭(zhēng)模式。我們要做的就是在曲線增長(zhǎng)階段保持技術(shù)創(chuàng)新領(lǐng)先，用創(chuàng)新速度創(chuàng)造市場(chǎng)空間，獲得創(chuàng)新的技術(shù)溢價(jià)。

方三文：研發(fā)投入主要目的是在大模型方面保持持續(xù)領(lǐng)先優(yōu)勢(shì)，還是在產(chǎn)品化、商業(yè)化方面有更好體驗(yàn)和效率？

張鵬：一定是前者。基礎(chǔ)模型能力上限是我們的根本，所有商業(yè)化都基于這一點(diǎn)。

方三文：這個(gè)行業(yè)有國(guó)際國(guó)內(nèi)巨頭，你要保持優(yōu)勢(shì)難不難？

張鵬：有挑戰(zhàn)，但正是有挑戰(zhàn)，團(tuán)隊(duì)覺(jué)得必須去做，必須做成。我們有這個(gè)自信和信心。

方三文：大廠可投入資金比你大得多，算力方面很難有優(yōu)勢(shì)；數(shù)據(jù)方面，大廠有存量互聯(lián)網(wǎng)內(nèi)容優(yōu)勢(shì)。你們是否是在算法方面有優(yōu)勢(shì)？

張鵬：三要素不是分裂看的。算力投入我們跟大廠沒(méi)法比，人家投得起。數(shù)據(jù)方面，我也不覺(jué)得他們能把那些數(shù)據(jù)無(wú)償合法地拿來(lái)做訓(xùn)練，這中間涉及法律問(wèn)題。算法、研發(fā)能力是我們的強(qiáng)項(xiàng)。三要素單獨(dú)看有勝有劣，但怎么粘合起來(lái)產(chǎn)生化學(xué)反應(yīng)，考驗(yàn)團(tuán)隊(duì)能力。還有更本質(zhì)的是對(duì)AGI、AI第一性原理的理解和認(rèn)知程度。舉個(gè)例子，某個(gè)大廠也是比較早就開(kāi)始做大模型，做了一段時(shí)間之后，它們內(nèi)部也不是無(wú)限制投入，投入完之后被問(wèn)怎么商業(yè)化，團(tuán)隊(duì)被逼商業(yè)化，結(jié)果失敗了，團(tuán)隊(duì)被替換。大廠投入也不是無(wú)上限，有考核要求。所以不用過(guò)于夸大所謂大廠的能力。

方三文：聽(tīng)起來(lái)是需要勇氣才能參與的市場(chǎng)競(jìng)爭(zhēng)。你是有勇氣的人？

張鵬：我們這個(gè)團(tuán)隊(duì)很有勇氣。

方三文：你們商業(yè)模式建立在B端市場(chǎng)，你們C端市場(chǎng)是做什么的？

張鵬：我們很早思考過(guò)這個(gè)問(wèn)題。為什么要把B和C分開(kāi)？分的原理是什么？沒(méi)人能講明白。很多人從商業(yè)層面說(shuō)ToB/ToC的產(chǎn)品形態(tài)、付費(fèi)模式不一樣。但從產(chǎn)品和技術(shù)層面來(lái)看，回歸第一性原理，這兩者沒(méi)有差別。因?yàn)椴还芊?wù)企業(yè)還是互聯(lián)網(wǎng)客戶，最終都是服務(wù)人。只有人認(rèn)可價(jià)值，利用技術(shù)和產(chǎn)品獲得價(jià)值增益，才愿意付費(fèi)。只是B端和C端付費(fèi)邏輯、決策邏輯不同。但AI是生產(chǎn)力級(jí)別的，付費(fèi)取決于生產(chǎn)力轉(zhuǎn)換的價(jià)值增益。沒(méi)有這個(gè)就不會(huì)付費(fèi)。所以C端不是我們現(xiàn)在的重點(diǎn)。就像電，為電付費(fèi)，個(gè)人或企業(yè)有什么差別？沒(méi)差別，都是因?yàn)橛昧擞袃r(jià)值。

方三文：目前商業(yè)化主要在B端，是嗎？

張鵬：未來(lái)很多事情都是不確定性的，所以為什么我一直在說(shuō)，現(xiàn)在這個(gè)時(shí)代最大的挑戰(zhàn)來(lái)源于人。人對(duì)于新鮮事物的線性外推，只能基于過(guò)去認(rèn)知預(yù)測(cè)未來(lái)，永遠(yuǎn)預(yù)測(cè)不到認(rèn)知之外的東西。很多問(wèn)題根源在此。智譜應(yīng)該堅(jiān)持AGI理想往前走，當(dāng)市場(chǎng)需要什么類型時(shí)它就是什么類型。我們認(rèn)為在這個(gè)階段這種模式是好的，對(duì)我們來(lái)講是合適的。我們就會(huì)沿著這個(gè)路去走。太遠(yuǎn)的我們預(yù)測(cè)不了，也沒(méi)必要給自己設(shè)限。

全文原視頻：

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.