在人工智能技術(shù)快速迭代、大模型成為產(chǎn)業(yè)焦點(diǎn)的背景下,全球AI競(jìng)爭(zhēng)格局逐漸清晰,技術(shù)多樣性與商業(yè)化落地成為行業(yè)的核心議題。在這一背景下,中國(guó)大模型企業(yè)的技術(shù)選擇、組織路徑與長(zhǎng)期判斷,逐漸成為觀察全球AI競(jìng)爭(zhēng)格局的重要樣本。
在雪球出品的投資類專業(yè)對(duì)話欄目《方略》第三季第二期中,雪球創(chuàng)始人、董事長(zhǎng)方三文對(duì)話智譜CEO張鵬,圍繞AI發(fā)展歷程、AI應(yīng)用的邊界、智譜商業(yè)模式等核心話題展開(kāi)。張鵬表示,模型體系的多樣性是技術(shù)持續(xù)進(jìn)步的重要?jiǎng)恿ΑR韵率菍?duì)話精選:
大眾對(duì)AI的問(wèn)題沒(méi)有超越圖靈九問(wèn)
方三文:什么是AI?
張鵬:AI是一個(gè)縮寫,它叫做Artificial Intelligence,直譯過(guò)來(lái)就是人工智能。最簡(jiǎn)單直白的一個(gè)描述就是,用技術(shù)的方法,不管是計(jì)算機(jī)還是其他的方法,去模擬人類的智能,進(jìn)而來(lái)服務(wù)人。
方三文:圖靈在1950年的論文《計(jì)算機(jī)器與智能》里面提出了智能這個(gè)概念,后來(lái)在達(dá)特茅斯會(huì)議里面直接定義了人工智能。我們今天談?wù)摰腁I,和圖靈說(shuō)的智能或者是1956年提出的人工智能之間有什么關(guān)系?
張鵬:如果按照邏輯學(xué)或數(shù)學(xué)的概念來(lái)描述,智能是更大的一個(gè)圈,人工智能是智能當(dāng)中的一部分,就是我們?cè)趺慈ツM人類的智能。所以現(xiàn)在我們說(shuō)的AI或者人工智能,其實(shí)就是1956年達(dá)特茅斯會(huì)議上提出來(lái)的那個(gè)定義。但是,隨著時(shí)間不斷演進(jìn),技術(shù)和市場(chǎng)的變化,AI的內(nèi)涵在不斷變化。現(xiàn)在的人工智能包含的事情比當(dāng)年范圍更廣,但核心目標(biāo)沒(méi)變。
方三文:大模型和AI,是一回事嗎?
張鵬:大模型只是我們實(shí)現(xiàn)人工智能的技術(shù)方法中的一種。
方三文:從1950年代到現(xiàn)在,AI發(fā)展經(jīng)歷了什么重要的節(jié)點(diǎn)?
張鵬:從1950年代到現(xiàn)在大概70多年,不到80年。這幾十年來(lái),AI的發(fā)展并不是一帆風(fēng)順的。大家公認(rèn)的有三次人工智能浪潮,或者嚴(yán)格劃分也可以說(shuō)現(xiàn)在是第四次。為什么會(huì)起起落落?我覺(jué)得這也是一個(gè)歷史的必然規(guī)律。一件事情的發(fā)展不會(huì)永遠(yuǎn)是增長(zhǎng)的曲線,過(guò)程中會(huì)碰到各種挑戰(zhàn)、困難,結(jié)合當(dāng)時(shí)的社會(huì)經(jīng)濟(jì)情況,會(huì)有起伏,都很正常。
方三文:1958年提出的感知機(jī)是什么?
張鵬:感知機(jī)是一個(gè)數(shù)學(xué)上的方法,簡(jiǎn)單理解就是嘗試在數(shù)據(jù)的空間中找到所謂的“超平面”,把這個(gè)空間一分為二,平面的一側(cè)是我們想要的結(jié)果,另一側(cè)是不想要的,這其實(shí)是個(gè)分類問(wèn)題。感知機(jī)就是找到這個(gè)“超平面”的一種方法,通過(guò)機(jī)器設(shè)定一個(gè)模型,讓它通過(guò)數(shù)據(jù)迭代的方式準(zhǔn)確定位超平面。它對(duì)AI的作用是奠定了一個(gè)基礎(chǔ),通過(guò)機(jī)器學(xué)習(xí),讓機(jī)器從數(shù)據(jù)中學(xué)習(xí)的方法去解決具體問(wèn)題。就像人通過(guò)學(xué)習(xí)解決問(wèn)題,不斷實(shí)踐,通過(guò)數(shù)據(jù)反饋來(lái)迭代求解,而不是設(shè)定一個(gè)公式算一遍就結(jié)束。這個(gè)和現(xiàn)在的大模型、深度學(xué)習(xí)的思想完全一致。可以說(shuō)它是機(jī)器學(xué)習(xí)的源頭、鼻祖。
方三文:1966年MIT開(kāi)發(fā)了第一個(gè)真正意義上的聊天機(jī)器人,叫Eliza。你看現(xiàn)在大家特別熱衷的ChatGPT,都在聊天。為什么人工智能跟聊天有這么密切的關(guān)系?
張鵬:我覺(jué)得最重要的還是回歸到人工智能的本質(zhì)目標(biāo),就是用機(jī)器或技術(shù)的方法實(shí)現(xiàn)類人的智能。但你如何確定你做出來(lái)的東西具備類人的智能?它需要一個(gè)檢驗(yàn)方式。對(duì)于人來(lái)說(shuō)最自然的檢驗(yàn)方式就是聊天,看我能不能識(shí)別出你是不是個(gè)人。所以從最開(kāi)始的出發(fā)點(diǎn),就影響到后續(xù)很多工作。
方三文:1973年出了一個(gè)萊特希爾報(bào)告,提出AI的局限性,導(dǎo)致AI投資下降。當(dāng)時(shí)AI局限性主要指什么?
張鵬:萊特希爾報(bào)告里舉出的AI局限性有幾個(gè)方面。首先最明顯的是當(dāng)時(shí)整個(gè)AI研究界樂(lè)觀情緒占上風(fēng),在那個(gè)年代就喊出口號(hào)說(shuō)未來(lái)20年要實(shí)現(xiàn)通用人工智能。大家的理想很好,目標(biāo)遠(yuǎn)大,但路徑中困難太大。那時(shí)計(jì)算機(jī)的計(jì)算能力很差。第二,當(dāng)時(shí)對(duì)數(shù)據(jù)也沒(méi)有很好的整理。第三,早期的人工智能方法基本上都基于符號(hào)學(xué)派,它能解決的問(wèn)題非常局限,比如數(shù)學(xué)物理這種能用完備符號(hào)系統(tǒng)表達(dá)的,稍微擴(kuò)大到知識(shí)、常識(shí)就不行了。所以導(dǎo)致大家重新冷靜審視AI的投入,引起第一次AI寒冬。
方三文:是不是任何科學(xué)的終極目標(biāo)或愿望,和現(xiàn)在可用的資源、路徑總是存在著較大差距?
張鵬:這是一個(gè)行業(yè)或技術(shù)往前發(fā)展的源動(dòng)力。就像物理化學(xué)里的滲透壓,兩邊濃度不同會(huì)產(chǎn)生滲透動(dòng)力,來(lái)自于不均衡。當(dāng)你遠(yuǎn)大目標(biāo)和當(dāng)下?lián)碛械馁Y源、技術(shù)能達(dá)到的效果之間有差距時(shí),這個(gè)差距會(huì)刺激大家不斷研究、找到新方法、投入新資源。這很正常,只是看差距有多大。
方三文:這個(gè)滲透壓達(dá)成的平衡是不是一個(gè)相對(duì)動(dòng)態(tài)的平衡?
張鵬:是,肯定是動(dòng)態(tài)平衡。就像AI的發(fā)展起起落落,為什么第一次寒冬后會(huì)有第二波?因?yàn)榇蠹抑匦驴吹搅藙?dòng)態(tài)平衡的可能性,有新資源加入,滲透壓變化,好像能克服或利用這個(gè)差距,于是投入新方法、新資源去做。所以它永遠(yuǎn)是動(dòng)態(tài)變化的。
方三文:1981年產(chǎn)生了第一臺(tái)帶GPU的電腦。GPU是什么?它今天很熱,跟AI是什么關(guān)系?
張鵬:GPU跟CPU相對(duì)。CPU是計(jì)算機(jī)的核心處理單元,中央處理器。GPU叫圖形處理器,當(dāng)時(shí)專門設(shè)計(jì)出來(lái)幫CPU分擔(dān)圖形處理能力。GPU和AI的關(guān)系挺有意思。因?yàn)樗鰣D像處理時(shí)更偏重浮點(diǎn)計(jì)算,CPU偏重整數(shù)計(jì)算。GPU專門加強(qiáng)了浮點(diǎn)數(shù)計(jì)算的能力。這一點(diǎn)恰恰跟AI或科學(xué)計(jì)算類似,科學(xué)計(jì)算里有大量浮點(diǎn)計(jì)算。有些科學(xué)家就說(shuō),能不能用硬件加速的方法來(lái)加速科學(xué)計(jì)算的算法程序?英偉達(dá)敏銳捕捉到這點(diǎn),黃仁勛當(dāng)時(shí)給很多科學(xué)家送GPU卡,唯一要求是把算法在上面跑,收集效果來(lái)宣傳。
方三文:1980年代末1990年代初,AI又進(jìn)入第二次寒冬。這個(gè)中間發(fā)生了什么?和第一次有什么區(qū)別?
張鵬:第二次AI起來(lái)是因?yàn)榇蠹艺业搅艘粋€(gè)新方法——專家系統(tǒng)。在第一代感知機(jī)等方法基礎(chǔ)上,通過(guò)結(jié)構(gòu)化知識(shí)表示,讓計(jì)算機(jī)具備像專家一樣的專業(yè)知識(shí)來(lái)解答問(wèn)題。這是第二代人工智能成功的點(diǎn)。但到一定程度后發(fā)現(xiàn),雖然理論上比第一代好,有完備方法論,可以把人類規(guī)則用if/else方式寫下來(lái)交給機(jī)器用。但這種方式到一定規(guī)模后,知識(shí)能不能窮舉?比如醫(yī)療領(lǐng)域所有病癥和治療方案能不能窮舉?把所有知識(shí)寫出來(lái),可能是天文數(shù)字。這是實(shí)現(xiàn)成本和周期的問(wèn)題。第二,雖然計(jì)算能力增加了,但巨大量的專家知識(shí)輸入后,計(jì)算量是指數(shù)級(jí)爆炸增長(zhǎng),仍然不能滿足需求。水位永遠(yuǎn)是動(dòng)態(tài)的,看到計(jì)算能力提升投入新方法,加了很多東西后計(jì)算能力又不夠了。所以是動(dòng)態(tài)互相促進(jìn)的過(guò)程。
方三文:1997年深藍(lán)擊敗國(guó)際象棋世界冠軍,有什么意義?
張鵬:這是非常標(biāo)志性的事件。大家會(huì)覺(jué)得聊天簡(jiǎn)單,下棋比聊天復(fù)雜,智能水平高很多。如果機(jī)器在下棋上勝過(guò)人類,說(shuō)明智力水平到一定程度了。深藍(lán)戰(zhàn)勝卡斯帕羅夫的意義就在這。
方三文:后來(lái)過(guò)了將近20年,2016年AlphaGo擊敗李世石。AlphaGo和深藍(lán)在技術(shù)上不同?
張鵬:實(shí)現(xiàn)路徑上不一樣。深藍(lán)主要是搜索式的方法,在已知棋譜或當(dāng)前棋盤狀態(tài)中搜索下一步,可能往前搜索幾步,用蒙特卡洛樹(shù)搜索剪枝,不搜索所有空間,只搜索一部分,預(yù)測(cè)有限步數(shù),在有限時(shí)間內(nèi)找到最接近最好的解法。AlphaGo也沿著這個(gè)路徑,但實(shí)現(xiàn)方式不同,用了神經(jīng)網(wǎng)絡(luò),用大量數(shù)據(jù)訓(xùn)練來(lái)逼近搜索和預(yù)測(cè)算法。目標(biāo)都是搜索空間預(yù)測(cè)最好方法,但預(yù)測(cè)方式不同。可以理解為AlphaGo是端到端的方法,深藍(lán)更多是基于規(guī)則、一環(huán)套一環(huán)的工作流水線。
方三文:簡(jiǎn)單說(shuō)說(shuō)深度學(xué)習(xí)是什么?
張鵬:深度學(xué)習(xí)指有比較深的算法層次。比如一層神經(jīng)元或基本計(jì)算單元,能解決非常簡(jiǎn)單的問(wèn)題。復(fù)雜問(wèn)題就疊很多層,一層一層往上疊,層數(shù)越多能模擬的情況越多,計(jì)算越復(fù)雜。
方三文:就是函數(shù)套函數(shù)?
張鵬:對(duì),一層套一層,不斷壘起來(lái)。
方三文:從終端角度看,1995年前后PC普及,2000年前后互聯(lián)網(wǎng)普及,把機(jī)器和數(shù)據(jù)連起來(lái)。這對(duì)深度學(xué)習(xí)發(fā)展有關(guān)系嗎?
張鵬:深度學(xué)習(xí)需要非常大的計(jì)算能力。剛才講GPU就是因?yàn)樗↑c(diǎn)計(jì)算能力強(qiáng),所以火起來(lái)。計(jì)算設(shè)備能力的提升是深度學(xué)習(xí)快速發(fā)展的前提條件,算力相當(dāng)于發(fā)動(dòng)機(jī),越強(qiáng)大輸出馬力越大。數(shù)據(jù)相當(dāng)于燃料,要有優(yōu)良、大量的燃料才能讓發(fā)動(dòng)機(jī)跑更長(zhǎng)時(shí)間,輸出更大功率。PC和互聯(lián)網(wǎng)提供了大量數(shù)據(jù)。
方三文:Google 2016年發(fā)表了Transformer論文,論文發(fā)表后短時(shí)間內(nèi)OpenAI發(fā)布了ChatGPT,這兩個(gè)事情有聯(lián)系嗎?
張鵬:肯定有聯(lián)系。OpenAI真正轉(zhuǎn)做大模型就在這篇論文發(fā)布之后。OpenAI 2015年成立,到2018年左右一直不是走這條路,而是走強(qiáng)化學(xué)習(xí)路線。Transformer論文后不久,2018年開(kāi)始,以伊利亞為首的科學(xué)家果斷轉(zhuǎn)向,基于它做GPT相關(guān)研究。
方三文:第一個(gè)版本ChatGPT出來(lái)時(shí)你關(guān)注了嗎?
張鵬:分兩個(gè)階段。2018年他們開(kāi)始做GPT,沒(méi)引起太大關(guān)注,效果不太好。從GPT-2開(kāi)始有一定關(guān)注,學(xué)界有討論,褒貶不一,有人說(shuō)它只是大力出奇跡,不是算法革新,也有人說(shuō)是好范式。那時(shí)關(guān)注到討論,在國(guó)外比較多,國(guó)內(nèi)相對(duì)少。得益清華環(huán)境,接觸國(guó)外學(xué)術(shù)圈方便。真正讓大家覺(jué)得很牛是2020年GPT-3發(fā)布。從GPT-3發(fā)布我們就關(guān)注到,并且認(rèn)知到它可能就是未來(lái)的范式變化轉(zhuǎn)折點(diǎn)。
方三文:為什么做出這種判斷?當(dāng)時(shí)出現(xiàn)什么現(xiàn)象或重要突破?
張鵬:之前我們用傳統(tǒng)機(jī)器學(xué)習(xí)方法做NLP任務(wù),包括對(duì)話、QA等,一直沒(méi)做到讓人滿意。傳統(tǒng)NLP方法需要很長(zhǎng)算法流水線處理句子,找到結(jié)構(gòu)、名詞、動(dòng)詞,理解句子。但GPT出現(xiàn)后,發(fā)現(xiàn)不用這么做,只要把句子扔進(jìn)去,它就能答,而且答得很好。這就是端到端解決,不需要復(fù)雜拆解。效果很多時(shí)候碾壓傳統(tǒng)流水線方法。所以大家看到這個(gè)方法有優(yōu)勢(shì),覺(jué)得這可能就是下個(gè)階段的技術(shù)范式。
方三文:DeepSeek-R1的發(fā)布,好像顛覆了大家認(rèn)知。你認(rèn)為從原理和效果上它有什么突破?
張鵬:DeepSeek引起行業(yè)內(nèi)重大關(guān)注,但它還是沿著這條路走,沒(méi)有像GPT相對(duì)于傳統(tǒng)機(jī)器學(xué)習(xí)有那樣迥異的方法論。它不是方法論級(jí)別的,更多是在怎么降低成本、怎么把工程優(yōu)化,把原來(lái)“力大磚飛”簡(jiǎn)單堆參數(shù)量或數(shù)據(jù)量的邏輯拉回來(lái),告訴大家不用堆那么多,可以在算法上優(yōu)化,把成本壓下來(lái),效果同時(shí)提升。更重要的原因是,它在那個(gè)時(shí)間點(diǎn)用開(kāi)源方式把技術(shù)全部交給社區(qū)、研究界、工業(yè)界,讓大家無(wú)償免費(fèi)使用最新技術(shù),對(duì)當(dāng)時(shí)的市場(chǎng)沖擊很大。
方三文:AI發(fā)展涉及算力、數(shù)據(jù)、算法。現(xiàn)在這三個(gè)因素哪個(gè)最卡住AI發(fā)展?哪個(gè)突破可能帶來(lái)進(jìn)一步發(fā)展?
張鵬:不同時(shí)間段認(rèn)知不一樣。最早大家覺(jué)得算法重要,可以直達(dá)AGI。過(guò)一段時(shí)間模型參數(shù)量大,又覺(jué)得互聯(lián)網(wǎng)上能拿到的數(shù)據(jù)不夠了,擔(dān)心數(shù)據(jù)用盡、預(yù)訓(xùn)練撞墻。然后大家琢磨解決數(shù)據(jù)問(wèn)題,到現(xiàn)在數(shù)據(jù)問(wèn)題也能解決掉,又擔(dān)心算力不夠。后來(lái)技術(shù)進(jìn)步,英偉達(dá)拼命生產(chǎn),算力也能搞到。大家又會(huì)覺(jué)得算法本身有問(wèn)題,效率不高,災(zāi)難性遺忘等問(wèn)題解不了,很多人預(yù)測(cè)Transformer也要被革新。所以它是個(gè)動(dòng)態(tài)循環(huán)、螺旋式上升的過(guò)程。
方三文:你覺(jué)得AGI是抽象目標(biāo)還是具體目標(biāo)?是最終可以實(shí)現(xiàn)還是只能無(wú)限接近?
張鵬:AGI定義不像AI那么清晰,它的內(nèi)涵外延從沒(méi)有非常明確權(quán)威的定義。但AGI能不能實(shí)現(xiàn)?只要我們能把這個(gè)目標(biāo)定義好,不太離譜的定義,大概率能實(shí)現(xiàn),時(shí)間長(zhǎng)短問(wèn)題。智譜從成立第一天目標(biāo)就是AGI,我們有自己定義。
方三文:對(duì)普羅大眾來(lái)說(shuō),AGI是不是有點(diǎn)像科學(xué)中的終極真理,不容易具體化?
張鵬:終極真理很難描繪,因?yàn)檎l(shuí)也不知道。但科學(xué)界有多種方法描繪,比如圖靈測(cè)試用行為學(xué)定義智能。AGI很多時(shí)候大家也用行為學(xué)定義,比如有一派說(shuō),AI取得人各項(xiàng)能力的平均水平就叫AGI。有了行為定義,倒推技術(shù)要做到哪些事情,匹配人的水平。所以跟定義方式有關(guān),實(shí)現(xiàn)路徑參照這個(gè)一步步走上去。
方三文:今天大眾對(duì)AI爭(zhēng)論,有沒(méi)有超出圖靈提出的那九個(gè)反問(wèn)?
張鵬:基本上沒(méi)有超出那個(gè)范圍。AI行業(yè)70多年,起起伏伏好幾次,但問(wèn)題回到原點(diǎn),哲學(xué)上的思考很早就有了,不是新鮮東西。我們不斷演進(jìn)的是用什么路徑、方法去接近當(dāng)初定義的最高目標(biāo)。
AI應(yīng)用的邊界
方三文:大模型具體是什么東西?
張鵬:首先“模型”大家可能容易理解,是一種算法的載體。傳統(tǒng)機(jī)器學(xué)習(xí)里也有模型,不稀奇。關(guān)鍵是前面加了“大”字。為什么叫大模型?回到深度神經(jīng)網(wǎng)絡(luò),你可以想象它是一個(gè)非常大的計(jì)算矩陣,矩陣?yán)锩總€(gè)元素是一個(gè)參數(shù),輸入數(shù)據(jù)經(jīng)過(guò)矩陣乘加得到結(jié)果。中間這個(gè)矩陣就是模型核心。大模型的矩陣規(guī)模非常大,體現(xiàn)在參數(shù)量非常大。傳統(tǒng)感知機(jī)可能只有兩三個(gè)參數(shù),大模型可能有幾千萬(wàn)、幾億、幾十億、上千億參數(shù),所以叫大模型。
方三文: 業(yè)余人士也大概知道大模型有分類:一種通用大模型,類似ChatGPT、Grok、Gemini、智譜GLM;還有一些在特定領(lǐng)域的特定場(chǎng)景模型。是不是可以分成這兩大類?
張鵬: ChatGPT火起來(lái)后國(guó)內(nèi)爭(zhēng)論過(guò),有沒(méi)有通用模型和專業(yè)/垂直模型這個(gè)分類?我們回到第一性原理,為什么要分這兩類?原因是什么?我們是通用模型派。當(dāng)時(shí)有人說(shuō)通用模型拿通用數(shù)據(jù)訓(xùn)練,參數(shù)量大成本高,但不能解決專業(yè)問(wèn)題。另一派說(shuō)訓(xùn)練參數(shù)量小點(diǎn)的,用專用數(shù)據(jù)訓(xùn)練,解決專業(yè)問(wèn)題。這叫垂直或?qū)I(yè)模型。但后來(lái)發(fā)現(xiàn)有個(gè)悖論:如果你能拿到專業(yè)數(shù)據(jù),為什么不把它加到通用模型里訓(xùn)練?它是不是也能解決專業(yè)問(wèn)題?為什么要單獨(dú)弄專業(yè)模型?第二個(gè)問(wèn)題,專業(yè)小模型用少量數(shù)據(jù)訓(xùn)練,能力就一定會(huì)比通用模型強(qiáng)嗎?通用模型加專業(yè)數(shù)據(jù)后能力超過(guò)專業(yè)模型。所以專業(yè)模型存在的兩個(gè)根本起點(diǎn)塌了,從實(shí)踐中大家看到這是個(gè)偽命題。
方三文:那導(dǎo)向一個(gè)可怕結(jié)論:所有大模型公司都在通用大模型業(yè)務(wù)模式下競(jìng)爭(zhēng)。最后競(jìng)爭(zhēng)格局會(huì)是怎樣?會(huì)始終存在很多通用大模型,還是會(huì)越來(lái)越少?
張鵬:收斂是肯定的。首先做這個(gè)事情成本挺高,算力、數(shù)據(jù)、人力需求非常高。如果大家都從零開(kāi)始做,是資源重復(fù)投入。從資源最優(yōu)化角度,一定會(huì)收斂到頭部那幾家,其他家做別的事。這是大勢(shì)。現(xiàn)在越來(lái)越細(xì)分,不一定是應(yīng)用,還有模型的基礎(chǔ)設(shè)施、平臺(tái)、具體細(xì)分場(chǎng)景的應(yīng)用、服務(wù)等,形成大的生態(tài)。但大模型本身的參與門檻不是一般公司能參與的。
方三文:世界上通用大模型主要玩家大概四五家,主要在中美兩國(guó),歐洲有Mistral。你覺(jué)得會(huì)不會(huì)最后只剩一家?
張鵬:我直覺(jué)上認(rèn)為不會(huì)只剩一家。因?yàn)榧夹g(shù)發(fā)展需要多樣性,尤其在早中期,技術(shù)革新可能性多,研究方向多,大家會(huì)有差異,各自有生存空間。加上市場(chǎng)很大,蓬勃發(fā)展,空間足夠大,不會(huì)快速收斂。早中期會(huì)有多樣化生態(tài),不會(huì)因?yàn)橐患胰〉脙?yōu)勢(shì)就一家通吃。只剩下一家的情況只會(huì)出現(xiàn)在技術(shù)相對(duì)穩(wěn)定的狀態(tài),技術(shù)革新不快速時(shí),會(huì)有馬太效應(yīng)。現(xiàn)在階段暫時(shí)不會(huì)出現(xiàn)一家通吃,目前也看不到一家通吃的前景。
方三文:造成各家大模型差異的主要是算力、數(shù)據(jù)還是算法?
張鵬:我覺(jué)得都有。算力是資源投入,能獲取什么樣的算力、多大量、什么成本,決定了后續(xù)投入效率、速度、創(chuàng)新比例。數(shù)據(jù)也一樣,能獲取什么樣的高質(zhì)量數(shù)據(jù),在細(xì)分方面就有優(yōu)勢(shì)。算法更根本,誰(shuí)算法創(chuàng)新更快更持續(xù),行業(yè)排位就更靠前。
方三文:有人認(rèn)為,對(duì)普通人來(lái)說(shuō)AI除了方便信息獲取整理,沒(méi)引起生活太大變化。你認(rèn)為這個(gè)變化會(huì)不會(huì)發(fā)生?
張鵬:它一定會(huì)發(fā)生,而且正在發(fā)生。日常辦公、工作、生活場(chǎng)景中,AI已經(jīng)能幫我們做很多事。我不太喜歡逛商場(chǎng),很多事情希望AI幫我一鍵做完。我們發(fā)布AutoGLM產(chǎn)品就是這個(gè)目的。手機(jī)上有電商平臺(tái),我要買東西,可能有個(gè)想法,讓AI幫我挑幾樣?xùn)|西扔到購(gòu)物籃,要求挑最便宜或性價(jià)比最好的,我只要最后確認(rèn)付款。類似這樣的事已經(jīng)在生活中慢慢發(fā)生。
方三文:能否舉一些AI已經(jīng)改變行業(yè)的案例?
張鵬:有些大家看不到的地方,比如工業(yè)界、醫(yī)藥行業(yè)。原來(lái)發(fā)明一款藥周期非常長(zhǎng),要篩選很多化合物,做實(shí)驗(yàn),成本高。現(xiàn)在可以用AI幫助藥物設(shè)計(jì),篩選分子。比如蛋白質(zhì)結(jié)構(gòu)要找小分子契合,大量篩選工作通過(guò)AI做。還有AlphaFold,人體內(nèi)蛋白質(zhì)結(jié)構(gòu)原來(lái)靠實(shí)驗(yàn)一點(diǎn)點(diǎn)拼湊,現(xiàn)在AlphaFold可以根據(jù)歷史數(shù)據(jù)快速預(yù)測(cè),用計(jì)算方法找出候選方案,再實(shí)驗(yàn)確定。這些領(lǐng)域發(fā)生很大變化,最終會(huì)給普通人帶來(lái)很大變化,以后藥可能沒(méi)那么貴。
方三文:醫(yī)生環(huán)節(jié),AI有幫助或替代作用嗎?
張鵬:肯定有。國(guó)內(nèi)外都有。國(guó)外有大量研究文獻(xiàn)、臨床數(shù)據(jù),用AI分析研判,幫助醫(yī)生解決疑難雜癥,或給醫(yī)學(xué)研究提供知識(shí)支持。國(guó)內(nèi)也有醫(yī)療機(jī)構(gòu)和商業(yè)化公司在做類似產(chǎn)品,幫助基層醫(yī)生提供知識(shí)輔助、培訓(xùn)等。
方三文:輔助駕駛或自動(dòng)駕駛是不是AI的應(yīng)用方向?
張鵬:自動(dòng)駕駛做了十幾年,替代人駕駛有可能做到,但跟AGI類似,首先得定義我們希望達(dá)到的完全自動(dòng)駕駛的本質(zhì)是什么,要解決什么問(wèn)題。描繪清楚才知道現(xiàn)有方法能做到什么程度,缺陷是什么,下一步方法是什么。取決于定義。只能不斷逼近已知認(rèn)知的部分,從行為學(xué)定義上越來(lái)越像它。但本質(zhì)沒(méi)拆解開(kāi),不知道智能怎么形成的,所以沒(méi)法確保100%做到。
方三文:如果一個(gè)東西是模仿游戲,它就是不斷接近?
張鵬: 對(duì),不斷逼近。
方三文:如果完全破解了它,知道演繹過(guò)程,就可以無(wú)限制復(fù)制?
張鵬:就是黑盒、白盒的區(qū)別。AI演化過(guò)程,第一、二代都是白盒,但發(fā)現(xiàn)白盒走得很累。到第三代深度學(xué)習(xí)出現(xiàn),慢慢向黑盒轉(zhuǎn)換,因?yàn)榘缀薪鉀Q問(wèn)題太多不知道怎么弄。有人說(shuō)不用管里面原理,人的大腦也是黑盒,用黑盒對(duì)黑盒,從輸入輸出結(jié)果看,效果出奇的好,大家就轉(zhuǎn)到端到端。
方三文:黑盒雖然無(wú)限接近,但要說(shuō)它能無(wú)限制準(zhǔn)確復(fù)制不一定?
張鵬:有兩個(gè)事情。第一,如果把黑盒模型無(wú)限接近人,那它是可復(fù)制的,就是一坨數(shù)據(jù),復(fù)制就好。但不可復(fù)制的是你沒(méi)辦法把它拆解開(kāi),說(shuō)它為什么能做到,它某部分能力能不能單獨(dú)拆出來(lái),用白盒方式復(fù)現(xiàn)。所以問(wèn)題分兩面。
方三文:人和AI到底是什么關(guān)系?很多人說(shuō)AI越能干,我失業(yè)了。你怎么看?
張鵬:挺復(fù)雜的,這是所有人都要面對(duì)的問(wèn)題。這一代AI跟之前不一樣,它終于有能力跟人平等對(duì)話,知識(shí)水平可能超出一般人。這就帶來(lái)很大問(wèn)題,人只跟人打過(guò)交道,沒(méi)跟AI打過(guò)交道,不知道怎么和諧相處。 但我不覺(jué)得人類智能會(huì)停滯,人類適應(yīng)和進(jìn)化能力非常強(qiáng)。歷史上技術(shù)變革、社會(huì)變革,都討論過(guò)人類面臨巨大危機(jī),會(huì)被取代,但都挺過(guò)來(lái)了,過(guò)得越來(lái)越好。人本身也在進(jìn)步進(jìn)化。所以AI未必是絕對(duì)危機(jī),可能刺激人類進(jìn)化加速。
方三文:人這種生物或智能,跟計(jì)算機(jī)智能最大的區(qū)別可能是什么?
張鵬:我們?cè)袮GI路徑分為L(zhǎng)1到L5:知識(shí)學(xué)習(xí)壓縮、推理、自我學(xué)習(xí)、初步意識(shí)、完整意識(shí)。現(xiàn)在大模型大概發(fā)展到自我學(xué)習(xí)這個(gè)中間階段。差別在于后面兩個(gè)階段:人有自我意識(shí),知道自己是我,AI目前顯然做不到。
方三文:全球AI行業(yè)最大競(jìng)爭(zhēng)體是美國(guó)和中國(guó)。你覺(jué)得它們?cè)诟?jìng)爭(zhēng)什么?
張鵬:個(gè)人感覺(jué)是兩種AI發(fā)展路徑或思路的競(jìng)爭(zhēng)。
方三文:美國(guó)思路是什么?中國(guó)思路是什么?
張鵬:美國(guó)在AI發(fā)展上求極致創(chuàng)新,追求高度,通過(guò)頭部玩家、資本聚集,在小范圍內(nèi)大量投入,不斷追求極限創(chuàng)新。中國(guó)不一樣,中國(guó)很難像美國(guó)那樣集中巨大資源在少數(shù)玩家砸出來(lái)。中國(guó)很多事情要求確定性和普惠。所以中國(guó)路徑是穩(wěn)扎穩(wěn)打,首先技術(shù)創(chuàng)新要跟上,不能太落后;其次過(guò)程中追求現(xiàn)有成果不斷轉(zhuǎn)化成生產(chǎn)力、經(jīng)濟(jì)價(jià)值,改善生活。政策制定者強(qiáng)調(diào)AI+千行百業(yè),AI賦能,改善民生經(jīng)濟(jì)。中國(guó)不是一味脫開(kāi),而是沿途下蛋,每個(gè)階段結(jié)果在各行各業(yè)落地。這個(gè)過(guò)程效率驅(qū)動(dòng)、ROI驅(qū)動(dòng),更強(qiáng)調(diào)成本效益收益核算。
方三文:跟過(guò)去很多行業(yè)一樣,中國(guó)更側(cè)重落地、應(yīng)用、產(chǎn)業(yè)化、商業(yè)化,講究用戶體驗(yàn)和商業(yè)效率。之后很長(zhǎng)一段時(shí)間AI競(jìng)爭(zhēng)都會(huì)這樣分工?
張鵬:可能會(huì)這樣,至少我們國(guó)家還會(huì)這樣做下去,歷史文化決定的。美國(guó)頭部公司在搞0到1,中國(guó)在搞10到100,更看重1到10和10到100,因?yàn)檫@畢竟是普惠的,更大范圍的。
智譜的商業(yè)模式與護(hù)城河
方三文:智譜是AI落地、產(chǎn)業(yè)化、商業(yè)化的一個(gè)案例。簡(jiǎn)單說(shuō)說(shuō)智譜的商業(yè)模式?
張鵬:智譜思考得比較清晰。2020、2021年左右我們?cè)谧聊ミ@件事。技術(shù)不起源于我們,但我們追得很快。那時(shí)我們想這個(gè)技術(shù)怎么變成一門生意,商業(yè)化路徑是什么。我們提出MaaS,Model as a Service,把模型本身變成一種服務(wù),讓大家能理解、使用,嵌入到產(chǎn)品、系統(tǒng)、生活中。這就是我們的商業(yè)模式。
方三文:這個(gè)模式是創(chuàng)立時(shí)定的還是慢慢摸索的?
張鵬:慢慢摸索的。2019年公司成立早期做學(xué)術(shù)運(yùn)用,探索一些服務(wù)。后來(lái)有一個(gè)體外獨(dú)立團(tuán)隊(duì)探索MaaS商業(yè)化,服務(wù)更多類型客戶。到一定階段,我們認(rèn)為模式是正確的,就合并進(jìn)來(lái)一起做。現(xiàn)在做得很大,增長(zhǎng)很好,也證明了這種模式是當(dāng)下大模型商業(yè)化比較靠譜的路徑。
方三文:現(xiàn)在這種模式是階段性最優(yōu)解,還是長(zhǎng)期穩(wěn)定形態(tài)?
張鵬:目前MaaS模式在相當(dāng)長(zhǎng)一段時(shí)間會(huì)比較穩(wěn)定,但絕不是終局。終局變數(shù)多,有待驗(yàn)證。大模型未來(lái)有個(gè)確定性方向是越來(lái)越向基礎(chǔ)設(shè)施演進(jìn),像水電燃?xì)猓蔀樯鐣?huì)運(yùn)轉(zhuǎn)所需的智能基礎(chǔ)設(shè)施。基礎(chǔ)設(shè)施必須標(biāo)準(zhǔn)化、便宜、易于獲取的。MaaS符合這種形態(tài)。另一個(gè)方向是模型作為基礎(chǔ)設(shè)施以外,從應(yīng)用角度會(huì)有不同形態(tài),加上硬件,在手機(jī)或終端里,形成不同產(chǎn)品。就像電和電器,兩端都有大市場(chǎng)前景。
方三文:一邊是基礎(chǔ)大模型,一邊是基于大模型的應(yīng)用。你們比較確定做后面這個(gè)?
張鵬:也不是后面,兩件事同時(shí)做。更主要的是MaaS這個(gè)基礎(chǔ)模型部分。上面的應(yīng)用我們也有一些。
方三文:請(qǐng)舉一個(gè)具體例子,你們?yōu)槟銈兊目蛻鬗aaS提供什么服務(wù),解決什么問(wèn)題?
張鵬:挺多例子。主要客戶像中國(guó)前十互聯(lián)網(wǎng)公司,九個(gè)是我們的客戶。有一個(gè)客戶,去年發(fā)生國(guó)際事件,某海外社交平臺(tái)大批用戶遷移到國(guó)內(nèi)一個(gè)社交平臺(tái),但語(yǔ)言不通,外國(guó)人看不懂中文,國(guó)內(nèi)用戶看不懂外文。我們就用模型輔助解決大量?jī)?nèi)容翻譯工作。第二個(gè)例子,我們跟三星合作,把模型能力植入手機(jī)終端,在端側(cè)可以用,解決數(shù)據(jù)隱私問(wèn)題,聊天記錄、圖片不用傳到云上,本地可搜索、編輯。這些都是解決現(xiàn)實(shí)世界的問(wèn)題。
方三文:你覺(jué)得AI應(yīng)用市場(chǎng)規(guī)模多大?
張鵬:Gartner預(yù)計(jì)在萬(wàn)億美金級(jí)別,有報(bào)告說(shuō)到2033年全球AI市場(chǎng)規(guī)模4.8萬(wàn)億美金。國(guó)內(nèi)至少萬(wàn)億以上。
方三文:你們目前業(yè)務(wù)主要競(jìng)爭(zhēng)對(duì)手是什么人?
張鵬:我們是獨(dú)立通用大模型廠商,這類玩家國(guó)內(nèi)不多。但大廠也在做同樣的事,做基礎(chǔ)模型和AI相關(guān)業(yè)務(wù),他們是我們的友商、競(jìng)爭(zhēng)對(duì)手、合作伙伴。
方三文:相對(duì)這些競(jìng)爭(zhēng)對(duì)手,你們公司長(zhǎng)期持續(xù)的優(yōu)勢(shì)是什么?
張鵬:我們足夠聚焦。第一,對(duì)AI的認(rèn)知從第一天就領(lǐng)先市場(chǎng)平均水平。第二,我們把自己定位成通用大模型廠商,目標(biāo)AGI,其他事可以選擇不做,聚焦在這。這是最大優(yōu)勢(shì)。依靠這種定位和專注,在技術(shù)創(chuàng)新、產(chǎn)品迭代上創(chuàng)造市場(chǎng),創(chuàng)造更多商業(yè)化機(jī)會(huì)。通用模型能力不是虛的,不同階段有切實(shí)的落地。最近我們聚焦在編程能力上,這是個(gè)通用能力,聚焦后產(chǎn)生的技術(shù)、產(chǎn)品、商業(yè)化價(jià)值很大。來(lái)源于我們對(duì)這事認(rèn)知夠早、夠準(zhǔn),技術(shù)能力能達(dá)到最頂尖水平。
方三文:優(yōu)勢(shì)在模型本身還是落地應(yīng)用?
張鵬:這兩件事分不開(kāi)。這次AI革命,從算法研究到工程實(shí)現(xiàn)、產(chǎn)品化、應(yīng)用反饋整個(gè)閉環(huán)壓縮得非常緊密。不像以前實(shí)驗(yàn)室發(fā)論文,幾年后才做成Demo、產(chǎn)品、迭代。大模型這波從算法創(chuàng)新到類似ChatGPT上線只用了五年,用戶一下過(guò)幾億。時(shí)間周期和閉環(huán)壓縮得很厲害。你說(shuō)把算法研究到頂尖再考慮交付,做不到。這是一體化的。我們一邊研究一邊輸出,讓大家用反饋,往好用方向加深。
方三文:通用大模型廠商會(huì)越來(lái)越少,但把大模型能力放到具體企業(yè)應(yīng)用場(chǎng)景的玩家會(huì)不會(huì)越來(lái)越多?
張鵬:把模型能力變成客戶需求、產(chǎn)品特性,最后這一公里。這個(gè)肯定會(huì)越來(lái)越多,因?yàn)槭袌?chǎng)需求大。這就是生態(tài)趨勢(shì)。
方三文:如果很多玩家進(jìn)來(lái),會(huì)不會(huì)把市場(chǎng)利潤(rùn)率玩得很低?比如圖像識(shí)別能力應(yīng)用到不同場(chǎng)景,很多廠商做,利潤(rùn)率很低。
張鵬:那種情況是在技術(shù)接近天花板時(shí)發(fā)生,比如人臉識(shí)別到97%、98%,再往上沒(méi)意義,技術(shù)穩(wěn)定,大家蜂擁而上壓成本,導(dǎo)致價(jià)格越來(lái)越低。但大模型還在技術(shù)快速增長(zhǎng)階段,技術(shù)溢價(jià)高,創(chuàng)新活躍,不太會(huì)出現(xiàn)低價(jià)競(jìng)爭(zhēng)模式。我們要做的就是在曲線增長(zhǎng)階段保持技術(shù)創(chuàng)新領(lǐng)先,用創(chuàng)新速度創(chuàng)造市場(chǎng)空間,獲得創(chuàng)新的技術(shù)溢價(jià)。
方三文:研發(fā)投入主要目的是在大模型方面保持持續(xù)領(lǐng)先優(yōu)勢(shì),還是在產(chǎn)品化、商業(yè)化方面有更好體驗(yàn)和效率?
張鵬:一定是前者。基礎(chǔ)模型能力上限是我們的根本,所有商業(yè)化都基于這一點(diǎn)。
方三文:這個(gè)行業(yè)有國(guó)際國(guó)內(nèi)巨頭,你要保持優(yōu)勢(shì)難不難?
張鵬:有挑戰(zhàn),但正是有挑戰(zhàn),團(tuán)隊(duì)覺(jué)得必須去做,必須做成。我們有這個(gè)自信和信心。
方三文:大廠可投入資金比你大得多,算力方面很難有優(yōu)勢(shì);數(shù)據(jù)方面,大廠有存量互聯(lián)網(wǎng)內(nèi)容優(yōu)勢(shì)。你們是否是在算法方面有優(yōu)勢(shì)?
張鵬:三要素不是分裂看的。算力投入我們跟大廠沒(méi)法比,人家投得起。數(shù)據(jù)方面,我也不覺(jué)得他們能把那些數(shù)據(jù)無(wú)償合法地拿來(lái)做訓(xùn)練,這中間涉及法律問(wèn)題。算法、研發(fā)能力是我們的強(qiáng)項(xiàng)。三要素單獨(dú)看有勝有劣,但怎么粘合起來(lái)產(chǎn)生化學(xué)反應(yīng),考驗(yàn)團(tuán)隊(duì)能力。還有更本質(zhì)的是對(duì)AGI、AI第一性原理的理解和認(rèn)知程度。舉個(gè)例子,某個(gè)大廠也是比較早就開(kāi)始做大模型,做了一段時(shí)間之后,它們內(nèi)部也不是無(wú)限制投入,投入完之后被問(wèn)怎么商業(yè)化,團(tuán)隊(duì)被逼商業(yè)化,結(jié)果失敗了,團(tuán)隊(duì)被替換。大廠投入也不是無(wú)上限,有考核要求。所以不用過(guò)于夸大所謂大廠的能力。
方三文:聽(tīng)起來(lái)是需要勇氣才能參與的市場(chǎng)競(jìng)爭(zhēng)。你是有勇氣的人?
張鵬:我們這個(gè)團(tuán)隊(duì)很有勇氣。
方三文:你們商業(yè)模式建立在B端市場(chǎng),你們C端市場(chǎng)是做什么的?
張鵬:我們很早思考過(guò)這個(gè)問(wèn)題。為什么要把B和C分開(kāi)?分的原理是什么?沒(méi)人能講明白。很多人從商業(yè)層面說(shuō)ToB/ToC的產(chǎn)品形態(tài)、付費(fèi)模式不一樣。但從產(chǎn)品和技術(shù)層面來(lái)看,回歸第一性原理,這兩者沒(méi)有差別。因?yàn)椴还芊?wù)企業(yè)還是互聯(lián)網(wǎng)客戶,最終都是服務(wù)人。只有人認(rèn)可價(jià)值,利用技術(shù)和產(chǎn)品獲得價(jià)值增益,才愿意付費(fèi)。只是B端和C端付費(fèi)邏輯、決策邏輯不同。但AI是生產(chǎn)力級(jí)別的,付費(fèi)取決于生產(chǎn)力轉(zhuǎn)換的價(jià)值增益。沒(méi)有這個(gè)就不會(huì)付費(fèi)。所以C端不是我們現(xiàn)在的重點(diǎn)。就像電,為電付費(fèi),個(gè)人或企業(yè)有什么差別?沒(méi)差別,都是因?yàn)橛昧擞袃r(jià)值。
方三文:目前商業(yè)化主要在B端,是嗎?
張鵬:未來(lái)很多事情都是不確定性的,所以為什么我一直在說(shuō),現(xiàn)在這個(gè)時(shí)代最大的挑戰(zhàn)來(lái)源于人。人對(duì)于新鮮事物的線性外推,只能基于過(guò)去認(rèn)知預(yù)測(cè)未來(lái),永遠(yuǎn)預(yù)測(cè)不到認(rèn)知之外的東西。很多問(wèn)題根源在此。智譜應(yīng)該堅(jiān)持AGI理想往前走,當(dāng)市場(chǎng)需要什么類型時(shí)它就是什么類型。我們認(rèn)為在這個(gè)階段這種模式是好的,對(duì)我們來(lái)講是合適的。我們就會(huì)沿著這個(gè)路去走。太遠(yuǎn)的我們預(yù)測(cè)不了,也沒(méi)必要給自己設(shè)限。
全文原視頻:
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.