![]()
文|唐曉園、錢伽諾
正文共計 4880字
預(yù)計閱讀時間 5分鐘
一則來自美國的消息暫時打破了此岸AI大模型創(chuàng)業(yè)者和資本們時而亢奮時而抑郁、時而趨之若鶩時而謹慎保守的敘事節(jié)奏。
美國《華爾街日報》27日援引知情人士消息稱,美國商務(wù)部可能最快在下月初采取行動,禁止英偉達等芯片制造商在事先未獲得許可證的情況下,向中國和其他相關(guān)國家的客戶出口芯片。
英偉達今年年初剛對公司旗艦芯片進行了調(diào)整,以符合向中國出口的法規(guī)。
據(jù)路透社29日消息稱,英偉達首席財務(wù)官科萊特?克雷斯表示:
“從長遠來看,如果實施禁止向中國出售我們的數(shù)據(jù)中心圖形處理單元(GPU)的限制措施,將導(dǎo)致美國產(chǎn)業(yè)永久喪失在全球最大市場之一競爭和領(lǐng)先的機會,并對我們未來的業(yè)務(wù)和財務(wù)業(yè)績產(chǎn)生影響。”
01 無盡前沿的回響
1945年,美國二戰(zhàn)時期工程師范內(nèi)瓦·布什,如同穿越者一般向白宮遞交了一份報告。70多年來,這份報告對美國科研決策和發(fā)展的影響綿延至今。
《21年美國創(chuàng)新與競爭法案》被認為是對《科學(xué):無盡的前沿》中主要觀點的延申和致敬。
報告核心觀點:一是從戰(zhàn)略上明確科技立國。明確美國要在“醫(yī)學(xué)和基礎(chǔ)科學(xué)研究”、“涉及國家安全的研究”等方面重點投入科研。
二是為了達到這個目標,政府該扮演怎樣的角色。首先政府應(yīng)堅定投入公共資金支持基礎(chǔ)研究。其次是注重長期回報,在不計成本培養(yǎng)科學(xué)人才的同時,鼓勵企業(yè)加大科研投入等。
![]()
今天的環(huán)境與冷戰(zhàn)時期和熱戰(zhàn)時期又截然不同。隨著以ChatGPT為代表的生成類AI大模型的橫空出世,“國產(chǎn)大模型是否存在自主可控”的問題在中美人工智能領(lǐng)域存在差距的現(xiàn)實背景下被頻頻提及。
作為一種生成邏輯,與其說大模型的自主可控,不如說“算力平臺的自主可控”和“確保國家數(shù)據(jù)主權(quán)”。
星船知造文章《算力時代下的中國云:讀懂中國式現(xiàn)代化必要的數(shù)字底層》中寫過:數(shù)據(jù)是數(shù)字經(jīng)濟時代重要生產(chǎn)要素。《中華人民共和國數(shù)據(jù)安全法》中明確指出,數(shù)據(jù)是國家基礎(chǔ)性戰(zhàn)略資源,沒有數(shù)據(jù)安全就沒有國家安全。
中國目前正通過建設(shè)自主可控的數(shù)字基礎(chǔ)設(shè)施,來保障國家數(shù)據(jù)安全。確保核心數(shù)據(jù)始終掌握在自己手中。

source:giphy
中美在人工智能領(lǐng)域的一些差距是顯而易見的。
主要體現(xiàn)在以下幾個方面 (更多可點擊《星船知造ChatGPT技術(shù)架構(gòu)及中國人工智能未來發(fā)展趨勢報告》或后臺回復(fù)關(guān)鍵詞“白皮書”,下載高清完整版報告)
首先是中國在AI芯片上的落后。
![]()
AI芯片引進方面:美國此前將特定高性能芯片、高性能計算芯片加入了商業(yè)管制清單。其中就包括AI最主要的英偉達A100和H100系列以及AMD的MR1250等高性能人工智能芯片。
6月28日,據(jù)《華爾街日報》周二援引知情人士的話稱,美國正在考慮對向中國出口人工智能芯片實施新的限制。
在以ChatGPT為代表的生成類AI大模型中,對于AI芯片的要求更高,包括要求更高速的內(nèi)存帶寬、更大的內(nèi)存容量以及更加高效的數(shù)據(jù)通信帶寬。
集成電路芯片加工領(lǐng)域:臺積電已經(jīng)可以生產(chǎn)3納米的芯片,目前中國芯片制造排名第一的中芯國際,生產(chǎn)14納米的芯片,差距十分明顯。
其次是美國對華出口AI芯片速率方面的限制。
OpenAI不僅使用本公司的物理服務(wù)器和數(shù)據(jù)中心,同時也會使用微軟位于華盛頓鳳凰城,德州圣安東尼等多個異地的超算中心。然后將結(jié)果同步到自己的計算機上,以達到加速訓(xùn)練和提高模型性能。AI芯片的高速互聯(lián)的性能指標,對于人工智能大模型的訓(xùn)練將會起到至關(guān)重要的作用。
美國政府對華出口的英偉達公司AI芯片輸出速率加以了嚴格限制,明確提到了要限制600GP/秒互聯(lián)寬帶以上的AI芯片的出口。
英偉達公司因此為了繼續(xù)能向中國出口AI芯片,賺取利潤同時又不違反美國政府的管制要求,向中國提供特供版的A800芯片,用于替代A100芯片。A800的高速互聯(lián)通信速率降為了400GB/秒,而美國本土使用的A100產(chǎn)品的高速互聯(lián)通信速率為600GB/秒,這種降級指標會對AI系統(tǒng)的性能造成很大的影響。
再者是芯片加工是阻礙我國大模型進展的一環(huán)。
目前英偉達A100芯片是采用臺積電7納米工藝制作完成,而M1250采用的是臺積電6納米工藝,英偉達H100采用的則是臺積電的4納米工藝,第四代的NVlink GPU之間的傳輸速率達到了900GB每秒。美國政府限制對華出口AI芯片,就是利用技術(shù)手段有針對性遏制我國人工智能和大模型訓(xùn)練模型的步伐,保證美國始終處于人工智能發(fā)展的制高點。
NVIDIA 護城河是從應(yīng)用、軟件、到硬件的一整個生態(tài)系統(tǒng)。
除開硬件對中國算力的部分掣肘,發(fā)展人工智能三大要素:數(shù)據(jù)、算法、算力中的另兩樣——
數(shù)據(jù)層面,到2022年底,中國網(wǎng)民接近11億。每次對互聯(lián)網(wǎng)的觸摸,都是對某類青澀數(shù)據(jù)的填補。作為擁有全球最大規(guī)模網(wǎng)民群體的國家,我們在數(shù)據(jù)和應(yīng)用場景上保有優(yōu)勢。(更多可點擊《全國人民用20年為中國互聯(lián)網(wǎng)找到解題新思路》)。
算法層面,國內(nèi)科研機構(gòu)和企業(yè)大煉千億級大模型,底層算法中國并不落后。
另一個問題就是,任何攻堅都要花大錢。

source:giphy
據(jù)OpenAI 測算,訓(xùn)練一次ChatGPT模型的算力成本在450萬美元左右,還只是計算硬件投入的成本,不包括人工成本、網(wǎng)絡(luò)寬帶成本、數(shù)據(jù)儲存、固定資產(chǎn)折舊等的綜合成本。比如OpenAI訓(xùn)練GPT3的費用可高達1200萬美元,訓(xùn)練GPT-4成本可高達1億美元。
人力成本和運維成本支出也占據(jù)總成本很大一部分,OpenAI就雇傭了大量第三世界國家的外包員工來完成指定的優(yōu)化任務(wù)降低人工成本。
對于創(chuàng)業(yè)公司來說,融個幾億都不夠燒的。
![]()
初創(chuàng)后很長一段時間里,OpenAI都是一家非營利組織。之后的橫空出世,一靠微軟輸入巨資,二靠背靠巨頭帶來的業(yè)務(wù)加持。
今年春節(jié)前后,被大模型出圈首先刺激到的,是創(chuàng)業(yè)者和投資人。
02浪潮之下,泡沫和廝殺的加速器
抑郁和焦慮如同一對雙生子。最開始的癥狀則表現(xiàn)為亢奮。
GPT從3.5到4.0僅歷時105天。但仍比不上中國創(chuàng)業(yè)者的速度。《中國人工智能大模型地圖研究報告》顯示,截至今年5月,中國已發(fā)布了79個人工智能大模型。王小川4月宣布創(chuàng)業(yè),6月產(chǎn)品就出來了。光年之外更是在幾個月的時間內(nèi)完成了從成立、融資、創(chuàng)始人抑郁、被收購的一整個過程。
![]()
大模型的亢奮還在。但回頭看看元宇宙……某地剛爭到“元宇宙第一城”的名號,元宇宙就在大模型的映襯下看起來像涼了。
去年此時PPT上的元宇宙造車還沒搞明白,今天已經(jīng)鋪天蓋地自動駕駛大模型了。
某位不愿透露姓名的投資人在參加完一場以大模型和人工智能相關(guān)項目為主的路演后對我們表示,大部分項目提到的“大模型”定義都相當含糊,聽上去換個別的詞也OK,比如大數(shù)據(jù)、虛擬人。
曾借元宇宙概念炒作的事物將在大模型時代加速涼透。但元宇宙本身具備殺手級應(yīng)用一切特征的本質(zhì)不會改變。從包含的技術(shù)、已有的政策扶持、可能的產(chǎn)業(yè)落地回看,元宇宙都沒有理由被大模型擠得徹底褪去熱度。
![]()
![]()
包括上海在內(nèi),目前全國各地仍在出臺政策扶持當?shù)氐脑钪娈a(chǎn)業(yè)。今年6月《上海市“元宇宙”關(guān)鍵技術(shù)攻關(guān)行動方案(2023—2025年)》印發(fā),明確提出以沉浸式技術(shù)與Web3技術(shù)為兩大主攻方向。
![]()
目前大模型能帶來的商業(yè)回報誰也不敢保證,但極度燒錢是確定的——資本因此呈現(xiàn)出狂熱和謹慎的兩面性。
ChatGPT1早在五年前就已發(fā)布。同時AIGC(AI-Generated Content 人工智能生成內(nèi)容)也早在ChatGPT3.5爆火的22年底之前,就已憑借去年的“AI繪畫”獲得一定關(guān)注。借助AIGC技術(shù),可進行文章、視頻創(chuàng)作、音頻剪輯、游戲開發(fā)等工作。只是其熱度始終沒有真正破圈。
無視AIGC的投資人同樣在去年年底無視了ChatGPT。直到今年春節(jié)后,再聊不上幾句GPT就會徹底暴露自己在新一輪科技周期中的無知——一場圍繞新周期的狂熱才就此展開。
![]()
歷時5年
另一些投資人則忘不掉幾年前人工智能領(lǐng)域泡沫破裂的慘狀。畢竟,從2015年開始,每一年都會被稱為人工智能元年。有人說,對付泡沫的有效方法,就是用另一個泡沫取代它,也叫“嵌套式泡沫”。
回報是不確定的,商業(yè)模式是不確定的,只有風(fēng)險是明確的。
資本市場最先感受到不確定帶來的涼意。昆侖萬維、科大訊飛、360等AI概念股自6月26日開始下挫。
SimilarWeb數(shù)據(jù)顯示的ChatGPT平臺訪問量增速放緩的背后(1月的環(huán)比增長131.6%,到2月與3月的60%左右,再到4月接近跌破10%,5月則僅增長2.8%),是人們對其新鮮感的大幅減弱。

source:giphy
03 擁抱、反噬,風(fēng)險和缺陷
百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖說:大模型出現(xiàn)前的AI像氧氣——有價值,但自己不會燃燒,必須找到可燃物才能發(fā)揮價值。“可燃物”,就是落地場景。
五道口和陸家嘴的咖啡館里,人們都在聊大模型和AI。但誰也不知道該先進哪個車間。
![]()
制造業(yè)企業(yè)數(shù)智化轉(zhuǎn)型的剛需仍然是降本增效。并且不會輕易交出行業(yè)數(shù)據(jù)。
星船知造在對國內(nèi)服裝制造企業(yè)的走訪中,以及對移動機器人全場景應(yīng)用者快倉等企業(yè)的溝通中,發(fā)現(xiàn)企業(yè)自動化及數(shù)字化布局時呈現(xiàn)明顯的區(qū)域特點:比如,長三角和珠三角地區(qū)紡織服裝企業(yè)對自動化和數(shù)字化的熱情要高于內(nèi)陸地區(qū)。
主要由兩方面決定:一是當?shù)氐挠萌顺杀尽6瞧髽I(yè)本身的品牌定位需求。
部分企業(yè)受到淘寶等互聯(lián)網(wǎng)公司的推動進行轉(zhuǎn)型布局。
![]()
我們也從數(shù)位游戲業(yè)內(nèi)人士處了解到,游戲行業(yè)在 AIGC 和元宇宙探索多年,AI一個比較大的應(yīng)用落地方向是“游戲中對NPC的優(yōu)化”。通過相關(guān)技術(shù)讓NPC和用戶進行更生動的互動,增加游戲真實感。
微軟 GDC2023 上,分享了Azure OpenAI 在游戲 NPC 中應(yīng)用的三大方向:游戲虛擬玩家、游戲虛擬主播、游戲 NPC 動態(tài)互動。

source:giphy
文章最后,加入一個使用GPT的彩蛋。大家注意避免在使用中碰到人工智障(AI,Artificial Idiot)、誤聯(lián)網(wǎng)(Internet of Error)和深度瞎學(xué)(Deep Blind Learning)。
首先是比較ChatGPT3.5和GPT4的區(qū)別
![]()
以及別忘了GPT-4作為系列中的過渡版本,已暴露出很多缺陷,存在的缺陷與風(fēng)險主要體現(xiàn)在以下幾個方面:
首先是ChatGPT在道德和法律方面的違規(guī)行為。
ChatGPT對信息、數(shù)據(jù)來源無法進行核實、核查和驗證,可能存在個人數(shù)據(jù)與商業(yè)秘密被泄露,引起竊取他人信息的道德問題和提供虛假信息兩大隱患。
ChatGPT涉及的法律風(fēng)險不限于以下幾種:
著作權(quán):生成的內(nèi)容可能會侵犯他人的著作權(quán)。
隱私權(quán):使用ChatGPT 可能需要提供一些個人信息,存在泄露個人隱私風(fēng)險。
信息誤導(dǎo):生成的內(nèi)容可能不準確或有誤導(dǎo)性和歧視性。
侵權(quán)違規(guī):ChatGPT生成的內(nèi)容可能侵犯他人的合法權(quán)益,如商標權(quán)、出版權(quán)、著作權(quán)、專利權(quán)等。
商標侵權(quán):ChatGPT 生成的圖像和視頻內(nèi)容可能涉及商標侵權(quán)。
人身攻擊:ChatGPT 生成的內(nèi)容可能涉及對宗教和人身攻擊,違反社會倫理道德。
偏激誹謗:使用 ChatGPT 生成的內(nèi)容可能侮辱他人,可能涉及偏激、誹謗等法律問題。
![]()
其次是ChatGPT提供大量虛假信息。
ChatGPT常常一本正經(jīng)的胡說八道,這是ChatGPT目前被人詬病的一個主要缺點,這就為不法分子惡意訓(xùn)練或誤導(dǎo)人工智能,使其提供詐騙信息、釣魚網(wǎng)站等內(nèi)容,損害公民人身和財產(chǎn)安全創(chuàng)造了條件。
第三是GPT-4 引用數(shù)據(jù)同樣不能實時更新。
目前GPT-4在生成性預(yù)訓(xùn)練中使用的數(shù)據(jù)與ChatGPT3.5的數(shù)據(jù)都是2021年底前的網(wǎng)絡(luò)數(shù)據(jù),不能與互聯(lián)網(wǎng)實時聯(lián)網(wǎng)調(diào)用數(shù)據(jù),因此在回答2022年以后的問題時無法得到有效支撐,造成信息的誤導(dǎo)。
第四是不善于討論未來。
盡管GPT-4似乎可以對已經(jīng)發(fā)生的事情進行推理,做出相對正確的回答,但當被要求對未來做出假設(shè)時,回答就有點答非所問,根本無法提出全新的想法。
最后,ChatGPT信息監(jiān)管迫在眉睫
ChatGPT在建立語料庫、生成文本時,大量使用并非公開的開源代碼,或未辦理許可證申請,可能會導(dǎo)致侵權(quán)。因此各國政府對ChatGPT必須要考慮建立相關(guān)的監(jiān)管機制迫在眉睫,防止產(chǎn)生不良的社會影響。
參考資料:
[1]ChatGPT翻開了硬幣的哪一面?北京郵電大學(xué)人工智能學(xué)院教授鄧偉洪、中國信通院云大所有內(nèi)容科技部副主任石霖
[2]《ChatGPT技術(shù)架構(gòu)及我國人工智能未來發(fā)展策略的研究》 星船知造
[3]OpenAI官網(wǎng)(ChatGPT:優(yōu)化對話的語言模型 (OpenAI.com))
[4]Interactive Learning from Policy-Dependent Human Feedback (MacGlashan et al. 2017)
[5]Deep Reinforcement Learning from Human Preferences (Christiano et al. 2017)
[6]ChatGPT: Optimizing Language Models for Dialogue (OpenAI 2022)
[7]Scaling Laws for Reward Model Overoptimization (Gao et al. 2022)
[8]Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback (Anthropic, 2022)
[9]《中國人工智能大模型地圖研究報告》中國科學(xué)技術(shù)信息研究所、科技部新一代人工智能發(fā)展研究中心
本文基于訪談及公開資料寫作,不構(gòu)成任何投資建議
本文為星船知造原創(chuàng)內(nèi)容
未經(jīng)授權(quán),禁止轉(zhuǎn)載
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.