![]()
文 | 錢鴻生
編輯 | 唐曉園
序言及摘要:
作為星船知造“現(xiàn)代通信與智能網(wǎng)技術展望”系列欄目的第一輯,我們邀請星船知造的資深讀者、通信行業(yè)教授級高級工程師錢鴻生博士為我們撰寫了《ChatGPT技術架構及中國人工智能未來發(fā)展趨勢報告》。
報告正文共3.8萬字,在介紹了ChatGPT的進化歷程、主要內涵、底層技術架構與邏輯后,主要分析中美現(xiàn)階段在AI領域的競爭優(yōu)勢與差距,提出ChatGPT潛在的商業(yè)價值和對資本市場影響的風險管控警示。并分析了算法和算力以及芯片技術,對我國人工智能AI發(fā)展的制約與影響,最后切入我國AI產業(yè)結構調整、建立AI法律保護與系統(tǒng)安全的視角,對發(fā)展我國人工智能產業(yè)提出一些前瞻性的趨勢分析和研判。
![]()
![]()
![]()
也歡迎您關注星船知造,高清版《ChatGPT技術架構及我國人工智能未來發(fā)展趨勢報告》。
01,我國發(fā)展AI產業(yè)國家規(guī)劃與階段性困境
OpenAI推出ChatGPT后不久,微軟宣布將ChatGPT與搜索引擎Bing整合,谷歌宣布推出Bard應對挑戰(zhàn),接著Meta官網(wǎng)公布了一款新的人工智能大型語言模型LLaMA。
此時,人們自然而然把目光轉向了中國相關企業(yè),他們何時宣布推出類似于ChatGPT人工智能發(fā)展的時間表。
人們特別關注的企業(yè)有百度、阿里巴巴以及人工智能企業(yè)科大訊飛等等一大批中國與人工智能有關聯(lián)企業(yè)的動向。
3.4.3我國人工智能發(fā)展中存在的主要問題
我國發(fā)展人工智能面臨三方面技術難點如下:
第一,人工智能的AI算法
人工智能常見的算法技術的基礎性研究主要集中于國內各大高校團隊,但在科研成果轉化領域一直發(fā)展比較緩慢,較難實現(xiàn)從理論和技術向生產力的轉化。
目前以華為、阿里、騰訊等公司主導的人工智能技術研發(fā)團隊迅速崛起,將科研產品開發(fā)與算法技術結合,從產業(yè)領域實現(xiàn)人工智能算法的技術成果轉化。
但是在算法的基礎理論研究層面,一直以來是我們發(fā)展人工智能技術的短板。沒有對大規(guī)模機器學習場景中強化學習算法模型、生成性預訓練變換模型、分布式并行的研發(fā)投入,或者說由于受到資金投入與人才缺乏的影響,研究成果與世界發(fā)達企業(yè)還有很大的差距。
美國現(xiàn)有的人工智能系統(tǒng)的關鍵技術都是不開源的,系統(tǒng)深度學習框架、數(shù)據(jù)庫和工具集,均限內部使用,部分僅對系統(tǒng)的應用接口持開源的態(tài)度,使我們無法在短時間內掌握世界最先進的人工智能系統(tǒng)的開發(fā)經(jīng)驗。
從市場的角度來看,我國目前的人工智能系統(tǒng)都是一些比較初級的數(shù)據(jù)采集與分析應用系統(tǒng),類似于ChatGPT高度智能化的AI產品的研發(fā)還處于摸索與初級階段,在性能和穩(wěn)定性方面改善空間潛力巨大。
![]()
圖源:pexels
早在20世紀80年代,我國學術界就提出了相當完善的AI算法模型,中國多家高校有從事算法模型的研究,但大多都將算法模型應用在人臉識別系統(tǒng),提高圖像識別精度方面。到目前為止算法模型在AI領域的價值還沒有被真正體現(xiàn),這可能受限于我們的芯片制造水平難以提供支撐深度神經(jīng)網(wǎng)絡訓練和預訓練需要的算力。
科研領域需要更大投入,要針對目前的已有算法進行深度優(yōu)化,或者另辟蹊徑,提出更為先進的算法理論。要打造出符合世界產業(yè)發(fā)展最新技術水平,具有全球市場競爭力的人工智能產品,看來有相當長的一段路要走。但也不排除彎道超車或換道超車奇跡的發(fā)生。
我國AI發(fā)展現(xiàn)狀任重而道遠。
第二,人工智能AI模型軟件
國內的人工智能模型軟件開發(fā)已經(jīng)起步,開始對標世界先進的人工智能模型,培育自己的發(fā)展環(huán)境。人工智能模型是人工智能生態(tài)中最重要的因素之一,我國需要促進國產模型軟件的發(fā)展和推廣,擺脫國外的標準制約。ChatGPT就是基于“生成型預訓練變換模型”開發(fā)出來的自然語言聊天機器人。
第三,人工智能開發(fā)環(huán)境
人工智能開發(fā)環(huán)境是指相關算法、數(shù)據(jù)庫、軟件開發(fā)工具、高性能的人工智能AI計算機芯片、云計算網(wǎng)絡的集合。國產AI模型開發(fā)需要和國產AI智能芯片及硬件進行相互適配、性能優(yōu)化和應用推廣,才能夠形成面向行業(yè)應用的軟硬件一體化人工智能平臺。
![]()
圖源:unsplash
國際人工智能巨頭掌控著人工智能開發(fā)環(huán)境的關鍵技術,我們目前還較難在短時間內在AI芯片、算法、模型軟件、云數(shù)據(jù)庫服務等人工智能開發(fā)環(huán)境上有十分大的突破。
人工智能系統(tǒng)開發(fā)是一個系統(tǒng)工程,需要協(xié)同各個方面的資源共同發(fā)力,才能在產業(yè)發(fā)展中占有制高點。
![]()
圖源:pexels
3.4.4 AI芯片,人工智能繞不過去的坎
人工智能AI芯片是技術發(fā)展的關鍵之一,它是提供人工智能算力的靈魂和大腦,承載了為各種終端提供強大算力的重要任務。人工智能AI 芯片的出現(xiàn),極大提高數(shù)據(jù)處理的能力,尤其在處理海量數(shù)據(jù)時明顯優(yōu)于傳統(tǒng)CPU。
從技術架構來看,AI芯片一般可以分為GPU、FPGA、ASIC和類腦芯片四大類——
GPU(Graphics Processing Unit,圖形處理器)
GPU是利用處理圖形任務的圖形處理器來計算原本由中央處理器CPU的通用計算任務。
GPU的關鍵性能是矩形并行計算,主流的GPU具有強大的計算能力,無論性能還是內存帶寬均遠大于同代的CPU。CPU 由專為順序串行處理而優(yōu)化組成,而 GPU 則擁有一個由數(shù)以千計的更小、更高效的核心(專為同時處理多重任務而設計)組成的大規(guī)模并行計算架構。同時CPU相當一部分時間在執(zhí)行外設的中斷、進程的切換等任務,而GPU有更多的時間用于并行計算。
英偉達是AI芯片GPU(圖形處理器單元)的主要生產廠商,無論是OpenAI的ChatGPT、還是微軟的搜索引擎Bing、谷歌的人工智能系統(tǒng)LaMDA,都離不開英偉達提供的底層芯片GPU的算力支持,英偉達系列的A100和H100系列占全球AI芯片市場的80%以上的份額。
除了英偉達,還有AMD,ARM家的Mali,Imagination的PowerVR,Qualcomm的Adreno等。
![]()
圖源:unsplash
基于FPGA現(xiàn)場可編程門陣列
FPGA(Field Programmable Gate Array)現(xiàn)場可編程門陣列,或稱半定制化芯片。它是在PAL、GAL、CPLD等可編程器件的基礎上進一步發(fā)展的產物,可以根據(jù)算法需求,動態(tài)重構計算架構。它是作為專用集成電路(ASIC)領域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點。
全球知名的FPGA生產廠商有:Altera,Xilinx,Actel,Lattice,Atmel,我國廠商代表有深鑒科技DPU、百度XPU等。
ASIC(Application Specific Integrated Circuit)
ASIC專用集成電路是針對特定用戶要求定制設計、制造的專門的應用程序芯片。ASIC芯片廣泛應用于人工智能設備、虛擬貨幣挖礦設備、耗材打印設備、軍事國防設備等智慧終端。
ASIC芯片還可以細分為全定制ASIC芯片、半定制ASIC芯片及可編程ASIC芯片。ASIC芯片擁有面積小、集成度高等優(yōu)勢,被廣泛應用于人工智能終端和網(wǎng)絡系統(tǒng)中。
類腦計算芯片(Brain-Inspired Chip)
類腦計算芯片是人工智能AI的一個重要組成部分,類腦芯片可模擬人類大腦信息處理方式,能以極低的功耗對信息進行并行和分布式處理,類腦計算芯片就是把微電子技術和新型神經(jīng)形態(tài)器件結合,突破傳統(tǒng)計算架構,實現(xiàn)存儲與計算的深度融合,大幅提升計算性能、提高集成度、降低能耗。對于現(xiàn)有的計算體系與系統(tǒng)做出變革,并實現(xiàn)在計算能耗、計算能力與計算效率等方面的大幅改進。
IBM已經(jīng)開始進行類腦智能算法與技術的探索,并已成功研制出TrueNorth芯片。
中國目前有清華大學的天機芯,浙江大學的Darwin2 (55nm)等一批研制類腦計算芯片機構和企業(yè)。
02,ChatGPT對資本市場影響的研判
4.2 ChatGPT背后的技術壁壘和文化控制權
ChatGPT是一種自然語言處理技術,一旦ChatGPT能從目前的實驗階段走向應用成熟階段,將這標志著在人類活動中,人工智能將開始扮演重要角色并占據(jù)優(yōu)勢地位。
我們知道,在自然語言處理大模型技術上,由于受到各種因素的影響,我國的人工智能相比國外發(fā)展有一定的差距,特別受制于美國對我國芯片技術的控制,嚴重阻礙了我國的人工智能的研發(fā)和應用。
但在局部技術領域,我們還是具有很大優(yōu)勢的,比如在優(yōu)化大模型中的數(shù)據(jù)庫,在某些特定領域進行模型優(yōu)化和云數(shù)據(jù)庫建設,以及在一些與自然語言處理關系密切的學科。在國家宏觀政策的指導下,發(fā)揮社會市場經(jīng)濟體制的優(yōu)勢,能集中力量辦大事的原則,完全可以進行基于大模型處理方法模型的應用性研究,以適應人工智能發(fā)展對拉動國家經(jīng)濟上行,滿足人們追求豐富多彩生活娛樂的需求。
![]()
從國際競爭角度來看,我們也必須關注ChatGPT帶來的國際技術壟斷企業(yè)利用技術標準和先入為主的優(yōu)勢,在關鍵技術和人工智能芯片方面卡住我們發(fā)展的命脈,制約我們的發(fā)展。
一旦這種在人工智能關鍵技術上形成國外企業(yè)壟斷的局面,對我們在人工智能以及其他高科技方面的發(fā)展是極其不利的,而這樣的以技術版權和相應的技術壁壘為前提,就可能帶來文化上的弱勢,甚至是某種形態(tài)下受制于人。
因此,我們應當把發(fā)展人工智能的重心放在推動我們國家的基礎產業(yè)、芯片技術、大模型優(yōu)化、數(shù)據(jù)庫應用以及與人工智能等相關產業(yè)同步發(fā)展的正確軌道上來。而不是一味地跟隨ChatGPT起舞。
![]()
4.3 ChatGPT可能引發(fā)的機遇與風險
我們對ChatGPT要時刻保持清醒的認知,每一次技術迭代,都將改變人類生活的內涵和方式。ChatGPT是否屬于一次新的技術迭代這個問題還有進一步觀察,可是以ChatGPT為代表的人工智能技術的發(fā)展和自然語言處理技術的突破,一定會對現(xiàn)有產業(yè)發(fā)展格局帶來前所未有的重要影響。
![]()
無人機拍攝下的蘇州 圖源:unsplash
從正面影響來看,ChatGPT可以幫助人們快速獲取信息和提高工作效率,擴展知識面,提供發(fā)展AI 產業(yè)新的思路和方法。
另一方面,某些低端和重復的工作可能被ChatGPT和 AI代替,導致勞動力市場的階段性動蕩和變化。如果人們過度依賴AI,可能會降低人們一部分的操作技能水平和創(chuàng)新精神。某些行業(yè)可能會發(fā)生重組甚至消失,有可能在變化過程中引發(fā)社會矛盾等。
顛覆性創(chuàng)新理論的提出者克里斯滕森在《創(chuàng)新者的窘境》這本書中,將創(chuàng)新分為了延續(xù)性創(chuàng)新和破壞性創(chuàng)新兩種:破壞性創(chuàng)新難以評估市場規(guī)模增長的需求和未來的發(fā)展路徑;延續(xù)性創(chuàng)新則會將資源推向更容易帶來增長的方向。
總體而言,以ChatGPT為代表的人工智能的發(fā)展, 可能對人類的未來產生重要影響,需要積極開展相關的研究和管理,以確保國家經(jīng)濟技術發(fā)展不受制于人,保持社會的穩(wěn)定發(fā)展和保護大多數(shù)人的共同利益。
人工智能解決方案可以為企業(yè)和公民提供巨大的機會,但也可能帶來風險,這就需要一個堅實的監(jiān)管框架來確保人工智能技術的健康發(fā)展。
4.4 ChatGPT的隱患與潛在危機
盡管目前的ChatGPT還是一個驗證的版本,強大的文本處理與聊天能力十分強大,但ChatGPT在短短的幾個月試運行中也暴露出了很多缺陷,甚至可能會引發(fā)危機。這些問題正隨著以ChatGPT為代表的生成型AI系統(tǒng)的推進逐漸浮出水面。人們也會更關注這些問題,并迅速采取防范措施。ChatGPT存在的缺陷與風險主要體現(xiàn)在以下幾個方面:
4.1.1 ChatGPT在道德和法律方面的違規(guī)行為
人們在使用中發(fā)現(xiàn),ChatGPT對信息、數(shù)據(jù)來源無法進行核實、核查和驗證,可能存在個人數(shù)據(jù)與商業(yè)秘密被泄露,引起竊取他人信息的道德問題和提供虛假信息兩大隱患。
ChatGPT從網(wǎng)絡中獲取大量信息,依托海量數(shù)據(jù)庫分析運行,其中包括大量的互聯(lián)網(wǎng)用戶自行輸入的信息,比如新聞工作者編寫的稿子,ChatGPT目前無法追溯到文字的來源,因此當用戶輸入提問時,ChatGPT可能產生泄露個人數(shù)據(jù)或商業(yè)秘密等的風險。
![]()
Unsplash
ChatGPT涉及的法律風險不限于以下幾種:
著作權:生成的內容可能會侵犯他人的著作權。
隱私權:使用ChatGPT 可能需要提供一些個人信息,因此存在泄露個人隱私的風險。
信息誤導:生成的內容可能不準確或有誤導性和歧視性。
侵權違規(guī):ChatGPT生成的內容可能侵犯他人的合法權益,如商標權、出版權、著作權、專利權等。
商標侵權:ChatGPT 生成的圖像和視頻內容可能涉及商標侵權。
人身攻擊:ChatGPT 生成的內容可能涉及對宗教和人身攻擊,違反社會倫理道德。
侮辱誹謗:使用 ChatGPT 生成的內容可能侮辱他人,可能涉及誹謗等法律問題。
最近,OpenAI表示,正考慮在ChatGPT中添加模型水印,即監(jiān)測模型可以識別的特殊標記,以降低信息濫用的問題。
4.1.2 ChatGPT提供虛假信息
ChatGPT常常出現(xiàn)“一本正經(jīng)的胡說八道’”,這是ChatGPT目前被人詬病的一個主要缺點。對于有些虛假信息,需要具備一定專業(yè)知識的人才能辨別真?zhèn)危@就為不法分子惡意“訓練”或“誤導”人工智能,使其提供詐騙信息、釣魚網(wǎng)站等內容,損害公民人身和財產安全創(chuàng)造了有利條件。
4.1.3. ChatGPT信息監(jiān)管迫在眉睫
ChatGPT在建立語料庫、生成文本時,大量使用并非公開的開源代碼,或未辦理許可證申請,可能會導致侵權。對于一些受著作權或版權保護的文本、視頻、軟件代碼等,如果沒有經(jīng)過權利人的授權,直接復制到自己的數(shù)據(jù)庫中,在此基礎上修改、拼湊,極有可能侵害他人的著作權,因此對ChatGPT必須要考慮建立相關的監(jiān)管機制,防止產生不良的社會影響。
4.1.4. ChatGPT提供侵權信息
一位美國眾議院科學委員議員表示:“我對人工智能以及人工智能推動的社會進步感到興奮,但也為其不受限制和不受監(jiān)管感到擔憂。”
紐約大學認知科學名譽教授Gary Marcus對以深度學習為中心的 AI 持懷疑態(tài)度,他認為:“生成式 AI 對社會結構構成了真實而迫在眉睫的威脅”。
各國監(jiān)管機構要有切實可行的風險評估框架,并任命一個負責任的機構。此外,人工智能倫理框架的建立將為所有部門創(chuàng)造一個良好的創(chuàng)新環(huán)境。
一位資深的網(wǎng)絡安全公司管理者認為:她的團隊能夠讓 ChatGPT 編寫網(wǎng)絡攻擊的程序,ChatGPT從編寫網(wǎng)絡釣魚電子郵件到編寫惡意代碼,再到規(guī)避常見的網(wǎng)絡安全檢查,實施對其他系統(tǒng)的攻擊,ChatGPT幾乎可以成為讓沒有軟件編碼技能的人成為網(wǎng)絡罪犯。
無數(shù)的教育工作者譴責有人使用 ChatGPT考試作弊,美國的多所學校已經(jīng)禁止學生用 ChatGPT聊天機器人答題,拒絕采用ChatGPT編寫的論文和答卷。
![]()
人們?yōu)槿斯ぶ悄芡苿拥纳鐣M步感到興奮 圖源:pexels
由于ChatGPT是一種人工智能工具,只要輸入提問,點擊鼠標,就可以完成任何的主題文章、詩歌和電子郵件。特別是學生用ChatGPT完成試題應答和論文撰寫。在國外教育界引起了軒然大波。
為此OpenAI迫于社會壓力,趕緊開發(fā)出了防作弊應用軟件,可以審查哪些試卷和論文是由ChatGPT提供的,以此防止學生作弊。
但是,這種新的檢測工具并沒有消除教師們的恐懼,反而讓科技界和教育界有些失望。據(jù)測試,該系統(tǒng)大約只有20%的準確性,不能完全檢出作弊的試卷答題。
2023年1月初,美國普林斯頓大學的學生愛德華·田(Edward Tian)開發(fā)了GPTZero工具,該工具的標語是“人類應該知道真相”,該工具可以更準確鑒別由ChatGPT提供的文檔,相信不久國內也會催生出這類的應用軟件和工具。
![]()
圖源:unsplash
03,中美在人工智能領域的競爭焦點與差距
中美在人工智能領域的競爭焦點與差距,主要體現(xiàn)在以下幾個方面:
5.2.1 AI芯片方面的競爭
中美在人工智能領域的競爭首先是超級計算機方面,更具體來說,就是計算機的芯片之爭,其中包括AI芯片引進與我國自主開發(fā)兩個方面。
AI芯片引進方面:自從2022年10月美國更新了限制對華出口的管制條例,宣布將全面限制向中國出口超級計算機領域的芯片,將特定高性能芯片、高性能計算芯片加入了商業(yè)管制清單。其中就包括AI最主要的英偉達A100和H100系列以及AMD的MR1250等高性能人工智能芯片。
在以ChatGPT為代表的生成類AI大模型中,對于AI芯片的要求更高,包括要求更高速的內存帶寬、更大的內存容量以及更加高效的數(shù)據(jù)通信帶寬。以OpenAI的ChatGPT-3.5模型訓練為例,微軟公司專門為Open AI 開發(fā)了一款定制的超級計算機,使用了上萬顆英偉達A100的AI芯片。
在集成電路芯片加工領域,世界排名第一的臺積電已經(jīng)可以生產3納米的芯片,目前中國芯片制造排名第一的中芯國際,生產14納米的芯片,差距十分明顯,而且這種差距可能在相當一段時間內依然存在,并且有被拉開的可能性。
這是個殘酷的事實,也激勵我們需舉全國之力縮小在芯片制造領域的差距,否則包括人工智能在內的其他高科技發(fā)展都將受到很大的制約。
5.2.2美國對華出口AI芯片速率方面的限制
ChatGPT-3模型的預訓練使用了大量分布式計算技術,OpenAI不僅會使用本公司的物理服務器和數(shù)據(jù)中心,同時也會使用微軟位于華盛頓鳳凰城、德州圣安東尼等多個異地的超算中心。然后將結果同步到自己的計算機上,以達到加速訓練和提高模型性能。
ChatGPT-3模型參數(shù)量非常大,往往達到上萬億個參數(shù),需要使用大量分布式計算技術計算作為支持,每個訓練節(jié)點需要和其他節(jié)點之間進行高速的數(shù)據(jù)傳輸和協(xié)同計算。因此AI芯片的高速互聯(lián)的性能指標,對于人工智能大模型的訓練將會起到一個至關重要的作用。
美國政府對華出口的英偉達公司AI芯片輸出速率加以了嚴格限制,明確提到了要限制600GP/秒互聯(lián)寬帶以上的AI芯片的出口。英偉達公司因此為了繼續(xù)向中國出口AI芯片,賺取利潤的同時又不違反美國政府的管制要求,向中國提供特供版的A800芯片,用于替代A100芯片。據(jù)查英偉達官網(wǎng),表明A800的高速互聯(lián)通信速率降為了400GB/秒,而美國本土使用的A100產品的高速互聯(lián)通信速率為600GB/秒,這種降級指標會對AI系統(tǒng)的性能造成很大的影響。
5.2.3芯片加工阻礙了我們的進步
AI芯片的加工是體現(xiàn)芯片性能的一個重要方面,目前英偉達A100芯片是采用臺積電7納米工藝制作完成,而M1250采用的是臺積電6納米工藝,最新的英偉達H100采用的則是臺積電的4納米工藝,第四代的NVlink GPU之間的傳輸速率達到了900GB每秒。美國政府有預謀地限制對華出口AI芯片,就是利用技術手段有針對性遏制我國人工智能和大模型訓練模型的步伐,保證美國始終處于人工智能發(fā)展的制高點,其他國家只能跟隨其后。
![]()
圖源:pexels
5.2.4中國企業(yè)在AI芯片上奮起直追成果喜人
在國產AI芯片自主研發(fā)領域,國內多家廠商奮起直追,成果喜人,為我國的人工智能發(fā)展奠定了堅實基礎,令世界刮目相看。
成立于2004年10月的海思半導體公司,前身是華為集成電路設計中心。海思公司總部位于深圳,在北京、上海、美國硅谷和瑞典設有設計分部。2019年8月23日,華為在深圳發(fā)布商用AI芯片Ascend 910(昇騰910),以及與之配套的新一代AI開源計算框架,它是當時全球算力最強、訓練速度最快的AI芯片,其算力是國際頂尖AI芯片的2倍,相當50個當時最強的CPU。
升騰910采用了自主達芬奇架構,半精度浮點(FP16)算力達到了320TX,互連帶寬達到了640GB每秒。此外,昇騰910規(guī)格算力所需的功耗僅為310瓦,遠低于設計規(guī)格的350瓦。可以看出,雖然在計算能力與內存帶寬方面,昇騰910與A100有一定的差距,但是昇騰910總體上擁有更小的體積和功耗,整體的功效比英偉達的A100更好,技術性價比更高,部署的靈活性更強。
更重要的是,華為不僅推出了自主研發(fā)的AI芯片,還推出了全棧式的mindStudiode智能開發(fā)平臺,它包括了完整的開發(fā)環(huán)境和工具,對標就是英偉達的CUDA-X。
2023年3月2日,英國金融時報節(jié)目主持人拉赫曼對微軟創(chuàng)始人比爾·蓋茨采訪時,在談到美國對中國芯片出口限制時,蓋茨提到:美國的做法只會迫使中國花時間和金錢來制造自己的芯片,美國永遠無法成功阻止中國擁有強大的芯片,他認為美國限制中國技術發(fā)展的努力注定要失敗。
![]()
圖源:wikimedia
5.2.5中美雙方在AI方面的投入相差巨大
OpenAI公司發(fā)展人工智能,在微軟投資100億美元拿到49%的股權之前,OpenAI在成立的七年多的時間里,總共收到了大約40億美元的風險投資,就是在這樣巨額投資的情況下,根據(jù)OpenAI公司2022年財報顯示虧損仍高達5.45億美元(折合人民幣虧損額達到將近40億人民幣)。
微軟在入股OpenAI 后,為OpenAI部署了一個超級計算機,按照算力來說,該超級計算機可以進入全球超計算機的前五名。
2023年1月,微軟還承諾將繼續(xù)為OpenAI提供更多的超算中心的部署,讓它能夠更加高效完成下一代ChatGPT模型的訓練。
根據(jù)OpenAI測算,目前訓練一次ChatGPT模型的算力成本在450萬美元左右,這里還只是計算硬件投入的成本,還不包括人工成本、網(wǎng)絡寬帶成本、數(shù)據(jù)儲存、固定資產折舊等的綜合成本。
實際上訓練一次ChatGPT模型,有時候人力成本和運維成本支出要占據(jù)總成本很大一部分,因此Open AI雇傭了第三世界國家的低成本外來外包員工來完成指定的優(yōu)化任務,從而降低人工成本。
目前ChatGPT-3參數(shù)量在1750億參數(shù)左右。而以OpenAI發(fā)布最新的ChatGPT-3.5B模型為例,數(shù)量將達到1.7萬億。預測成本就更夸張了,訓練時間也將從之前的幾周變?yōu)閿?shù)月甚至幾個月的周期。
目前OpenAI公司有1000多名正式員工,人力成本也是非常龐大的一筆支出。因此AI產業(yè)研發(fā)成本支出是非常燒錢的行業(yè),對于一般發(fā)展中國家來說這是一筆巨資。同樣我們國家人工智能系統(tǒng)還處在研發(fā)階段,資本投入也是當下面臨的一個重要課題。
隨著大模型訓練體量的不斷增加,未來算力資源、人才資源、數(shù)據(jù)資源三者的投入不可小覷。
5.2.6 ChatGPT引爆全球互聯(lián)網(wǎng)入口爭奪戰(zhàn)
從ChatGPT功能來看,還處在聯(lián)網(wǎng)驗證階段,就是在基本的功能方面還存在很多問題和不確定性,在有些功能上更是漏洞百出,在軟件編程方面還遠遠沒有達到顛覆軟件編程產業(yè)的程度。
但是全網(wǎng)熱潮背后一定有深層次的原因:經(jīng)過深度分析不難看出,其實ChatGPT引爆的不完全是AI里程碑式的技術革命,而是引爆一場全球互聯(lián)網(wǎng)入口的爭奪戰(zhàn)。
![]()
全球互聯(lián)網(wǎng)入口長期被谷歌占據(jù),谷歌的搜索引擎業(yè)務占到全球市場份額的97%,谷歌內部有一個商業(yè)警戒系統(tǒng),只要公司業(yè)務受到威脅就會觸發(fā),其中最高級別是紅色告警。
谷歌(Google)公司1998年9月創(chuàng)立,自從公司成立以來,這個紅色警戒系統(tǒng)就從來沒有觸發(fā)過。然而2023年2月,谷歌瀏覽器的下載量從全球第一降到了第二,谷歌傳統(tǒng)的搜索引擎業(yè)務首次被微軟反超,系統(tǒng)自動觸發(fā)了紅色警戒系統(tǒng)。
微軟公司從誕生以來,從未在任何產品上投資超過100億,這次對Open AI 投資超過100個億,目的就是要把ChatGPT整合到微軟公司的所有產品中去。
微軟近期已經(jīng)宣布將ChatGPT整合入微軟的搜索引擎Bing,沒過幾天,又宣布會將ChatGPT整合進Office辦公套件中去。用戶使用Office時就能體驗ChatGPT的對話功能。很明顯微軟就是要利用ChatGPT先入為主的優(yōu)勢,爭奪谷歌搜索引擎的市場份額,目前第一階段目標已經(jīng)圓滿達到。
![]()
ChatGPT整合進了微軟Office辦公套件中 圖源:unsplash
微軟一直都在厲兵秣馬,以前一直被谷歌、蘋果、亞馬遜壓得喘不動氣,現(xiàn)在終于開始了在全球互聯(lián)網(wǎng)入口的爭奪戰(zhàn)中的絕地反擊戰(zhàn)。
同樣的情況,在我國的互聯(lián)網(wǎng)企業(yè)中也有發(fā)生。在ChatGPT成功的示范效應帶動下,以及國家支持數(shù)字經(jīng)濟發(fā)展兩個強力點的支撐下,相信不遠的將來,中國的AI 產品將像雨后春筍一樣拔地而起。
![]()
圖源:pixabay
5.4淺談未來我國人工智能發(fā)展趨勢
隨著科學技術的飛速發(fā)展,國家已經(jīng)把人工智能作為戰(zhàn)略性新興產業(yè),作為新增長引擎加以扶持和培養(yǎng),人工智能的未來發(fā)展將會帶來更多的驚喜和機遇,下面就讓我們淺談一下我國人工智能發(fā)展趨勢。
5.4.1國內主要廠商應當承擔發(fā)展人工智能的重任
在國家宏觀政策的大力支持下,我國的人工智能將迎來重大的發(fā)展機遇期,國內的人工智能企業(yè),互聯(lián)網(wǎng)企業(yè),科研機構應當抓住這個難得的機遇,為國家的數(shù)字經(jīng)濟轉型發(fā)展作出應有的貢獻。
特別是華為、阿里巴巴,騰訊、百度、科大訊飛、字節(jié)跳動等等大型企業(yè)和科研單位,應該發(fā)揮各自優(yōu)勢強強聯(lián)手,他們有義務、有責任,承擔起這個時代賦予的歷史使命。
應該清楚認識到我們與ChatGPT為代表的生成類大模型的AI系統(tǒng)有差距,在AI芯片領域受到美國的制裁。有差距就有趕超的希望,歐洲和亞洲的某些經(jīng)濟強國,在人工智能領域落后比我們更多,根本還看不到與美國AI領域的差距,這才是最可悲的。我們在與美國的AI產品有差距就有趕超的希望,這種希望能夠鼓舞我們的士氣,促使我們奮起直追。
強化企業(yè)在研發(fā)投入中的主體地位,繼續(xù)加大企業(yè)研發(fā)費用,建立起金融支持企業(yè)在AI領域的創(chuàng)新工作機制,打通科技、產業(yè)、金融的全產業(yè)鏈條。
5.4.2打造我國人工智能軟硬件產業(yè)生態(tài)
人工智能產業(yè)屬于新型的高科領域,目前世界上尚未形成占絕對主導的技術路徑依賴,微軟推出ChatGPT先發(fā)制人,谷歌技術積累實力更雄厚,后勁十足,我國由于受到美國政府芯片制裁打壓,遇到暫時的困難和瓶頸,相信只要把‘卡脖子’的問題解決了,我們的人工智能產業(yè)發(fā)展將有后發(fā)制人的優(yōu)勢。
在世界產業(yè)生態(tài)也沒有形成絕對壁壘的人工智能開創(chuàng)初期,我們要結合國情把軟硬件協(xié)同發(fā)展,作為提升人工智能發(fā)展的主要手段,單純的數(shù)據(jù)與算法優(yōu)化已不能滿足我國人工智能產業(yè)發(fā)展需求。
面對這一發(fā)展契機,我國應強化人工智能產業(yè)發(fā)展的頂層設計,加強人工智能軟硬件協(xié)同布局。重點布局具有我國自主知識產權的“框架軟件+AI芯片”架構,構建起有利于我國人工智能發(fā)展的生態(tài)環(huán)境,力爭在人工智能領域取得主導優(yōu)勢。
5.4.3分階段科學突破芯片瓶頸
目前AI芯片的核心技術被美國廠商壟斷這是一個不爭的事實,并且在短時間內無法改變。雖然國內一些廠商也在積極推進高端AI芯片研制,但無論是從技術成熟度還是市場占有率考慮,我國的AI芯片與國際先進水平差距依然非常明顯。目前來我國與人工智能有關的芯片如GPU及FPGA基本完全依賴進口,ASIC專用集成電路芯片國產化程度相對較好。
針對我國AI芯片的現(xiàn)實情況,可采取全面布局、分步突破的發(fā)展路徑,近期重點突破專用芯片ASIC,而GPU、FPGA等成熟的標準化產品,還可以從國際市場購買,但從AI產業(yè)布局的角度來看,國家要鼓勵有實力的企業(yè)聯(lián)合攻關,早日實現(xiàn)GPU、FPGA等通用芯片研制方面的突破,把AI發(fā)展的主動權牢牢地掌握在自己的手中。
5.4.4加強類腦芯片前沿布局
類腦芯片研發(fā)屬于AI芯片的前瞻性領域,我國類腦芯片的研究尚處于理論階段,涉及的企業(yè)不多,應充分發(fā)揮國內高校以及科研院所力量進行前沿布局。
國際龍頭企業(yè)還沒有形成明確的技術及知識產權壁壘,IBM研制的TrueNorth類人腦計算有突破性進展,隨著存儲、邏輯、傳感技術的改進,將來類腦計算芯片有望取得更大的發(fā)展,在AI領域將發(fā)揮更大的作用。
結束語
總之,人工智能的未來發(fā)展將會是一個充滿機遇和挑戰(zhàn)的過程,隨著技術的不斷發(fā)展和成熟,人工智能已經(jīng)開始滲透到我們日常生活的各個方面,人工智能不僅可以幫助改善人們的生活品質、豐富人們的娛樂生活,也將會在工業(yè)自動化、軍事裝備現(xiàn)代化、提高醫(yī)療診斷水平、提升教育能力,拓展學生的知識面等各個領域得到更加廣泛的應用,從而幫助我們更好地解決問題、提高效率、改善生活。
![]()
我們也需要保持警惕,推動建立人工智能安全可控的治理體系,積極面對技術發(fā)展中出現(xiàn)的各種問題和挑戰(zhàn)。
讓我們以開放的心態(tài)迎接新技術的出現(xiàn),寬容新技術存在的不足之處,在國家宏觀政策的大力支持下,發(fā)揮舉國體制的優(yōu)勢,積極推動人工智能與經(jīng)濟社會深度融合,在重大應用場景中錘煉技術、升級迭代、培育市場,從而使我國的人工智能技術能夠為全人類社會的進步和發(fā)展做出更加積極的貢獻。
參考資料:
[1].ChatGPT翻開了硬幣的哪一面?北京郵電大學人工智能學院教授鄧偉洪、中國信通院云大所內容科技部副主任石霖
[2].采訪報道ChatGPT“火出圈”我們該“急眼”嗎?中國經(jīng)濟網(wǎng)2023年2月20日
[3].OpenAI官網(wǎng)(ChatGPT:優(yōu)化對話的語言模型 (OpenAI.com))
[4].Interactive Learning from Policy-Dependent Human Feedback (MacGlashan et al. 2017)
[5].Deep Reinforcement Learning from Human Preferences (Christiano et al. 2017)
[6].ChatGPT: Optimizing Language Models for Dialogue (OpenAI 2022)
[7].Scaling Laws for Reward Model Overoptimization (Gao et al. 2022)
[8].Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback (Anthropic, 2022)
[9].Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned (Ganguli et al. 2022)
[10].Dynamic Planning in Open-Ended Dialogue using Reinforcement Learning (Cohen at al. 2022)
本文基于訪談及公開資料寫作,不構成任何投資建議
本文為星船知造原創(chuàng)內容
未經(jīng)授權,禁止轉載
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.