![]()
作者|李煒
原創(chuàng)首發(fā)|藍(lán)字計劃
凌晨,在加州的一間廉價酒店,“AI教父”杰弗里·辛頓接到了一通陌生電話,通知他獲得了諾貝爾獎。
和大多數(shù)正常人一樣,辛頓的第一反應(yīng)是“這好像是一通詐騙電話?”但對方濃重的瑞典口音,又讓他繼續(xù)聽了下去。
隨后的半個月,全世界都知道了這通電話不是騙子打的,辛頓因“通過人工神經(jīng)網(wǎng)絡(luò)實現(xiàn)機器學(xué)習(xí)的基礎(chǔ)性發(fā)現(xiàn)和發(fā)明”拿了2024年諾貝爾物理學(xué)獎。
![]()
|2024年諾貝爾物理學(xué)獎得主:約翰·霍普菲爾德(左)和杰弗里·辛頓(右)
很長一段時間,辛頓提出的機器模擬人腦的“深度神經(jīng)網(wǎng)絡(luò)”學(xué)說無人問津。2010年9月,和辛頓共同做研究的AI科學(xué)家鄧力到訪中科大,宣講深度神經(jīng)網(wǎng)絡(luò),“現(xiàn)場只來了稀稀落落的二三十個人,真正能聽懂的人也不多。”
但臺下有幾位年輕人聽懂了,還對鄧力提出了很多尖銳的問題。這幾位年輕人是供職于科大訊飛研究院的胡郁、王智國、 劉聰,專門來母校聽講座。鄧力后來回憶“當(dāng)時相信深度神經(jīng)網(wǎng)絡(luò)的公司只有谷歌和科大訊飛。”
鄧力來訪后,科大訊飛啟動了基于深度神經(jīng)網(wǎng)絡(luò)的語音識別模型探索。2011年,科大訊飛上線國內(nèi)首個中文語音識別深度學(xué)習(xí)系統(tǒng),并將其落地在訊飛輸入法這個有大量潛在用戶、場景豐富且可以快速迭代的商業(yè)化系統(tǒng)中,成為中國首個上線深度學(xué)習(xí)算法的公司,效果提升非常明顯。2年后,科大訊飛已將深度神經(jīng)網(wǎng)絡(luò)落地在多項技術(shù)中,客戶和用戶都快速增長,市值突破百億元。
深度神經(jīng)網(wǎng)絡(luò)的故事延續(xù)至今。2022年,ChatGPT橫空出世,預(yù)示著大語言模型時代到來。OpenAI一路高歌猛進(jìn),幾乎壟斷了AI時代話語權(quán),并以權(quán)謀、宮斗、巨額融資吸引全世界目光。
而在中國,科大訊飛對深度神經(jīng)網(wǎng)絡(luò)的產(chǎn)業(yè)化研究更加深入,開發(fā)的訊飛星火模型安卓端下載量超過2億次,國內(nèi)工具類通用大模型排名第一。在基于真實場景的背靠背測試中,訊飛星火4.0 Turbo在文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)、代碼和多模態(tài)等七個能力上都超過了GPT-4 Turbo,數(shù)學(xué)、代碼能力已超越GPT-4o。
更關(guān)鍵的,中國大模型正在進(jìn)入更多現(xiàn)實場景——企業(yè)的智能助手、員工的AI助理、學(xué)生的AI學(xué)習(xí)機,學(xué)校的智慧黑板,大學(xué)的科研實驗室,政府大廳的政務(wù)大屏,汽車的智能駕駛艙,聾啞人群的助聽器……都因為大模型的加入變得更加實用便捷。
中國AI公司正銜枚疾走,且走出了一條和OpenAI不太一樣的路。這一切的根源,離不開中國企業(yè)對“實用主義”的追求。同時也引發(fā)了更多思考:這個時代,我們究竟需要怎樣的AI和大模型?
大模型是一場泡沫嗎?
一個月前,OpenAI CEO奧特曼罕見地在凌晨發(fā)了一篇長文:“我們可能在幾千天后就擁有超級智能,這也許是人類歷史上最重要的事,在AI幫助下,我們將能做到祖輩看來像魔法一樣的事,全世界人民的生活都會比現(xiàn)在更繁榮,人類進(jìn)步的故事還將繼續(xù)下去……”
即便是深夜,這篇題為《智能時代》的文章,瀏覽量依然很快突破百萬。但沒有人清楚,這位擅于玩弄概念的新硅谷之王,為什么又突然給全人類開出一張“空頭支票”?
大約一周后,OpenAI宣布從微軟、英偉達(dá)、Thrive Capital等投資者那里又籌集到66億美元,估值膨脹至1570億美元(約合人民幣1.1萬億元),大家才驚覺奧特曼文章原來“意味深長”。
但這輪金額創(chuàng)紀(jì)錄的融資,反而加劇了人們對AI泡沫的擔(dān)憂。
科技博客Techcrunch諷刺:“山姆·奧特曼正從創(chuàng)始人模式一躍成為‘上帝模式’,盡管他提出了AI能拯救世界的眾多方法,試圖說服懷疑者相信AI的重要性,但這樣的帖子不但不會吸引新粉絲,反而讓人思考我們是否正陷入‘皇帝的新衣’的境地。”
就在一年前,奧特曼還是媒體口中“這個時代的奧本海默”,可現(xiàn)如今,這位“AI奧本海默”也不得不正視一個問題——AI是否正脫離實際,變成了炒作概念的工具?
高盛在近期的一份報告中提出了一個關(guān)鍵問題:美股巨頭們已為AI投入數(shù)百億美金,未來可能是上萬億美金,但幾乎沒有任何實質(zhì)性的、可見的成果證明這些投入是值得的。
Gartner對美國市場統(tǒng)計發(fā)現(xiàn),在狂飆兩年后,生成式AI的行業(yè)使用率僅有5%,除了讓開發(fā)人員的工作效率提升了一些,沒看到其他明顯效果。“人們已經(jīng)開始懷疑,這一輪AI熱潮,可能與之前的區(qū)塊鏈、元宇宙一樣,只是技術(shù)樂天派的幻想,而并不具備實際價值。”
就在美國精英們對AI的未來憂心忡忡之際,河南濮陽一名普通的高中物理老師許一龍向大模型產(chǎn)品訊飛曉醫(yī)問出了第一個問題。
第一次聽說訊飛曉醫(yī)這款A(yù)I健康助手時,許一龍首先想到了自己的岳父。岳父今年86歲,肝臟不好,吃飯也成了一件難事。許一龍每天都要發(fā)愁,如何讓老人吃得營養(yǎng),又不過度油膩。
許一龍的問題是“如何為有基礎(chǔ)病的老人規(guī)劃營養(yǎng)食譜?”可這款號稱能看病的醫(yī)療模型APP并沒有直接給出答案,反而向許一龍?zhí)崞鹆藛枺骸澳挲g、性別、身高、體重、體檢報告、健康史、個人史、家族史……”
這不是許一龍印象中的互聯(lián)網(wǎng)搜索引擎,反倒更像一位嚴(yán)肅的老醫(yī)生,他按照這位“AI醫(yī)生”的指示上傳了所有信息,才終于拿到一份給自己岳父設(shè)計的營養(yǎng)食譜,食譜上不僅標(biāo)注了食材類型,連食材用量都精確到了克。
許一龍感到很滿意。他在之后的時間里對訊飛曉醫(yī)大模型提出了更多問題:自己的高血壓問題,父母的養(yǎng)生問題,親朋好友的健康問題……一年以來,訊飛曉醫(yī)成為了許一龍的“家庭健康顧問”。
也是在這一年間,依托訊飛星火大模型的技術(shù)支持和大量的醫(yī)學(xué)知識,能夠進(jìn)行健康自查、報告解讀、醫(yī)療信息查詢、健康檔案管理等多種功能的訊飛曉醫(yī)累計下載量突破1500萬次,有1.1億人次咨詢。
![]()
|訊飛曉醫(yī)App
即便是科大訊飛董事長劉慶峰,對自家大模型的普及速度也有些驚訝。
2022年底,劉慶峰借來一個賬號體驗了ChatGPT,他第一時間就感到大模型將對人類的生產(chǎn)和生活方式帶來巨大顛覆,產(chǎn)生全新機會。但同時,如何用好大模型,讓大模型轉(zhuǎn)化為生產(chǎn)力,將成為未來企業(yè)乃至國際競爭的關(guān)鍵。
在一周之內(nèi),劉慶峰做了三個決策。第一,科大訊飛要集中力量,重現(xiàn)OpenAI的智慧涌現(xiàn)。第二,大模型要做“1+N”,“1”是通用認(rèn)知智能大模型,“N”是讓大模型在教育、辦公、汽車、數(shù)字員工等各個領(lǐng)域落地。第三,建立一套科學(xué)的、系統(tǒng)的評測體系。用評測體系給出判斷,技術(shù)到底進(jìn)展到了什么程度,下一個發(fā)展方向應(yīng)該往哪邊走。
![]()
|應(yīng)用大模型技術(shù)的數(shù)字員工
秉承著科大訊飛“技術(shù)頂天、應(yīng)用落地”的戰(zhàn)略,他們將大模型命名為“星火”,取自“星星之火,可以燎原”之意,“也是希望大模型能像火焰一樣,點亮更多未知領(lǐng)域。”
大模型實踐的關(guān)鍵是什么?
關(guān)于AI的應(yīng)用邊界問題,早在20多年前,麻省理工學(xué)院第一任AI研究室主任西蒙爾·派普特就做過一個思想實驗。
西蒙爾·派普特假設(shè),如果一名現(xiàn)代噴氣發(fā)動機工程師穿越回200多年前,向當(dāng)時的馬車夫和馬車行展示噴氣發(fā)動機,并詢問這是否能幫到他們。他會得到什么樣的回答?
馬車夫首先想到的回答是將噴氣發(fā)動機安裝到馬車上,因為這是人們根據(jù)經(jīng)驗最快能想到的應(yīng)用方式,發(fā)動機確實會讓馬車比馬跑得更快。
但最終發(fā)動機沒有裝到馬車上,而是被裝到了汽車上,因為人們需要物流變得更快、更省錢。受限于馬車的物理結(jié)構(gòu),發(fā)動機并不能發(fā)揮最大功效。
西蒙爾·派普特由此得出結(jié)論,由于思想和經(jīng)驗主義限制,人們最快能想到的應(yīng)用方式,不一定是最好、最代表趨勢的方式。相反地,由實踐需求引導(dǎo)的新技術(shù)應(yīng)用,或許能給人類帶來更大的價值。
西蒙爾·派普特的思想實驗,直到今天依然貼切。只是主角從“發(fā)動機與馬車夫”變成了“大模型與××”。
2023年6月16日,全世界第一輛汽車的制造商奔馳宣布將ChatGPT整合進(jìn)下一階段的車載語音控制系統(tǒng),同時在美國開啟MBUX智能人機交互系統(tǒng)測試計劃。
奔馳不知道的是,在中國安徽的兩家本土企業(yè)——奇瑞和科大訊飛早就醞釀起了“大模型+智能座艙”的計劃。
科大訊飛董事長劉慶峰形容,即便相識二十多年,奇瑞創(chuàng)始人尹同躍還是能“點燃自己”。
2003年的廣州車展上,奇瑞QQ搭載科大訊飛“I-say”數(shù)碼聽系統(tǒng),集文本朗讀、MP3播放于一身,推出了會說話的奇瑞QQ。這款預(yù)計產(chǎn)量3萬臺一年的QQ,加上當(dāng)時最酷的語音系統(tǒng),瞬間點燃了市場,一年干到了16.8萬輛。
時至今日尹同躍還會開玩笑,當(dāng)年“奇瑞QQ+AI”意料之外的成功,讓奇瑞和科大訊飛有底氣對省里(安徽)許下宏愿,一個要做最大的公司,一個要做最聰明的公司。
21年后,奇瑞成了《財富》世界500強公司,并走出國門,成了中國乘用車“出海一哥”,科大訊飛成為市值超千億的中國AI龍頭企業(yè)。雙方依然在精誠合作。
去年8月,奇瑞與科大訊飛宣布星火大模型首搭星途星紀(jì)元ES車型。5個月后,奇瑞星紀(jì)元ES車型在第四屆中國汽車風(fēng)云盛典上獲得了“最佳轎車”獎項。
很多人可能不理解智能座艙對汽車的意義,認(rèn)為只是添頭技。
奇瑞汽車執(zhí)行副總經(jīng)理、研發(fā)總院院長CTO高新華以自身經(jīng)歷舉例:“一些新手司機在開車總會遇到一些故障或是問題,比如雨刮器打不開、后霧燈怎么開、系統(tǒng)按鍵找不到等等,但開車的時候沒法求助,打客服電話又要很多次轉(zhuǎn)接,這時候如果問‘大模型’,就可以立即得到解答。”
如果把新手司機擴張到海外新手司機,智能座艙的還會顯得更實用。
![]()
![]()
![]()
![]()
|市民在體現(xiàn)搭載了星火智能座艙的智能汽車
以往當(dāng)一輛國產(chǎn)汽車賣到海外,由于語言不通,系統(tǒng)不夠智能,海外用戶很難體驗中國的完整智能用車服務(wù),有用車問題只能自己摸索。
但加入人工智能相關(guān)技術(shù)后,車載語音系統(tǒng)能覆蓋23個主要語種,用車助手會實時監(jiān)測車輛狀況,根據(jù)當(dāng)下的路況車況,解答用戶的用車問題。例如在不同的路況下,幫助用戶開啟自動駕駛輔助;在不同天氣下,引導(dǎo)用戶正確使用車燈;根據(jù)實時車況,精準(zhǔn)給出維修保養(yǎng)建議等等。
事實證明,大模型+汽車的價值遠(yuǎn)不止這些功能,在汽車成為人們生活“第三空間”的當(dāng)下,AI還能是車上的影音空間、生活助手、工作智囊、育兒幫手……兼具實用和情緒價值。
有一個很實際的數(shù)字,有了大模型之后,用戶與汽車的交互次數(shù)從7次提升到了18次。用高新華的話來說:“星紀(jì)元ES是瞄著特斯拉去做的,智能化方面,有訊飛星火加持后,我們已經(jīng)領(lǐng)先特斯拉。”
除了讓汽車變得“聰明”的智能座艙,大模型也在改變更多行業(yè)。在中國,僅2024年第三季度,市場上公開可統(tǒng)計的大模型相關(guān)中標(biāo)項目數(shù),至少有369個,遠(yuǎn)超上半年項目總數(shù)276個,尤以能源、金融、教育、互聯(lián)網(wǎng)等行業(yè)更為活躍。
在今年的訊飛開發(fā)者大會上,劉慶峰列出了一項數(shù)據(jù)“科大訊飛是今年1-9月份大模型市場中標(biāo)數(shù)量、中標(biāo)金額第一的廠商,更是央國企的首選。”中國石油、中國移動、華為共建的昆侖大模型;中國海油、中國電信打造的“海能”AI模型;中國綠發(fā)打造的泰山大模型,背后都是科大訊飛的大模型底座支撐。
整個現(xiàn)場為之沸騰。央國企是市場中的風(fēng)向標(biāo)。全世界都不得不承認(rèn),中國擁有大模型應(yīng)用最多的場景。大模型在美國橫空出世不到2年時間,中國的央國企、頭部企業(yè)和很多中國人已經(jīng)用上了大模型。目前,訊飛星火大模型就已經(jīng)覆蓋了20個多個行業(yè)300多個場景,其中包括醫(yī)療、教育、政務(wù)等和民生需求息息相關(guān)的行業(yè),也包括“AI for Science”等高精尖的科研行業(yè)。
劉慶峰說:“為什么我們能夠成為央國企和頭部企業(yè)的首選?我們讓大模型真正落地場景,數(shù)據(jù)和訓(xùn)練模型效率成倍提升,實用性大幅提高。”現(xiàn)在,科大訊飛構(gòu)建了從“建算力、理數(shù)據(jù)、訓(xùn)模型”,到“落場景、保安全、精運營”的全套解決方案,“科大訊飛有領(lǐng)先的工具鏈,可大幅提升‘理數(shù)據(jù)、訓(xùn)模型’的效率;有覆蓋300+行業(yè)場景的實際應(yīng)用案例,已形成相互借鑒和復(fù)用的規(guī)模化效應(yīng);還有全國產(chǎn)化的算力平臺。”
什么是最適合中國的大模型?
關(guān)注國產(chǎn)模型的人,應(yīng)該都有一個感受:今年以來國產(chǎn)模型對標(biāo)OpenAI說的少了,產(chǎn)業(yè)應(yīng)用說的多了。
2023年初,許多中國大模型廠商放出豪言“要做中國的OpenAI”,之后的行為也帶有濃厚的“軍備競賽”意味,大家攀比的是你家大模型有多少億參數(shù),屯了多少張英偉達(dá)顯卡,融了多少輪資金?
這的確是OpenAI的經(jīng)典玩法——堆參數(shù)、屯卡、燒融資,但對中國大模型來說,恐怕并不適配“財大氣粗的”美股玩法。
今年3月,金沙江創(chuàng)投主管合伙人朱嘯虎被問到“如果大模型公司看不到商業(yè)化可能,你會為了人類夢想與科學(xué)研究投資嗎?”
朱嘯虎給出的回答是:“不要燒錢搞AIGC,你必須找到PMF(產(chǎn)品與市場匹配)。為什么美國人敢投?微軟3萬億美金市值,蘋果2萬億美金市值,他們敢砸錢。中國不需要砸,美國有錢在前面試錯,它一旦證明路通了,后面要花的錢少一個數(shù)量級。”
作為一名在移動時代投出過餓了么、滴滴、ofo等知名案例的投資人,朱嘯虎的回答代表了一眾市場信仰派VC的心聲——國產(chǎn)模型不能光講技術(shù)理想,更應(yīng)該發(fā)揮國內(nèi)應(yīng)用場景廣闊這一核心優(yōu)勢,將足夠的AI能力投入可以快速變現(xiàn)的商業(yè)場景中,用中國市場龐大而獨特的數(shù)據(jù)構(gòu)筑壁壘,讓模型產(chǎn)生價值,以價值產(chǎn)生利潤,實現(xiàn)自我造血。
短短半年后,當(dāng)OpenAI因贏利與技術(shù)之爭,內(nèi)部飽受爭議,一些在中國的商場中浸泡更久,對技術(shù)和商業(yè)化理解更深的中國公司,反倒異軍突起。
以科大訊飛為例,因為一開始確定的“1+N”策略,技術(shù)開發(fā)和應(yīng)用落地并重,“All in 大模型”的高投入在2024年第三季度財報得到回饋。科大訊飛年內(nèi)首次實現(xiàn)利潤當(dāng)季度轉(zhuǎn)正。前三季度收入148.5億元,同比增長17.73%。第三季度營業(yè)收入55.25億元,同比增長15.77%;毛利22.6億元,同比增長16.68%;歸母凈利潤5696萬元,同比增長120.87%。經(jīng)營性現(xiàn)金流凈額7.15億元,同比增長100%。
在2024年三季報業(yè)績解讀會上,科大訊飛副總裁、董事會秘書江濤解釋稱,這是公司加大星火大模型的研發(fā)投入和布局后,自然實現(xiàn)的收入增長。“隨著未來幾年國家和政府的重大算力布局支持,公司在算力方面無需大幅度投入的自有資金,收入還可能繼續(xù)增長。”
技術(shù)優(yōu)先還是商業(yè)化優(yōu)先,從來不是非此即彼的兩極對立,各國大模型發(fā)展的現(xiàn)狀,也充分證明“自我造血,扎根應(yīng)用場景”這個移動互聯(lián)網(wǎng)時代硬性標(biāo)準(zhǔn),對現(xiàn)在的大模型創(chuàng)企依然極具現(xiàn)實意義。
即使今天,比起大洋彼岸,我們在資金、算力、技術(shù)上,依然沒有優(yōu)勢。針尖對麥芒地?zé)X、玩概念、拼參數(shù),無疑是以己之短攻彼之長——這是硅谷更擅長的游戲,規(guī)則和解釋權(quán)由他們定義,美股巨頭的萬億美金市值,可以提供近乎無限的資源。
但技術(shù)創(chuàng)新從來不止一種選項。正如互聯(lián)網(wǎng)時代,美國誕生了微軟、蘋果、谷歌、亞馬遜這些偉大的科技公司,扎根中國廣袤應(yīng)用市場,將產(chǎn)業(yè)應(yīng)用、自我造血視作生命線的中國創(chuàng)業(yè)者們,同樣催生了騰訊、阿里、字節(jié),同樣影響人類社會。
正如微軟中國CTO韋青對當(dāng)前生成式AI的總結(jié):“我們已經(jīng)進(jìn)入了一個開卷考試的時代,現(xiàn)在最不缺的就是標(biāo)準(zhǔn)答案,最缺的是經(jīng)過獨立思考而得到的適合自己的答案。”
以科大訊飛為代表的中國AI企業(yè)給出的答案是:中國大模型很難成為OpenAI,也沒有必要成為OpenAI。
我們有我們自己的道路。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.