文:任澤平團(tuán)隊(duì)
1、 AI應(yīng)用驅(qū)動下一輪洗牌:跨越AI發(fā)展冷靜期,發(fā)展AI向?qū)?/strong>
人工智能領(lǐng)域正在進(jìn)入大模型浪潮以來 第一段“冷靜期”。
一方面,OpenAI的下一代語言模型Orin遭遇重大瓶頸,效果不及內(nèi)部預(yù)期。其2024年初主推的多模態(tài)模型Sora的發(fā)布日期也持續(xù)推遲。
另一方面,AI行業(yè)的“Scaling Law”似乎正在失效,大模型的性能不再隨著參數(shù)量、數(shù)據(jù)量、計(jì)算資源的增加而產(chǎn)生指數(shù)提升。
![]()
AI需要新驅(qū)動力,應(yīng)用驅(qū)動將成為第一性原理。進(jìn)入“冷靜期”符合行業(yè)發(fā)展的規(guī)律,就像歷史上許多次技術(shù)浪潮一樣,在度過最初的高期望階段之后,泡沫不可避免產(chǎn)生。當(dāng)技術(shù)沒有達(dá)到高期望時,行業(yè)會進(jìn)入一段冷靜期,等待新技術(shù)和應(yīng)用變革帶來大洗牌。
2、 海外和中國兩條路線發(fā)展,以AI應(yīng)用殊途同歸
海外AI發(fā)展曾經(jīng)以技術(shù)驅(qū)動,實(shí)現(xiàn)AGI(通用人工智能)等同于實(shí)現(xiàn)AI企業(yè)的終極商業(yè)價值。ChatGPT讓產(chǎn)業(yè)界看到了以AGI為目標(biāo)的技術(shù)驅(qū)動的潛力,但經(jīng)過兩年發(fā)展,行業(yè)意識到AGI仍然遙遠(yuǎn),純技術(shù)驅(qū)動還不具備客觀條件。海外AI巨頭在2024年逐步調(diào)整方向,開始以應(yīng)用開發(fā)、產(chǎn)業(yè)結(jié)合為當(dāng)前階段重點(diǎn)。OpenAI轉(zhuǎn)向盈利性商業(yè)化運(yùn)營,谷歌、微軟等都開始以To C、企業(yè)端、開發(fā)者社區(qū)合作為聚焦點(diǎn)。
中國AI發(fā)展特點(diǎn)是應(yīng)用驅(qū)動。2023年ChatGPT浪潮掀起“百模大戰(zhàn)”,積累了早期中國AI市場基礎(chǔ)。根據(jù)《全球數(shù)字經(jīng)濟(jì)白皮書》,截止2024年11月,中國的大模型數(shù)量高達(dá)478個,約占全球總數(shù)量的36%。中國市場投入大量資源開發(fā)基礎(chǔ)大模型,在一定程度上導(dǎo)致AI深層技術(shù)發(fā)展整體滯后。但另一方面也提高了生成式AI的社會認(rèn)知和接受度,進(jìn)而促進(jìn)個人和企業(yè)去關(guān)心AI產(chǎn)品與市場的契合度,打下了應(yīng)用驅(qū)動AI發(fā)展的“彎道超車”基礎(chǔ)。
![]()
原生AI企業(yè)是推動行業(yè)技術(shù)進(jìn)步和產(chǎn)業(yè)化的引擎。2024年11月,沙利文發(fā)布《2024年全球AI生態(tài)全景概覽》,其中原生AI巨頭有谷歌、百度、OpenAI三家。通過原生AI企業(yè)的技術(shù)、產(chǎn)業(yè)創(chuàng)新實(shí)現(xiàn)“冷靜期”跨越有跡可循。比如,谷歌在2017提出了Transformer架構(gòu),成為推動預(yù)訓(xùn)練模型進(jìn)化為大模型落地的最關(guān)鍵技術(shù)。2023年OpenAI發(fā)布ChatGPT,通用大模型首次進(jìn)入公眾視野,喚醒沉寂多年的AI賽道。2024年百度世界大會召開,開創(chuàng)性主張“AI應(yīng)用向?qū)崱保袊鳤I發(fā)展正式進(jìn)入彎道超車階段。
3、 重視AI行業(yè)的“新三要素”:幻覺消除、開發(fā)加速、智能體發(fā)展
3.1 大模型欠缺真實(shí)感,消除智能幻覺是首要任務(wù)
大語言模型(Large Language Model)中的“幻覺”現(xiàn)象指的是模型生成的內(nèi)容雖然看似合理,但實(shí)際存在事實(shí)錯誤;或者AI生成的文字、圖片、視頻在直覺上不符合人類認(rèn)知,欠缺真實(shí)感。“幻覺”主要有邏輯謬誤、捏造事實(shí)、數(shù)據(jù)偏見三類。通常是因?yàn)槟P偷耐评砟芰η啡保惴蚣艽嬖诼┒矗瑪?shù)據(jù)壓縮、數(shù)據(jù)不一致性等原因?qū)е隆?/p>
多模態(tài)大模型領(lǐng)域興起,圖像、音頻、視頻類模型也出現(xiàn)幻覺現(xiàn)象。比如,OpenAI的Sora大模型雖然在視頻生成領(lǐng)域表現(xiàn)優(yōu)異,但也存在生成的視頻違背物理規(guī)律,時空關(guān)系錯亂等情況。這也是正式版Sora無法上線的主要原因之一。
業(yè)內(nèi)解決“幻覺”問題的方式是采用RAG技術(shù),(Retrieval-Augmented Generation)即檢索增強(qiáng)生成,通過結(jié)合階段和增強(qiáng)生成,減少學(xué)習(xí)數(shù)據(jù)中的“負(fù)樣本”,以此來減少大模型的幻覺現(xiàn)象。但這也僅限于在LLM領(lǐng)域。在多模態(tài)領(lǐng)域,百度開發(fā)了基于圖像的iRAG(Image based RAG)技術(shù),將搜索引擎的億級圖片資源與文心基礎(chǔ)模型能力進(jìn)行結(jié)合,在強(qiáng)化學(xué)習(xí)生成下,輸出各種真實(shí)的圖片,整體效果遠(yuǎn)超傳統(tǒng)的“文生圖”的原生系統(tǒng),有效的消除了“AI味”。未來,以iRAG技術(shù)為代表多模態(tài)RAG將成為業(yè)內(nèi)緩解AI“幻覺”現(xiàn)象的主要方向,為更成熟、更真實(shí)的多模態(tài)應(yīng)用發(fā)展提供更準(zhǔn)確的能力。
![]()
3.2 編程AI應(yīng)用加速行業(yè)走向下個爆發(fā)奇點(diǎn)
AI編程應(yīng)用將加速AI迭代進(jìn)程,賦予企業(yè)和個人更強(qiáng)的開發(fā)能力。全球AI企業(yè)已經(jīng)進(jìn)入“效率時代”,由于軟件應(yīng)用開發(fā)的成本高、周期長,算法工程師昂貴且稀缺,通過開發(fā)輔助編程AI來提高開發(fā)者效率、縮短開發(fā)周期成為方向。
一種是企業(yè)內(nèi)部用AI直接輔助開發(fā)任務(wù)。比如,亞馬遜將Amazon Q用于公司內(nèi)部的軟件升級任務(wù),為其節(jié)省了相當(dāng)于“4500 名開發(fā)人員一年的工時”,并且還提高了準(zhǔn)確性和安全性,降低了基礎(chǔ)設(shè)施成本。
或是與開發(fā)者社區(qū)聯(lián)合開發(fā)編程AI助手,提高個人寫代碼效率。比如,GitHub Copilot由GitHub、OpenAI和微軟Azure團(tuán)隊(duì)聯(lián)合推出,可以提供代碼建議和自動補(bǔ)全功能,幫助開發(fā)者更快地編寫代碼。
甚至是直接省去人工代碼步驟,由AI完成開發(fā)全流程。2024百度世界大會發(fā)布的“秒噠”是里程碑式的開發(fā)工具,不同于前兩種輔助編程工具,使用秒噠不需要任何代碼能力,通過自然語言就能實(shí)現(xiàn)軟件開發(fā),人人都將擁有程序員的能力。其實(shí)現(xiàn)是通過將任務(wù)拆解成核心需求、內(nèi)容結(jié)構(gòu)、工程開發(fā)、數(shù)據(jù)需求四個步驟,再采用多個智能體協(xié)同來完成,這也是迄今為止,最復(fù)雜的多智能體協(xié)作工具。以后隨著基礎(chǔ)模型能力提升,以及智能體本身的技術(shù)能力迭代,秒噠將能完成更復(fù)雜的開發(fā)訴求,實(shí)現(xiàn)系統(tǒng)級開發(fā)能力。
百度在AI編程應(yīng)用上邁出的這一步,不僅消除了未來成為開發(fā)者的門檻,更是對AI時代商業(yè)模式的一次革新。這意味者實(shí)現(xiàn)商業(yè)創(chuàng)意或不再需要組織人員架構(gòu),智能體就能充當(dāng)項(xiàng)目經(jīng)理、設(shè)計(jì)師、開發(fā)工程師,憑借AI工具和創(chuàng)意,個人就能開發(fā)產(chǎn)品和創(chuàng)造商業(yè)模型。
3.3 智能體是LLM的進(jìn)化,是可以反思、進(jìn)化、使用的工具
智能體會變成AI時代內(nèi)容、信息和服務(wù)的新載體,是下一個爆發(fā)點(diǎn)。大模型是AI應(yīng)用的初期形態(tài),具備一定的通用性,但在深度方面欠缺。大模型作為應(yīng)用發(fā)展的下一步是智能體(AI Agent),不但能基于LLM進(jìn)行任務(wù)推理和解決,還具備記憶、規(guī)劃功能和更強(qiáng)的自我學(xué)習(xí)能力,并且能使用特定的行業(yè)知識完成更復(fù)雜、更高質(zhì)量的任務(wù)。
第一類具身智能體(Embodied AI),典型代表有智能駕駛汽車、通用人形機(jī)器人。如英偉達(dá)CEO黃仁勛所言,具身智能體是AI進(jìn)入物理世界的超級智能形態(tài)。L3以上的高階智能駕駛是第一步,目前以國內(nèi)的百度Apollo和美國的特斯拉RoboCab為代表。第二步是通過自動駕駛的大范圍應(yīng)用鋪開,積累智駕算法的數(shù)據(jù)和經(jīng)驗(yàn),再構(gòu)建虛擬環(huán)境去訓(xùn)練人形機(jī)器人算法,幫助其實(shí)現(xiàn)量產(chǎn)落地。比如人形機(jī)器人領(lǐng)域領(lǐng)先的特斯拉Optimus,采用的就是其FSD智能駕駛算法。
第二類是平臺智能體(Platform AI),為工具、企業(yè)、角色、行業(yè)、產(chǎn)業(yè)等提供AI賦能升級和定制化解決方案。
工具智能體,在個人的工作和興趣應(yīng)用場景中擁有強(qiáng)大的創(chuàng)造力和價值,將成為AI界的新質(zhì)生產(chǎn)力代表。如AI寫作、Canva設(shè)計(jì)助手、logo生成器等等,都是典型的代表。工具智能體的核心在于AI的“自由性”——能通過連接公域(公開數(shù)據(jù)、搜索引擎內(nèi)容、社交平臺內(nèi)容)和私域(個人數(shù)據(jù)、音頻、圖像、文字)來生成符合用戶期望的內(nèi)容,解鎖“創(chuàng)造性”和“獨(dú)特性”。比如,百度發(fā)布的自由畫布就是由文心多模態(tài)大模型加持的創(chuàng)造力工具,具備輸入自由、編輯自由、創(chuàng)作自由三大屬性,覆蓋從創(chuàng)意繪畫、AI寫作到專業(yè)報(bào)告領(lǐng)域等使用場景,幫用戶完成從找資料、到編輯、再到生成和分享的全部任務(wù)。
![]()
企業(yè)類智能體,相當(dāng)于人工智能時代的公司官方AI,具備官網(wǎng)+服務(wù)一體的系統(tǒng)化能力。由于傳統(tǒng)的企業(yè)官網(wǎng)通常信息龐雜、專業(yè)術(shù)語難懂、視覺觀感上易疲勞,檢索方式復(fù)雜、服務(wù)效率較低,已無法滿足用戶的需求變化。而AI企業(yè)智能體則具備了定制化推薦、及時化響應(yīng)、高效化服務(wù)的能力。在汽車零售領(lǐng)域,比亞迪官網(wǎng)是成熟的企業(yè)智能體案例,對于不懂術(shù)語的用戶,智能體能像人類客服一樣為用戶找出匹配的參數(shù),一鍵式提供清晰明了的對比,省去手動篩選步驟,給出符合用戶期待的建議。
角色類智能體,也就是AI數(shù)字人,擁有自己的背景、設(shè)定、知識庫。可以是基于現(xiàn)實(shí)真人、特定職業(yè)進(jìn)行在線服務(wù)的AI角色,也可以是虛擬角色。以往的虛擬數(shù)字人,大部分存在聲音口型不匹配、肢體動作機(jī)械、神情呆板等問題。在LLM和多模態(tài)的技術(shù)加持下,角色智能體能呈現(xiàn)出更高度擬人化的表情、神態(tài)、情感。可以充當(dāng)輔導(dǎo)老師,健康咨詢師,網(wǎng)絡(luò)娛樂主播等,通過與人互動提供知識和價值。實(shí)際上,當(dāng)前的數(shù)字人直播在許多場景下已經(jīng)超過真人直播的轉(zhuǎn)化率,具備可觀的商業(yè)價值。
行業(yè)類智能體,為用戶打破信息不對稱,提供對應(yīng)領(lǐng)域的專業(yè)服務(wù),在法律、醫(yī)療健康、金融、體育、旅行等領(lǐng)域潛力巨大。比如,法律行業(yè)的智能體——法行寶就是普通人的專業(yè)法律助手,從案件分析、條文引用、賠償計(jì)算、訴訟起草,實(shí)現(xiàn)了全流程免費(fèi)服務(wù)。上線半年多以來,百度推出的法行寶為940萬多人提供了高效、可信的法律服務(wù)。
產(chǎn)業(yè)類智能體,為不同產(chǎn)業(yè)中、不同分工的公司,提供商業(yè)決策中各環(huán)節(jié)解決方案。比如,餐飲產(chǎn)業(yè)的選址和售后服務(wù)是兩大難題。國內(nèi)的餐飲龍頭百勝集團(tuán)選擇與百度合作,基于大模型能力進(jìn)行選址評估,提高了上千家門店的選址效率與銷售效果。初期的賦能成功后,百勝又對全線業(yè)務(wù)進(jìn)行了數(shù)字化升級,大模型每天調(diào)用量的峰值達(dá)到數(shù)百萬,AI客服的問題解決率提升到了90%。為傳統(tǒng)行業(yè)轉(zhuǎn)型提供AI升級,還只是產(chǎn)業(yè)類智能體的應(yīng)用探索第一步,未來隨著模型學(xué)習(xí)能力更具深度,數(shù)據(jù)訓(xùn)練更龐大,產(chǎn)業(yè)類智能體甚至有潛力成為公司戰(zhàn)略的核心決策者。
4、 立足于AI浪潮之中:理想主義、聚焦人才是AI進(jìn)步的引擎
科技進(jìn)步的原力是理想主義,前沿的技術(shù)浪潮最早都是由少數(shù)個人的理想主義來推動的,這一點(diǎn)在AI領(lǐng)域尤其突出。2024年的諾貝爾物理學(xué)獎頒給了約翰·霍普菲爾德和杰弗里·辛頓,一方面表彰兩位學(xué)界先驅(qū)對于AI理論研究和產(chǎn)業(yè)化的貢獻(xiàn);另一方面,是對兩位在深度學(xué)習(xí)路線受到冷落的30余年,仍然堅(jiān)定該研究方向的理想主義精神致以敬意。
![]()
30年來,推動美國AI產(chǎn)業(yè)發(fā)展成型是學(xué)術(shù)界的辛頓團(tuán)隊(duì)和產(chǎn)業(yè)界的微軟、谷歌團(tuán)隊(duì),將這一成果轉(zhuǎn)換為商業(yè)化浪潮的是OpenAI和英偉達(dá)。其背后根本是以辛頓、伊利亞、蘇萊曼等為代表的學(xué)者和以馬斯克、奧特曼、黃仁勛為代表的企業(yè)家以個人理想主義推動行業(yè)進(jìn)步。
中國的AI產(chǎn)業(yè)發(fā)展和未來趨勢亦是如此,有AI理想主義的企業(yè)家是推動行業(yè)進(jìn)步的關(guān)鍵。早在2012年,李彥宏就瞄準(zhǔn)人工智能領(lǐng)域,率先意識到AI發(fā)展的轉(zhuǎn)折點(diǎn)到來,發(fā)起計(jì)劃收購剛完成AlexNet的辛頓團(tuán)隊(duì)。該團(tuán)隊(duì)中還包括了后來的“ChatGPT之父”伊利亞·蘇茨克維。彼時參與拍賣的還有谷歌、微軟、DeepMind,而百度在競標(biāo)中一直出價最高,直漲到4400萬。盡管因?yàn)樾令D的身體條件等原因,最終未能與百度合作,但這場改變?nèi)斯ぶ悄芨锩奈枧_上,中國企業(yè)的世界眼光和視角高度讓AI學(xué)術(shù)界感嘆。“AI教父”、深度學(xué)習(xí)發(fā)起人之一楊立昆感嘆:百度是最早部署商業(yè)化深度學(xué)習(xí)系統(tǒng)的大型公司之一,甚至領(lǐng)先于谷歌和微軟。
十年來,李彥宏作為企業(yè)家一方面將百度的十年布局聚焦在AI領(lǐng)域,另一方面作為個人也在不斷傳播他的理想主義,無論是對國家領(lǐng)導(dǎo)、企業(yè)家、媒體,還是對朋友、學(xué)生、極客,他從不放過任何“布道”AI的機(jī)會。在連續(xù)8年的“兩會”中,李彥宏提出了13份AI相關(guān)提案。在堅(jiān)持十年的“布道”和產(chǎn)業(yè)落地中,越來越多的企業(yè)也看到了AI技術(shù)的價值并開始重視對AI的投入,互聯(lián)網(wǎng)科技公司轉(zhuǎn)向發(fā)展人工智能的信心也更加堅(jiān)定。
![]()
AI理想主義從理念到落地,根基是聚焦人才培養(yǎng)。2013年,李彥宏組建了成立百度深度學(xué)習(xí)實(shí)驗(yàn)室,擔(dān)任院長。這是世界上首個以“深度學(xué)習(xí)”命名的企業(yè)級實(shí)驗(yàn)室。至此,中國AI領(lǐng)域開始招賢納士,打穩(wěn)根基,踏上10年的探索之路。2014年,谷歌貓牽頭人吳恩達(dá)加入百度深度學(xué)習(xí),擔(dān)任首席科學(xué)家,負(fù)責(zé)百度大腦項(xiàng)目,培養(yǎng)了眾多中國AI界的核心技術(shù)骨干。2017年,王海峰接棒吳恩達(dá),搭建AIG(AI技術(shù)平臺體系)后來發(fā)展為深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心。2023年,王海峰發(fā)布百度人才培養(yǎng)星河計(jì)劃,宣布為社會再培養(yǎng)500萬大模型人才的愿景。
十年來,百度不但實(shí)現(xiàn)從0到1的AI技術(shù)人才骨架逐漸成型,打穩(wěn)了中國AI發(fā)展的人才基本盤,也讓人工智能的理想主義隊(duì)伍不斷壯大,為中國AI行業(yè)在下一次變革性浪潮中做好了準(zhǔn)備。2021年,李彥宏在致股東信中提到:“百度有定力,有耐心。因?yàn)槲覀兩钪钋把氐募夹g(shù)浪潮是等不來的,你必須提前10年、20年去布局”。當(dāng)下看,不僅提前10年布局的百度做到了生態(tài)領(lǐng)先,中國AI行業(yè)也做到了立足于全球人工智能的大浪潮中。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.