2024年企業(yè)應(yīng)用大模型怎么選?近日,全球增長咨詢公司弗若斯特沙利文發(fā)布《2024年中國大模型能力評(píng)測》,全面梳理了當(dāng)前大模型的最新發(fā)展態(tài)勢(shì)和競爭格局,為企業(yè)選購大模型提供精準(zhǔn)決策支持。
報(bào)告對(duì)國內(nèi)主流的15個(gè)大模型進(jìn)行了權(quán)威評(píng)測。結(jié)果顯示,百度、騰訊、阿里等互聯(lián)網(wǎng)大廠旗下大模型位于第一梯隊(duì),綜合表現(xiàn)相比初創(chuàng)企業(yè)更為優(yōu)異。其中,文心一言能力最為全面,五項(xiàng)評(píng)測維度均為優(yōu)勢(shì)能力,并取得四項(xiàng)第一。
![]()
沙利文《2024年中國大模型能力評(píng)測》:大模型綜合競爭力氣泡圖
沙利文的最新報(bào)告以用戶使用體驗(yàn)和實(shí)際使用價(jià)值為衡量標(biāo)準(zhǔn),綜合考量數(shù)理科學(xué)、語言能力、道德責(zé)任、行業(yè)能力及綜合能力等5大核心維度及21個(gè)細(xì)化二級(jí)維度。
報(bào)告顯示,國際領(lǐng)先模型在通用基礎(chǔ)能力和專業(yè)應(yīng)用能力上略優(yōu)于中國領(lǐng)先模型,但以文心一言為代表的中國模型具備亮眼表現(xiàn)。文心一言拿下數(shù)理科學(xué)、語言能力、道德責(zé)任、行業(yè)能力及綜合能力等五大評(píng)測維度的四項(xiàng)第一,評(píng)測結(jié)果遠(yuǎn)超國際均線,展現(xiàn)了中國大模型在自然語言處理領(lǐng)域的顯著實(shí)力和在實(shí)際應(yīng)用中的高價(jià)值。
沙利文報(bào)告的大模型通用基礎(chǔ)能力評(píng)測包含數(shù)理科學(xué)、語言能力和道德責(zé)任管理等三大要素,結(jié)果顯示文心一言排名第一,展現(xiàn)出模型在底層基礎(chǔ)能力方面的較高水平。大模型的專業(yè)應(yīng)用能力包含綜合能力和專業(yè)能力兩大核心要素,是大模型實(shí)際運(yùn)用效能的集中展現(xiàn),文心一言同樣位列榜首,表現(xiàn)顯著優(yōu)于國際均線。
![]()
文心一言綜合表現(xiàn)搶眼:5大維度取得4項(xiàng)第一
從具體細(xì)分維度來看,在語言能力的評(píng)測中,得益于先進(jìn)的模型架構(gòu)、大規(guī)模預(yù)訓(xùn)練、精細(xì)調(diào)優(yōu)、多任務(wù)學(xué)習(xí)以及強(qiáng)大的計(jì)算資源等多方面的優(yōu)勢(shì),文心一言在語言表達(dá)能力、語言理解能力、以及語言邏輯能力等關(guān)鍵指標(biāo)上都達(dá)到了領(lǐng)先水平,在語言能力評(píng)測中排名第一。特別是開放式邏輯推理方面,文心一言樹立了新的標(biāo)桿。這要求模型具備深入剖析、全面比較和精確判斷的能力,在處理復(fù)雜、多層次的邏輯推理問題時(shí)尤為重要。
![]()
中國大語言模型能力評(píng)析:語言能力
在日益重要的道德責(zé)任評(píng)測中,文心一言在道德理解深度、危險(xiǎn)言論規(guī)避機(jī)制以及魯棒性對(duì)抗方面均表現(xiàn)卓越,成為此次測試中安全性最高的模型。這反映出文心一言在模擬和處理涉及道德判斷和決策的情境時(shí),具備更為精準(zhǔn)的理解力和適應(yīng)性。這無疑將確保AI大模型的可持續(xù)發(fā)展和社會(huì)效益的最大化。
![]()
中國大語言模型能力評(píng)析:道德責(zé)任
在大模型落地看重的行業(yè)能力評(píng)測中,文心一言同樣排名第一。報(bào)告顯示,文心一言靈活適應(yīng)并高效解決了電商、工業(yè)、教育、能源、醫(yī)療等超過10個(gè)行業(yè)實(shí)際應(yīng)用場景中遇到的問題,在多行業(yè)能力評(píng)測中表現(xiàn)優(yōu)異。
沙利文還在報(bào)告中預(yù)測,2024年,大模型的技術(shù)發(fā)展將趨向多功能與小型化,同時(shí)產(chǎn)業(yè)端將強(qiáng)調(diào)自主研發(fā)和行業(yè)標(biāo)準(zhǔn)化,而倫理責(zé)任和數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范將成為持續(xù)發(fā)展的關(guān)鍵。
以百度文心一言為代表的國產(chǎn)模型,正在不斷提升大模型的效率,豐富大模型的功能。公開資料顯示,自文心大模型發(fā)布以來,百度不斷降低推理成本,進(jìn)一步提升文心大模型的效率。借助百度獨(dú)特的四層AI技術(shù)架構(gòu),文心大模型周均訓(xùn)練有效率超過98%。
百度還推出兩款MaaS產(chǎn)品,降低大模型及AI原生應(yīng)用開發(fā)門檻,分別是用于應(yīng)用開發(fā)的千帆AppBuilder和用于專有模型開發(fā)精調(diào)的千帆ModelBuilder,累計(jì)幫助用戶精調(diào)1.3萬個(gè)大模型,服務(wù)8萬企業(yè)用戶,幫助用戶開發(fā)出16萬個(gè)大模型應(yīng)用。
據(jù)媒體報(bào)道,百度近期在大模型上有諸多新動(dòng)作。4月16-17日,百度Create AI開發(fā)者大會(huì)將在深圳國際會(huì)展中心(寶安)舉辦,不僅會(huì)帶來AI技術(shù)的最新進(jìn)展,還將設(shè)置超30節(jié)“AI公開課”,與全球各地參會(huì)者分享百度在AI領(lǐng)域的科研成果。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.