網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

權(quán)威發(fā)布！沙利文最新國內(nèi)大模型報(bào)告文心一言領(lǐng)跑

2024-03-25 21:37:08　來源: 貝克街探案官

北京舉報(bào)

分享至

2024年企業(yè)應(yīng)用大模型怎么選？近日，全球增長咨詢公司弗若斯特沙利文發(fā)布《2024年中國大模型能力評(píng)測》，全面梳理了當(dāng)前大模型的最新發(fā)展態(tài)勢(shì)和競爭格局，為企業(yè)選購大模型提供精準(zhǔn)決策支持。

報(bào)告對(duì)國內(nèi)主流的15個(gè)大模型進(jìn)行了權(quán)威評(píng)測。結(jié)果顯示，百度、騰訊、阿里等互聯(lián)網(wǎng)大廠旗下大模型位于第一梯隊(duì)，綜合表現(xiàn)相比初創(chuàng)企業(yè)更為優(yōu)異。其中，文心一言能力最為全面，五項(xiàng)評(píng)測維度均為優(yōu)勢(shì)能力，并取得四項(xiàng)第一。

沙利文《2024年中國大模型能力評(píng)測》：大模型綜合競爭力氣泡圖

沙利文的最新報(bào)告以用戶使用體驗(yàn)和實(shí)際使用價(jià)值為衡量標(biāo)準(zhǔn)，綜合考量數(shù)理科學(xué)、語言能力、道德責(zé)任、行業(yè)能力及綜合能力等5大核心維度及21個(gè)細(xì)化二級(jí)維度。

報(bào)告顯示，國際領(lǐng)先模型在通用基礎(chǔ)能力和專業(yè)應(yīng)用能力上略優(yōu)于中國領(lǐng)先模型，但以文心一言為代表的中國模型具備亮眼表現(xiàn)。文心一言拿下數(shù)理科學(xué)、語言能力、道德責(zé)任、行業(yè)能力及綜合能力等五大評(píng)測維度的四項(xiàng)第一，評(píng)測結(jié)果遠(yuǎn)超國際均線，展現(xiàn)了中國大模型在自然語言處理領(lǐng)域的顯著實(shí)力和在實(shí)際應(yīng)用中的高價(jià)值。

沙利文報(bào)告的大模型通用基礎(chǔ)能力評(píng)測包含數(shù)理科學(xué)、語言能力和道德責(zé)任管理等三大要素，結(jié)果顯示文心一言排名第一，展現(xiàn)出模型在底層基礎(chǔ)能力方面的較高水平。大模型的專業(yè)應(yīng)用能力包含綜合能力和專業(yè)能力兩大核心要素，是大模型實(shí)際運(yùn)用效能的集中展現(xiàn)，文心一言同樣位列榜首，表現(xiàn)顯著優(yōu)于國際均線。

文心一言綜合表現(xiàn)搶眼：5大維度取得4項(xiàng)第一

從具體細(xì)分維度來看，在語言能力的評(píng)測中，得益于先進(jìn)的模型架構(gòu)、大規(guī)模預(yù)訓(xùn)練、精細(xì)調(diào)優(yōu)、多任務(wù)學(xué)習(xí)以及強(qiáng)大的計(jì)算資源等多方面的優(yōu)勢(shì)，文心一言在語言表達(dá)能力、語言理解能力、以及語言邏輯能力等關(guān)鍵指標(biāo)上都達(dá)到了領(lǐng)先水平，在語言能力評(píng)測中排名第一。特別是開放式邏輯推理方面，文心一言樹立了新的標(biāo)桿。這要求模型具備深入剖析、全面比較和精確判斷的能力，在處理復(fù)雜、多層次的邏輯推理問題時(shí)尤為重要。

中國大語言模型能力評(píng)析：語言能力

在日益重要的道德責(zé)任評(píng)測中，文心一言在道德理解深度、危險(xiǎn)言論規(guī)避機(jī)制以及魯棒性對(duì)抗方面均表現(xiàn)卓越，成為此次測試中安全性最高的模型。這反映出文心一言在模擬和處理涉及道德判斷和決策的情境時(shí)，具備更為精準(zhǔn)的理解力和適應(yīng)性。這無疑將確保AI大模型的可持續(xù)發(fā)展和社會(huì)效益的最大化。

中國大語言模型能力評(píng)析：道德責(zé)任

在大模型落地看重的行業(yè)能力評(píng)測中，文心一言同樣排名第一。報(bào)告顯示，文心一言靈活適應(yīng)并高效解決了電商、工業(yè)、教育、能源、醫(yī)療等超過10個(gè)行業(yè)實(shí)際應(yīng)用場景中遇到的問題，在多行業(yè)能力評(píng)測中表現(xiàn)優(yōu)異。

沙利文還在報(bào)告中預(yù)測，2024年，大模型的技術(shù)發(fā)展將趨向多功能與小型化，同時(shí)產(chǎn)業(yè)端將強(qiáng)調(diào)自主研發(fā)和行業(yè)標(biāo)準(zhǔn)化，而倫理責(zé)任和數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范將成為持續(xù)發(fā)展的關(guān)鍵。

以百度文心一言為代表的國產(chǎn)模型，正在不斷提升大模型的效率，豐富大模型的功能。公開資料顯示，自文心大模型發(fā)布以來，百度不斷降低推理成本，進(jìn)一步提升文心大模型的效率。借助百度獨(dú)特的四層AI技術(shù)架構(gòu)，文心大模型周均訓(xùn)練有效率超過98%。

百度還推出兩款MaaS產(chǎn)品，降低大模型及AI原生應(yīng)用開發(fā)門檻，分別是用于應(yīng)用開發(fā)的千帆AppBuilder和用于專有模型開發(fā)精調(diào)的千帆ModelBuilder，累計(jì)幫助用戶精調(diào)1.3萬個(gè)大模型，服務(wù)8萬企業(yè)用戶，幫助用戶開發(fā)出16萬個(gè)大模型應(yīng)用。

據(jù)媒體報(bào)道，百度近期在大模型上有諸多新動(dòng)作。4月16-17日，百度Create AI開發(fā)者大會(huì)將在深圳國際會(huì)展中心（寶安）舉辦，不僅會(huì)帶來AI技術(shù)的最新進(jìn)展，還將設(shè)置超30節(jié)“AI公開課”，與全球各地參會(huì)者分享百度在AI領(lǐng)域的科研成果。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.