中經(jīng)記者 李靜 北京報(bào)道
4月24日,美團(tuán)新一代基礎(chǔ)大模型LongCat-2.0-Preview正式開放測試,該模型總參數(shù)規(guī)模突破萬億級,躋身全球頂尖大模型行列,其核心亮點(diǎn)在于訓(xùn)練與推理全程依托國產(chǎn)算力集群完成,成為國產(chǎn)AI算力支撐超大規(guī)模模型研發(fā)的重要里程碑。
此次發(fā)布的LongCat-2.0-Preview支持1M上下文窗口,可單次處理數(shù)百萬字輸入,處理能力對標(biāo)國際主流大模型水平;模型面向Agent智能體場景深度優(yōu)化,可高效適配代碼生成、復(fù)雜任務(wù)規(guī)劃、企業(yè)自動(dòng)化等多類生產(chǎn)場景,具備更強(qiáng)的商業(yè)化落地潛力。據(jù)業(yè)內(nèi)信息,同日發(fā)布的DeepSeek新一代V4大模型,在總參數(shù)量與激活參數(shù)量上與該模型基本處于同一梯隊(duì)。
《中國經(jīng)營報(bào)》記者從知情人士處獲悉:“這次美團(tuán)大模型在訓(xùn)練階段動(dòng)用算力卡規(guī)模達(dá)5萬—6萬張,是迄今通過國產(chǎn)算力完成的規(guī)模最大的大模型訓(xùn)練任務(wù),不僅驗(yàn)證了國產(chǎn)算力集群的工程可行性與穩(wěn)定性,也標(biāo)志著國內(nèi)大模型研發(fā)在自主算力支撐上邁出關(guān)鍵一步。”
作為國內(nèi)非云業(yè)務(wù)企業(yè)中AI投入規(guī)模領(lǐng)先的公司,美團(tuán)持續(xù)推進(jìn)大模型與AI生態(tài)布局,此前已發(fā)布多款A(yù)I應(yīng)用與自研模型,并戰(zhàn)略投資多家算力芯片與大模型企業(yè)。
目前LongCat-2.0-Preview已在官方平臺(tái)開放測試,測試期間每日向用戶提供1000萬免費(fèi)Token。
(編輯:張靖超 審核:李正豪 校對:顏京寧)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.