4月24日,《每日經濟新聞》記者獲悉,美團新一代基礎大模型LongCat-2.0-Preview已經開放測試,該模型總參數規模突破萬億。據知情人士透露,DeepSeek同日發布的新一代V4大模型,其總參數量和激活參數量,與美團LongCat-2.0-Preview基本一致。
總參數量決定了大模型的知識容量上限及存儲成本。據悉,LongCat-2.0-Preview和DeepSeek V4,均支持1M上下文窗口,可在單次推理中處理數百萬字的輸入,其處理量級等同于新發布的GPT-5.5。
記者了解到,美團新的LongCat模型還面向Agent(智能體)應用場景進行了深度優化,可有效適配代碼生成、復雜任務規劃、企業自動化等生產場景。
除參數規模外,美團新一代基礎大模型的更大突破在于,其訓練推理全程依托國產算力集群完成。
據上述人士透露,美團本次訓練階段動用的算力卡數量在5萬至6萬之間,這也是迄今為止,在國產算力上完成的規模最大的大模型訓練任務。“不僅是對國產算力生態成熟度的一次有效驗證,也標志著國產自主算力上邁出了關鍵一步。”該人士表示。
一年多前,美團CEO(首席執行官)王興曾表示:“在AI(人工智能)領域,美團唯一的策略是進攻。”在今年3月財報電話會上,美團CEO王興對外透露,自2023年初以來,美團在資本支出和AI人才上進行了大規模投入,除云廠商外,可能是中國AI領域投入最大的公司之一,且投入已持續超過三年。他也表示,要“爭取把美團App率先升級成為AI-Powered App”。
“美團正繼續投入自研基座大模型LongCat,也在和當前行業頂尖的第三方大模型合作,致力于最精準地理解真實物理世界。同時率先推動主應用升級為AI驅動,以應對本地服務行業高度復雜的場景、海量碎片化信息及大量實時商家數據。”王興表示。
值得一提的是,除自研外,美團還先后投資了摩爾線程、沐曦股份、紫光展銳、愛芯元智等多家算力及半導體公司,以及智譜AI、月之暗面等領先的大模型企業。
4月24日下午,美團已開放新模型測試,用戶可通過其官網申請領取免費測試名額。官網介紹顯示,測試期間,LongCat-2.0-Preview每天會給用戶提供1000萬免費Token(詞元)額度。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.