品玩1月19日訊,據美團LongCat官方消息,團隊正式開源新一代模型LongCat-Flash-Thinking-2601。該模型在智能體搜索、工具調用及工具交互推理等核心評測中均達到開源模型SOTA水平,其工具調用泛化能力在隨機復雜任務中性能超越Claude。
模型創新性地引入“重思考模式”,通過并行思考與總結歸納的閉環迭代,顯著提升復雜決策可靠性。在數學推理、編程等多項權威評測中表現突出,尤其在AIME-25獲滿分。團隊通過多環境強化學習與噪聲穩健訓練技術,使模型具備強大的實戰泛化與抗干擾能力。
模型權重與代碼已在GitHub、Hugging Face等平臺開源,并提供官網在線體驗與API調用服務,助力開發者低門檻應用智能體技術。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.