中國AI大模型的重磅消息陸續(xù)傳來。
2月11日晚,智譜官方確認(rèn),此前在全球模型服務(wù)平臺(tái)OpenRouter登頂熱度榜首的神秘模型“Pony Alpha”,為智譜新模型GLM-5。目前新模型已在chat.z.ai平臺(tái)上線。
2月6日,全球模型服務(wù)平臺(tái)OpenRouter悄然上線一款代號(hào)為"Pony Alpha"的匿名模型,因其較強(qiáng)的編碼能力、超長(zhǎng)上下文窗口及針對(duì)智能體工作流的深度優(yōu)化,迅速引發(fā)開發(fā)者社區(qū)關(guān)注,在海外社區(qū)熱度迅速攀升。
OpenRouter官方將Pony Alpha描述為“前沿基礎(chǔ)模型”,在編程、智能體工作流、推理及角色扮演方面表現(xiàn)強(qiáng)勁,特別強(qiáng)調(diào)其“極高的工具調(diào)用準(zhǔn)確率”。這一特性使其在AI Agent(智能體)應(yīng)用場(chǎng)景中展現(xiàn)出顯著優(yōu)勢(shì),開發(fā)者可通過Claude Code等工具調(diào)用該模型,實(shí)現(xiàn)長(zhǎng)達(dá)數(shù)小時(shí)的復(fù)雜項(xiàng)目開發(fā)。
1月8日,智譜正式在港交所掛牌上市,在掛牌當(dāng)日,公司首席科學(xué)家、清華大學(xué)計(jì)算機(jī)系教授唐杰向全員發(fā)出內(nèi)部信,確認(rèn)新一代基座模型GLM-5“即將發(fā)布”,并宣布2026年起“全面回歸基礎(chǔ)模型研究”,同時(shí)設(shè)立前沿創(chuàng)新部門X-Lab,聚焦架構(gòu)、學(xué)習(xí)范式與持續(xù)進(jìn)化三大方向。
此外,DeepSeek也更新了模型。據(jù)報(bào)道,多名用戶反饋,DeepSeek在網(wǎng)頁端和APP端進(jìn)行了版本更新,支持最高1M(百萬)Token的上下文長(zhǎng)度。而去年8月發(fā)布的DeepSeekV3.1上下文長(zhǎng)度拓展至128K。
![]()
目前,能將上下文推至百萬級(jí)別的模型較少,谷歌的Gemini系列和Anthropic的Claude Opus 4.6等已率先實(shí)現(xiàn)。
DeepSeek的V系列模型定位為追求極致綜合性能的基礎(chǔ)模型。2024年12月推出的基礎(chǔ)模型V3是DeepSeek的重要里程碑,其高效的MoE架構(gòu)確立了強(qiáng)大的綜合性能基礎(chǔ)。此后,DeepSeek在V3基礎(chǔ)上快速迭代,發(fā)布了強(qiáng)化推理與Agent(智能體)能力的V3.1,并于2025年12月推出了最新正式版V3.2。同時(shí),還推出了一個(gè)專注于攻克高難度數(shù)學(xué)和學(xué)術(shù)問題的特殊版本V3.2-Speciale。
科技媒體The Information此前爆料稱,DeepSeek將在今年2月中旬農(nóng)歷新年期間推出新一代旗艦AI模型DeepSeek V4,將具備更強(qiáng)的寫代碼能力。
今年初,DeepSeek團(tuán)隊(duì)發(fā)表兩篇論文,公開了兩項(xiàng)創(chuàng)新架構(gòu):mHC(流形約束超連接)用來優(yōu)化深層Transformer信息流動(dòng),使模型訓(xùn)練更穩(wěn)定、易擴(kuò)展,在不增加算力負(fù)擔(dān)前提下提升性能;Engram(條件記憶模塊)將靜態(tài)知識(shí)與動(dòng)態(tài)計(jì)算解耦,用廉價(jià)DRAM存儲(chǔ)實(shí)體知識(shí),釋放昂貴HBM專注推理,顯著降低長(zhǎng)上下文推理成本。
同日,MiniMax也有消息傳來,M2.5模型即將正式上線,目前MiniMax M2.5模型已在海外的MiniMax Agent產(chǎn)品進(jìn)行內(nèi)測(cè)。
每日經(jīng)濟(jì)新聞綜合公開信息
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.