品玩12月9日訊,智譜AI正式開源GLM-4.6V系列多模態大模型,包含高性能版GLM-4.6V(106B-A12B)與輕量免費版GLM-4.6V-Flash(9B)。
該系列實現“圖像即參數,結果即上下文”的原生多模態工具調用能力,支持128K視覺上下文,可處理約150頁文檔或1小時視頻。
模型在30余項多模態基準評測中達同規模SOTA水平,API價格較上一代降低50%。典型應用涵蓋智能圖文生成、視覺導購Agent、前端代碼復刻及長視頻理解。模型權重與代碼已在GitHub、Hugging Face及魔搭社區同步開放。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.