最近,美國斯坦福大學等團隊發布了一份名為《2025 年基礎模型透明度指數》(FMTI,The 2025 Foundation Model Transparency Index)的報告。其中,IBM 以透明度得分最高奪冠,xAI 和 Midjourney 則墊底。
該報告揭示了一種令人擔憂的趨勢:隨著技術的發展,盡管基礎模型在性能等各方面持續進步,但其在數據使用、模型訓練和下游影響等方面的透明度卻出現了集體倒退。
這是該報告自 2023 年以來發布的第三個年度版本,就像通過量化透明度為各大基礎模型開發者做一次“體檢”。
本次評估共包括 13 家基礎模型公司,其中既有阿里巴巴、DeepSeek 和馬斯克的 xAI 等首次納入報告的企業,也有 IBM、OpenAI 等老牌科技巨頭。為使評估更全面,今年的報告中還涵蓋了數據獲取、使用數據和監控等方面的新指標。
![]()
(來源:The 2025 Foundation Model Transparency Index)
從報告的整體結果來看,盡管 2024 年報告顯示模型透明度有短暫的改善,但 2025 年的報告指出,透明度指數正呈現倒退:各基礎模型的平均得分從 2024 年的 58 分下降到 2025 年的 40 分,幾乎與 2023 年報告首次發布時的水平相當(備注:100 分為滿分)。
報告顯示,公司在其旗艦模型的訓練數據、訓練計算以及模型部署后的使用和影響方面信息披露最為有限。盡管公司在模型能力評估和風險評估方面披露較多,但在方法透明度、第三方參與、可復現性和訓練-測試數據重疊報告方面仍存在挑戰。
![]()
(來源:The 2025 Foundation Model Transparency Index)
從各公司的表現來看差異明顯,其中 IBM 以 95 分獲得透明度最高得分,xAI 和 Midjourney 得分最低,僅 14 分。中國的兩家公司 DeepSeek 和阿里巴巴在透明度的得分則位于中下游。
可以看到的是,公司特征和透明度指數在某些程度上存在著一些有趣的關聯,例如開放模型開發者、以企業為中心的 B2B 公司、自行準備透明度報告的公司以及簽署歐盟 AI 法案通用目的 AI 行為準則的公司得分高于平均水平。
![]()
(來源:The 2025 Foundation Model Transparency Index)
那么,透明度越高就意味著模型越好嗎?
清華大學邱寒副教授告訴 DeepTech,“這里的透明度不等同于我們常識認為的開源,而是由一系列明確的打分表組成的量化指標——如果不按照這個指標披露相關的數據(而不是什么都沒披露),那么這項指標得分就是 0。”
以阿里巴巴 Qwen 和 DeepSeek 得分均為 0 的使用數據、影響、部署后監控三項指標為例:它們都各自含有更詳細的評測指標,得分為 0 并不等于什么都沒有披露,而這些計算指標的方法與開源、安全、性能并不能直接劃等號。
需要了解的是,透明或開源也并不意味著模型性能更好。從這份報告來看,透明度得分最高的模型(IBM 的 Granite 3.3),在實際應用場景種的性能表現并不是最頂尖的那批模型。
試想一下,如果有一個任務要做,你是會去選擇微調 Qwen3 或 Claude 的 API,還是會因為透明度得分更高而選擇 Granite 3.3?
邱寒認為,透明度是安全的前提,但必須明確不一定是報告中定義的透明:如果公司拒絕披露任何模型生產相關的信息,比如版權內容、隱私數據的濫用確實難以發掘和確認;模型的偏見和價值觀更難評測,確實會給安全和治理帶來一定的影響。更糟的是,一旦嚴重安全事故發生,還可能引發更粗暴的安全監管策略落地,反而進一步限制了大模型技術的進步。
該報告提到,隨著全球政策制定者越來越多地要求某些類型的透明度,這項工作揭示了基礎模型開發者的當前透明度狀態,透明度可能如何變化,以及需要更積極的政策干預來解決哪些關鍵信息問題。
正如邱寒所指出的那樣,黑盒模型的評測技術可以在一定程度上彌補不透明的問題,而當前的透明與否也只是暫時狀態。隨著模型落地的深化和監管機制的完善,最終目標是“公司不需完全公開,但模型行為可測、聲明可證、安全可控”。
總之,表面上看公司信息披露程度影響透明度,但本質上這需要一種權責歸屬的清晰界定。通過這份報告對透明度倒退的警示,我們需要看到,未來需要構建一種綜合的激勵機制,來理解、評估并最終確保模型的安全與可信。
參考資料:
https://arxiv.org/abs/2512.10169
運營/排版:何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.