海外“最強模型”的原型是國產模型?
日前,AI編程平臺Cursor推出Composer2和Composer2Fast兩款編程模型專注于“長周期智能體編程”,并具備20萬Token上下文窗口,為復雜多步任務深度優化,因為優秀的性價比表現引發行業廣泛關注,被稱為“目前最強編程模型”。
不過,這兩款模型發布后,有網友發現Composer2疑似使用月之暗面Kimi-K2.5模型,并在操作baseURL后發現相關線索。對此,特斯拉創始人埃隆·馬斯克公開評論確認:“是的,這就是Kimi2.5。”
3月20日晚間,“月之暗面kimi”官方微博賬號回應并@ElonMusk 寫道“聽說我,謝謝你,因為有你……”。
21日凌晨,Cursor聯合創始人Aman Sanger發文致歉,稱“沒有在博客中從一開始就提及Kimi基礎模型,確實是我們的疏漏,會在下一個模型中修正這一點。”
Kimi官方賬號隨后表示:“恭喜Cursor推出Composer 2,很驕傲看到Kimi K2.5成為基礎模型,這就是我們喜歡的開源生態。”據報道,Cursor正以500億美元估值進行融資。
此前3月16日,月之暗面Kimi發布技術報告,對大模型十年沒有變化的核心結構殘差連接行重新設計,使每一層能夠選擇性地關注此前各層輸出,而非統一求和,48B模型訓練效率提升1.25倍,被行業解讀為提前預告了下一代模型的關鍵模塊。
月之暗面三位聯合創始人楊植麟、吳育昕、周昕宇帶領數十名研究員完成了這項研究。論文發布后,馬斯克評價Kimi的研究令人印象深刻,前OpenAI研究科學家Andrej Karpathy表示,這項研究真正踐行了“Attention is All You Need”的理念,推理之父、前OpenAI研究副總裁Jerry Tworek則認為,深度學習2.0真的來了。
國產AI賽道競速正在不斷加劇。
3月19日,“AI才女”羅福莉帶領的小米大模型團隊發布面向agent時代的旗艦基座模型Xiaomi MiMo-V2-Pro,以及全模態基座模型Xiaomi MiMo-V2-Omni和語音合成模型Xiaomi MiMo-V2-TTS。
雷軍在微博發文稱,剛發布萬億參數大模型 Mimo-V2-Pro。在全球大模型綜合智能排行榜 Artificial Analysis 上,位列全球第八。
3月18日,MiniMax發布新一代Agent旗艦大模型M2.7,首次展示“模型自我進化”路徑。該模型通過構建Agent Harness體系,深度參與自身訓練與優化流程,在部分研發場景中可承擔30%-50%的工作量,并在內部評測集上實現約30%的效果提升。
在核心能力上,M2.7在SWE-bench Pro中取得56.22%成績,接近國際一線水平;同時在VIBE-Pro、Terminal Bench 2等真實工程測試中表現突出,支持端到端項目交付與復雜系統理解。辦公場景方面,其在 GDPval-AA 的ELO得分是1495,為開源最高,并顯著提升Office文檔處理與多輪編輯能力。
從行業趨勢來看,目前國產大模型正在加速趕超海外一流模型,海外市場已經成為國產大模型競相追逐的重要標的。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.