<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      代碼+視覺不再“偏科”,國產模型真正平替Claude還有多遠?

      0
      分享至



      出品 | 創業最前線

      作者 | 白華

      編輯 | 閃電

      美編 | 邢靜

      審核 | 頌文

      過去一年,AI編程工具邁入“軍備競賽”階段。以Anthropic的Claude系列為代表的閉源模型,憑借領先的代碼生成和Agent能力,成為全球主流開發平臺的首選。然而,其對中國市場的服務限制、高昂的API成本,以及缺乏本地化支持,正倒逼國內開發者尋找高性能、高性價比的替代方案。

      與此同時,國產大模型在純文本任務上已取得顯著進展,但在視覺理解、復雜Agent工具調用等真實工程場景中仍存在明顯短板——多數編程模型要么不支持圖像輸入,要么支持圖像的模型編程能力不足。因為圖文能力割裂,難以支撐現代軟件開發中日益增長的代碼+多模態基礎需求。

      近期,Kimi新發布的K2.5模型在開發者群體中引發廣泛關注,因為編程性能的提升與視覺能力的補齊,讓開發者終于等到了完整Claude平替的希望。

      在全球最大的大模型API聚合平臺OpenRouter上,Kimi K2.5模型發布次日就沖上了全球前三。



      這份亮眼表現也迅速獲得了頭部編程工具平臺的認可與青睞。Cursor的核心競品,由GitLab創始人打造的知名編程工具Kilo Code宣布推出Kimi K2.5的首周免費活動后,K2.5也成為該平臺上最受歡迎的模型,單日消耗超過380億Token。



      最近很火的Claude Code開源版OpenCode,也宣布限時免費來吸引開發者用戶。



      國內大廠旗下的編程工具同樣第一時間接入了K2.5模型。騰訊CodeBuddy將其設定為首選模型;字節Trae宣布提供免費額度,阿里Qoder、美團CatPaw等據傳也在接入中。



      1、K2.5代碼能力究竟如何?

      從知名匿名評測機構大模型競技場LMarena公布的數據來看,K2.5在Thinking模式下,代碼能力以1509分與Claude Sonnet 4.5持平。排在它前面的,只有Claude和Gemini最新的旗艦模型。這應該是開源模型代碼能力的新高。



      不止代碼能力表現亮眼,K2.5在視覺能力上的評測成績同樣令人驚喜。從大模型競技場的視覺能力匿名評測來看,K2.5模型的視覺能力比Claude更能打。



      我們也從開發者社區看到一些真實反饋,K2.5的實際表現和體感,與榜單呈現的結果比較接近,代碼能力確實有了提升。





      一位Sezxy的網友表示Kimi K2.5+OpenCode感覺很不錯,幾個需求都用它倆解決。



      不過,似乎編程能力的提升,也有一定的“副作用”,部分網友表示,之前K2模型的創意寫作能力好像在K2.5模型上減弱了。



      2、代碼模型為什么需要視覺?

      在知乎問題《Kimi發布并開源K2.5模型,哪些信息值得關注?》下,有Kimi的工程師分享了Kimi做多模態的背后思路,其中一段提到了視覺能力對代碼模型的價值,其中一個關鍵場景是模型可以自己發現前端頁面的視覺bug,然后有機會在后續的流程中自己進行修正:

      其實對于很多任務而言,Agent模型也能去自己debug,去根據Console Log的文本內容去解決問題,但是我們還是會遇到一些沒有任何Error或者Warnning,但又不得不再次提出Feedback的時刻,比如:“網站兩個組件產生了堆疊遮擋,你修改下”“放在首頁的圖裂開了,應該是Link失效了,麻煩你check下”“這是一個介紹中學生的網頁,配圖不應該是工作人員”。

      這些問題總是在不斷提出,我們總是希望模型能不犯這些錯誤。是的,模型是有可能one-shot出來沒有任何問題的代碼,但是,只要我們給模型一雙眼睛,這些吐槽的問題或者就有可能會讓模型自己形成一個Action-Critic的Refine閉環,而沒有Human的工作流水線是有更高效率的理想上限。



      這可能是K2.5模型上線后,立即受到開發者群體歡迎的關鍵原因之一。此前的中國編程模型,普遍沒有視覺能力,遇到圖片和視頻都無法處理,只能報錯。或者需要非常復雜的流程,自行接入另一個模型來處理,對編程的效率影響很大。另一個關鍵原因則是Claude模型太貴了,燒錢太快。Kimi新模型的API價格只有Claude中號模型Sonnet 4.5的1/5,用起來錢包不會太疼。

      3、更多K2.5的幕后

      除了市場端的亮眼表現,K2.5的技術研發背后還有不少值得深挖的細節。

      因此在1月29日凌晨,Kimi核心團隊在Reddit平臺舉行了一場長達3小時的AMA(有問必答)活動,CEO楊植麟、算法團隊負責人周昕宇、吳育昕三位聯合創始人,與全球網友交流了K2.5的技術細節、產品規劃與行業看法。這場對話中,許多關鍵問題的回應,讓外界了解了更多K2.5的幕后。



      有網友拋出尖銳問題:Kimi K2.5非常棒,但我看到有人說模型會自稱為Claude,并把這當作你們大量蒸餾(distill)自Claude模型的證據。這是怎么回事?

      楊植麟回應稱:“我們的觀察是,在正確的系統提示詞下,它有很高的概率回答‘Kimi’,尤其是在思考模式下。但當系統提示為空時,它就進入了一個未定義區域,這更多地反映了預訓練數據的分布情況。其中一項改進是,我們在預訓練階段對來自互聯網的最新編程數據進行了上采樣,而這些數據似乎與詞元‘Claude’的關聯性更強。事實上,K2.5在許多基準測試中似乎都優于Claude,例如HLE、BrowseComp、MMMU Pro和MathVision等等。”



      對于“Kimi Code和Claude Code有什么區別?為什么Kimi要開發自己的編程工具?”的問題,楊植麟表示:“我們認為我們需要一個與模型最匹配的框架。但使用Claude Code時,框架會不斷變化,兼容性有時會成為問題。此外,Kimi Code還擁有一些獨有的功能。我們認為video2code(視頻生代碼)非常重要,代表著前端開發的未來。”



      而被問及“訓練VLM的主要挑戰是什么?為什么Kimi如此堅定地投入視覺模型的訓練?”時,楊植麟給出了深入的技術解讀:“主要挑戰在于同步提升文本與視覺能力。我們發現,只要配方得當,兩者可以相互增強:在視覺任務上做RL訓練,反而提高了文本知識基準;反過來,像K2這樣扎實的文本基礎,也是視覺性能的關鍵。”

      從技術突破到市場認可,再到研發底層的邏輯拆解,K2.5的出現為國產大模型的發展提供了全新的思路和樣本。

      4、結束語

      中國企業和開發者都亟需一個真正的Clauce平替,“代碼和視覺功能完備+性能全面對標+性價比優勢”。現在看起來,kimi2.5暫時彌補了這一空缺。但我們還是希望看到更多中國模型可以站起來,讓企業和開發者有更多選擇。

      *注:文中題圖來自界面圖庫。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      手機市場崩盤了?12月銷量下滑29%,大家都不買了

      手機市場崩盤了?12月銷量下滑29%,大家都不買了

      互聯網.亂侃秀
      2026-01-31 12:15:02
      外蒙古面積縮水30萬平方公里?從180萬到150萬,原因出乎你意料

      外蒙古面積縮水30萬平方公里?從180萬到150萬,原因出乎你意料

      妙知
      2026-01-31 17:05:15
      廣州一初中生獨自背著被褥、蚊帳坐地鐵,行李在背上堆成“小山”!當事人:花了20多分鐘打包;網友:“自己扛”的能力比成績更重要!

      廣州一初中生獨自背著被褥、蚊帳坐地鐵,行李在背上堆成“小山”!當事人:花了20多分鐘打包;網友:“自己扛”的能力比成績更重要!

      揚子晚報
      2026-01-31 20:51:13
      曾不顧恩師反對,常昊執意娶大8歲師姑為妻,后來兩人過得怎樣?

      曾不顧恩師反對,常昊執意娶大8歲師姑為妻,后來兩人過得怎樣?

      秋姐居
      2026-01-19 22:01:43
      解放戰爭謎團:關鍵時刻,鄧華和劉亞樓為何雙雙否定毛主席決策?

      解放戰爭謎團:關鍵時刻,鄧華和劉亞樓為何雙雙否定毛主席決策?

      大運河時空
      2026-01-30 18:15:03
      聯合國四常已攤牌,中方無憂,九天后高市交權?

      聯合國四常已攤牌,中方無憂,九天后高市交權?

      觀察者海風
      2026-01-31 11:56:48
      06年我把臥鋪票讓給孕婦,自己站了一宿,下車前她遞給我一張紙條

      06年我把臥鋪票讓給孕婦,自己站了一宿,下車前她遞給我一張紙條

      溫情郵局
      2026-01-27 10:14:26
      美國評1979年中越戰爭:打了28天,中國軍隊出現了很多問題

      美國評1979年中越戰爭:打了28天,中國軍隊出現了很多問題

      小豫講故事
      2026-01-31 06:00:10
      人事!達州市委書記邵革軍當選成都市人大常委會副主任

      人事!達州市委書記邵革軍當選成都市人大常委會副主任

      明月照鳳凰
      2026-01-31 13:04:21
      這一次特朗普對俄羅斯的打擊,可能比烏克蘭的任何導彈都重

      這一次特朗普對俄羅斯的打擊,可能比烏克蘭的任何導彈都重

      火星宏觀
      2026-01-31 13:36:12
      回顧探花大神:害人害己,多位女主被親戚認出當場“社死”

      回顧探花大神:害人害己,多位女主被親戚認出當場“社死”

      就一點
      2025-10-09 12:19:42
      約基奇你太狠了,復出才1場,就轟破79年歷史紀錄,鴨梨MVP不穩了

      約基奇你太狠了,復出才1場,就轟破79年歷史紀錄,鴨梨MVP不穩了

      籃球看比賽
      2026-01-31 19:16:16
      姚明:08奧運結束那一晚很失落,被隊友拉去喝酒以為世界會完蛋

      姚明:08奧運結束那一晚很失落,被隊友拉去喝酒以為世界會完蛋

      林小湜體育頻道
      2026-01-31 02:15:43
      太爛了!浙江德比,衛冕冠軍拿下勝利,連70分都達不到,布朗8中1

      太爛了!浙江德比,衛冕冠軍拿下勝利,連70分都達不到,布朗8中1

      萌蘭聊個球
      2026-01-31 21:44:06
      天呢!一個德國人非議中國教育是對人性的摧殘…

      天呢!一個德國人非議中國教育是對人性的摧殘…

      慧翔百科
      2026-01-26 11:45:53
      長期喝酒卻堅持運動的人,結果都怎么樣了?醫生道出實話

      長期喝酒卻堅持運動的人,結果都怎么樣了?醫生道出實話

      岐黃傳人孫大夫
      2026-01-16 12:45:03
      英高官硬氣了,“特朗普錯了,英中關系搞不好才是真瘋了”

      英高官硬氣了,“特朗普錯了,英中關系搞不好才是真瘋了”

      觀察者網
      2026-01-30 23:25:07
      高中生扶老人被訛50萬,15年后老人孫子考上清華,在校門口跪下求饒

      高中生扶老人被訛50萬,15年后老人孫子考上清華,在校門口跪下求饒

      紅豆講堂
      2025-07-14 17:21:43
      當不成總統了?突襲委內瑞拉后,美后院起火,特朗普面臨下臺危機

      當不成總統了?突襲委內瑞拉后,美后院起火,特朗普面臨下臺危機

      兵說
      2026-01-30 16:42:23
      某魚驚現“天價筆”:800元一支的中性筆,藏著多少骯臟暗語?

      某魚驚現“天價筆”:800元一支的中性筆,藏著多少骯臟暗語?

      戧詞奪理
      2026-01-24 16:05:41
      2026-01-31 22:16:49
      創業最前線 incentive-icons
      創業最前線
      創業有道·創新中國|長期關注中國科技創新經濟市場,提供更有價值的創投科技報道。
      3537文章數 53560關注度
      往期回顧 全部

      科技要聞

      SpaceX申請部署百萬衛星 打造太空數據中心

      頭條要聞

      夫妻買房2年后才得知發生過兩起墜樓:不敢在家里住了

      頭條要聞

      夫妻買房2年后才得知發生過兩起墜樓:不敢在家里住了

      體育要聞

      新時代得分王!東皇37+三雙刷7紀錄怒吼釋放

      娛樂要聞

      李維嘉、吳昕、汪涵現身魏文彬追悼會

      財經要聞

      白銀,暴跌!黃金,40年最大跌幅!

      汽車要聞

      新款賓利歐陸GT S/GTC S官圖發布 V8混動加持

      態度原創

      房產
      旅游
      數碼
      健康
      公開課

      房產要聞

      藏不住的小城大事,海澄新城執掌自貿港風口,進階兌現美好生活新篇

      旅游要聞

      南京紫金山驚現霧凇美景

      數碼要聞

      索泰推出Edge AI系列邊緣計算平臺,最高可選64GB內存

      耳石癥分類型,癥狀大不同

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版