<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      國產大模型年前集中爆發,Kimi新模型k1.5對標OpenAI o1滿血版(附帶技術報告解讀)

      0
      分享至

      大洋彼岸的 OpenAI 遲遲沒有發布 GPT-5,一度讓業界懷疑 Scaling Law 是否已經失效。然而,國內多個團隊卻接連推出重磅 AI 大模型,用事實證明 Scaling 依然有效,只不過并不是無腦堆硬件、堆算力。

      Kimi k1.5的這次推出的大模型就是以推理能力見長的模型。

      不知道你們有沒有注意到Recipe這個詞,在Kimi k1.5的技術報告提到了好多次,它的意思是「菜譜」,相當于說把一道菜需要的原材料、炊具以及注意事項都明明白白告訴你了。

      技術報告鏈接:

      https://github.com/MoonshotAI/Kimi-k1.5/blob/main/Kimi_k1.5.pdf


      可以說,一向閉源的Kimi這次的技術報告可以理解為「半開源」,就像把西紅柿雞蛋的做法一步步的列出來,你模仿它的方法即可,唯一不同的就是具體的操作差異。

      比如你的火力大一點兒,鍋的材質不同等等,并且Kimi k1.5的性能在好幾個方面的性能都已經事實上的超過了OpenAI o1滿血版,可以說是含金量非常高的一次「半開源」。

      特別是OpenAI o3,也就是在FrontierMath這個非常難的數學測試集上達到了變態成績后的幾周,被曝出暗中資助了這個比賽的丑聞。


      如果o3是靠在數據集和答案上預訓練出來的,那么它這種既當運動員也當裁判員的操作,也才拿到了25%左右的正確率,這只能證明o3僅是o1的特殊微調版,只是用來維持OpenAI紙面榮譽的工具。

      那Kimi k1.5的含金量就直線上升了,long CoT在Math數學推理,Code編程能力以及Vision視覺多模態上的表現,4/6超過了最強的o1正式版模型。

      Kimi k1.5還用了Long2short的方法,將Long CoT的能力遷移到Short CoT上,也在大多數的任務上達到了SOTA的水平,最牛的是在AIME的Pass@1實驗中,效果遠超其他幾家(第一個子圖藍色的Kimi獨樹一幟)。


      特別是Long2short之后迭代出來的幾個short CoT,在下面這兩個數學數據集上的性能甚至超過了long CoT,可見CoT可以深挖甚至scaling的地方還有很多。


      這些數據基本上表明了OpenAI o1滿血版的性能全面在Kimi k1.5上實現,更重要的是Kimi K系列的快速迭代能力,從初代 Kimi k0 math 到Top級別的 Kimi 1.5,就倆月多點,直接數學偏科到全科專精。

      其中第一個長上下文是最近發布的幾個大模型的共性,因為初代LLM的思路簡單直接,就是一問一答,單步操作;

      但是后來發現這樣的單步操作對于比較復雜的問題,比如數學物理等需要更多邏輯思考且一步完不成的任務,就需要思維鏈(CoT)這樣的技術,相比起初代LLM,推理大模型可以將復雜的任務分成簡單的單步任務進行。


      這樣的好處很直接,不過缺點也很明顯,那就是這些思考過程明顯是需要更多的“記憶力”,換到LLM大模型領域就是上下文長度了,理論上越長越好,最近發布的MiniMax-01就把上下文長度記錄拉到了400萬。

      Kimi k1.5并沒有在極限上下文上做文章,而是將long context長度定為128K,然后用Partial Rollout的方法重復利用歷史記錄,而不是重新生成,這樣的策略從結果上表明非常有效。


      再加上如果用過OpenAI o1的話,很多簡單的問題o1會出現過度思考(overthinking)的現象,其實這也是一種對于計算能力的浪費以及策略不夠優化的表現。

      菜譜也提到了這個點,他們采用了長度懲罰(Length Penalty)的措施,倒逼大模型跟人類對齊,畢竟人類不會對一個簡單問題思考6分鐘。


      最后,我特意看了看Kimi微信公眾號對于自己新模型的介紹,開頭的一句話特別契合Kimi k1.5這個模型。


      簡單的方法在很多時候被認為是取巧的,但事實支配上人類社會以及整個自然界運轉的規律都是非常簡潔且優雅的,既不存在無限資源這種美夢,也沒有出現普遍的窮思竭慮。

      總的來說,Kimi k1.5的這次更新,無疑將中國的大模型和國外最頂尖的OpenAI差距拉到了幾乎同一個水平線,同時這次的「半開源」更是給AI 大模型社區注入了一些「做菜秘訣」,相信這些東西可以讓整個大模型社區的進化速度更進一步。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中美在聯合國吵起來了,輪到美方被“圍攻”,中方不許做5件事

      中美在聯合國吵起來了,輪到美方被“圍攻”,中方不許做5件事

      起喜電影
      2025-12-27 11:20:24
      凱樂石被曝“產品換名漲價900元”,涉事羽絨服缺貨下架

      凱樂石被曝“產品換名漲價900元”,涉事羽絨服缺貨下架

      藍鯨新聞
      2025-12-25 18:12:08
      宋徽宗用瘦金體寫的圣旨,幾經戰亂而流傳至今,乃真正的國寶

      宋徽宗用瘦金體寫的圣旨,幾經戰亂而流傳至今,乃真正的國寶

      幸福娃3790
      2025-12-11 11:34:53
      一家五口駕車在江門施工棧橋墜江遇難 老家村委會負責人:車上有7歲小孩和六旬老人

      一家五口駕車在江門施工棧橋墜江遇難 老家村委會負責人:車上有7歲小孩和六旬老人

      紅星新聞
      2025-12-26 13:15:16
      那個男人回來了!馬丁內斯領銜曼聯防守大戰,阿莫林變陣獲奇效

      那個男人回來了!馬丁內斯領銜曼聯防守大戰,阿莫林變陣獲奇效

      夜白侃球
      2025-12-27 10:49:10
      楊鳴:連續客場要盡量避免傷病,趙繼偉還在積極康復歸期未定

      楊鳴:連續客場要盡量避免傷病,趙繼偉還在積極康復歸期未定

      懂球帝
      2025-12-27 12:16:03
      房價下跌對普通人意味著什么?網友:我的首付先哭為敬!

      房價下跌對普通人意味著什么?網友:我的首付先哭為敬!

      另子維愛讀史
      2025-12-26 16:33:56
      這菜再貴也要吃,大量上市!通便排毒,殺菌消炎,錯過了真可惜!

      這菜再貴也要吃,大量上市!通便排毒,殺菌消炎,錯過了真可惜!

      江江食研社
      2025-12-26 12:30:03
      陳皮加它一煮,沾床就睡著!疏肝解郁安神,這法子讓我一覺到天亮

      陳皮加它一煮,沾床就睡著!疏肝解郁安神,這法子讓我一覺到天亮

      江江食研社
      2025-12-26 07:30:06
      太夸張了!iPhone 17 單月銷量超 600 萬臺,創歷史新紀錄

      太夸張了!iPhone 17 單月銷量超 600 萬臺,創歷史新紀錄

      XCiOS俱樂部
      2025-12-26 19:34:41
      事發上海外灘!游客被帶上警車,后續意想不到,網友:他們才是隱藏的高手

      事發上海外灘!游客被帶上警車,后續意想不到,網友:他們才是隱藏的高手

      上觀新聞
      2025-12-27 08:52:12
      天助C羅:1-2,C羅爭冠勁敵爆大冷門吞下首敗+落后利雅得勝利8分

      天助C羅:1-2,C羅爭冠勁敵爆大冷門吞下首敗+落后利雅得勝利8分

      俯身沖頂
      2025-12-26 23:04:44
      全員法國人踢非洲杯!這屆非洲杯有多少球員在法國出生?

      全員法國人踢非洲杯!這屆非洲杯有多少球員在法國出生?

      仰臥撐FTUer
      2025-12-26 17:19:06
      決戰山西!徐杰掛帥,三外援沖鋒,廣東劍指太原,吹響爭冠號角

      決戰山西!徐杰掛帥,三外援沖鋒,廣東劍指太原,吹響爭冠號角

      老曁科普
      2025-12-27 11:13:18
      曼聯1-0紐卡斯爾,中場夠硬,小鬼當家、沒有B費、第2場零封

      曼聯1-0紐卡斯爾,中場夠硬,小鬼當家、沒有B費、第2場零封

      卡靈頓分析師
      2025-12-27 10:33:51
      一包30塊,一口毀一生!不到十年,北方農村已經被檳榔全面入侵!

      一包30塊,一口毀一生!不到十年,北方農村已經被檳榔全面入侵!

      好賢觀史記
      2025-12-16 10:01:53
      滬深交易所發布:降費!

      滬深交易所發布:降費!

      數據寶
      2025-12-27 07:35:44
      91年,南京小伙被女友逼著在深圳買了5套房,21年后他不敢相信

      91年,南京小伙被女友逼著在深圳買了5套房,21年后他不敢相信

      卡西莫多的故事
      2025-11-22 15:18:18
      大量“洋垃圾”小主機流入閑魚!能用9代標壓U,準系統275元

      大量“洋垃圾”小主機流入閑魚!能用9代標壓U,準系統275元

      閑搞機
      2025-12-25 11:06:11
      隨著寧波88-79雙殺浙江,廣東贏山東,新疆3連敗,CBA積分榜更新

      隨著寧波88-79雙殺浙江,廣東贏山東,新疆3連敗,CBA積分榜更新

      小火箭愛體育
      2025-12-26 22:00:30
      2025-12-27 13:07:00
      平凡AI incentive-icons
      平凡AI
      高校AI從業者
      54文章數 23關注度
      往期回顧 全部

      科技要聞

      小米也漲價了!業界稱終端再不漲明年必虧

      頭條要聞

      賈國龍首次回應西貝風波 稱自己連續40天靠安眠藥入睡

      頭條要聞

      賈國龍首次回應西貝風波 稱自己連續40天靠安眠藥入睡

      體育要聞

      NBA教練圈的布朗尼,花了22年證明自己

      娛樂要聞

      劉宇寧:我的價值不需要靠番位來證明

      財經要聞

      注意,開始拉物價了!

      汽車要聞

      好音響比大屏更重要?車企開始“聽”用戶的

      態度原創

      教育
      時尚
      手機
      家居
      親子

      教育要聞

      3甲=2乙,就他們的乘積

      推廣中獎名單-更新至2025年12月15日推廣

      手機要聞

      華為Mate 70 Air 16GB版開售:沉浸大屏+鴻蒙6重構輕薄旗艦體驗

      家居要聞

      格調時尚 智慧品質居所

      親子要聞

      多吃富含葉黃素的食物對保持孩子眼健康有補益

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人人网aV| 亚洲精品www久久久久久| 精品久久久无码人妻中文字幕| 乱子轮熟睡1区| 热久在线免费观看视频| 亚洲色情在线播放| AV资源吧首页| 久久婷婷五月综合色精品| 人妻少妇av无码一区二区| 亚洲av午夜福利精品一区二区| 爱3P| 红桥区| 亚洲国产精品自产在线播放| 成人性爱视频网站| 夜夜欢视频| 东山县| 99视频偷窥在线精品国自产拍| 老鸭窝在钱视频| 欧美色综合| 宜兴市| 亚洲三区在线观看无套内射| 日韩 欧美 亚洲 一区二区| 一区二区三区av| 武安市| 精品久久久久久亚洲综合网| 91中文字幕在线一区| 国产高清A片| 亚洲色欲网| 亚欧色一区w666天堂| 强奷乱码中文字幕| 潞西市| 无码精品人妻一区二区三区湄公河| 一级做a爰片久久毛片下载| 无码人妻精品一区二| 亚洲自偷自偷在线成人网站传媒 | 伊人成色| 精品人妻无码一区二区三区四川人| 中国女人内谢69xxxx| 国产无遮挡18禁网站免费| 精品无码三级在线观看视频 | 9久精品视频|