<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      AI泡沫論調(diào)下,月之暗面用460萬美元訓(xùn)練了一款萬億參數(shù)模型

      0
      分享至



      出品|搜狐科技

      作者|梁昌均

      編輯|楊 錦

      “AI獨(dú)角獸又重回舞臺(tái)中心了?!闭劶白罱鼑a(chǎn)大模型的表現(xiàn),有AI從業(yè)者感嘆。

      最新例證是,月之暗面發(fā)布的萬億參數(shù)思考模型Kimi K2 Thinking,其基本趕超GPT-5等領(lǐng)先的閉源模型,并登頂全球開源模型榜首。

      值得注意的是,這款模型還用了很低的成本。搜狐科技獲悉,Kimi K2 Thinking模型的訓(xùn)練成本約為460萬美元(約合人民幣3200萬元)。

      這刷新了DeepSeek的紀(jì)錄。DeepSeek曾透露V3模型僅花了560萬美元,引發(fā)全球AI圈震動(dòng),如今Kimi K2 Thinking又降低了百萬美元。

      “這是中國大模型最接近OpenAI的時(shí)刻”、“又一個(gè)DeepSeeek時(shí)刻”,不少評(píng)價(jià)稱。而除了月之暗面,智譜、MiniMax的模型最近也在海外出圈。

      DeepSeek-R2遲遲不來,現(xiàn)在其也似乎已不再是話題中心,曾被搶去風(fēng)頭的國內(nèi)AI獨(dú)角獸則開始走向全球舞臺(tái),這也是這些公司試圖重新?lián)尰丶夹g(shù)話語權(quán)的嘗試。


      “又一個(gè)DeepSeeek時(shí)刻”

      萬億參數(shù)、開源登頂、趕超GPT-5……這是月之暗面最新發(fā)布的思考模型Kimi K2 Thinking被外界討論的關(guān)注點(diǎn)。

      官方評(píng)測顯示,該模型在推理、編程等多個(gè)能力超過或接近GPT-5和Claude Sonnet 4.5,并在人類最后的考試(Humanity's Last Exam)等多項(xiàng)基準(zhǔn)測試中達(dá)到SOTA(最優(yōu))水平。



      “這是開源模型的歷史性突破?!痹贏rtificial Analysis(下稱AA)最新發(fā)布的全球模型綜合評(píng)測中,Kimi K2 Thinking得分躍居全球第二,和GPT-5兩款模型僅有1分之差。


      在該機(jī)構(gòu)發(fā)布的智能體評(píng)測基準(zhǔn)τ2-Bench的電信任務(wù)中,Kimi K2 Thinking更是直接躍升至第一名,吊打GPT-5、Claude Sonnet 4.5、Grok4等領(lǐng)先模型。

      月之暗面在海外社交平臺(tái)對(duì)這款模型的介紹推文短短幾天閱讀就超過440萬,并再次刷新了海外對(duì)中國大模型的認(rèn)知,有評(píng)論認(rèn)為這又是一個(gè)“DeepSeek時(shí)刻”。

      這款模型用了比DeepSeek更低的成本。搜狐科技從知情人士獲悉,Kimi K2 Thinking模型的訓(xùn)練成本約為460萬美元。這不僅遠(yuǎn)低于OpenAI等模型投入,還打破了DeepSeek-V3約560萬美元的訓(xùn)練成本紀(jì)錄。

      “相對(duì)美國那些頂尖模型來說,這個(gè)成本很低。中國多數(shù)模型都差不多這個(gè)預(yù)算水平,很多企業(yè)沒有那么多芯片可用,所以就是看誰訓(xùn)得好?!庇蠥I從業(yè)者表示。

      至于Kimi K2 Thinking為何能繼續(xù)降低成本,月之暗面并未透露相關(guān)技術(shù)論文,業(yè)內(nèi)認(rèn)為還是得益于算法、架構(gòu)、后訓(xùn)練等方面的優(yōu)化,此次關(guān)鍵的一點(diǎn)是采用了原生INT4量化技術(shù)。

      INT4是指在大語言模型中的一種量化技術(shù),其通過降低模型參數(shù)的數(shù)值精度來減少模型的存儲(chǔ)需求和計(jì)算資源消耗,同時(shí)盡可能地保持模型的性能。

      月之暗面研究員劉少偉發(fā)文透露,在研發(fā)K2-Thinking時(shí),發(fā)現(xiàn)隨著模型的生成長度變得越來越長,想要實(shí)現(xiàn)低延遲的推理,必須使用量化損失更小的INT4 QAT(訓(xùn)練感知量化)方案,這也使得后訓(xùn)練強(qiáng)化學(xué)習(xí)的訓(xùn)練效率顯著提升。

      至于為何不選擇更“先進(jìn)”的格式,劉少偉稱是為了更好地支持非Blackwell架構(gòu)硬件。“在大模型時(shí)代,量化是一個(gè)可以跟SOTA和Frontier(邊界)放在一起,甚至加快模型達(dá)到Frontier速度的概念?!?/p>

      不過,不少實(shí)測顯示,Kimi K2 Thinking顯得非?!霸挵A”。在AA的智能指數(shù)評(píng)測時(shí),它總共使用1.4億個(gè)token,是DeepSeek V3.2的2.5倍,是GPT-5的2倍,導(dǎo)致推理成本和速度受到一定影響。

      “現(xiàn)在,世界上最智能的模型是開源的,而且來自中國。如果美國繼續(xù)閉門造車,中國開源模型將會(huì)完全取勝。”有評(píng)論說到。

      全球華人首富黃仁勛上周提到,中國的AI技術(shù)非常出色,并開發(fā)出了非常優(yōu)秀的AI,目前世界上最流行的開源AI模型都來自中國,發(fā)展速度非???。

      這話說得沒錯(cuò),目前中國的開源模型無論是能力,還是數(shù)量都占據(jù)優(yōu)勢(shì),今年的開源榜首也由中國模型輪流做。

      在AA全球最新開源模型榜單中,全球前十模型中有六款來自中國,其中Kimi K2 Thinking居首,取代了半月前登頂榜首的MiniMax-M2,以及更早前的阿里、DeepSeek模型。


      過去一段時(shí)間,以O(shè)penAI為核心的美國科技圈圍繞算力基礎(chǔ)設(shè)施進(jìn)行捆綁,并揮出上萬億美元的投資,將自身優(yōu)勢(shì)發(fā)揮到了極致,但這種模式在中國難以復(fù)制。

      對(duì)中國多數(shù)大模型廠商來說,需要在算法、架構(gòu)、工程等層面加大創(chuàng)新突破,正如DeepSeek和Kimi所做的這樣。一點(diǎn)一點(diǎn)的微創(chuàng)新累計(jì)起來,最終有可能產(chǎn)生驚人的成果。

      一個(gè)明顯的信號(hào)是,中國AI獨(dú)角獸在重回技術(shù)競賽后,正在重回舞臺(tái)中心?,F(xiàn)在,DeepSeek在AA全球模型的排名已至十名之外,或許只有R2會(huì)再扳回一局。


      國產(chǎn)模型的應(yīng)用之風(fēng)吹到了硅谷

      在Kimi 模型出圈的背后,中國大模型日益受到海外青睞,硅谷正嘗試從昂貴的閉源往更便宜的中國開源模型上遷移。

      硅谷知名投資人、Social Capital公司創(chuàng)始人Chamath Palihapitiya近日坦言,已把大量工作負(fù)載轉(zhuǎn)移到Kimi K2。

      美國云計(jì)算公司Vercel則上線了該模型的API服務(wù),AI編程獨(dú)角獸Cursor和Windsurf,百度前高管景鯤在美創(chuàng)業(yè)公司Genspark,以及AI搜索獨(dú)角獸Perplexity等多家公司均有接入。

      MiniMax早前發(fā)布的推理模型M2,推出幾天后就在海外模型路由器OpenRouter的全球調(diào)用量達(dá)到前三,一度成為HuggingFace下載量最大的模型,還有至少20家平臺(tái)提供了API服務(wù)。

      此外,不少硅谷公司被爆出套殼中國大模型。Cursor在最新2.0版本更新中,推出首個(gè)自家的代碼模型Composer。但被開發(fā)者爆出,Composer套殼了中國的GLM-4.6模型。

      GLM- 4.6是智譜在今年9月底發(fā)布的旗艦?zāi)P?,代碼能力對(duì)齊Claude Sonnet 4,當(dāng)時(shí)號(hào)稱國內(nèi)最好的代碼模型,隨后在大模型競技場LMArena中排名開源模型第一。

      另外兩大AI編程獨(dú)角獸Cognition和Windsurf也被爆出套殼GLM-4.6,Windsurf在被網(wǎng)友扒出后,直接不裝了,稱應(yīng)社區(qū)用戶的熱烈呼聲,上線了GLM-4.6模型,認(rèn)為其“將帶來更出色的代碼生成能力和編程任務(wù)表現(xiàn)”。

      這也讓不少AI從業(yè)者感到振奮?!霸瓉矶际侵袊竽P吞讱ずM忸I(lǐng)先模型,現(xiàn)在我們的模型成為被套殼的對(duì)象,國產(chǎn)模型真正開始揚(yáng)眉吐氣了。”

      可以說,中國大模型出海已進(jìn)入新階段。從最初僅僅是關(guān)注討論,到部分產(chǎn)品應(yīng)用出圈,再到多個(gè)國產(chǎn)基座模型在海外企業(yè)落地,大模型領(lǐng)域的Made in China含金量,正在持續(xù)上升。

      值得注意的是,這些模型均選擇了開源。這讓全球開發(fā)者和企業(yè)能夠無負(fù)擔(dān)地應(yīng)用起來,而中國大模型借助開源正在構(gòu)建起越來越大的技術(shù)影響。

      當(dāng)然,開源也需要實(shí)力支撐,而讓硅谷選擇中國模型的關(guān)鍵就是極致的性價(jià)比。

      美國云計(jì)算公司Vercel CEO吉列爾莫·勞赫(Guillermo Rauch)提到,在內(nèi)部智能體真實(shí)場景基準(zhǔn)測試中,Kimi K2在運(yùn)行速度和準(zhǔn)確率上優(yōu)于GPT-5和Claude Sonnet 4.5,其中準(zhǔn)確率更是高出50%。

      前述硅谷投資人Chamath則提到,Kimi-K2性能夠強(qiáng),且比OpenAI和Anthropic便宜太多。

      數(shù)據(jù)顯示,Kimi-K2、Kimi K2 Thinking以及智譜GLM-4.6的API輸出價(jià)格約為GPT-5的20%,不到Claude Sonnet 4.5的15%,MiniMax-M2的價(jià)格更是僅有Claude Sonnet 4.5的8%。

      “這個(gè)一個(gè)重要時(shí)刻,中國的開源模型具備了足夠的能力來支持西方產(chǎn)品的開發(fā),全球AI正進(jìn)入多極化競爭的新格局?!庇性u(píng)論稱,甚至有海外網(wǎng)友表示:是不是該學(xué)點(diǎn)中文了?


      融資上市,AI獨(dú)角獸各謀出路

      技術(shù)趕超、出海破圈,中國的AI獨(dú)角獸試圖繼續(xù)留在牌桌上。這也讓它們?cè)谶~向上市和新一輪融資的過程中,更有底氣了。

      月之暗面最近被爆出開啟新一輪融資,甚至傳出海外知名的a16z考慮投資。有消息稱,月之暗面此次融資約6億美金,投前估值38億美金,領(lǐng)投方指向IDG,騰訊、五源資本、今日資本等老股東計(jì)劃跟投。

      如融資完成,月之暗面有望成為繼智譜、MiniMax后又一家估值超300億元的AI獨(dú)角獸。

      搜狐科技就此向月之暗面以及有關(guān)投資方求證,對(duì)方未做回應(yīng)。有關(guān)注AI的投資人認(rèn)為,這么高額的融資,一般需要比較長的時(shí)間決策確認(rèn),而美國基金在當(dāng)前環(huán)境下不太可能投。

      對(duì)月之暗面前述估值,該投資人表示,在國內(nèi)大模型融資熱潮已經(jīng)過去的情況下,這個(gè)估值不算低,但相較美國大模型獨(dú)角獸來說差距很大。

      有觀點(diǎn)認(rèn)為,國內(nèi)AI獨(dú)角獸相較美國AI創(chuàng)企,技術(shù)和估值嚴(yán)重不匹配。比如,月之暗面估值不到OpenAI和Anthropic的1%,“國內(nèi)大模型賺錢還是太難了”。

      此前兩年,月之暗面是大模型市場炙手可熱的明星,去年超13億美元的兩輪融資更是讓其成為估值達(dá)33億美元的AI獨(dú)角獸,Kimi也一度成為國內(nèi)流量最高的AI原生應(yīng)用。

      然而,隨著聯(lián)創(chuàng)張予彤和朱嘯虎的糾紛,以及DeepSeek沖擊,月之暗面遭遇質(zhì)疑,公司發(fā)展也出現(xiàn)擺動(dòng),停止產(chǎn)品投流,重心轉(zhuǎn)向技術(shù),并從閉源走向開源等。

      今年以來,Kimi用戶規(guī)模增長停滯甚至下降。據(jù)QuestMobile,今年9月,Kimi月活規(guī)模已不足千萬,相較去年12月下降超過1100萬,在國內(nèi)AI原生APP排名從第二降至第五。


      在商業(yè)化方面,月之暗面繼續(xù)押注C端,此前在海內(nèi)外上線OK Computer,并首次開啟訂閱付費(fèi)。在國內(nèi)同類型產(chǎn)品均免費(fèi),且面臨頭部競爭情況下,這可能是一場持久的惡戰(zhàn)。

      在這種情況下,此次融資對(duì)月之暗面頗為重要,尤其是在商業(yè)化相對(duì)較好的智譜開啟上市和MiniMax計(jì)劃上市的情況下,其需要積累更多資金應(yīng)對(duì)未來的變局。

      今年中期,MiniMax完成近3億美元新一輪融資,投后估值超40億美元,上海國資等出手。隨后,該公司被爆計(jì)劃赴港上市,當(dāng)時(shí)內(nèi)部人士稱確有上市想法。

      目前,該公司海外推出的陪伴類應(yīng)用Talkie和視頻生成應(yīng)用海螺AI構(gòu)成其主要收入來源,最近還在編程和智能體產(chǎn)品上推出收費(fèi)模式,進(jìn)一步押注C端。

      深耕G端和B端的智譜則在今年上半年完成多地國資融資,并開啟上市,有望在年內(nèi)提交科創(chuàng)板招股書,成為大模型第一股。此前該公司爆出裁員,亦反應(yīng)出商業(yè)化和上市的不易。

      肉眼可見的是,AI四小虎中的階躍星辰,似乎有些掉隊(duì)。AI獨(dú)角獸們?cè)诩夹g(shù)理想和現(xiàn)實(shí)交織當(dāng)中仍面臨生存壓力,但目前還遠(yuǎn)未到格局已定的局面。



      運(yùn)營編輯 |曹倩審核|孟莎莎




      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      轟20+6+5!中國男籃又一19歲新星崛起:重傷歸來劍指最佳新秀?

      轟20+6+5!中國男籃又一19歲新星崛起:重傷歸來劍指最佳新秀?

      李喜林籃球絕殺
      2025-12-16 11:24:43
      99分鐘驚魂!曼聯(lián)門將封神戰(zhàn):3分鐘2次救主 捍衛(wèi)41年紀(jì)錄

      99分鐘驚魂!曼聯(lián)門將封神戰(zhàn):3分鐘2次救主 捍衛(wèi)41年紀(jì)錄

      葉青足球世界
      2025-12-16 08:01:39
      太給面子!楊鳴效仿杜鋒,潛力賽派年輕小將,賽后發(fā)言太霸氣

      太給面子!楊鳴效仿杜鋒,潛力賽派年輕小將,賽后發(fā)言太霸氣

      宗介說體育
      2025-12-16 13:26:41
      穿搭的樂趣就是把普通得單品穿出高級(jí)感

      穿搭的樂趣就是把普通得單品穿出高級(jí)感

      牛彈琴123456
      2025-12-16 12:06:55
      “過去兩年沒收到過消息,她可能已經(jīng)去世了”

      “過去兩年沒收到過消息,她可能已經(jīng)去世了”

      觀察者網(wǎng)
      2025-12-15 21:17:04
      提車當(dāng)日發(fā)生意外,小米汽車員工門口被撞,雷軍賬號(hào)被扒上熱搜

      提車當(dāng)日發(fā)生意外,小米汽車員工門口被撞,雷軍賬號(hào)被扒上熱搜

      天天熱點(diǎn)見聞
      2025-12-16 06:52:11
      乾隆出上聯(lián):此木為柴山山出,6歲稚童巧對(duì)下聯(lián),還破了一樁懸案

      乾隆出上聯(lián):此木為柴山山出,6歲稚童巧對(duì)下聯(lián),還破了一樁懸案

      凱裕說故事
      2025-08-19 17:16:08
      在體制內(nèi)最不該犯的錯(cuò)誤, 一是醉駕, 二是玩女人, 三是賭博

      在體制內(nèi)最不該犯的錯(cuò)誤, 一是醉駕, 二是玩女人, 三是賭博

      細(xì)說職場
      2025-12-10 16:02:05
      食肉動(dòng)物捕獵成功后,為什么優(yōu)先要先吃掉獵物的內(nèi)臟呢?

      食肉動(dòng)物捕獵成功后,為什么優(yōu)先要先吃掉獵物的內(nèi)臟呢?

      向航說
      2025-12-16 00:45:03
      鶯歌28+5+5猛龍逆轉(zhuǎn)送熱火5連敗 熱巴20+10約維奇重摔傷退

      鶯歌28+5+5猛龍逆轉(zhuǎn)送熱火5連敗 熱巴20+10約維奇重摔傷退

      醉臥浮生
      2025-12-16 10:57:17
      大廠員工自爆:985畢業(yè),投百份簡歷無人問津,一氣之下把薪資由2W調(diào)為3W,簡歷改成英文,結(jié)果出乎意料!

      大廠員工自爆:985畢業(yè),投百份簡歷無人問津,一氣之下把薪資由2W調(diào)為3W,簡歷改成英文,結(jié)果出乎意料!

      上海約飯局
      2025-12-05 19:59:53
      SU7銷量大跌,雷軍嚇了車圈一跳!

      SU7銷量大跌,雷軍嚇了車圈一跳!

      李東陽朋友圈
      2025-12-16 14:07:07
      老婆被外派非洲8年,直到偶遇她上司,驚訝知道:她5年前就離職了

      老婆被外派非洲8年,直到偶遇她上司,驚訝知道:她5年前就離職了

      農(nóng)村情感故事
      2025-12-07 15:05:41
      1947 年:毛主席對(duì)粟裕積怨已深,即將爆發(fā)沖突時(shí),陳毅一席話巧妙化解

      1947 年:毛主席對(duì)粟裕積怨已深,即將爆發(fā)沖突時(shí),陳毅一席話巧妙化解

      寄史言志
      2025-12-15 21:51:07
      陳盈駿:趙睿非常有能力是CBA有統(tǒng)治力的球員,我們需要時(shí)間慢慢磨合

      陳盈駿:趙睿非常有能力是CBA有統(tǒng)治力的球員,我們需要時(shí)間慢慢磨合

      懂球帝
      2025-12-16 09:17:19
      這兩地剛?;鹩珠_打,“特朗普和平”成了笑話|京釀館

      這兩地剛?;鹩珠_打,“特朗普和平”成了笑話|京釀館

      新京報(bào)
      2025-12-16 12:05:07
      今年冬天火了一種穿法:叫“襪子裹褲子”,這樣穿時(shí)髦高級(jí)又保暖

      今年冬天火了一種穿法:叫“襪子裹褲子”,這樣穿時(shí)髦高級(jí)又保暖

      時(shí)尚穿搭生活館
      2025-12-16 14:42:04
      80歲老太感染上艾滋,女兒查看監(jiān)控后瞠目結(jié)舌,連捅男保姆43刀

      80歲老太感染上艾滋,女兒查看監(jiān)控后瞠目結(jié)舌,連捅男保姆43刀

      民間精選故事匯
      2025-05-12 08:01:12
      中國武器遭變數(shù)!196架飛行器被擊落,美戰(zhàn)機(jī)卻沒事,反導(dǎo)有用嗎

      中國武器遭變數(shù)!196架飛行器被擊落,美戰(zhàn)機(jī)卻沒事,反導(dǎo)有用嗎

      策前論
      2025-12-13 17:41:02
      泰柬沖突進(jìn)一步升級(jí),柬埔寨首相不找中國,居然又去找美國調(diào)停!

      泰柬沖突進(jìn)一步升級(jí),柬埔寨首相不找中國,居然又去找美國調(diào)停!

      阿龍聊軍事
      2025-12-16 05:32:58
      2025-12-16 15:55:00
      搜狐科技 incentive-icons
      搜狐科技
      搜狐科技官方賬號(hào)
      4602文章數(shù) 9173關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克徹底放手!特斯拉股價(jià)一夜狂歡

      頭條要聞

      戴琳在球迷去世當(dāng)天還5千:不計(jì)較他之前的話 救命要緊

      頭條要聞

      戴琳在球迷去世當(dāng)天還5千:不計(jì)較他之前的話 救命要緊

      體育要聞

      楊瀚森18+10首次兩雙 關(guān)鍵攻防統(tǒng)治G聯(lián)賽

      娛樂要聞

      溫崢嶸回應(yīng)賣面膜爭議,已報(bào)警刑事立案

      財(cái)經(jīng)要聞

      浙金中心暴雷始末:祥源控股設(shè)計(jì)的騙局?

      汽車要聞

      智聯(lián)網(wǎng)功能升級(jí) 方程豹鈦3迎第四次OTA升級(jí)

      態(tài)度原創(chuàng)

      家居
      健康
      親子
      旅游
      藝術(shù)

      家居要聞

      溫馨獨(dú)棟 駝色與淺色碰撞

      這些新療法,讓化療不再那么痛苦

      親子要聞

      為什么說如果有條件,踢球的孩子越早出去越好? 7歲的誠誠,登陸西班牙只有半年,從最開始的興趣班,到現(xiàn)...

      旅游要聞

      南明區(qū)發(fā)布七條冬季文旅Citywalk線路

      藝術(shù)要聞

      16位畫家17幅靜物花卉,你喜歡哪位的呢?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 人妻?日韩?中文?无码?制服| 伊人久久大香线蕉亚洲五月天| 免费看一区二区三区四区| 欧美精品在线观看视频| 亚洲天堂在线播放| 白浆网站| 精品九九在线| 人妻人人澡人人添人人爽| 无码成人AV在线看免费| 成人自拍中文字幕| 欧美日韩导航| 国产成人?亚洲?日韩| 久久人人爽人人人人爽av| 亚洲国产欧美日本视频| 亚洲午夜福利精品无码不卡| 亚洲v欧美| 中文字幕人成无码人妻综合社区| 色综合色天天久久婷婷基地| 国产成人免费一区二区三区| 亚洲最大免费色情网| 馆陶县| 日本又色又爽又黄的a片吻戏| 黄桃av无码免费一区二区三区 | 九九热视频在线免费观看| 亚洲成人网在线| 手机在线观看av| 亚洲国产成人精品无码区在线观看| 在线 | 一区二区三区| 日本韩国一区二区精品| 国产黄拍| 色欲av亚洲一区无码少妇| 激情综合色综合啪啪五月丁香| 人与禽交av在线播放| 欧美性交网| 欧美野外疯狂做受xxxx高潮 | 亚洲AV日韩AV永久无码网站| 平遥县| 水蜜桃av导航| 2022亚洲男人天堂| 亚洲熟女豪乳视频| 国产精品资源管理站在线直播|