<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      “美國公司制造的最好開源模型”,基模來自DeepSeek

      0
      分享至

      今年 10 月,當硅谷兩家最火熱的 AI 編程工具公司 Cursor 和 Windsurf 前后腳發布自己的“首個自研模型”時,整個開發者社區一片歡呼。然而慶祝的聲音還未散去,就有眼尖的網友發現了蹊蹺之處:這些號稱“自研”的模型,在推理過程中竟然會突然冒出中文,甚至有模型在被越獄后直接承認自己來自中國公司智譜 AI。這個發現迅速在社交媒體上發酵,有人調侃道:“這邊一開源,那邊就自研。”那時候,這種借用還帶著幾分遮遮掩掩的羞澀,仿佛借了鄰居的東西怕被發現,總要刷上一層新漆。

      但到了昨天,這種遮掩似乎已無必要,甚至演變成了一種理直氣壯的實用主義宣言。

      總部位于舊金山的初創公司 Deep Cogito 發布了其最新一代旗艦模型 Cogito v2.1 671B。公司 CEO Drishan Arora 在社交平臺 X 上豪情萬丈地宣布:“今天,我們發布了由美國公司制造的最好的開源大語言模型。”


      圖丨相關推文(來源:X)

      為了證明這一點,CEO Drishan Arora 甩出了一組極其漂亮的數據:在 GPQA Diamond 推理測試中,它逼近了 GPT-5;在多語言 MMLU 上,它擊敗了 Claude Sonnet 4.5;在數學和代碼能力上,它把 Meta 引以為傲的 Llama 系列甩在了身后。看著那些直沖云霄的柱狀圖,你差點就要相信這是美國開源 AI 的一次反擊。


      圖丨基準測試結果(來源:Deep Cogito)

      其實對于 AI 圈內人來說,看到 671B 這個比較奇特的數字大概就能發現一些端倪了,它恰好就是 DeepSeek-V3 的參數規模

      而沒多久之后,網友們就在該模型的 HuggingFace 的配置文件里發現了一行代碼:“base_model: deepseek-ai/DeepSeek-V3-Base”。


      圖丨相關推文(來源:X)

      不過,與此前 Cursor 那種死鴨子嘴硬直到被抓包才承認的態度不同,Deep Cogito 完全沒打算藏著掖著。Drishan Arora 表現得相當坦蕩。他直接承認了分叉(fork)自 DeepSeek-V3-Base,并解釋道:在今天的 AI 領域,預訓練(Pre-training)已經變成了像發電一樣的通用商品(commodity)。

      “真正困難的問題,是如何將一個基礎模型進行后訓練(Post-training),使其達到前沿智能的水平。”他還補了一刀:“具有競爭力的前沿開源模型,只有極少數大型研究實驗室發布過。而在美國,除了 Meta,幾乎沒有其他選擇。”也因此,DeepSeek 是一個顯而易見的選擇, 因為 DeepSeek 架構周圍已經建立了廉價推理的生態系統。

      既然底座是別人的,那 Deep Cogito 到底造了什么?

      正如我們此前在關于 Cogito v1 發布的報道中所提及,這家由 DeepMind 前產品經理和 Google 前高級工程師聯手創立的公司,從一開始就不是為了“從零開始預訓練”而生的。在他們看來,目前大多數預訓練模型的能力都在趨同。在這種背景下,競爭的焦點已經從預訓練轉向了后訓練。

      Deep Cogito 的核心在于一套被稱為“前沿后訓練棧”的技術。簡單來說,他們基于了 DeepSeek 的基礎模型,利用自己獨創的強化學習算法和迭代蒸餾放大(IDA,Iterated Distillation and Amplification)技術,對其進行了極其復雜的“再教育”。

      根據官方披露的技術細節,他們利用了數百個 GPU 節點進行了大規模的分布式強化學習。與其前代產品 Cogito v1 相比,v2.1 在推理效率上實現了巨大進步。在達到同等推理能力的水平下,Cogito v2.1 消耗的 Token 數量顯著低于競爭對手。例如,在處理復雜邏輯問題時,Cogito v2.1 平均消耗 4894 個 Token,而 Google 的 Gemini 2.5 Pro 則高達 9178 個。


      圖丨平均使用的 token 數對比(來源:Deep Cogito)

      Deep Cogito 的技術團隊將其歸功于“過程監督”(Process Supervision)。傳統的推理模型往往通過生成冗長的思維鏈(Chain of Thought)來逼近答案,這既費時又費錢。而 Cogito v2.1 通過強化學習,培養了模型更強的直覺,使其能夠以更短的搜索路徑找到正確的推理軌跡。這種“少即是多”的能力,恰恰是 IDA 方法論的體現,即不僅要讓模型會思考,還要讓它高效地思考。

      在數學基準測試 MATH-500 中,Cogito v2.1 得分 98.57%,微弱優勢領先于“老師”DeepSeek v3.2(97.87%),且大幅領先于 Llama 4 Scout。在代碼修復任務 SWE-Bench Verified 中,它也展現出了比較出色的解決率。


      圖丨基準測試結果(來源:Deep Cogito)

      客觀而言,Cogito v2.1 確實是一款性能不錯的模型。在代碼修復、數學推理等任務上都展現出了出色的能力,而且在推理效率上實現了有價值的突破。Deep Cogito 在后訓練方面投入的技術努力也值得認可,將一個基礎模型訓練到前沿水平,并在效率上有所創新,本身就需要深厚的技術積累。

      而且,Deep Cogito 在技術文檔中明確標注了使用 DeepSeek-V3-Base 作為基礎模型,并沒有刻意隱瞞這一事實。只是一個模型的基礎架構、核心參數規模都來自中國的 DeepSeek,只是在后訓練階段由美國公司完成優化,就宣稱這是“由美國公司制造的最好的開源大語言模型”,確實有些言過其實。

      另外還要夾帶私貨,在模型中植入特定意識形態傾向的做法,也偏離了開源精神的初衷,讓人有所不齒。

      只能說,Deep Cogito 的這一舉動實際上是在 Cursor 和 Windsurf 事件之后,又一次印證了中國開源 AI 模型在全球范圍內日益增長的影響力。

      無論對于哪個國家的 AI 初創公司或者開發者來說,基于中國開源模型進行開發已經成為一種務實的選擇。從零預訓練一個 671B 規模的模型需要數千萬甚至上億美元,而基于現成的高質量開源模型進行后訓練優化,不僅成本低廉,還能快速推向市場。這種實用主義的選擇,本身并無可厚非。

      而 Deep Cogito 這種“既要技術里子,又要地緣面子”的矛盾心態,恰恰折射出部分硅谷從業人員在面對新興競爭對手時復雜的心理活動:既無法忽視對方的技術價值,又難以完全放下長期以來的領跑者身段。

      這種執念背后,或許是對技術競爭被簡化為國家競賽的焦慮,但它恰恰忽視了開源生態最寶貴的特質:超越地域的協作與創新。真正的技術自信,應該體現在坦誠的態度和實實在在的創新貢獻上,而不是包裝出來的“X 國最強”敘事。

      參考資料:

      1.https://www.deepcogito.com/research/cogito-v2-1

      2.https://x.com/drishanarora/status/1991204769642475656

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      男子7年給媽存54萬養老,得癌癥后打算取錢救命,看到余額崩潰了

      男子7年給媽存54萬養老,得癌癥后打算取錢救命,看到余額崩潰了

      飯小妹說歷史
      2025-12-08 10:14:06
      29歲雙向變勇士老大?小說都不敢編的劇情!最不可思議的NBA童話

      29歲雙向變勇士老大?小說都不敢編的劇情!最不可思議的NBA童話

      阿浪的籃球故事
      2025-12-08 16:54:02
      超1700億成交!今天,漲停潮

      超1700億成交!今天,漲停潮

      新浪財經
      2025-12-08 16:45:05
      夢回巔峰!湖人112-108力克76人,看數據:他是頭號功臣!

      夢回巔峰!湖人112-108力克76人,看數據:他是頭號功臣!

      籃壇籃談
      2025-12-08 09:48:41
      奎因大贊廣東隊1人:不管是傳球,還是進攻都非常出色

      奎因大贊廣東隊1人:不管是傳球,還是進攻都非常出色

      體育哲人
      2025-12-08 11:12:45
      小米推出米家智能燃氣熱水器2瀑布洗零冷水18L

      小米推出米家智能燃氣熱水器2瀑布洗零冷水18L

      IT之家
      2025-12-08 18:14:09
      西伯利亞有多可怕?零下73度,千斤存糧百罐腌菜,砍柴一個月才行

      西伯利亞有多可怕?零下73度,千斤存糧百罐腌菜,砍柴一個月才行

      霽寒飄雪
      2025-11-04 09:19:58
      賽力斯,90億銷售費用之謎!

      賽力斯,90億銷售費用之謎!

      新浪財經
      2025-12-06 18:52:11
      尖叫之夜紅毯:王楚然資源降級,白鹿比肩楊冪,柯淳壓軸出場

      尖叫之夜紅毯:王楚然資源降級,白鹿比肩楊冪,柯淳壓軸出場

      君笙的拂兮
      2025-12-07 16:07:47
      用圍巾擦地的女乘客找到了!蘇州地鐵:已和她取得聯系,正約時間送出禮物

      用圍巾擦地的女乘客找到了!蘇州地鐵:已和她取得聯系,正約時間送出禮物

      極目新聞
      2025-12-07 16:35:20
      醪糟被關注!醫生:常吃醪糟的人,不用多久,腸道或迎來3個變化

      醪糟被關注!醫生:常吃醪糟的人,不用多久,腸道或迎來3個變化

      阿兵科普
      2025-11-30 20:53:55
      杯賽八強出爐!廣廈山西大概率四強會面,上海廣東首輪對決成焦點

      杯賽八強出爐!廣廈山西大概率四強會面,上海廣東首輪對決成焦點

      籃球資訊達人
      2025-12-08 17:15:53
      謝霆鋒沒想到,離婚12年李亞鵬公開曬王菲照片,有一件事他真做對

      謝霆鋒沒想到,離婚12年李亞鵬公開曬王菲照片,有一件事他真做對

      做一個合格的吃瓜群眾
      2025-12-08 18:10:21
      2015年,谷俊山被判死緩,朱德外孫對他的評價一針見血

      2015年,谷俊山被判死緩,朱德外孫對他的評價一針見血

      歷史龍元閣
      2025-12-03 13:50:04
      1945年,換了美式裝備的國民黨軍,便能在湘西一舉擊潰10余萬日軍

      1945年,換了美式裝備的國民黨軍,便能在湘西一舉擊潰10余萬日軍

      老范談史
      2025-11-26 16:39:35
      杭州承辦世預賽票房破5000萬,據估創10億級別的綜合經濟效益

      杭州承辦世預賽票房破5000萬,據估創10億級別的綜合經濟效益

      懂球帝
      2025-12-08 12:10:08
      偷雞不成蝕把米,本想“毀掉”張柏芝,不料自己先被扒了個底朝天

      偷雞不成蝕把米,本想“毀掉”張柏芝,不料自己先被扒了個底朝天

      老謝談史
      2025-12-08 16:44:04
      跌破1499元,茅臺都賣不動了

      跌破1499元,茅臺都賣不動了

      豹變
      2025-12-08 08:03:25
      臺海戰爭爆發,西方可凍結 3.2 萬億中國資產,但中國手里也有王炸

      臺海戰爭爆發,西方可凍結 3.2 萬億中國資產,但中國手里也有王炸

      藍色海邊
      2025-12-03 14:27:26
      天空:薩拉赫在上午9:30抵達訓練基地,斯洛特更早抵達

      天空:薩拉赫在上午9:30抵達訓練基地,斯洛特更早抵達

      懂球帝
      2025-12-08 18:34:08
      2025-12-08 19:03:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      15961文章數 514352關注度
      往期回顧 全部

      科技要聞

      外面有人挖,家里有人跑:蘋果亂成了一鍋粥

      頭條要聞

      臺學者:殲-15開射控雷達照射F-15 反而是日本撿到寶

      頭條要聞

      臺學者:殲-15開射控雷達照射F-15 反而是日本撿到寶

      體育要聞

      一位大學美術生,如何用4年成為頂級跑者?

      娛樂要聞

      章子怡被說拜高踩低 主動和卡梅隆熱聊

      財經要聞

      重磅!政治局會議定調明年經濟工作

      汽車要聞

      純電全尺寸大六座 凱迪拉克"小凱雷德"申報圖曝光

      態度原創

      教育
      時尚
      房產
      手機
      軍事航空

      教育要聞

      2025中國百強中學出爐!山東4所學校上榜!

      除了大衣,今年最火的外套一定就是它了!

      房產要聞

      碧桂園,開始甩賣海口家底!

      手機要聞

      真我GT8系列已支持微信聊天收發實況照片:畫面與聲音可完整傳遞

      軍事要聞

      柬泰沖突細節披露 洪森要求部隊“克制”

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 无码内射成人免费喷射| 巴彦淖尔市| 边坝县| 国内精品久久久久伊人aⅴ| 夏邑县| 亚洲成人www| 高碑店市| 亚洲日本va午夜在线电影| 无码免费中文字幕视频| 国产午夜福利片在线观看| 野花社区www高清视频| 亚洲女初尝黑人巨高清| 欧美成人一区二免费视频| 久久婷婷激情综合色综合俺也去| 一性一交一口添一摸视频| 狠狠综合久久久久综| 国产综合久久久久久鬼色| 国产午夜一区二区在线观看| 91在线视频观看| 成人日本有码在线| 18禁网址| 日本午夜视频| 少妇无码太爽了在线播放| 亚洲乱码中文字幕综合| 国产av一区二区三区| 特黄 做受又硬又粗又大视频| 中国女人和老外的毛片 | 人妻精品久久久久中文字幕86 | AV色色色| 日韩在线不卡免费视频一区| 亚洲乱妇熟女爽到高潮的片| 999久久欧美人妻一区二区| 亚洲成人在线电影| 97色伦97色伦国产| 洋洋AV| 国产熟女精品| 9191久久| 狠狠干性视频| 国模精品在线| 日韩欧美亚洲综合久久| 又污又爽又黄的网站|