<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      中國AI編程面臨殘酷競爭,OpenAI推出1000token/秒的Codex-Spark |以Agent為馬

      0
      分享至

      當AI正在能替人類編程數個小時甚至數天,編程的速度就愈發關鍵;當多個智能體協作完成更加復雜的任務,延時就變得更加不能容忍。

      在推出GPT-5.3-Codex之后一周,OpenAI即推出Codex-Spark。這個輕量版,可以實現即時編程,速度達到1000token/秒。這也是OpenAI首個運行在英偉達GPU競爭對手Cerebras芯片上的模型。

      隨著模型功能的日益強大,交互速度顯然成為了瓶頸。這樣的速度,對于長程工作、動輒耗費成上億token的智能體來說,會帶來產品的差異性競爭力。

      以OpenAI為代表的美國前沿AI實驗室,進一步抬高競爭門檻,用新一代更強的算力,訓練更強大的模型,持續擴展性能邊界,并創造出更好的用戶體驗。Blackwell大規模上市成為主流,TPU-7e即將量產推出,以及更快速的推理芯片如Groq、Cerebras等,正在加快部署。中國的開源AI軍團,要快馬加鞭了。

      “響應速度即產品”

      OpenAI開始用算力與模型協同,加入AI編程的殘酷競爭。Codex-Spark運行在Cerebras的芯片上;雙方宣布合作也僅僅一個月,即推出首個模型。Cerebras 的創始人兼CEO Andrew Feldman稱,Codex-Spark 是為實時軟件開發而打造的。“在編程領域,響應速度本身就是產品。這不是“錦上添花”,而是剛需。”

      Codex-Spark針對定向代碼修改、邏輯調整和前端迭代進行了優化,為開發者提供幾乎即時的反饋,讓他們保持在高效的心流狀態中——這對于10X甚至100X的人才來說,具有極高的經濟價值。


      OpenAI提出了馬年工作重心:提高數據中心容量,強化端到端用戶體驗,并部署更大的前沿模型。

      如OpenAI所說,其最新的前沿模型在執行長時間運行的任務方面展現出優勢,無需人工干預即可自主運行數小時、數天甚至數周。這樣的話,低延時可以直接縮短任務完成的時間,轉化為經濟價值。

      Codex-Spark 成為首個專為實時編程而設計的模型,提供128k的上下文窗口,并且僅支持文本。在研究預覽期間,Codex-Spark 將擁有獨立的速率限制,其使用量不計入標準速率限制。但是,當需求量較高時,用戶可能會遇到訪問受限或臨時排隊的情況,“因為我們需要平衡不同用戶的可靠性。”

      速度即智能

      Codex-Spark 針對交互式工作進行了優化,在這種工作環境中,低延遲與智能同樣重要。用戶可以與模型實時協作,在模型運行過程中隨時中斷或重定向它,并快速迭代,獲得近乎實時的響應。由于 Codex-Spark 注重速度,因此其默認工作方式非常輕量級:它只進行最少的、有針對性的編輯,并且除非用戶口主動要求,否則不會自動運行測試。

      Codex-Spark 運行在 Cerebras 的晶圓級引擎(Wafer Scale Engine)3上,這是一款專為高速推理而打造的 AI 加速器,為 Codex 提供了一個優先降低延遲的服務層。OpenAI與 Cerebras 合作,還將把這條低延遲路徑添加到其他服務器相同的生產服務堆棧中,使其能夠在 Codex 上無縫運行,并為支持未來的模型做好準備。

      OpenAI特意說明,GPU 仍然是其訓練和推理流程的基礎,能夠提供最具成本效益的token,適用于廣泛的應用。Cerebras 則在此基礎上更進一步,在對延遲要求極低的工作流程中表現更好,能夠縮短端到端循環,使 Codex 在迭代過程中響應更加迅速。GPU 和 Cerebras 可以結合使用,針對單個工作負載實現最佳性能。

      Codex 將擁有快慢結合的兩種互補模式:一種是用于長期推理和執行的模式,另一種是用于快速迭代的實時協作模式。隨著時間的推移,這兩種模式將會融合,既讓用戶保持緊密的交互循環,又能將耗時較長的任務委托給后臺運行的子代理;或者,當需要兼顧廣度和速度時,它還可以將任務并行分配給多個模型,因此無需預先選擇單一模式。

      關于Cerebras


      2015年創立,設計的處理器,實現了單晶圓級的計算、內存和互連架構。比H100快10-20倍,在Mistral, Perplexity等模型上使用,速度達到1000-1200token/秒。

      為什么WSE架構在速度上碾壓GPU? GPU將模型權重保存在 HBM 中,每生成一個 token,整個模型需要通過內存總線傳輸。受限于帶寬瓶頸,無論計算能力,吞吐量都限制在 200-300 tps 左右。而Cerebras 的晶圓級引擎足夠大,可以將整個模型存儲在芯片上,無需外部內存,也無需總線。權重和計算都位于同一位置,能實現2500+ tps 的吞吐量。


      目前大模型的推理已經成為瓶頸。訓練展現了人工智能的顯著突破,但推理的成本決定了其經濟可行性,維護和使用前沿模型成本高昂,OpenAI每1美元收入需要3美元成本,急需建立推理的經濟性,不僅需要token的數量,更需要token的質量,即所能創造的經濟價值,而低延遲是目前在智能體長程任務中比較迫切的需求。

      2026正是推理定制芯片戰爭爆發之年,TPU, Grok(LPU),Cerebras等。每家前沿AI實驗室仍然需要GPU滿足基本的訓練推理需求,但是在延遲、總擁有成本(TCO)、功耗等方面的競爭,其差異化將主要通過ASIC定制推理芯片實現。英偉達花了200億美元將推理芯片初創企業Groq的核心團隊買下,也是為了把它的護城河拓得更寬、掘得更深。

      Andrew Feldman說:當推理足夠快時,全新的市場將隨之打開。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      52歲龍丹妮上熱搜,網友:舞是龍丹妮跳的,面子是前男友李維丟的

      52歲龍丹妮上熱搜,網友:舞是龍丹妮跳的,面子是前男友李維丟的

      她時尚丫
      2026-02-13 22:55:36
      新春走基層|820噸的“安全帽”被這樣戴上

      新春走基層|820噸的“安全帽”被這樣戴上

      人民資訊
      2026-02-12 07:16:11
      78歲鄭少秋喪女兩年至今神隱,汪明荃也難聯絡,曾給許紹雄送花牌

      78歲鄭少秋喪女兩年至今神隱,汪明荃也難聯絡,曾給許紹雄送花牌

      查爾菲的筆記
      2026-02-12 19:25:00
      米蘭冬奧|今日早報:金博洋謝幕,馬里寧爆冷,花滑男單冠軍花落哈薩克斯坦

      米蘭冬奧|今日早報:金博洋謝幕,馬里寧爆冷,花滑男單冠軍花落哈薩克斯坦

      上觀新聞
      2026-02-14 06:59:04
      應急管理部:加強煙花爆竹非法制售、儲存的排查打擊

      應急管理部:加強煙花爆竹非法制售、儲存的排查打擊

      環球網資訊
      2026-02-13 14:16:06
      22歲中國男子巴厘島旅游時溺亡,去年剛大學畢業,原計劃除夕前回國和家人團圓,同伴發聲

      22歲中國男子巴厘島旅游時溺亡,去年剛大學畢業,原計劃除夕前回國和家人團圓,同伴發聲

      極目新聞
      2026-02-13 22:17:39
      重磅消息!中國將向烏克蘭提供能源援助,展現大國擔當

      重磅消息!中國將向烏克蘭提供能源援助,展現大國擔當

      老馬拉車莫少裝
      2026-02-13 19:42:35
      英偉達成功,美國人反思:太多印度人當高管,除了吹牛啥也不會

      英偉達成功,美國人反思:太多印度人當高管,除了吹牛啥也不會

      夕陽渡史人
      2026-02-13 10:52:15
      美團被AI扔了一個二向箔

      美團被AI扔了一個二向箔

      商業數據派
      2026-02-13 23:22:19
      2-1,63歲穆帥發威:率隊22輪不敗,逼近葡超榜首,繼續沖冠軍

      2-1,63歲穆帥發威:率隊22輪不敗,逼近葡超榜首,繼續沖冠軍

      俯身沖頂
      2026-02-14 06:33:36
      澳門之所以不鬧騰,不鬧獨立,不鬧分裂,不鬧反共,不鬧親臺親美

      澳門之所以不鬧騰,不鬧獨立,不鬧分裂,不鬧反共,不鬧親臺親美

      百態人間
      2026-02-13 15:10:15
      歐洲屏息以待,萬斯“挑釁性”演講一年后,魯比奧會否重演“萬斯時刻”?

      歐洲屏息以待,萬斯“挑釁性”演講一年后,魯比奧會否重演“萬斯時刻”?

      上觀新聞
      2026-02-14 05:15:05
      無冕之王!40歲保羅被裁后宣布退役 長文深情告別21年NBA生涯

      無冕之王!40歲保羅被裁后宣布退役 長文深情告別21年NBA生涯

      醉臥浮生
      2026-02-14 02:17:59
      你在體制內捅過的最大簍子是啥? 網友:人怎么能捅這么大的簍子

      你在體制內捅過的最大簍子是啥? 網友:人怎么能捅這么大的簍子

      帶你感受人間冷暖
      2026-02-13 10:06:39
      高市沒想到,日本剛扣押中國漁船,抓走船長,中方就迅速出手了

      高市沒想到,日本剛扣押中國漁船,抓走船長,中方就迅速出手了

      聚焦熱點內幕
      2026-02-14 04:07:45
      原來iPhone信號差是沒開對,這個隱藏設置一開,信號直接滿格

      原來iPhone信號差是沒開對,這個隱藏設置一開,信號直接滿格

      小柱解說游戲
      2026-02-13 12:20:15
      眾星齊賀保羅退役!詹姆斯:了不起的生涯,冠軍!

      眾星齊賀保羅退役!詹姆斯:了不起的生涯,冠軍!

      體壇周報
      2026-02-14 08:14:11
      “日掙千元”扛樓小伙回家陪爺爺過年:去年賺了約35萬,花20萬買了車,特意早點回家

      “日掙千元”扛樓小伙回家陪爺爺過年:去年賺了約35萬,花20萬買了車,特意早點回家

      大風新聞
      2026-02-13 10:55:04
      太突然!資本大佬李兆廷,被公安拘留!他是石家莊前首富,身家曾超200億元,此前因欺詐發行等被罰5.9億元并終身市場禁入

      太突然!資本大佬李兆廷,被公安拘留!他是石家莊前首富,身家曾超200億元,此前因欺詐發行等被罰5.9億元并終身市場禁入

      揚子晚報
      2026-02-14 07:33:59
      恒基地產主席李家誠控告女星周秀娜

      恒基地產主席李家誠控告女星周秀娜

      每日經濟新聞
      2026-02-13 20:13:06
      2026-02-14 09:27:00
      未盡研究 incentive-icons
      未盡研究
      新能源、人工智能、合成生物、地緣X
      303文章數 62關注度
      往期回顧 全部

      科技要聞

      獨家探訪蔡磊:答不完的卷子 死磕最后一程

      頭條要聞

      37年懸案告破 香港女總督察被認出是昔日TVB女主播

      頭條要聞

      37年懸案告破 香港女總督察被認出是昔日TVB女主播

      體育要聞

      一年怒虧2個億,庫里和安德瑪的“孽緣”

      娛樂要聞

      大衣哥女兒風光出嫁,農村婚禮超樸素

      財經要聞

      華萊士母公司退市 瘋狂擴張下的食安隱憂

      汽車要聞

      星光730新春促銷開啟 80天銷量破2.6萬臺

      態度原創

      家居
      教育
      旅游
      親子
      本地

      家居要聞

      中古雅韻 樂韻伴日常

      教育要聞

      內蒙古2026年普惠性幼兒園覆蓋率達到93%以上

      旅游要聞

      早安重慶|“龍”游古鎮【2月14日】

      親子要聞

      爸爸哄睡,就是這么自信! 網友:寶寶這個笑也太治愈了~ #睡個好覺

      本地新聞

      下一站是嘉禾望崗,請各位乘客做好哭泣準備

      無障礙瀏覽 進入關懷版