<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      中國AI編程面臨殘酷競爭,OpenAI推出1000token/秒的Codex-Spark |以Agent為馬

      0
      分享至

      當(dāng)AI正在能替人類編程數(shù)個(gè)小時(shí)甚至數(shù)天,編程的速度就愈發(fā)關(guān)鍵;當(dāng)多個(gè)智能體協(xié)作完成更加復(fù)雜的任務(wù),延時(shí)就變得更加不能容忍。

      在推出GPT-5.3-Codex之后一周,OpenAI即推出Codex-Spark。這個(gè)輕量版,可以實(shí)現(xiàn)即時(shí)編程,速度達(dá)到1000token/秒。這也是OpenAI首個(gè)運(yùn)行在英偉達(dá)GPU競爭對手Cerebras芯片上的模型。

      隨著模型功能的日益強(qiáng)大,交互速度顯然成為了瓶頸。這樣的速度,對于長程工作、動輒耗費(fèi)成上億token的智能體來說,會帶來產(chǎn)品的差異性競爭力。

      以O(shè)penAI為代表的美國前沿AI實(shí)驗(yàn)室,進(jìn)一步抬高競爭門檻,用新一代更強(qiáng)的算力,訓(xùn)練更強(qiáng)大的模型,持續(xù)擴(kuò)展性能邊界,并創(chuàng)造出更好的用戶體驗(yàn)。Blackwell大規(guī)模上市成為主流,TPU-7e即將量產(chǎn)推出,以及更快速的推理芯片如Groq、Cerebras等,正在加快部署。中國的開源AI軍團(tuán),要快馬加鞭了。

      “響應(yīng)速度即產(chǎn)品”

      OpenAI開始用算力與模型協(xié)同,加入AI編程的殘酷競爭。Codex-Spark運(yùn)行在Cerebras的芯片上;雙方宣布合作也僅僅一個(gè)月,即推出首個(gè)模型。Cerebras 的創(chuàng)始人兼CEO Andrew Feldman稱,Codex-Spark 是為實(shí)時(shí)軟件開發(fā)而打造的。“在編程領(lǐng)域,響應(yīng)速度本身就是產(chǎn)品。這不是“錦上添花”,而是剛需。”

      Codex-Spark針對定向代碼修改、邏輯調(diào)整和前端迭代進(jìn)行了優(yōu)化,為開發(fā)者提供幾乎即時(shí)的反饋,讓他們保持在高效的心流狀態(tài)中——這對于10X甚至100X的人才來說,具有極高的經(jīng)濟(jì)價(jià)值。


      OpenAI提出了馬年工作重心:提高數(shù)據(jù)中心容量,強(qiáng)化端到端用戶體驗(yàn),并部署更大的前沿模型。

      如OpenAI所說,其最新的前沿模型在執(zhí)行長時(shí)間運(yùn)行的任務(wù)方面展現(xiàn)出優(yōu)勢,無需人工干預(yù)即可自主運(yùn)行數(shù)小時(shí)、數(shù)天甚至數(shù)周。這樣的話,低延時(shí)可以直接縮短任務(wù)完成的時(shí)間,轉(zhuǎn)化為經(jīng)濟(jì)價(jià)值。

      Codex-Spark 成為首個(gè)專為實(shí)時(shí)編程而設(shè)計(jì)的模型,提供128k的上下文窗口,并且僅支持文本。在研究預(yù)覽期間,Codex-Spark 將擁有獨(dú)立的速率限制,其使用量不計(jì)入標(biāo)準(zhǔn)速率限制。但是,當(dāng)需求量較高時(shí),用戶可能會遇到訪問受限或臨時(shí)排隊(duì)的情況,“因?yàn)槲覀冃枰胶獠煌脩舻目煽啃浴!?/p>

      速度即智能

      Codex-Spark 針對交互式工作進(jìn)行了優(yōu)化,在這種工作環(huán)境中,低延遲與智能同樣重要。用戶可以與模型實(shí)時(shí)協(xié)作,在模型運(yùn)行過程中隨時(shí)中斷或重定向它,并快速迭代,獲得近乎實(shí)時(shí)的響應(yīng)。由于 Codex-Spark 注重速度,因此其默認(rèn)工作方式非常輕量級:它只進(jìn)行最少的、有針對性的編輯,并且除非用戶口主動要求,否則不會自動運(yùn)行測試。

      Codex-Spark 運(yùn)行在 Cerebras 的晶圓級引擎(Wafer Scale Engine)3上,這是一款專為高速推理而打造的 AI 加速器,為 Codex 提供了一個(gè)優(yōu)先降低延遲的服務(wù)層。OpenAI與 Cerebras 合作,還將把這條低延遲路徑添加到其他服務(wù)器相同的生產(chǎn)服務(wù)堆棧中,使其能夠在 Codex 上無縫運(yùn)行,并為支持未來的模型做好準(zhǔn)備。

      OpenAI特意說明,GPU 仍然是其訓(xùn)練和推理流程的基礎(chǔ),能夠提供最具成本效益的token,適用于廣泛的應(yīng)用。Cerebras 則在此基礎(chǔ)上更進(jìn)一步,在對延遲要求極低的工作流程中表現(xiàn)更好,能夠縮短端到端循環(huán),使 Codex 在迭代過程中響應(yīng)更加迅速。GPU 和 Cerebras 可以結(jié)合使用,針對單個(gè)工作負(fù)載實(shí)現(xiàn)最佳性能。

      Codex 將擁有快慢結(jié)合的兩種互補(bǔ)模式:一種是用于長期推理和執(zhí)行的模式,另一種是用于快速迭代的實(shí)時(shí)協(xié)作模式。隨著時(shí)間的推移,這兩種模式將會融合,既讓用戶保持緊密的交互循環(huán),又能將耗時(shí)較長的任務(wù)委托給后臺運(yùn)行的子代理;或者,當(dāng)需要兼顧廣度和速度時(shí),它還可以將任務(wù)并行分配給多個(gè)模型,因此無需預(yù)先選擇單一模式。

      關(guān)于Cerebras


      2015年創(chuàng)立,設(shè)計(jì)的處理器,實(shí)現(xiàn)了單晶圓級的計(jì)算、內(nèi)存和互連架構(gòu)。比H100快10-20倍,在Mistral, Perplexity等模型上使用,速度達(dá)到1000-1200token/秒。

      為什么WSE架構(gòu)在速度上碾壓GPU? GPU將模型權(quán)重保存在 HBM 中,每生成一個(gè) token,整個(gè)模型需要通過內(nèi)存總線傳輸。受限于帶寬瓶頸,無論計(jì)算能力,吞吐量都限制在 200-300 tps 左右。而Cerebras 的晶圓級引擎足夠大,可以將整個(gè)模型存儲在芯片上,無需外部內(nèi)存,也無需總線。權(quán)重和計(jì)算都位于同一位置,能實(shí)現(xiàn)2500+ tps 的吞吐量。


      目前大模型的推理已經(jīng)成為瓶頸。訓(xùn)練展現(xiàn)了人工智能的顯著突破,但推理的成本決定了其經(jīng)濟(jì)可行性,維護(hù)和使用前沿模型成本高昂,OpenAI每1美元收入需要3美元成本,急需建立推理的經(jīng)濟(jì)性,不僅需要token的數(shù)量,更需要token的質(zhì)量,即所能創(chuàng)造的經(jīng)濟(jì)價(jià)值,而低延遲是目前在智能體長程任務(wù)中比較迫切的需求。

      2026正是推理定制芯片戰(zhàn)爭爆發(fā)之年,TPU, Grok(LPU),Cerebras等。每家前沿AI實(shí)驗(yàn)室仍然需要GPU滿足基本的訓(xùn)練推理需求,但是在延遲、總擁有成本(TCO)、功耗等方面的競爭,其差異化將主要通過ASIC定制推理芯片實(shí)現(xiàn)。英偉達(dá)花了200億美元將推理芯片初創(chuàng)企業(yè)Groq的核心團(tuán)隊(duì)買下,也是為了把它的護(hù)城河拓得更寬、掘得更深。

      Andrew Feldman說:當(dāng)推理足夠快時(shí),全新的市場將隨之打開。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      局面升級,大批導(dǎo)彈將抵臺!賴清德選擇了不歸路,解放軍戰(zhàn)艦回防

      局面升級,大批導(dǎo)彈將抵臺!賴清德選擇了不歸路,解放軍戰(zhàn)艦回防

      攬星辰入夢
      2026-04-26 23:52:27
      初中的幾個(gè)潛規(guī)則:初一成績就中下,甚至倒數(shù)的,基本跟高中無緣

      初中的幾個(gè)潛規(guī)則:初一成績就中下,甚至倒數(shù)的,基本跟高中無緣

      好爸育兒
      2026-04-20 15:00:49
      炸穿臺灣政壇!蔣友松強(qiáng)行遷走兩蔣懸棺,半世紀(jì)漂泊終要?dú)w鄉(xiāng)

      炸穿臺灣政壇!蔣友松強(qiáng)行遷走兩蔣懸棺,半世紀(jì)漂泊終要?dú)w鄉(xiāng)

      陳漎侃故事
      2026-04-14 17:28:18
      淚目 趙心童曬兒時(shí)與丁俊暉合照:偶像暉哥讓我加油 你也要加油啊

      淚目 趙心童曬兒時(shí)與丁俊暉合照:偶像暉哥讓我加油 你也要加油啊

      風(fēng)過鄉(xiāng)
      2026-04-27 06:15:09
      湯姆斯杯:兩大男雙降維打擊,李詩灃橫掃楊燦,國羽4-1加拿大

      湯姆斯杯:兩大男雙降維打擊,李詩灃橫掃楊燦,國羽4-1加拿大

      釘釘陌上花開
      2026-04-27 17:46:40
      5月1日起,銀行有10-50萬存款的人,這5個(gè)消息別錯(cuò)過!

      5月1日起,銀行有10-50萬存款的人,這5個(gè)消息別錯(cuò)過!

      老特有話說
      2026-04-27 17:40:16
      中國裁判驕傲 46歲馬寧曬亞足聯(lián)獎(jiǎng)牌 嘲諷沙特媒體:這次真回國了

      中國裁判驕傲 46歲馬寧曬亞足聯(lián)獎(jiǎng)牌 嘲諷沙特媒體:這次真回國了

      風(fēng)過鄉(xiāng)
      2026-04-27 18:34:41
      055萬噸大驅(qū)直面日艦,試射鷹擊-20震懾力十足

      055萬噸大驅(qū)直面日艦,試射鷹擊-20震懾力十足

      失我者永失qq
      2026-04-27 22:22:20
      新版人民幣已落地,紙幣將何去何從?蘇州試點(diǎn)帶你揭開真相

      新版人民幣已落地,紙幣將何去何從?蘇州試點(diǎn)帶你揭開真相

      流史歲月
      2026-04-27 16:30:08
      空房交物業(yè)費(fèi)合理嗎?2026年物業(yè)費(fèi)新規(guī):這4種情況一分不掏

      空房交物業(yè)費(fèi)合理嗎?2026年物業(yè)費(fèi)新規(guī):這4種情況一分不掏

      老特有話說
      2026-04-15 15:11:16
      中國汽車市場份額:法系0.2%,韓系1%,美系6.9%,日系13%

      中國汽車市場份額:法系0.2%,韓系1%,美系6.9%,日系13%

      狐貍先森講升學(xué)規(guī)劃
      2026-04-21 09:30:03
      進(jìn)攻效率高到離譜!馬刺應(yīng)該給3D鋒線大將多一些出手機(jī)會?

      進(jìn)攻效率高到離譜!馬刺應(yīng)該給3D鋒線大將多一些出手機(jī)會?

      稻谷與小麥
      2026-04-27 22:49:52
      8+11+8!NBA首輪最讓人失望球星誕生,2.89億美金頂薪要打折了

      8+11+8!NBA首輪最讓人失望球星誕生,2.89億美金頂薪要打折了

      世界體育圈
      2026-04-27 21:36:54
      心梗去世的人越來越多?醫(yī)生再次強(qiáng)調(diào):寧可打打牌,也別做這6事

      心梗去世的人越來越多?醫(yī)生再次強(qiáng)調(diào):寧可打打牌,也別做這6事

      醫(yī)學(xué)科普匯
      2026-04-27 19:55:08
      26歲網(wǎng)壇冰美人罕見暴怒 質(zhì)疑鄭欽文ACE出界 與主裁爭吵 全場狂噓

      26歲網(wǎng)壇冰美人罕見暴怒 質(zhì)疑鄭欽文ACE出界 與主裁爭吵 全場狂噓

      我愛英超
      2026-04-27 06:24:59
      回顧遼寧一廠長邀15名歌廳舞女做客,喝完酒后,將15人沖進(jìn)下水道

      回顧遼寧一廠長邀15名歌廳舞女做客,喝完酒后,將15人沖進(jìn)下水道

      談史論天地
      2026-04-27 15:00:03
      我給保姆兩年漲薪五次,她臨別提醒:太太,你最好看看天花板上面

      我給保姆兩年漲薪五次,她臨別提醒:太太,你最好看看天花板上面

      千秋文化
      2026-04-25 20:32:18
      林芳兵北京電影節(jié)上引熱議!在劇組差點(diǎn)離世,丈夫兒子是她的驕傲

      林芳兵北京電影節(jié)上引熱議!在劇組差點(diǎn)離世,丈夫兒子是她的驕傲

      娛說瑜悅
      2026-04-27 16:06:12
      蘇州一對情侶,談了7年,女子提了18次分手,分手后在街頭痛哭!

      蘇州一對情侶,談了7年,女子提了18次分手,分手后在街頭痛哭!

      川渝視覺
      2026-04-17 22:13:14
      菲律賓的求援來了!萬萬沒想到生死關(guān)頭,中方潑了一盆冷水

      菲律賓的求援來了!萬萬沒想到生死關(guān)頭,中方潑了一盆冷水

      紀(jì)中百大事
      2026-04-26 12:19:41
      2026-04-27 23:07:00
      未盡研究 incentive-icons
      未盡研究
      新能源、人工智能、合成生物、地緣X
      365文章數(shù) 63關(guān)注度
      往期回顧 全部

      科技要聞

      DeepSeek V4上線三天,第一批實(shí)測出來了

      頭條要聞

      水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險(xiǎn)

      頭條要聞

      水庫放水21人被困下游河灘 有人讓家人踩肩頭爬樹避險(xiǎn)

      體育要聞

      最抽象的天才,正在改變瓜迪奧拉

      娛樂要聞

      黃楊鈿甜為“耳環(huán)風(fēng)波”出鏡道歉:謠言已澄清

      財(cái)經(jīng)要聞

      Meta 140億收購Manus遭中國發(fā)改委否決

      汽車要聞

      不那么小眾也可以 smart的路會越走越寬

      態(tài)度原創(chuàng)

      家居
      親子
      藝術(shù)
      健康
      公開課

      家居要聞

      江景風(fēng)格 流動的秩序

      親子要聞

      教孩子防侵犯誤區(qū):對熟悉的壞人孩子不會害怕和恐懼!

      藝術(shù)要聞

      你絕對想不到,攝影能讓她成為女神!

      干細(xì)胞如何讓燒燙傷皮膚"再生"?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 久久91精品久久91综合| 亚洲精品区| 九九精品在线观| 豆国产97在线 | 亚洲| 久久亚洲av成人无码软件| 日本a网| 麻麻丰满的大屁股| 色色视频在线观看| 国产一级精品毛片基地| 亚洲欧洲美洲无码精品va| 白人无码| 无码帝国www无码专区色综合| wwwjizzjizz| 国产偷国产偷亚洲高清午夜| 一区二区丝袜美腿视频| 97免费人妻在线视频| 国产成人精选视频在线观看| 大英县| 男人扒女人添高潮视频| 99精品人妻| 揄拍成人国产精品视频| 国产精品国产三级国产试看| 苍井空无码丰满尖叫高潮| 亚洲人午夜精品射精日韩| 国产成人精品一区二区秒拍1o| 暖暖 在线 日本 免费 中文| 荔浦县| 中文字幕人成乱码熟女| 淫射网| 亚洲国产精品久久久久久久| 欧美精品久久久久久久久46P| 国产农村妇女aaaaa视频| 制服丝袜无码在线| 欧洲av在线| 一区二区AV| 国产欧美性成人精品午夜| 久久久国产精品消防器材| 变态另类AV| 精久国产av一区二区三区孕妇| 亚洲午夜理论片在线观看| 男人的天堂av社区在线|