<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      OpenAI的命門,決定了大模型公司的未來

      0
      分享至


      如果Scaling Law是指導大模型能力提升最重要的標尺,那么“算力成本控制”就是大模型行業(yè)發(fā)展和商業(yè)化的基石。

      年初DeepSeek在國外開源社區(qū)首先爆火,一個很重要的原因就是,DeepSeek幾乎將同性能模型的推理算力和訓練算力成本都降到了10%以內(nèi)。MoE架構也在GPT-4發(fā)布之后,逐漸取代了稠密架構,成為了幾乎所有大模型開發(fā)商的默認選項,最核心的原因也是能夠有效降低模型推理的算力成本。

      而OpenAI伴隨著GPT-5發(fā)布第一次與用戶見面的“路由(routing)”功能,設計本意也是代替用戶來把簡單問題匹配到低消耗模型,復雜問題匹配到能力和算力消耗高的推理模型,從而有效提升用戶體驗和算力效率,但卻變成AI圈最知名的“降本增笑”事件。


      即便是GPT-5發(fā)布接近了一個月,OpenAI還是沒有能讓所有用戶滿意,網(wǎng)友依然還在吐槽,GPT-5沒有辦法解決一些很簡單的問題。雖然隨著OpenAI回滾了GPT-4o,還讓用戶能夠手動在推理模型和基本模型間切換,讓大多數(shù)用戶開始同意OpenAI宣稱的“GPT-5性能明顯強于之前的模型”,但是Sam Altman自己也沒有辦法否認,GPT-5的發(fā)布確實是漏洞百出。


      而造成翻車最直接的原因,就是他們強推的路由功能沒有能夠將用戶的預期和相應的模型能力匹配好。

      01

      那么問題來了,為什么OpenAI要冒著GPT-5“發(fā)布即翻車”的風險,也要強推路由功能?


      第一個最直接的原因就是,在GPT-5發(fā)布之前,OpenAI并行推出了5個以上的模型,讓用戶能夠根據(jù)自己需求來選擇合適的模型。隨著模型越來越多,別說普通用戶了,就是ChatGPT的重度用戶,有時候也很難決定使用哪個模型是最合適自己當前任務的。


      對于立志于將ChatGPT打造成為AI時代超級APP的OpenAI,不可能允許這樣的情況持續(xù)存在。特別是對于大量沒有接觸過大模型的普通用戶,替他們針對不同的任務選擇合適的模型,是OpenAI在某一個時間點必須要做的事情。

      而另一個更深層次的原因在于,從算力成本的角度出發(fā),自從推理模型出現(xiàn)之后,每一次對于大模型的詢問,都需要在推理模式和非推理模式之間進行一次選擇。而這種調配“深度思考”能力的效率,決定了大模型產(chǎn)品對于算力的使用效率。

      根據(jù)學術界對于推理模型和非推理模型的研究結果,推理模型和飛推理模型的算力差異巨大,可能達到5-6倍。對于復雜問題,通過思維鏈等技術進行推理后內(nèi)部消耗的推理token數(shù)可能高達上萬個。


      而在延遲上,推理過程和非推理過程的差異就更加巨大了,根據(jù)OpenAI自己發(fā)布的數(shù)據(jù),使用推理模型回答復雜問題所需要的時間,可能是使用非推理模型的60倍以上。

      而就算對于很多需要復雜推理的任務在消耗了巨大的算力以及大量的時間之后, 之后給出的結果和準確性差異往往就在5%左右。為了這5%的性能提升,消耗多大的算力合適呢?


      做一個簡單的算術題,如果OpenAI將所有任務都默認使用推理模型來完成,路由功能能夠幫助OpenAI識別出10%的問題可以通過簡單的非推理模型完成,就可能將算力成本降低8%(推理非推理算力比值為5:1)。

      如果將這個比例進一步提高,能夠降低的算力成本將更加可觀。對于OpenAI這樣一個需要服務數(shù)億用戶,而且算力供應依然非常緊張的公司來說,路由功能是否能發(fā)揮作用可以說關系到自身商業(yè)模式是否可持續(xù)的核心能力。

      在行業(yè)層面,第三方平臺(如 OpenRouter)把“自動路由與回退(fallback)”做成基建能力:當主模型擁塞、限流或內(nèi)容拒絕時,按策略自動切換到次優(yōu)模型,以穩(wěn)定用戶體驗。微軟的Azure這樣的AI算力云供應商,也將不同模型之間的路由能力作為AI云計算的一大賣點。


      也許,GPT-5發(fā)布之后,對于OpenAI來說最重要的事情就是在“質量-延遲-成本”的三角中尋找每條請求的最優(yōu)平衡點。而目前官方對 GPT-5 的定位與“內(nèi)置思考(built-in thinking)”敘事,實際上就是把“路由+推理強度”做成默認能力,并在 ChatGPT 端通過“Auto/Fast/Thinking”給了用戶一定程度的可見與可控性。

      02

      為大模型打造一個高效的路由功能到底有多難?

      這個問題,外媒在一篇報道中向UIUC的一名計算機專業(yè)的助理教授求證,得到的回答是“可能是一個亞馬遜推薦系統(tǒng)級別的問題,需要大量專家努力工作數(shù)年時間才能獲得一個滿意的結果。”模型系統(tǒng)層面的路由功能本質是“多目標+強約束”的工程問題。 路由不是只拼準確率,還要在質量、延遲、成本、配額/峰值容量、成功率之間做實時優(yōu)化。


      而且從理論上來說,語義級別的路由功能在效率上來看,遠遠不是這問題的最優(yōu)解。DeepSeek在上周放出的DeepSeek V3.1就在嘗試將推理模型和非推理模型混合起來,在一個更深層次上打造出一個效率更高的路由系統(tǒng),從而從根本上提高大模型的“推理-非推理”的選擇效率。

      根據(jù)網(wǎng)友體驗之后的感受,新的混合推理模型相比之前R1有著更快的思考速度:相較于 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短的時間內(nèi)得出答案。

      并且在回答性能相似的前提下,輸出長度有明顯的下降:新的推理模型在簡單問題上,推理過程有約10%以上的縮短。正式輸出的部分,新模型大幅精簡,平均僅有1000字,比R1 0528的平均2100字的水平提高了接近一倍。

      但是另一方面,新的混合推理模型也爆出了一些不太穩(wěn)定的問:比如會不時的在很多輸出中出現(xiàn)莫名其妙的“極”bug:答案中出現(xiàn)很多完全不相關的“極”


      而且在R1上就存在的中英夾雜的情況似乎變得更加嚴重了,就像一個剛回國不久的留學生,在很多中文任務中會顯得很出戲。

      即使像DeepSeek這樣的國內(nèi)最頂尖的大模型團隊,將“推理-非推理”選擇功能內(nèi)置到模型內(nèi)部,模型的穩(wěn)定性上也會出現(xiàn)一定程度的問題。而OpenAI和DeepSeek在自己各自首個推出的試圖高效調度“深度思考”能力的模型上都出現(xiàn)了不同程度的翻車,側面反應出要處理好這個問題的難度。

      03

      提高效率的另一面,是OpenAI依然處于對于算力的“極度渴求”的狀態(tài)中。


      年初DeepSeekV3和R1的推出引發(fā)的全世界對于英偉達等算力供應商未來前景的擔憂,在短短幾個月之后就演變成了“AI成本悖論”——token單價下降但是模型的性能不斷成長,使得原本交由模型處理本來會顯得不經(jīng)濟的任務也能交給大模型處理,模型能夠處理的任務將更多樣與復雜,從而會進一步推高token總量的需求。

      OpenAI 正在推進代號Stargate的基礎設施擴張計劃:2025 年 7 月,OpenAI 與 Oracle 宣布在美國新增 4.5 GW 數(shù)據(jù)中心能力。


      昨天,外媒也報道OpenAI 正物色印度當?shù)睾献骰锇椋⒂媱澰谛碌吕镌O立辦公室,把印度(其第二大用戶市場)的用戶增長與本地算力配置對接起來,在印度建設至少1Gw規(guī)模的數(shù)據(jù)中心。


      “AI成本悖論”一方面不斷推高英偉達和AI云服務商的業(yè)績,同時也對像能夠有效降低模型算力需求的“路由”功能提出了更高的要求。

      Sam Altman 反復強調“2025 年底上線的GPU 超過 100 萬片”的目標,且把長遠愿景瞄準“一億 GPU 量級”。這類表態(tài)從側面說明:即便推理單價在下降,更復雜的任務與更高的調用量讓大模型的“總賬單”并不會自動下降——必須靠路由把昂貴的推理時段“留給更需要的人”。

      如果從大模型的第一性原理出發(fā),所有大模型公司追求的最終極標準,就是不斷提升“算力兌換智力”的效率。而高效調度“深度思考”的能力,在推理大模型時代某種程度決定了大模型公司能否在系統(tǒng)和商業(yè)效率以及用戶體驗上領先全行業(yè)。


      歡迎在評論區(qū)留言~
      如需開白請加小編微信:dongfangmark


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中國網(wǎng)貸技術全球領先,為啥出海收割老外卻慘敗?

      中國網(wǎng)貸技術全球領先,為啥出海收割老外卻慘敗?

      流蘇晚晴
      2025-12-14 16:17:52
      國足有戲!南美足聯(lián)主席再次呼吁:下下屆世界杯擴軍到64隊!

      國足有戲!南美足聯(lián)主席再次呼吁:下下屆世界杯擴軍到64隊!

      邱澤云
      2025-12-15 16:02:35
      中國“摸著石頭過河”數(shù)十年,“石頭”終于快被摸完了

      中國“摸著石頭過河”數(shù)十年,“石頭”終于快被摸完了

      朔方瞭望
      2025-11-08 11:29:44
      身價上億有什么用?68歲趙本山如今家庭情況,給中老年人提了個醒

      身價上億有什么用?68歲趙本山如今家庭情況,給中老年人提了個醒

      白面書誏
      2025-12-08 13:24:49
      臺海觀瀾 民進黨成了“民禁擋”,賴清德成了“賴獨裁”

      臺海觀瀾 民進黨成了“民禁擋”,賴清德成了“賴獨裁”

      經(jīng)濟觀察報
      2025-12-15 11:05:39
      賈躍亭和仨兒女美國團聚,甘薇給他準備了桃酥,賈總樂開了花

      賈躍亭和仨兒女美國團聚,甘薇給他準備了桃酥,賈總樂開了花

      阿廢冷眼觀察所
      2025-12-03 10:52:47
      中國足球留洋利好:大黑將志首次成為日本職業(yè)聯(lián)賽主教練!

      中國足球留洋利好:大黑將志首次成為日本職業(yè)聯(lián)賽主教練!

      邱澤云
      2025-12-15 16:08:36
      700億騙局曝光,專門收割有錢人,上海貴酒到底有多瘋狂?

      700億騙局曝光,專門收割有錢人,上海貴酒到底有多瘋狂?

      毒sir財經(jīng)
      2025-12-14 23:15:34
      86年我放走一個越南女兵,33年后我剛出越南機場就被一排軍車接走

      86年我放走一個越南女兵,33年后我剛出越南機場就被一排軍車接走

      蕭竹輕語
      2025-12-05 17:38:25
      大回暖真來了:南方將迎春天或初夏般溫暖,新一輪大降溫雨雪已醞釀

      大回暖真來了:南方將迎春天或初夏般溫暖,新一輪大降溫雨雪已醞釀

      中國氣象愛好者
      2025-12-15 23:34:11
      東盟也要變天了,印尼終于清醒,柬埔寨被摁著摩擦不是偶然的,不是柬王室的事,柬埔寨洪森是掌控柬埔寨的實權人物,王室被架空了?

      東盟也要變天了,印尼終于清醒,柬埔寨被摁著摩擦不是偶然的,不是柬王室的事,柬埔寨洪森是掌控柬埔寨的實權人物,王室被架空了?

      軍霆說
      2025-12-16 01:18:17
      他在失蹤網(wǎng)站看到和自己一模一樣的臉,竟由此破獲30多年謎案…

      他在失蹤網(wǎng)站看到和自己一模一樣的臉,竟由此破獲30多年謎案…

      英國那些事兒
      2025-12-14 23:06:36
      宗慶后DNA被調取,3個私生子力證血緣關系,宗慶后72歲生小兒子?

      宗慶后DNA被調取,3個私生子力證血緣關系,宗慶后72歲生小兒子?

      削桐作琴
      2025-07-14 20:20:04
      冬煮蘋果水,內(nèi)熱自己退!3種神仙搭配,清內(nèi)熱、養(yǎng)脾胃、補津液

      冬煮蘋果水,內(nèi)熱自己退!3種神仙搭配,清內(nèi)熱、養(yǎng)脾胃、補津液

      江江食研社
      2025-12-13 16:30:08
      最新消息!廣東再發(fā)消費券

      最新消息!廣東再發(fā)消費券

      廣東發(fā)布
      2025-12-15 21:25:31
      所有人不許吃肉?準大一素食女生發(fā)文求助,網(wǎng)友:誰做她室友誰倒霉

      所有人不許吃肉?準大一素食女生發(fā)文求助,網(wǎng)友:誰做她室友誰倒霉

      趣筆談
      2025-08-18 15:51:25
      中國凍結巖崎茂在華資產(chǎn);同時不再向日本提供熊貓

      中國凍結巖崎茂在華資產(chǎn);同時不再向日本提供熊貓

      跟著老李看世界
      2025-12-16 00:01:14
      12月事業(yè)財運雙雙登頂?shù)男亲鵗OP3!

      12月事業(yè)財運雙雙登頂?shù)男亲鵗OP3!

      朗威談星座
      2025-12-16 06:50:21
      洪森危險了,不在佩通坦報復,而是馬仔陳志的150億比特幣被抄!

      洪森危險了,不在佩通坦報復,而是馬仔陳志的150億比特幣被抄!

      南宮一二
      2025-10-26 07:52:25
      遼寧最多領先21分吊打衛(wèi)冕冠軍 威爾斯成王牌王嵐嵚填趙繼偉空缺

      遼寧最多領先21分吊打衛(wèi)冕冠軍 威爾斯成王牌王嵐嵚填趙繼偉空缺

      醉臥浮生
      2025-12-15 21:40:03
      2025-12-16 08:11:00
      直面派 incentive-icons
      直面派
      講述值得講述的真實故事
      239文章數(shù) 236關注度
      往期回顧 全部

      科技要聞

      L3車型可以上路了!重慶北京兩款車獲批

      頭條要聞

      天津警察學院兩干部論文查重率超70% 校方:官方?jīng)]認定

      頭條要聞

      天津警察學院兩干部論文查重率超70% 校方:官方?jīng)]認定

      體育要聞

      戰(zhàn)勝完全體雷霆,馬刺“瘋狂動物城”只是半成品

      娛樂要聞

      何晴告別式現(xiàn)場,前夫許亞軍雙眼泛紅?

      財經(jīng)要聞

      新農(nóng)合漲到400元 農(nóng)民斷繳背后的扎心真相

      汽車要聞

      主駕配按摩還可選6座 新款捷途X90PRO售13.59萬起

      態(tài)度原創(chuàng)

      教育
      時尚
      本地
      家居
      公開課

      教育要聞

      年薪30萬+!數(shù)據(jù)工程師必學3大專業(yè)

      外套+半身裙封神穿搭!6款顯瘦神器保暖不臃腫,冬天美得出彩

      本地新聞

      云游安徽|阜陽三朝風骨,傳承千年墨香

      家居要聞

      溫暖色調 大空間不冷清

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久av高潮av无码av喷吹| 亚洲国产精品无码久久久秋霞1 | 欧美一线天| 喜德县| 欧美国产日韩久久mv| 亚洲精品一区国产| 后入内射国产一区二区| 欧美色欧美亚洲高清在线视频| 中文字幕乱码亚洲中文在线| 人妻aⅴ久久久北条麻妃| aⅴ天堂αv国产| 中文乱码人妻系列一区二区| 国产精品理论片| 亚洲一区AV| 临江市| 国产高清在线a视频大全| 亚洲熟女综合一区二区三区| 欧美国产日韩在线三区| 鲁久久久| 国产欧美久久久久久| 欧美成人精精品一区二区三区| 久久男人av资源网站无码软件| 国产精品自在自线视频| 亚洲精品影院| 久久久无码人妻精品无码| 乱人伦精品视频在线观看| 久久精品国产久精国产| 久久久久久AV| 人人妻人人妻人人片av| 精品少妇无码av无码专区| 中文字幕亚洲在线| 亚州成人小说| 欧日韩无套内射变态| 亚洲中文精品久久久久久不卡| 一本色道久久88加勒比中文字幕| 友谊县| 乱色熟女综合一区二区三区| 日韩激情成人| 日韩福利在线视频| 亚洲精品成人AV无码| 少妇熟女久久综合网色欲|