<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      清華教授翟季冬:Benchmark正在「失效」,智能路由終結大模型選型亂象

      0
      分享至



      「選擇悖論」正在AI模型與算力世界里上演。

      作者丨趙之齊

      編輯丨包永剛

      北京一月的初雪落下前,我們在清華見到了翟季冬教授。他手持保溫杯,說話很利落,即便一邊思考一邊敘述,言辭間也幾乎沒有停頓、沒有模糊地帶。

      這位曾帶隊拿下15次世界超算冠軍的清華計算機系長聘教授,此刻正在拆解一個行業怪象:為什么在大模型參數狂飆、算力價格下探的當下,用戶的AI落地負擔卻越來越重?

      他指出,如今Benchmark(基準測試)上的高分,在比對用戶真實需求時不一定管用,有時,同個模型在不同MaaS平臺上跑出來的效果可能差異巨大,因為部分服務商為了降低成本,會對模型進行“閹割級”量化。而面對眼花繚亂的MaaS供應商,用戶要在性能、價格與穩定性之間做取舍,往往光調研一輪市場報價,就已耗盡精力。

      “把選型的主動權完全交給用戶,其實是很大的挑戰”, 翟季冬直言。這種“選擇悖論”不僅折磨著開發者,更在吞噬企業的利潤——對于企業來說,降本增效的核心可能并非追求最頂尖的模型,而是如何調度能力恰當的模型,讓昂貴的大模型處理復雜指令,讓輕量的小模型應付日常任務。

      洞察到這一痛點后,由翟季冬的幾位畢業學生發起的AI Infra廠商——清程極智,開發出智能路由產品AI Ping(AI 評),希望成為算力界的“大眾點評”。

      他們將分散的性能數據系統性整理,并收集用戶的使用習慣,公開不同模型與供應商的測評數據,并給用戶推薦合適的、高性價比方案。翟季冬認為,這種產品形態,有助于撬動算力行業的馬太效應——他相信,當數據越集中,模型的選擇就越精準;選擇越精準,用戶需要付出的成本就越低。


      翟季冬

      與我們交流時,盡管判斷明確,翟季冬說話時的語氣卻始終都是溫和的。他走進會議室時,手上拎著提前為我們備好的飲用水;對話結束后,還為北京凜冽的寒潮給我們來訪帶來的困擾而“致歉”。待人的認真,也換來了學生們的真心相待——在許多博士生習慣將導師稱為“老板”的當下,他的博士生們仍堅持稱呼他為“老師”。

      這份溫和的師者風范背后,是他對算力行業叢林法則的洞察。當大模型從實驗室走向萬千企業,性能數據與用戶體驗之間的信息差該如何填平?在國內“重硬輕軟”的ToB市場中,AI Infra團隊又應該如何定位自己的存在?(關于AI Infra生存路徑的探討,歡迎添加作者微信Ericazhao23交流)

      這些問題的答案,都藏在他的娓娓道來里。

      01

      模型選型的隱形賬本:位置、定價與被閹割的精度

      更多的自由和選擇,并不意味著更大的幸福,有限且可比較的選項,反而能提升決策效率與滿意度——這一“選擇悖論”,正在AI模型與算力的世界里上演。

      大模型井噴式發展,每個人手里都握著好幾款“AI助手”。但翟季冬捕捉到一個痛點:現在很多用戶上網挑選模型,能參考的只有很標準的Benchmark(基準測試),不少人直接沖著跑分最高的模型去——但最牛的不一定是最合適的。他直言:“模型刷了多少分,并不一定能匹配用戶的真實需求?!?/p>

      究其原因,除了純粹的性能,還有很多因素會影響模型使用體驗。

      供給側上,各家模型供應商的服務響應效果有所差別。以DeepSeek-v3.2模型為例,翟季冬團隊調研發現,國內提供這一API服務的廠商就有幾十家,但他們的API服務吞吐卻覆蓋從15~200 token/s,相差10倍以上;而其支持的輸入輸出長度,也從8k~160k不等,相差了20倍。

      用戶對此其實早有體感:去年初DeepSeek爆火后,一眾服務商紛紛接入其API,很多人用過一輪后卻發現,同樣調用DeepSeek模型、問出相同問題,不同供應商的輸出效果卻天差地別。

      答案很快浮出水面:即便接入同個模型,有的廠商會對模型做激進的量化處理,例如從FP8變成INT4,輸出的表現自然隨之改變。

      服務商的算力部署位置,也會左右模型的調用體驗:同款模型,如果用戶在北京調用,MaaS提供方在上?;蛏钲?,體驗都會有很大差異。

      此外,各玩家定價策略各異,不同階段的促銷活動還會導致成本相差甚遠。

      用戶的需求本身就是多維度的:有的更看重性價比,有的追求穩定性,有的則更在意響應速度。而不同的任務場景,也對應著不同的大模型最優解——

      對于需求是“寫小說”的用戶,模型擅長寫調研報告的能力就毫無意義;而日常查天氣、問穿搭,一個輕量級的小模型也足夠用;可要是解一道復雜的科學難題,就得大參數的模型出馬。

      把選型的主動權完全交給用戶,其實是很大的挑戰”,翟季冬指出。雖然對個人免費用戶而言影響可能甚微,但對企業級用戶來說,會直接引發巨大的成本鴻溝

      同樣的預算,調用大模型可能僅能支持十萬次請求,換成小模型卻能達到百萬次量級。

      理想的情況是:如果能對需求做精細化拆分,讓復雜問題匹配大模型、簡單問題對接小模型,就能實現算力成本的最優解。

      而這些,都是翟季冬和清程極智團隊想解決的問題。

      02

      做算力界的“大眾點評”,終結大模型選型亂象

      瞄準這些行業痛點,清程極智團隊打造出智能路由產品AI Ping(AI評)。

      “AI評的‘評’,就是評測,清程對國內MaaS供應商持續測試——既測同款模型在不同廠商手中的延遲、帶寬表現,也對比不同模型在各家平臺的吞吐效率與價格成本差異”,翟季冬介紹說。

      拆解來看,智能路由的能力分為兩層:一是服務商路由,在眾多API服務提供者中選擇最佳的服務;二是模型路由,在眾多大模型中選擇最佳的模型。

      回顧技術的研發,翟季冬感慨,服務商路由的搭建不算是最難的事,真正難啃的硬骨頭,是如何為用戶精準匹配模型。

      “要給企業的問題精準匹配模型,前提是積累他們的海量歷史數據”,但在初期,數據儲備往往不足、用戶行為畫像模糊,模型的精準選擇很難。

      這個難點,在AI Ping的目標市場——個人開發者和中小企業這個群體里,被進一步放大

      AI Ping團隊發現,這類用戶對產品質量的要求幾乎是要“超出預期”,八十分的水準,在他們眼里幾乎等同于不合格,這讓產品打磨的難度陡增。

      因此,在起初的冷啟動階段,團隊選擇用“笨辦法”突圍:一邊給供應商測試大量數據,用Benchmark測試準確性、延遲帶寬、價格;一邊聯合上下游企業拓展市場,在真實場景中積累用戶、沉淀數據。

      解決了這個問題,另一重考驗隨即出現:面對企業的高吞吐剛需,單一供應商的算力儲備往往難以滿足。這就對平臺提出了兩大要求——強大的算力整合能力,以及國產算力接入通道的打通能力。

      對此,清程極智就在AI Infra上做了大量工作,把“赤兔”推理引擎與AI Ping對接,完成了算力資源的整合調度。


      截圖來自AI Ping網站

      在翟季冬看來,AI Ping很像算力行業的“大眾點評”,給用戶打造一套垂直領域的解決方案。

      這本質上也是一種團購邏輯:聚合海量用戶需求后,清程極智能以更大的體量與算力廠商議價。畢竟,大模型選型的核心命題,始終是成本與效率的平衡。

      “這本身也會形成一種馬太效應”,翟季冬指出,“聚合的用戶越多、收集的數據越豐富,模型匹配的精準度就越高;既能幫助用戶省去更多錢,也能幫算力廠商盤活資源,我們的軟件能力也能借此賦能”。

      從2025年春夏之交籌備至今,歷時近一年,AI Ping終于迎來了正式面市的時刻。

      這種中立的評測甚至成了行業“裁判”:硅基流動創始人袁進輝此前在朋友圈提及,有的用戶分不清其基于國產卡的非pro版與基于國際算力的Pro版的指標差異,于是直接拋出AI Ping的測評結果作佐證。

      “可以去這個網站看各項指標,很靠譜”,袁進輝這樣寫道。

      來自同行的反饋,已側面印證出AI Ping作為風向標的價值。不過,一個更現實的問題也隨之浮現:對于清程極智而言,如何把這種數據影響力在商業上變現?

      03

      AI Ping商業解法:整機與算力雙管齊下

      對話剛開場,被問及“如今Infra行業的普遍焦慮是什么”時,翟季冬的回應直指核心:

      “怎么讓國內AI Infra賺到更多錢?”

      在他看來,商業化的核心邏輯正在逐漸明晰:算力需求是一個非常真實的市場,怎么通過服務軟件把算力有效整合提供給用戶,會是AI Infra行業未來的重要發展方向。

      這一判斷,也支撐起了清程極智的產品布局——大模型訓練智能軟件?!鞍素誀t”、被譽為國產算力部署神器的“赤兔”大模型推理引擎和一站式大模型API評測和調用平臺AI Ping,本質上都是底層算力到用戶端的一個個“出口”。其中,AI Ping便通過整合模型和供應商,把軟件能力賦能到算力上,給用戶提供token和算力。

      這也是清程在這兩年沉淀出來的解法。

      翟季冬評論道,清程極智的核心競爭力是中間軟件層,包括編譯、通信庫、并行加速等技術,基于此,他們逐漸找到了自己的定位:和芯片廠商合作,做其系統軟件之上增量的部分,讓大模型在這些芯片上發揮出極致的效率。

      圍繞這一定位,清程也在探索多種不同的商業化路徑:

      一方面,將軟件與硬件打包為整機服務,針對“買了國產卡卻難落地”的痛點,讓裸機用戶也能做訓練與微調;另一方面,是通過AI Ping等平臺與算力廠商合作,提升國產算力的易用性。

      而在最近與國產芯片公司的廠商交流中,翟季冬也感受到,大家對軟硬件高效協同的重要性已形成共識,“剩下的問題,無非就是這些軟件由誰去做”。

      清程極智聯合創始人師天麾,也觀察到了這種行業認知的轉變。他此前向雷峰網表示:

      “DeepSeek能用極少的算力卡和極低的成本,訓練出如此大規模的模型,主要依靠的是模型架構設計和Infra軟件技術,尤其是他們把大量算力加速類Infra軟件開源后,大家才真正意識到Infra的重要性?!?/p>

      一個顯著標識是,以前他還需要和投資人解釋什么是Infra,進入2025年之后,這一步已經可以省略了。

      但在當下,行業內也流傳著一種擔憂:

      “AI Infra的價值,只存在于國產算力群雄逐鹿階段,一旦算力架構定型、大模型技術收斂,Infra的必要性也會大打折扣?!?/p>

      這也是擺在所有Infra從業者面前共同的問題:下一個能證明自己價值的“地盤”會在哪里?未來如果國產算力逐漸同構,AI Infra還有存在的必要嗎?

      04

      Infra的生命力:架構演進不止,軟件迭代不息

      此前,AI Infra已在架構適配、算子生成、并行通信等領域初試鋒芒,不過,這遠非終點。

      在翟季冬看來,Infra的生命力源于底層架構與上層軟件的雙重迭代:“只要模型還在演進、算力架構還在融合發展,Infra的需求就會持續存在”。

      他指出,即便是英偉達的CUDA生態,底層芯片同構,但由于模型側還沒有完全收斂,推理、后訓練的復雜度仍在提升:

      文生圖、文生視頻等多模態模型還在興起,即將推出的DeepSeek V4,還將引入更多稀疏性相關的技術難題;AI for Science、AI for Engineering等新的應用領域迸發,也在倒逼AI Infra的底層需求發生變革。

      同時,國內算力不僅廠商多,各自的架構也并不統一,這更決定了AI Infra的不可替代性。

      翟季冬分析,海外算力市場的架構相對統一:英偉達與AMD占主導地位,二者的GPU架構均屬于SIMT(單指令多線程),有很強的相似性。

      反觀國內,有的廠商選擇對標英偉達的SIMT架構,有的則主攻SIMD(單指令流多數據流)架構。

      并且,在這幾年里,這兩種架構并非一方絕對壓倒另一方:很多芯片廠商如今都在走架構融合的路線,通過取長補短提升性能,比如華為,開始在SIMD架構里融入SIMT的設計思路;英偉達則正好相反。

      在此基礎上,即便已有比較成熟的Infra項目,例如開源圈里炙手可熱的Triton——這款由OpenAI為英偉達芯片開發的算子生成工具,在適配不同架構的國產芯片時,也必須經過大量本土化改造。

      而未來,隨著推理場景的全面爆發,AI Infra還將迎來新一輪的挑戰。

      翟季冬直言,行業現在普遍面臨一個痛點:芯片的峰值算力與實際利用率之間存在巨大鴻溝。一塊標稱300TFLOPS算力的芯片,在大模型訓練或推理中,實際利用率往往只有10%-20%;即便是英偉達這樣的巨頭,預訓練場景下的算力利用率也僅能達到50%上下。

      進入推理階段后,文字、圖像、視頻等不同任務的算力需求差異顯著,再加上對時延的極高要求,如何針對不同推理場景實現硬件性能的最大化釋放,將是AI Infra未來的核心攻堅方向

      除了這些看得見的產業機遇,翟季冬還在默默探索那些“冷賽道”,比如AI for Science等短期內難見商業價值、但對科技發展至關重要的領域。

      他還與我們分享了一段近期的交流經歷:一位歸國的天文系老師告訴他,射電望遠鏡每天都會產生海量觀測數據,他們需要高效的解決方案,來完成數據的實時處理與算法分析——這無疑對AI Infra的軟硬件協同能力,提出了更高的要求。

      這些眼下難見回報的探索,正藏著AI Infra的本真價值。在翟季冬眼中,這也是Infra行業可以穿越周期、走向未來的底氣。

      作者長期關注AI算力上下游等方向,歡迎添加微信Ericazhao23交流。


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      炸裂!中糧集團春招公告,學歷從大專起步,外語水平居然不設限…

      炸裂!中糧集團春招公告,學歷從大專起步,外語水平居然不設限…

      火山詩話
      2026-01-22 10:40:46
      2-4!乒壇再爆冷門:日本三大世界冠軍被淘汰,張本美和女單四連冠!

      2-4!乒壇再爆冷門:日本三大世界冠軍被淘汰,張本美和女單四連冠!

      好乒乓
      2026-01-24 10:39:08
      大寒時節,民間老話講:“大寒吃三寶,丟掉老棉襖”,是指哪3寶

      大寒時節,民間老話講:“大寒吃三寶,丟掉老棉襖”,是指哪3寶

      江江食研社
      2026-01-24 07:30:06
      太陽報:前西班牙主帥莫雷諾執教過度依賴AI,甚至用AI簽球員

      太陽報:前西班牙主帥莫雷諾執教過度依賴AI,甚至用AI簽球員

      懂球帝
      2026-01-25 06:16:40
      北京下了死命令,2027年底前,所有中小學必須告別“校外配餐”

      北京下了死命令,2027年底前,所有中小學必須告別“校外配餐”

      近史博覽
      2026-01-19 15:32:32
      風向有點不對了!市場開始喊出“去白銀化”,難道風暴要來了嗎?

      風向有點不對了!市場開始喊出“去白銀化”,難道風暴要來了嗎?

      流蘇晚晴
      2026-01-24 20:37:01
      三峽大壩賬本曝光:運行了 20 余年,2500 億投入如今回本了嗎?

      三峽大壩賬本曝光:運行了 20 余年,2500 億投入如今回本了嗎?

      現代小青青慕慕
      2026-01-23 21:35:30
      快船球星哈登回應全明星:一切順其自然&會帶兒子來快船現場觀看

      快船球星哈登回應全明星:一切順其自然&會帶兒子來快船現場觀看

      郭錉包工頭
      2026-01-25 03:41:25
      演員王傳君發文宣布退出

      演員王傳君發文宣布退出

      喬話
      2026-01-22 17:43:06
      萬萬沒想到,丁克大半輩子的張鐸,如今在46歲迎來了人生高光時刻

      萬萬沒想到,丁克大半輩子的張鐸,如今在46歲迎來了人生高光時刻

      胡一舸南游y
      2026-01-14 13:20:09
      最快幾天內,恐要開戰!伊朗革命衛隊開始轉移大量導彈和無人機

      最快幾天內,恐要開戰!伊朗革命衛隊開始轉移大量導彈和無人機

      青青子衿
      2026-01-23 02:15:44
      向美國捐8億被罵叛徒!無錫唐氏21代掌門:我的錢只認文明歸屬

      向美國捐8億被罵叛徒!無錫唐氏21代掌門:我的錢只認文明歸屬

      李砍柴
      2025-07-18 23:42:24
      1-2,聯賽第14遭聯賽第23掀翻,英超前冠軍連續3輪不勝

      1-2,聯賽第14遭聯賽第23掀翻,英超前冠軍連續3輪不勝

      側身凌空斬
      2026-01-25 01:09:21
      上海一大爺在直播間“上頭了”,砸進去10多萬,買回數十條號稱“野生高貨”的手串,突然發現不對勁!

      上海一大爺在直播間“上頭了”,砸進去10多萬,買回數十條號稱“野生高貨”的手串,突然發現不對勁!

      環球網資訊
      2026-01-24 15:33:08
      聞名后世的“桑弘羊之問”,難倒了中國歷代的知識精英!

      聞名后世的“桑弘羊之問”,難倒了中國歷代的知識精英!

      尚曦讀史
      2025-12-19 10:28:06
      PS5暴死新游被LGBT群體嘲諷:這就是"反覺醒"的下場

      PS5暴死新游被LGBT群體嘲諷:這就是"反覺醒"的下場

      游民星空
      2026-01-23 13:13:21
      湖人消息:裁判報告公布,老詹離隊倒計時,戰獨行俠出場更新

      湖人消息:裁判報告公布,老詹離隊倒計時,戰獨行俠出場更新

      冷月小風風
      2026-01-24 10:40:01
      今年,可能是史上最冷清的春節。

      今年,可能是史上最冷清的春節。

      詩詞中國
      2026-01-23 19:24:10
      北京下最后通牒?新加坡連夜撕毀半世紀盟約,賴清德謀獨徹底崩盤

      北京下最后通牒?新加坡連夜撕毀半世紀盟約,賴清德謀獨徹底崩盤

      聽風行天涯
      2026-01-24 18:01:24
      驚人小魔術,劉謙來了都得看兩遍

      驚人小魔術,劉謙來了都得看兩遍

      遠方青木
      2026-01-23 00:24:26
      2026-01-25 09:52:49
      雷峰網 incentive-icons
      雷峰網
      關注智能與未來!
      68407文章數 656059關注度
      往期回顧 全部

      科技要聞

      馬斯克SpaceX背后的她:現實版鋼鐵俠小辣椒

      頭條要聞

      媒體:特朗普發布與一只企鵝上格陵蘭島圖片 舉世嘩然

      頭條要聞

      媒體:特朗普發布與一只企鵝上格陵蘭島圖片 舉世嘩然

      體育要聞

      當家球星打替補,他們在故意擺爛?

      娛樂要聞

      回歸還是頂流 鳳凰傳奇將現身馬年春晚

      財經要聞

      隋廣義等80人被公訴 千億騙局進入末路

      汽車要聞

      別克至境E7內飾圖曝光 新車將于一季度正式發布

      態度原創

      旅游
      游戲
      本地
      公開課
      軍事航空

      旅游要聞

      云南昌寧金山云海美成流動仙境

      比一個人坐牢832次更難的,是和19個人一起坐牢"/> 主站 商城 論壇 自運營 登錄 注冊 比一個人坐牢832次更難的,是和19個人一起坐牢 廉頗 2...

      本地新聞

      云游中國|格爾木的四季朋友圈,張張值得你點贊

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      俄美烏三方首輪會談細節披露

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲18禁| 精人妻无码一区二区三区| 亚洲成a人片| 亚洲一区二区三区av在线免费| 国内老熟妇对白hdxxxx| 亚州脚交| 少妇粉嫩小泬喷水视频| 色欲色香天天天综合网站免费| 中文www新版资源在线| 91丝袜在线| 九九国产视频| 99精品视频在线观看| 日韩毛片免费看| 中文无码日韩欧免费视频| 激情一区二区三区成人文| 免费男人下部进女人下部视频| 伊人网在线观看| 四虎影视久久久免费| 久久久久厕拍| 国内偷拍精品人妻| 国产内射性高湖| 成人欧美一区二区三区| 亚洲成a人片77777kkkk| 国产人妻无码一区二区三区18 | 日韩无码一区二区三区四区| 夜色爽爽影院18禁妓女影院| 台湾佬中文娱乐网址| 中卫市| 特级av毛片免费观看| 亚洲精品熟女| 成人影片在线观看网站18| 午夜亚洲| 午夜视频在线观看区二区| 无码伊人66久久大杳蕉网站谷歌| 国产亚洲精品久久久美女18黄| 十九岁的日本电影免费观看| 九九99热久久精品在线6| 欧美精品乱码99久久蜜桃| 沙河市| 亚州少妇无套内射激情视频| 国产精品亚洲一区二区三区|