<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      阿里發布千問最強推理模型Qwen3-Max-Thinking,性能媲美GPT-5.2、Gemini 3 Pro

      0
      分享至

      阿里巴巴1月26日正式發布千問旗艦推理模型Qwen3-Max-Thinking,在多項權威評測中刷新全球紀錄,成為迄今最接近國際頂尖模型的國產AI大模型。這標志著中國大模型從“追平”到“領跑"的關鍵突破。

      據阿里云發布的信息,該模型總參數量超萬億,預訓練數據量達36T Tokens,是目前阿里規模最大、能力最強的千問推理模型。在涵蓋事實知識、復雜推理、指令遵循、人類偏好對齊、Agent能力等19項公認基準測試中,Qwen3-Max-Thinking整體性能可媲美GPT-5.2-Thinking、Claude Opus 4.5和Gemini 3 Pro等國際頂尖模型。

      該模型采用全新的測試時擴展機制,實現推理性能大幅提升的同時更具經濟性。在啟用工具的HLE(Humanity's Last Exam)評測中,千問得分58.3,大幅超過GPT-5.2-Thinking的45.5和Gemini 3 Pro的45.8,錄得當前所有模型的最高分。

      阿里巴巴同日宣布,根據Hugging Face數據,Qwen衍生模型數量突破20萬,成為全球首個達成此目標的開源大模型。Qwen系列模型累計下載量突破10億次,被開發者日均下載110萬次,穩居全球開源大模型首位。

      推理技術實現代際突破

      Qwen3-Max-Thinking的核心創新在于測試時擴展機制的應用。阿里云表示,這種機制可對此前推理的結果進行"經驗提取"式的提煉,并據此進行多輪自我迭代,在相同的上下文中實現更高效的推理計算。

      這一技術路徑區別于業界普遍采用的推理計算方式。阿里云指出,傳統方法只會簡單增加并行推理路徑,重復推導已知結論的情況常見,導致冗余推理效率低下。而千問新模型通過"經驗提取"機制,可識別并剪枝冗余的邏輯路徑,確保算力被用于探索最有價值的分支。

      該模型進行了更大規模的強化學習后訓練。阿里云數據顯示,在此前預覽版Qwen3-Max-Thinking斬獲數學推理AIME 25和HMMT 25國內首個雙滿分的基礎上,通義團隊進一步提升了正式版性能,在多項基準測試中刷新最佳表現紀錄。

      在HLE這一被稱為"人類最后的測試"的評測中,千問得分58.3,較GPT-5.2-Thinking和Gemini 3 Pro分別高出12.8分和12.5分。在AI評測領域,超過10分的差距通常意味著代際級的領先。


      原生Agent能力大幅增強

      面向智能體時代,Qwen3-Max-Thinking大幅增強了自主調用工具的原生Agent能力。該模型可在對話過程中自主選用搜索、個性化記憶和代碼解釋器等核心工具功能,提供更符合用戶需求的智能回答。

      阿里云介紹,這種能力源自通義團隊專門設計的訓練流程。在完成初步的工具使用微調后,團隊對模型在大量多樣化任務上進行了基于規則獎勵與模型獎勵的聯合強化學習訓練,使Qwen3-Max-Thinking能夠更智能地結合工具進行思考。

      這一能力的提升帶來實際應用價值的改變。模型不再是單純的"大腦",需要外掛工具導致指令遵循不穩定,而是可以自主判斷何時搜索互聯網、何時編寫代碼、何時查閱知識庫,并根據反饋動態調整計劃。阿里云表示,這種機制大幅降低了模型幻覺,為企業級應用提供了必要的可靠性保障。

      目前,開發者可在QwenChat上免費體驗Qwen3-Max-Thinking模型,企業可通過阿里云百煉獲取新模型API服務。普通用戶可通過千問PC端和網頁端試用模型,千問APP也即將接入新模型。

      開源生態確立全球領先地位

      Qwen系列在開源生態的表現展現了中國大模型的全球影響力。根據Hugging Face數據,基于Qwen的衍生模型數量突破20萬個,成為全球首個達成此目標的開源家族。其累計下載量突破10億次,日均下載量達110萬次。

      這一數據意味著Qwen已完全超越此前被視為開源大模型默認標準的Meta Llama系列。據此前報道,Meta內部代號“牛油果”的秘密項目,在訓練新模型時采用了“蒸餾”技術向包括Qwen在內的多方開源模型學習,在技術層面間接承認了Qwen在特定能力上的領先。

      Qwen的全球采用份額持續擴大。阿里巴巴采用"全尺寸、全模態"策略,從0.5B到480B的全參數段覆蓋,以及對119種語言的支持,使其在東南亞、中東等新興市場迅速成為首選。

      這一開源戰略正在轉化為實際的市場優勢。千問APP上線首周下載量突破1000萬,兩個月月活突破1億。該應用全面接入淘寶、支付寶、飛豬、高德等生態,用戶可通過語音指令完成訂機票、叫外賣等全流程,將AI價值從信息層推向交易層。

      全棧布局構建競爭護城河

      阿里巴巴在AI領域的布局覆蓋算力、模型、應用全棧。在底層算力方面,平頭哥研發的PPU在特定推理任務上的性能已與英偉達H20相當,配合倚天710服務器芯片,構建了"一云多芯"的異構算力體系。據市場消息,阿里巴巴已決定支持平頭哥未來獨立上市。

      阿里云已構建起中國最完整的AI基礎設施。據摩根士丹利預測,阿里云收入將在三年內翻倍,從2025財年的1180億元增長至2028財年的2400億元。其目標是在2026年拿下中國AI云市場增量的80%。

      阿里CEO吳泳銘去年宣布,未來三年將投入超過3800億元用于建設云和AI硬件基礎設施。這一投入規模與谷歌、Meta和亞馬遜等美股科技巨頭的AI資本開支處于同一量級,體現了阿里對AI長期競爭力的戰略判斷。

      Qwen3-Max-Thinking的發布標志著阿里巴巴在AI算法上的頂級實力得到驗證,配合其在算力、應用層面的全棧能力,為中國大模型從"追平"到"領跑"的轉變提供了關鍵案例。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      《我是刑警》原型,四人血洗煤礦、兄弟相殘,鶴崗128案真相還原

      《我是刑警》原型,四人血洗煤礦、兄弟相殘,鶴崗128案真相還原

      史記趣聞
      2025-01-08 20:50:03
      紫金礦業:擬280億元收購聯合黃金100%股權

      紫金礦業:擬280億元收購聯合黃金100%股權

      每日經濟新聞
      2026-01-26 21:10:02
      突發!廣東隊2米11中鋒,意外受到重傷,被隊友攙扶下場 令人擔憂

      突發!廣東隊2米11中鋒,意外受到重傷,被隊友攙扶下場 令人擔憂

      體育哲人
      2026-01-26 22:03:46
      央視怒批,人民日報點名封殺,這5位目無法紀的大網紅,徹底涼涼

      央視怒批,人民日報點名封殺,這5位目無法紀的大網紅,徹底涼涼

      一娛三分地
      2025-12-04 17:00:33
      于適聯手葛曉倩,報復張雨綺!

      于適聯手葛曉倩,報復張雨綺!

      八卦瘋叔
      2026-01-25 11:06:43
      2026秋冬巴黎男裝周ISSUE 02:打破想象與實穿的邊界

      2026秋冬巴黎男裝周ISSUE 02:打破想象與實穿的邊界

      風度mensuno
      2026-01-26 19:04:05
      大伯從不在乎人情世故,我出嫁時他沒隨禮,卻把我叫到了門口

      大伯從不在乎人情世故,我出嫁時他沒隨禮,卻把我叫到了門口

      五元講堂
      2026-01-01 07:10:03
      黃景瑜官宣上太空剛過一天,航天公司被扒底朝天,離譜事接連發生

      黃景瑜官宣上太空剛過一天,航天公司被扒底朝天,離譜事接連發生

      一娛三分地
      2026-01-24 19:27:30
      壽命與大便次數有關?研究發現:壽命長的人,每天排便在這個次數

      壽命與大便次數有關?研究發現:壽命長的人,每天排便在這個次數

      DrX說
      2025-10-24 14:15:19
      1968年,林彪想換北京軍區司令,毛主席只問了一句話,林彪徹底啞火

      1968年,林彪想換北京軍區司令,毛主席只問了一句話,林彪徹底啞火

      老杉說歷史
      2026-01-09 22:00:17
      斷崖式下跌!中國人突然不愛喝酒了?真相太扎心!

      斷崖式下跌!中國人突然不愛喝酒了?真相太扎心!

      達文西看世界
      2026-01-18 20:56:11
      全新奧迪A4L上市!售價親民,年輕外觀更動感,搭2.0T+7速雙離合

      全新奧迪A4L上市!售價親民,年輕外觀更動感,搭2.0T+7速雙離合

      小史談車
      2026-01-24 11:30:03
      馬年給孩子發紅包有講究,避開“3個數”,既不得罪人寓意又好

      馬年給孩子發紅包有講究,避開“3個數”,既不得罪人寓意又好

      小書蟲媽媽
      2026-01-25 22:55:43
      現貨白銀漲超11%

      現貨白銀漲超11%

      財聯社
      2026-01-27 01:06:04
      事業巔峰遠赴美國,被老外“玩膩”后晚年回國,如今變成了這樣!

      事業巔峰遠赴美國,被老外“玩膩”后晚年回國,如今變成了這樣!

      歸史
      2025-12-09 11:10:44
      上海炒股大賽冠軍的箴言:如果手里只有10萬,不妨死磕"七大口訣"

      上海炒股大賽冠軍的箴言:如果手里只有10萬,不妨死磕"七大口訣"

      一方聊市
      2026-01-19 13:13:48
      外網網友太有才!這 P 圖簡直是維多利亞 “本色出演”

      外網網友太有才!這 P 圖簡直是維多利亞 “本色出演”

      述家娛記
      2026-01-23 10:04:59
      全球首個戰術“方盒子”來襲,硬派SUV鼻祖,媲美大G,劍指坦克700!

      全球首個戰術“方盒子”來襲,硬派SUV鼻祖,媲美大G,劍指坦克700!

      隔壁說車老王
      2026-01-27 00:06:57
      阿根廷2002韓日世界杯陣容這么豪華 為啥3場2球4分!小組賽就出局

      阿根廷2002韓日世界杯陣容這么豪華 為啥3場2球4分!小組賽就出局

      體壇八點半的那些事兒
      2026-01-26 19:48:30
      交易大地震!詹姆斯!騎士!

      交易大地震!詹姆斯!騎士!

      老壥說體育
      2026-01-26 15:31:53
      2026-01-27 03:39:00
      華爾街見聞官方 incentive-icons
      華爾街見聞官方
      中國領先的金融商業信息提供商
      140725文章數 2652294關注度
      往期回顧 全部

      科技要聞

      印奇再上牌桌,階躍融資50億

      頭條要聞

      印度尼帕病毒現跨區域傳播 世衛:或引起全球大流行

      頭條要聞

      印度尼帕病毒現跨區域傳播 世衛:或引起全球大流行

      體育要聞

      叛逆的大公子,要砸了貝克漢姆這塊招牌

      娛樂要聞

      張雨綺被抵制成功!遼視春晚已將她除名

      財經要聞

      從美式斬殺線看中國社會的制度韌性構建

      汽車要聞

      賓利第四臺Batur敞篷版發布 解鎖四項定制創新

      態度原創

      家居
      旅游
      數碼
      親子
      藝術

      家居要聞

      流韻雅居,讓復雜變純粹

      旅游要聞

      本市將打造中國入境旅游首選地

      數碼要聞

      蘋果推出第二代AirTag 具備更遠搜索距離、更響亮的揚聲器等

      親子要聞

      “生孩子老了就這下場”,母親用按摩機被女兒網暴,網友看不下去

      藝術要聞

      沙特急剎車,NEOM規模大縮水,線性摩天樓留小段

      無障礙瀏覽 進入關懷版