<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      阿里Qwen3深夜發(fā)布,能終結(jié)汪峰式尷尬嗎

      0
      分享至


      很多人大概不知道通義Qwen的地位。蘋果公司已選定Qwen作為其在中國市場的大模型技術(shù)合作伙伴,這標志著Qwen在商業(yè)應(yīng)用領(lǐng)域取得重要突破。

      與此同時,學(xué)術(shù)界也展現(xiàn)出對Qwen的青睞。李飛飛團隊正基于Qwen架構(gòu)開發(fā)具備超低推理成本的AI模型,通用智能體平臺Manus已將其作為核心決策引擎。而最被大家熟悉的DeepSeekR1,其小尺寸模型的訓(xùn)練也用到了Qwen。

      實際上,我和身邊多位朋友都有聊過,國外最受追捧的中國大模型,一個是DeepSeek,另一個就是通義Qwen了。

      盡管Qwen在技術(shù)社區(qū)持續(xù)引發(fā)關(guān)注,但在國內(nèi)的公眾感知度常常與之不相稱。開發(fā)者社群中流傳著"大模型界汪峰"的戲稱,意思是其技術(shù)實力常被行業(yè)熱點事件暫時遮蔽,幾次重大版本發(fā)布均遭遇其他科技頭條的"截胡"現(xiàn)象。

      這種技術(shù)影響力與商業(yè)聲量的錯位,恰恰反映出Qwen作為底層基礎(chǔ)模型,在一個特殊時期技術(shù)內(nèi)核上的堅定。

      言歸正傳。從主流學(xué)術(shù)基準的權(quán)威數(shù)據(jù)看,這次Qwen3對DeepSeek R1實現(xiàn)了全方位壓制,這里的"全方位"并非夸張表述,而是實打?qū)嵉臄?shù)學(xué)、推理與代碼三大核心領(lǐng)域的集體突破。


      尤其值得關(guān)注的是其代碼生成能力,在LiveCodeBench和Codeforces雙榜中不僅甩開所有競品,甚至將當(dāng)前業(yè)界最強的Gemini2.5-Pro也拉入了追趕行列。

      具體來看,Qwen3在推理、指令遵循、工具調(diào)用、多語言能力等方面均大幅增強。在奧數(shù)水平的AIME25測評中,Qwen3斬獲81.5分,刷新開源紀錄。在考察代碼能力的LiveCodeBench評測中,Qwen3突破70分大關(guān),表現(xiàn)甚至超過Grok3。在評估模型人類偏好對齊的ArenaHard測評中,Qwen3以95.6分超越OpenAI-o1及DeepSeek-R1。

      而且Qwen3成本很低,旗艦?zāi)P?35B參數(shù)部署成本只要DeepSeek R1的三分之一。

      這些硬核數(shù)據(jù)背后,是Qwen3通過動態(tài)參數(shù)激活架構(gòu)(MoE)實現(xiàn)的質(zhì)變。在2350億總參數(shù)中精準調(diào)用220億激活參數(shù),既保證了算力密度,又將硬件成本壓縮至行業(yè)平均水平的1/3。

      如今它已不只是"全球最強開源模型"的稱號持有者,更是重新定義了大模型性能評估的標準坐標系。

      01

      再繼續(xù)說點干貨,本次Qwen的發(fā)布包含MoE 和Dense 兩種架構(gòu)。

      MoE:有30B(3B激活)和235B(22B激活)兩種。Dense:包含0.6B、1.7B、4B、8B、14B 和32B 這六款。


      模型的詳細參數(shù)

      旗艦?zāi)P褪荙wen3-235B-A22B,后綴235B指的是模型大小2350億參數(shù),A22B指的是激活參數(shù)220億。

      如果你以為大模型的世界只有“參數(shù)越大越強”的套路,那Qwen3可能會讓你重新認識什么叫“小而精”。

      作為阿里巴巴通義千問系列的最新一代模型,Qwen3在性能、成本和靈活性上玩出了新花樣,甚至可以用“降維打擊”來形容它對前代模型的碾壓,不是夸張,而是實打?qū)嵉挠脭?shù)據(jù)說話。

      先說說Qwen3為什么參數(shù)“瘦身”,反而更聰明。

      Qwen3的旗艦版Qwen3-235B-A22B總參數(shù)高達2350億,但激活參數(shù)僅需220億。換句話說,它就像一個學(xué)霸,考試時只翻220頁筆記就能完勝對手。相比之下,Qwen2.5-72B-Instruct這類前輩,可得靠“死記硬背”720億參數(shù)才能勉強跟上節(jié)奏。

      更絕的是,Qwen3的“小型號”也藏著玄機。比如Qwen3-4B這個迷你模型,居然能在代碼生成、數(shù)學(xué)推理等任務(wù)中匹敵Qwen2.5-72B-Instruct的性能。

      對比來看,Qwen3-4B VS Qwen2.5-72B-Instruct:參數(shù)量縮小18倍,性能不降反升。Qwen3-30B-A3B VS Qwen2.5-32B:激活參數(shù)僅為10%,但性能直接跨級超越。

      這次Qwen3最被業(yè)內(nèi)稱道的是,引入了思考模式和非思考模式,類似人類的大腦高速切換狀態(tài)。

      思考模式,適合解決復(fù)雜問題,比如寫論文、做數(shù)學(xué)題,模型會一步步推理,像考試時反復(fù)演算一樣細致。非思考模式,用于簡單任務(wù),比如聊天、查天氣,直接給出答案,省電又高效。

      舉個例子,如果你問Qwen3:請證明費馬大定理。它會啟動學(xué)霸模式,用長思維鏈逐步推導(dǎo)。但如果你問:今天北京天氣如何?它會立刻切換成快問快答,省下你寶貴的等待時間。


      在不同思考深度下,模型的得分情況

      我們都知道,DeepSeek R1就是深度思考,關(guān)閉R1選項,它就用v3來給你回答。 但是Qwen3把這兩個功能融為了一體,方便很多。

      另一個亮點,是Agent能力的增強。

      如今,Agent已經(jīng)是大模型領(lǐng)域重點關(guān)注的能力之一,尤其是最近MCP模型上下文協(xié)議的引入,更是大大增強了Agent 的適用性和靈活性,拓寬了應(yīng)用場景。

      這次Qwen3模型的Agent和代碼能力得到增強,包括加強了對MCP 的支持。我們可以看下面一個示例(提取QwenLM 庫的markdown 內(nèi)容,然后繪制顯示項目stars 數(shù)量的條形圖),展示了Qwen3 如何思考并與環(huán)境進行交互:

      很多人可能更關(guān)心這個模型是怎么訓(xùn)出來的。

      Qwen3模型訓(xùn)練數(shù)據(jù)體量較前代實現(xiàn)指數(shù)級增長,從Qwen2.5的18萬億token擴容至36萬億token,覆蓋119種語言及方言體系。

      數(shù)據(jù)采集采用多源融合策略:一方面通過全網(wǎng)爬取獲取泛化文本,另一方面部

      署Qwen2.5-VL視覺語言模型實現(xiàn)PDF文檔的深度解析,同時結(jié)合Qwen2.5基礎(chǔ)模型進行多輪數(shù)據(jù)精煉,確保信息質(zhì)量。

      針對數(shù)學(xué)與編程垂直領(lǐng)域,通義研發(fā)團隊構(gòu)建了專用數(shù)據(jù)生成管線。Qwen2.5-Math:生成復(fù)雜公式推導(dǎo)、幾何證明等數(shù)學(xué)專項訓(xùn)練數(shù)據(jù)。Qwen2.5-Coder:產(chǎn)出代碼注釋、算法實現(xiàn)等編程領(lǐng)域合成語料。

      通過這種領(lǐng)域自適應(yīng)的數(shù)據(jù)增強策略,顯著提升模型在專業(yè)場景的推理精度。

      三階段漸進式預(yù)訓(xùn)練

      1.基礎(chǔ)能力構(gòu)建階段
      在30萬億token數(shù)據(jù)池上進行基礎(chǔ)預(yù)訓(xùn)練,采用4K固定上下文窗口,重點培養(yǎng)模型的語言組織能力與常識推理基礎(chǔ)。此階段相當(dāng)于構(gòu)建認知底座,使模型掌握自然語言的底層表達規(guī)律。

      2.專業(yè)能力深化階段
      新增5萬億token專項訓(xùn)練數(shù)據(jù),聚焦STEM學(xué)科(科學(xué)/技術(shù)/工程/數(shù)學(xué))與編程任務(wù)。通過高密度專業(yè)語料注入,實現(xiàn)復(fù)雜邏輯推演能力的跨越式提升,特別強化代碼生成、科學(xué)計算等場景表現(xiàn)。

      3.長程理解突破階段
      引入高質(zhì)量長文本語料庫,將上下文處理能力從4K擴展至32K,使模型具備處理學(xué)術(shù)長文、多輪技術(shù)對話等超長文本的能力。該階段突破了傳統(tǒng)模型的記憶限制,可完整理解萬字量級的專業(yè)文檔。

      這種分層訓(xùn)練架構(gòu)既保證了基礎(chǔ)能力的廣度,又通過專項強化實現(xiàn)了深度能力的突破,最終構(gòu)建出兼具通用性與專業(yè)性的新一代語言大模型。


      如果說Qwen2開源時還帶著點“技術(shù)保留”,Qwen3則徹底放飛自我。2款MoE模型+6款Dense模型全部開源,連協(xié)議都換成Apache 2.0(商用隨便薅?。7从^Llama3,至今還在“開源但不可商用”的扭捏狀態(tài)。

      02

      斯坦?!?025人工智能指數(shù)報告》顯示,通義千問有六款模型入選全球前三,技術(shù)貢獻位列中國第一,全球第三,僅次于谷歌和OpenAI。

      增加模型在海外的部署,也是大廠在AI方面的競賽之一。開源模型成為技術(shù)出海的重要抓手,DeepSeek推出的MoE架構(gòu)模型,通過動態(tài)路由技術(shù)將推理成本降至GPT-4的17%,吸引全球3.6萬開發(fā)者參與優(yōu)化。百度文心一言、阿里Qwen等模型也在GitHub開源基礎(chǔ)版本,形成“開源獲客+閉源變現(xiàn)”的雙軌模式。

      今天上午和一個做算力的資深業(yè)內(nèi)人士聊,他說:“各大廠把模型做的越來越快,技術(shù)上沒有本質(zhì)上的變革,目的是在海外擴大自己的模型部署,不過就提升模型的能力方面,對大廠來說也是利好?!?/p>

      他認為,阿里這一次發(fā)布8個模型,是因為算力在不斷提升,大模型就像數(shù)學(xué)原理上的發(fā)展,數(shù)學(xué)原理發(fā)展的越好未必能直接帶來效益,但能帶來AI應(yīng)用方面的增長,AI應(yīng)用全部依賴于大模型的基礎(chǔ),沒有大模型的發(fā)展,應(yīng)用很難實現(xiàn)突破。

      相較于Llama 4系列模型獲得的社區(qū)反響,Qwen系列已憑借扎實的數(shù)據(jù)支撐確立其全球開源領(lǐng)域的領(lǐng)先地位。作為目前全球規(guī)模最大的開源模型體系,阿里通義已向公眾開放200余個預(yù)訓(xùn)練模型,累計下載量突破3億次(綜合 Hugging Face、魔搭等社區(qū)數(shù)據(jù))。

      更值得關(guān)注的是,基于Qwen核心架構(gòu)衍生的定制化模型已超過10萬個,這一數(shù)字不僅超越了Llama系列,更標志著Qwen生態(tài)已成長為全球最活躍的開源模型矩陣。這種指數(shù)級增長,印證了中國開源大模型在技術(shù)創(chuàng)新與社區(qū)共建方面的雙重突破。


      自通義千問自2023年首次亮相以來,幾乎以驚人的迭代速度和技術(shù)突破,從一款基礎(chǔ)語言模型逐步成長為橫跨多模態(tài)、全生態(tài)的AI平臺。這一歷程不僅展現(xiàn)了阿里巴巴在大模型領(lǐng)域的布局野心,也折射出國產(chǎn)人工智能技術(shù)在全球競爭中的崛起軌跡。

      2023年4月,通義千問1.0作為阿里巴巴推出的首款超大規(guī)模語言模型,正式開啟探索之路。該版本初步實現(xiàn)了中文、英文等多語言文本生成與對話交互能力,并通過阿里云峰會展開定向企業(yè)測試。

      盡管此時其整體技術(shù)成熟度仍落后于國際頭部模型(如GPT-3.5),但已在國內(nèi)首批通用型大模型中占據(jù)先機,與百度文心一言、騰訊混元形成早期競爭格局。

      同年10月31日發(fā)布的通義千問2.0標志著性能的飛躍。參數(shù)規(guī)模突破千億級,復(fù)雜指令理解、文學(xué)創(chuàng)作與數(shù)學(xué)推理能力顯著提升,并推出8大垂直領(lǐng)域子模型(如編程助手通義靈碼、法律助手通義法睿)。

      App端向個人用戶開放后,其綜合性能接近GPT-3.5,超越Meta Llama-2-70B,成為國內(nèi)首個實現(xiàn)工具化鏈路的企業(yè)級大模型平臺。

      2024年4月至5月,Qwen1.5系列的開源策略進一步鞏固了其行業(yè)地位。覆蓋5億至1100億參數(shù)的全尺寸模型矩陣滿足多樣化部署需求,CodeQwen1.5-7B成為智能編碼標桿,下載量超700萬次。

      2024年5月9日,通義千問2.5在多模態(tài)任務(wù)上實現(xiàn)質(zhì)的突破。深度推理能力優(yōu)化后,邏輯與數(shù)學(xué)題解答準確率大幅提升,旗艦?zāi)P蚎wen-VL-Max性能超越Gemini Ultra和GPT-4V,成為多模態(tài)領(lǐng)域的標桿產(chǎn)品。同年8月30日,視覺語言模型Qwen2-VL-72B重新定義視頻分析邊界。

      今年3月27日,Qwen2.5-Omni開創(chuàng)端到端全模態(tài)處理范式。文本、圖像、音頻、視頻同步處理能力實現(xiàn)人機交互體驗革新,實時語音合成與情緒識別功能適配智能家居、車載系統(tǒng),輕量化設(shè)計支持手機端高效部署,對標OpenAI GPT-4o和Google Gemini 2.5 Pro,引領(lǐng)下一代交互體驗。

      直到這次發(fā)布Qwen3,正式成長為從初代通用模型到全球開源領(lǐng)袖,通義千問的演進軌跡映射出中國AI力量的成長路徑。

      你已經(jīng)嘗鮮Qwen3了嗎,感覺怎么樣,歡迎評論區(qū)交流。


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      伊朗多地爆發(fā)抗議活動 哈梅內(nèi)伊告別儀式被推遲

      伊朗多地爆發(fā)抗議活動 哈梅內(nèi)伊告別儀式被推遲

      看看新聞Knews
      2026-03-04 20:42:20
      被爆換武僧心臟、喝小孩血! 李連杰笑噴:怎么不說我換「華為心、小米腎」?

      被爆換武僧心臟、喝小孩血! 李連杰笑噴:怎么不說我換「華為心、小米腎」?

      ETtoday星光云
      2026-03-04 16:42:06
      被問爆了!小龍蝦用什么電腦裝?選哪個模型省錢?這篇“養(yǎng)蝦”保姆級教程請收好

      被問爆了!小龍蝦用什么電腦裝?選哪個模型省錢?這篇“養(yǎng)蝦”保姆級教程請收好

      AI范兒
      2026-03-06 20:54:35
      全款一口價15.99萬起 2026款凱迪拉克XT4正式上市

      全款一口價15.99萬起 2026款凱迪拉克XT4正式上市

      太平洋汽車
      2026-03-06 16:07:18
      44歲范冰冰車內(nèi)趕場賣面膜!素顏發(fā)福變大媽,昔日頂流如今只剩奔波

      44歲范冰冰車內(nèi)趕場賣面膜!素顏發(fā)福變大媽,昔日頂流如今只剩奔波

      八卦王者
      2026-03-06 11:18:36
      豪門悲喜夜:巴黎圣日耳曼1-3,拜仁4-1,皇馬2-1,利物浦3-1晉級八強

      豪門悲喜夜:巴黎圣日耳曼1-3,拜仁4-1,皇馬2-1,利物浦3-1晉級八強

      側(cè)身凌空斬
      2026-03-07 06:10:33
      德黑蘭的最大漏洞,可能不是內(nèi)鬼,而是滿街的攝像頭

      德黑蘭的最大漏洞,可能不是內(nèi)鬼,而是滿街的攝像頭

      碼頭青年
      2026-03-07 14:44:45
      新娘臨時要10萬下車費,新郎去取錢卻未歸,新娘趕到婆家瞬間淚目

      新娘臨時要10萬下車費,新郎去取錢卻未歸,新娘趕到婆家瞬間淚目

      千秋歷史
      2026-02-02 20:23:42
      李連杰當(dāng)面一句“我剛換了心臟”,謝苗臉唰一下白了,氣都不敢喘

      李連杰當(dāng)面一句“我剛換了心臟”,謝苗臉唰一下白了,氣都不敢喘

      西樓知趣雜談
      2026-02-28 21:36:48
      萬萬沒想到!兩會最火提案不是醫(yī)療和就業(yè),而是霍啟剛的這一舉動

      萬萬沒想到!兩會最火提案不是醫(yī)療和就業(yè),而是霍啟剛的這一舉動

      查爾菲的筆記
      2026-03-05 20:24:50
      安徽肥西縣一飽受質(zhì)疑的破產(chǎn)清算“坑”,致投資商千萬借款打水漂

      安徽肥西縣一飽受質(zhì)疑的破產(chǎn)清算“坑”,致投資商千萬借款打水漂

      兵叔評說
      2026-03-07 11:37:00
      中央強力加杠桿,普通人的財富迎巨變

      中央強力加杠桿,普通人的財富迎巨變

      柏年說政經(jīng)
      2026-03-06 18:00:03
      世界上最燒錢的十項運動,沒錢你真玩不起!

      世界上最燒錢的十項運動,沒錢你真玩不起!

      馬拉松跑步健身
      2026-02-28 11:37:18
      戲子當(dāng)?shù)?,是央國企管理中的一大痛點

      戲子當(dāng)?shù)?,是央國企管理中的一大痛點

      細說職場
      2026-03-06 20:01:27
      列寧曾派特工來到中國,專門暗殺一個人:腦袋至今保存在俄博物館

      列寧曾派特工來到中國,專門暗殺一個人:腦袋至今保存在俄博物館

      老范談史
      2026-03-06 07:28:20
      無緣世界杯?伊拉克通知國際足聯(lián)無法參加附加賽 40%球員無法出行

      無緣世界杯?伊拉克通知國際足聯(lián)無法參加附加賽 40%球員無法出行

      念洲
      2026-03-07 06:17:28
      德云社弟子人氣大洗牌!4人上桌,3人邊緣,2人換桌,岳云鵬退場

      德云社弟子人氣大洗牌!4人上桌,3人邊緣,2人換桌,岳云鵬退場

      好賢觀史記
      2026-03-07 09:50:01
      李賀:我爸是李雙江,我弟是李天一,我在沒有父愛的環(huán)境中成長

      李賀:我爸是李雙江,我弟是李天一,我在沒有父愛的環(huán)境中成長

      談古論今歷史有道
      2026-03-07 10:20:03
      1971年,老太太質(zhì)問周恩來我啥級別,真相一出令人肅然起敬

      1971年,老太太質(zhì)問周恩來我啥級別,真相一出令人肅然起敬

      棠棣分享
      2026-03-05 18:11:12
      特朗普夸梅西:你們隊沒一個丑的!話鋒突轉(zhuǎn)“下一個是古巴”,“梅球王”懵圈

      特朗普夸梅西:你們隊沒一個丑的!話鋒突轉(zhuǎn)“下一個是古巴”,“梅球王”懵圈

      紅星新聞
      2026-03-07 11:58:25
      2026-03-07 15:08:49
      白鯨實驗室one incentive-icons
      白鯨實驗室one
      記錄 AI改變世界的瞬間
      99文章數(shù) 5關(guān)注度
      往期回顧 全部

      科技要聞

      OpenClaw爆火,六位"養(yǎng)蝦人"自述與AI共生

      頭條要聞

      伊朗大使:250年歷史的美國怎能挑釁3000年歷史的伊朗

      頭條要聞

      伊朗大使:250年歷史的美國怎能挑釁3000年歷史的伊朗

      體育要聞

      塔圖姆歸來:凱爾特人的春之綠

      娛樂要聞

      周杰倫田馥甄的“JH戀” 被扒得底朝天

      財經(jīng)要聞

      針對"不敢休、不讓休"怪圈 國家出手了

      汽車要聞

      逃離ICU,上汽通用“止血”企穩(wěn)

      態(tài)度原創(chuàng)

      游戲
      健康
      親子
      教育
      軍事航空

      《老頭環(huán)》多人新作近兩個月零更新!引玩家不滿

      轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

      親子要聞

      挑戰(zhàn)獨自帶弟弟們過8小時

      教育要聞

      開學(xué)第一個月,決定孩子一學(xué)期的成績!99%學(xué)霸家長都在盯3件事

      軍事要聞

      美第三個航母打擊群據(jù)稱準備部署至中東

      無障礙瀏覽 進入關(guān)懷版