<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Qwen3 發布,阿里也要靠多模態和性價比打天下了

      0
      分享至


      今天凌晨,阿里云正式發布了Qwen3系列,一口氣開源了從0.6B到235B共8款模型:2個MoE大模型和6個Dense大模型,構成了阿里完整的模型矩陣。


      這次Qwen3的開源重塑了大模型標準,可以說在“后DeepSeek R1”時代,以阿里為代表的國內大廠,正在借助產品化思維,以性價比和多模態能力全方位搶奪DeepSeek的市場影響力。

      01

      Qwen3再一次拉高了世界開源標準

      這回阿里云開源的Qwen3,在架構、性能、推理速度和應用方向上均有較大創新和提升。Qwen3系列在模型架構上采用了MoE(混合專家)架構。

      旗艦模型 Qwen3-235B-A22B 擁有約2350億的總參數量,在每次推理時僅僅激活約220億參數,性能極其耐打,在綜合能力、代碼與數學、多語言能力、知識與推理等多項基準測試中,都能與DeepSeek R1、OpenAI o1、o3-mini、Grok 3和谷歌Gemini 2.5 Pro等目前市場上的主流大模型相抗衡。


      一個亮點是:Qwen3-4B模型憑借極低的參數量,在一系列基準測試中與GPT-4o(2024-11-20版本)打了個有來有回。這體現了阿里在推理效率上的提升并非以犧牲能力為代價。


      其輕量化模型Qwen3-30B-A3B和32B,在許多任務上的表現也足夠令人滿意。


      除了基準測試上亮眼的表現外,Qwen3系列這回的一個主要創新特點是:混合思考模式。這種設計讓用戶能根據任務難度控制模型的推理量:思考模式下,模型能夠逐步推理,適合復雜問題,強調深度思考。無思考模式:模型快速響應,適合簡單問題,優先速度。難問題用更多推理,簡單問題快速解答。


      并且,Qwen3為了在國際應用端擴展影響力,已經能夠支持119種語言和方言。外網的各國網友對其的評價都很不錯,橫向對比的話,Qwen3已經追上或者超越了OpenAI o1、谷歌Gemini 2.5 Pro。


      Qwen3還針對最近半年爆火的“AI智能體”概念做出了優化,強調了“智能體”能力。比如它們強化了Qwen3 模型的編碼和代理能力,并增強了對 MCP 的支持,讓Qwen3 學會如何思考以及如何與環境交互。


      在預訓練方面,Qwen3 的數據集相比 Qwen2.5 幾乎翻了一倍,達到了3.6萬億個token,覆蓋了更廣泛的領域知識和語境,再度提升了在復雜任務處理和多語言場景中的表現。


      這回Qwen3系列的開源,統一采用Apache 2.0開源協議開放權重。通過“小杯-中杯-大杯-超大杯”的產品邏輯構建了一個完整的“Qwen宇宙”

      綜合來看,Qwen3 在單純的技術性能、成本價格、工具調用和MCP調用等所有方面獲得了全面的提升,其已經將開源世界的標準提升了一個層次。

      02

      DeepSeek光環下的大廠百態

      4月25日的2025百度AI開發者大會上,百度創始人李彥宏點名批評DeepSeek“不是萬能的,它只能處理單一的文本,不能理解聲音、圖片、視頻等多模態內容。更大的問題是慢和貴,中國市場上絕大多數大模型API的價格都更低,而且反應速度更快。”

      他點出了DeepSeek龐大光環下,中國的大廠正在走向用性價比抗衡DeepSeek的現狀:用更小參數,更低成本的方式,實現更快的響應,完成不屬于DeepSeek的多模態效果。

      阿里的Qwen3迅速引入MoE架構和雙模式推理設計,將龐大模型在實際使用中的成本大幅降低。憑借DeepSeek R1三分之一的參數量,性能全面超越R1。

      首先,Qwen3的MoE架構使得推理過程中僅激活部分專家,從而降低了實際計算開銷。例如,Qwen3-235B-A22B雖然總參數達235B,但每個token只需計算其中約9%(22B)的參數。這意味著在相近硬件條件下,其推理延遲并不像參數規模看上去那樣高不可攀。

      其次,Qwen3的雙模式推理設計高效地分配算力。在“非思考模式”下,模型可直接生成答案,實現接近即時的響應;而在需要“思考模式”時,才投入額外計算資源進行多步推理。這種按需分配計算的策略,使模型在大部分簡單交互中保持了快速性,又能在關鍵時刻發揮深度推理能力。

      這其實與騰訊的雙軌思路相似。2025年2月13日,騰訊元寶接入DeepSeek R1滿血版,幾天之后就上線了 “強推理深度思考模型”混元T1模型,隨即混元團隊官宣Turbo S模型上線測試,號稱在響應速度上比DeepSeek R1更快。Turbo模型針對日常對話進行優化,弱化長鏈推理而追求即時回答能力。騰訊內部的AI助手“元寶”應用中,就集成了Turbo快思考和T1深思考兩種模型,允許用戶在需要詳細推理時調用T1,平時默認用Turbo即時回答。

      這種雙軌策略,與阿里Qwen3單模型雙模式有異曲同工之妙,都是為不同復雜度的問題提供差異化模型,既保證效果又保證速度。

      DeepSeek R1自從正式上線以來,其幻覺現象頻發就成為了各大廠商瞄準的攻堅對象。


      百度就是其中的代表。百度在國內大模型競爭中經歷了一個明顯的策略轉折:從最初堅持閉源、尋求商業變現,到在DeepSeek等沖擊下宣布開源、全面免費的重大轉向。

      2025年3月16日,百度如期發布了文心大模型4.5。文心4.5被定義為百度首個“原生多模態”大模型,具備圖像、文本、音頻等多模態聯合理解與生成能力。它引入了深度思考能力,能夠進行復雜問題的逐步推理,并集成了百度自研的iRAG檢索增強技術。

      通過“深度搜索”功能,文心4.5可以自動檢索外部知識以回答用戶問題,顯著降低了幻覺率,這也是百度迎戰DeepSeek的底氣所在。

      在價格方面,百度也正在開始加碼。前幾天的百度AI開發者大會上發布的文心4.5Turbo,相比于文心4.5價格下降80%,每百萬token的輸入輸出價格僅為DeepSeek V3的40%。DeepSeek的成本優勢正在大廠們的面前蕩然無存。

      字節跳動為了應對DeepSeek的競爭,則將自身的產品重心放在了多模態上。從旗下火山引擎團隊于2024年5月首次對外全面介紹了代號“豆包”的大模型家族,一口氣亮相了9個模型開始,豆包就著重多模態模型上的發展。

      與其他廠商喜歡強調模型參數和基準測試成績不同,字節刻意淡化參數規模與榜單,轉而突出實際落地效果和低使用門檻,力求讓大模型真正融入多樣化的實際場景。

      本月中旬,豆包1.5深度思考模型上線,除了在數學推理、編程競賽、科學推理等專業領域上表現超越DeepSeek R1之外,最大的亮點是Doubao-1.5-thinking-pro-vision具備了視覺推理理解能力,同時豆包文生圖模型3.0版本發布,進一步豐富了多模態生態。

      字節跳動的多模態戰略背后,是敏銳感知到了大模型從技術概念轉向產品概念的路徑。后DeepSeek R1時代里,單純追求參數規模和技術指標的提升已不足以構建產品護城河了。

      字節跳動帶著這家宇宙大廠的“互聯網基因”,加入了大模型競爭。多模型并進確保了其在文本、語音、圖像各方面全面開花;極低價格和廣泛產品植入為其贏得了規模和數據。

      總的來看,除了單純的專業領域的基準測試刷分之外,價格、響應、多模態都已經成了各大廠商應對DeepSeek競爭的有力武器。當基礎語言對話能力很難拉開差距時,各大廠用產品思維找到了迅速突圍DeepSeek的差異化功能。

      03

      開源生態的長短期利益結合

      隨著DeepSeek、Llama、Qwen、智譜在開源生態構建上付出了越來越多的努力,開源已經成為主流路線之一。過去大廠傾向于閉源謀利,而如今開源被證明是贏得生態和快速迭代的有效途徑。DeepSeek進一步刺激了大廠擁抱開源生態的決心,阿里全面開源千問證明了 “模型開源是AI時代的主題”。

      不難看出,國內大模型正走向一個比拼綜合實力和效率的時代,而不再僅以參數和單點性能論英雄。

      Qwen3、DeepSeek以及騰訊、百度、字節的各種“模型”迭代實踐,折射出了一種轉變:大家都在追求更高的性價比——既要性能足夠好,又要成本足夠低、應用足夠廣。

      可以說,我們正在進入AI的下半場。


      OpenAI的研究員姚順雨前段時間曾發長文,探討AI的下半場該專注于哪里:“從現在開始,AI將從解決問題轉向定義問題。為了在‘下半場’蓬勃發展,人們需要及時轉變思維方式和技能,更接近產品經理的水平。”

      根據晚點訪談,阿里云CTO、通義實驗室負責人周靖人對于開源大模型的戰略意義:首先,模型作為核心生產要素,開源能加速其普及,推動產業快速發展;其次,開源已成為大模型創新的重要驅動力。

      可以預見的是:國內大模型的落地方向將更加貼近實際應用,不再只是實驗室里的模型比拼。這也給開源大模型的參數效率、推理成本提供了一個更加激烈的競爭區域。

      歡迎在評論區留言~
      如需開白請加小編微信:dongfangmark

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中國網貸技術全球領先,為啥出海收割老外卻慘敗?

      中國網貸技術全球領先,為啥出海收割老外卻慘敗?

      流蘇晚晴
      2025-12-14 16:17:52
      國足有戲!南美足聯主席再次呼吁:下下屆世界杯擴軍到64隊!

      國足有戲!南美足聯主席再次呼吁:下下屆世界杯擴軍到64隊!

      邱澤云
      2025-12-15 16:02:35
      中國“摸著石頭過河”數十年,“石頭”終于快被摸完了

      中國“摸著石頭過河”數十年,“石頭”終于快被摸完了

      朔方瞭望
      2025-11-08 11:29:44
      身價上億有什么用?68歲趙本山如今家庭情況,給中老年人提了個醒

      身價上億有什么用?68歲趙本山如今家庭情況,給中老年人提了個醒

      白面書誏
      2025-12-08 13:24:49
      臺海觀瀾 民進黨成了“民禁擋”,賴清德成了“賴獨裁”

      臺海觀瀾 民進黨成了“民禁擋”,賴清德成了“賴獨裁”

      經濟觀察報
      2025-12-15 11:05:39
      賈躍亭和仨兒女美國團聚,甘薇給他準備了桃酥,賈總樂開了花

      賈躍亭和仨兒女美國團聚,甘薇給他準備了桃酥,賈總樂開了花

      阿廢冷眼觀察所
      2025-12-03 10:52:47
      中國足球留洋利好:大黑將志首次成為日本職業聯賽主教練!

      中國足球留洋利好:大黑將志首次成為日本職業聯賽主教練!

      邱澤云
      2025-12-15 16:08:36
      700億騙局曝光,專門收割有錢人,上海貴酒到底有多瘋狂?

      700億騙局曝光,專門收割有錢人,上海貴酒到底有多瘋狂?

      毒sir財經
      2025-12-14 23:15:34
      86年我放走一個越南女兵,33年后我剛出越南機場就被一排軍車接走

      86年我放走一個越南女兵,33年后我剛出越南機場就被一排軍車接走

      蕭竹輕語
      2025-12-05 17:38:25
      大回暖真來了:南方將迎春天或初夏般溫暖,新一輪大降溫雨雪已醞釀

      大回暖真來了:南方將迎春天或初夏般溫暖,新一輪大降溫雨雪已醞釀

      中國氣象愛好者
      2025-12-15 23:34:11
      東盟也要變天了,印尼終于清醒,柬埔寨被摁著摩擦不是偶然的,不是柬王室的事,柬埔寨洪森是掌控柬埔寨的實權人物,王室被架空了?

      東盟也要變天了,印尼終于清醒,柬埔寨被摁著摩擦不是偶然的,不是柬王室的事,柬埔寨洪森是掌控柬埔寨的實權人物,王室被架空了?

      軍霆說
      2025-12-16 01:18:17
      他在失蹤網站看到和自己一模一樣的臉,竟由此破獲30多年謎案…

      他在失蹤網站看到和自己一模一樣的臉,竟由此破獲30多年謎案…

      英國那些事兒
      2025-12-14 23:06:36
      宗慶后DNA被調取,3個私生子力證血緣關系,宗慶后72歲生小兒子?

      宗慶后DNA被調取,3個私生子力證血緣關系,宗慶后72歲生小兒子?

      削桐作琴
      2025-07-14 20:20:04
      冬煮蘋果水,內熱自己退!3種神仙搭配,清內熱、養脾胃、補津液

      冬煮蘋果水,內熱自己退!3種神仙搭配,清內熱、養脾胃、補津液

      江江食研社
      2025-12-13 16:30:08
      最新消息!廣東再發消費券

      最新消息!廣東再發消費券

      廣東發布
      2025-12-15 21:25:31
      所有人不許吃肉?準大一素食女生發文求助,網友:誰做她室友誰倒霉

      所有人不許吃肉?準大一素食女生發文求助,網友:誰做她室友誰倒霉

      趣筆談
      2025-08-18 15:51:25
      中國凍結巖崎茂在華資產;同時不再向日本提供熊貓

      中國凍結巖崎茂在華資產;同時不再向日本提供熊貓

      跟著老李看世界
      2025-12-16 00:01:14
      12月事業財運雙雙登頂的星座TOP3!

      12月事業財運雙雙登頂的星座TOP3!

      朗威談星座
      2025-12-16 06:50:21
      洪森危險了,不在佩通坦報復,而是馬仔陳志的150億比特幣被抄!

      洪森危險了,不在佩通坦報復,而是馬仔陳志的150億比特幣被抄!

      南宮一二
      2025-10-26 07:52:25
      遼寧最多領先21分吊打衛冕冠軍 威爾斯成王牌王嵐嵚填趙繼偉空缺

      遼寧最多領先21分吊打衛冕冠軍 威爾斯成王牌王嵐嵚填趙繼偉空缺

      醉臥浮生
      2025-12-15 21:40:03
      2025-12-16 08:11:00
      直面派 incentive-icons
      直面派
      講述值得講述的真實故事
      239文章數 236關注度
      往期回顧 全部

      科技要聞

      L3車型可以上路了!重慶北京兩款車獲批

      頭條要聞

      天津警察學院兩干部論文查重率超70% 校方:官方沒認定

      頭條要聞

      天津警察學院兩干部論文查重率超70% 校方:官方沒認定

      體育要聞

      戰勝完全體雷霆,馬刺“瘋狂動物城”只是半成品

      娛樂要聞

      何晴告別式現場,前夫許亞軍雙眼泛紅?

      財經要聞

      新農合漲到400元 農民斷繳背后的扎心真相

      汽車要聞

      主駕配按摩還可選6座 新款捷途X90PRO售13.59萬起

      態度原創

      房產
      親子
      健康
      家居
      數碼

      房產要聞

      6.66億摘地,海南封關大動作,千畝海澄新城震撼登場

      親子要聞

      寶寶為啥一出門就不鬧了?真相不是“看新鮮”,90%家長沒琢磨透

      這些新療法,讓化療不再那么痛苦

      家居要聞

      溫暖色調 大空間不冷清

      數碼要聞

      韓國Wits公司:向三星Z TriFold供應無線充電模塊

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 性XXXX视频播放免费直播| 亚东县| √8天堂资源地址中文在线| 蜜桃av蜜臀av色欲av麻| av无码av天天av天天爽| 九九精品在线观看| 亚洲免费成人网站| 精品久久一区| 国产精品亚洲av三区色| 伊人久久大香线蕉av一区| 亚洲av专区一区| 香蕉av在线观看| 亚洲熟女乱色综合亚洲| 久久精品蜜芽亚洲国产av| 强行从后面挺进人妻| 国产口爆| 日韩A| 丁香婷婷综合激情五月色| 亚洲欧美综合精品成人导航| 午夜福利看片在线观看| 久久黄色网| 老河口市| 久久久亚洲精品无码| 一进一出抽搐gif| 日韩午夜福利| 黄浦区| 人妻少妇久久中文字幕| 高潮喷水抽搐无码免费| 国产日韩精品欧美一区灰| 91pao| 久精品国产欧美亚洲色aⅴ大片| 午夜免费视频| 国产情侣激情在线对白| 丝袜a片| 久热超碰| 51久久国产露脸精品国产| 日本一区二区三区四区黄色| 久久久久久久久无码| 成人av片无码免费网站| 人人玩人人添人人澡超碰| 精品久久久久久无码人妻蜜桃|