<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      細說|文心5.0 :2.4萬億參數、原生全模態架構

      0
      分享至

      今天是百度世界大會,文心 5.0 發布

      對于這個模型,要點歸結如下:

      • ? 2.4 萬億參數 :MoE架構,激活參數低于 3%

      • ? 原生全模態 :不同的路線選擇, 我覺得這是最大的發布,會細說

      • ? 40 余測試領先 :語言與多模態的綜合能力,與 Gemini-2.5-Pro、GPT-5-High 等模型持平

      語言能力 BenchMark “原生全模態”

      這次發布最大的信息點,是原生全模態這個架構

      要理解全模態,得從多模態說起

      這個詞,大家不陌生,最基礎的就是 AI 能看圖,后續還有能聽聲音、能看視頻,乃至能畫圖,這是怎么做的呢?

      最開始:假裝多模態

      最開始是純工程技巧,看圖靠 OCR、看視頻靠識別字幕、聽聲音靠 ASR(語音轉文字,然后再理解)


      OpenAI 的手搓規范: 讓 GPT 假裝學會多模態 接下來:學會多模態

      再之后,來到了「多模態」時代,廠商們也各自推出了「多模態模型」,一種做法是采用“后期融合”(Late Fusion),或者...我愿稱之為稱之為“拼好模”的策略

      簡單來說,就是為不同的信息模態(如文本、圖像、音頻)分別訓練獨立的編碼器(Encoder)。這就像是為不同的語言分別找了專家翻譯(差不多就這個意思)。一個圖像專家負責把圖片“翻譯”成機器能理解的數字特征,一個文本專家負責處理文字


      這事兒,最典型的就是當年的 GPT4-Vision,圖片到代碼

      舉個例子,當模型接到一個圖文任務時,它會先把這些專家的“翻譯稿”收集起來,再交給一個更高層的模塊進行整合,最終輸出結果。當然了,在多次“翻譯”和“整合”的過程中,信息不可避免地會產生損耗和偏差

      到現在:成為全模態(還在進行)

      原生全模態,則是想從根上解決問題,讓大模型能夠融合的處理各種信息


      換句話說:只有融合了全模態,才能把 AI 真當個人用

      這個方向,從原生多模態開始,Google 的 Gemini 是第一個大規模商業化并強調 原生多模態(natively multimodal) 概念的主流大模型,支持多模態的輸入,和文字的輸出。再之前,OpenAI 的 GPT-4V、Google 自己的 PaLM 等都是后期融合方式

      百度也在這個方向進行了探索,理論上還更進一步,就是這個文心 5.0,是按原生全模態來做的,架構上支持全模態的理解和輸出(文字、圖像、聲音和視頻)

      原生全模態 不同于業界多數的多模態模型采用后期融合的方式,文心 5.0 的技術路線是采用統一的自回歸架構進行原生全模態建模,理解與生成一體化。 ——王海峰,百度首席技術官

      這里面有幾個硬骨頭要啃:

      第一個:理解生成一體化
      多模態的理解和生成,在技術上是兩種不同的任務,需要模型在學習生成一張圖片的同時,也在提升它對圖片的理解能力,反之亦然

      第二個:統一架構下的訓練效率
      把不同模態的數據硬塞進一個統一的自回歸架構,需要極強的工程能力,也需要非常多的試錯(這個免不了)

      第三個:推理成本優化
      這事兒我還去專門問了,以百度這個為例,干了很多臟活累活辛苦活,包括不僅限于多模態編碼器分離異步訓練、動態自適應顯存卸載、FP8 混合精度訓練等

      沒辦法...搞模型的也是得為了用,控制好計算與推理成本,才能讓東西有上線的可能

      當然,理想和現實總有差距,大家都在往這個方向嘗試,但迄今為止,誰都沒完整放出來

      期待 全模態輸入+全模態輸出(能輸出各類內容) 目前 全模態輸入+多模態輸出(輸出圖片+文字)

      順便說下 MoE

      這里額外提一下,國內最早公開大規模落地 MoE 架構的,是“悟道”團隊(北京智源研究院)2021年,他們訓練了一個 1.75 萬億參數的模型


      悟道2.0...這是許多東西,開始的地方

      這兩年 MoE 也是體量模型的主流,從 Mistral-8x22B (還有人記得這個么)到 DeepSeek 671B、到 Kimi K2 和 MiniMax M2(這倆萬億參數),反正一個比一個大


      去年初的 Mistral,恍如隔世...

      百度這個文心5.0,參數又翻了一倍,到了2.4 萬億,應該是目前業界已公開參數的模型中,體量最大的

      能力表現

      這塊分為兩部分,先說說多模態帶來能力提升,再說說官方給到的評分榜單

      多模態能力

      音視頻理解
      先給大家洗洗耳朵,這首歌我聽了好多遍

      真的,這首《遇害》,我聽了好多好多遍,希望你也喜歡


      多圖/視頻比較
      這里有一個非常獨特的 case:圖片找不同


      在【找不同】的場景下,如果大模型是工程做法,則難以完成,比如:先把圖片轉化成文字描述,像這樣

      • [第一張圖片:一只貓在玩球,背后是xxxx]

      • [第二張圖片:一只貓在玩球,背后是xxxx]

      工程做法中,大模型會把這兩個描述塞進上下文里,然后對這兩個這兩個描述詞進行比較。自然的,完成不了【找不同】的這個任務

      但你會發現,如果 AI 能過全模態的進行理解,是會把我的文字提問、兩張圖的信息,都進行處理,并得到正確的結果



      細節捕捉&推理
      我們都知道,華強喜歡吃西瓜

      但華強不是孔融,西瓜肯定得拿大的

      那么,劈開的瓜中,是左邊大,還是右邊大?


      這里我也校驗了一下,確實是左邊瓜大


      評分榜單

      語言的相關榜單,對比 Deepseek-V3.2-Exp/Gemini-2.5-Pro/GPT-5(high),從左往右依次為:

      • (平均值)

      • 知識:SimpleQA、ChineseSimpleQA

      • 指令遵循:IFEval、MultiChallenge

      • 學科綜合:MMLU-Pro、Hulmanity's Last Exam

      • 邏輯推理:ZebraLogic、BBEH

      • 數學:AIME 2025、HMMT 2025

      • 代碼:LiveCodeBench v6(24.08-25.05)、HumanEval+、MBPP+

      • 智能體:TAU2-Bench、ACEBbench-en、ACEBbench-zh、BFCL V4、terminal-benc@1.0、BrowseComp-zh、SpreadSheetBench

      • 多語言:MMMLU-Lite、Multi-IF

      語言相關榜單

      音頻理解的相關榜單,對比 GPT-4o Audio/Gemini 2.5 Pro,從左往右依次為:

      • 音頻理解:MMAU、TUT2017、CochScene

      • 文本語音對話:OpenAudioBench-AlpacaEval、OpenAudioBench-Llama Questions、OpenAudioBench-Reasoning QA、OpenAudioBench-TriviaQA、OpenAudioBench-Web Question

      • 語音識別(數值越低越好):LibriSpeech(avg)-EN、Fleurs-EN、Fleurs-ZH、AISHELL-2-ZH

      音頻理解相關榜單

      視覺理解的相關榜單,對比 Gemini-2.5-Pro,GPT-5(high),從左往右依次為

      • (平均值)

      • 理科&推理:MathVista、MathVerse、MathVision、MMMU、VLM are Blind、VisuLogic、VisualPuzzle

      • 文檔理解:ChartQA、AI2D、DocVQA(val)、OCRBench、CharXiv-RQ、CharXiv-DQ

      • 通用視覺問答:SimpleVQA、HallusionBench、MMStar、BLINK、CV-Bench、CountBench

      視覺理解相關榜單 最后

      講個冷知識,百度是第一批整大模型的

      在 2019 年 3 月,百度弄了文心1.0


      https://arxiv.org/abs/1904.09223

      在 ChatGPT 誕生后,百度也是發布了文心一言


      2023年3月16日

      后續幾年,節奏似乎就放緩了..

      到了 2025,有點抬頭的意思了,能感到是開始重新做了投入,包括PaddleOCR-VL和這次的模型發布,就給人一種感覺(也不知道對不對)

      百度回歸牌桌

      聲明:包含AI生成內容

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      勝青島發布會!杜鋒談傷病情況,贊徐杰與2小將,王少杰回應傷勢

      勝青島發布會!杜鋒談傷病情況,贊徐杰與2小將,王少杰回應傷勢

      籃球資訊達人
      2025-12-21 22:42:40
      美聯儲,降息突發!

      美聯儲,降息突發!

      中國基金報
      2025-12-22 00:11:51
      南博事件還未平!北京一捐贈300多件藏品者后人,表示想去查查帳

      南博事件還未平!北京一捐贈300多件藏品者后人,表示想去查查帳

      火山詩話
      2025-12-21 08:48:38
      克林頓罕見強硬發聲:這不是烏克蘭的戰爭,而是美國的戰爭!

      克林頓罕見強硬發聲:這不是烏克蘭的戰爭,而是美國的戰爭!

      老馬拉車莫少裝
      2025-12-20 14:50:21
      只能退40%也要退,大批靈活就業在“被迫”退繳社保,原因有這4點

      只能退40%也要退,大批靈活就業在“被迫”退繳社保,原因有這4點

      平說財經
      2025-11-19 19:39:39
      庫里28+9+6勇士戰勝太陽結束3連敗,巴特勒25分追夢被逐布克38+5

      庫里28+9+6勇士戰勝太陽結束3連敗,巴特勒25分追夢被逐布克38+5

      湖人崛起
      2025-12-21 12:04:40
      你見過最主動的女人是啥樣?網友:不要主動,主動了,他就不理了

      你見過最主動的女人是啥樣?網友:不要主動,主動了,他就不理了

      帶你感受人間冷暖
      2025-12-20 00:20:10
      股價跌超43%!泡泡瑪特王寧現身遭喊話:回購點吧,跌成狗了

      股價跌超43%!泡泡瑪特王寧現身遭喊話:回購點吧,跌成狗了

      金石隨筆
      2025-12-21 18:12:25
      600800,終止重大資產重組!明日復牌!

      600800,終止重大資產重組!明日復牌!

      證券時報e公司
      2025-12-21 12:39:18
      俞敏洪自嘲成為“道歉哥”:一天到晚在道歉

      俞敏洪自嘲成為“道歉哥”:一天到晚在道歉

      都市快報橙柿互動
      2025-12-21 17:35:45
      魏建軍再開炮!推出購車防忽悠指南,有些車企瑟瑟發抖

      魏建軍再開炮!推出購車防忽悠指南,有些車企瑟瑟發抖

      象視汽車
      2025-12-19 07:00:05
      胡定欣新婚豪宅曝光 親手布置2米巨型圣誕樹客廳闊落盡顯奢華

      胡定欣新婚豪宅曝光 親手布置2米巨型圣誕樹客廳闊落盡顯奢華

      TVB資訊臺
      2025-12-21 21:17:07
      周琦一家近照,大6歲妻子身材好,兒子也愛籃球,29歲身家過億

      周琦一家近照,大6歲妻子身材好,兒子也愛籃球,29歲身家過億

      籃球看比賽
      2025-12-21 13:07:53
      54歲朱茵現狀:依舊開97年的車,住在深山殘屋,狀態一如既往的好

      54歲朱茵現狀:依舊開97年的車,住在深山殘屋,狀態一如既往的好

      小熊侃史
      2025-12-17 09:43:27
      冬至前夜探訪成都“羊肉湯一條街”:生意不如往年火爆 有商家表示“不漲價”

      冬至前夜探訪成都“羊肉湯一條街”:生意不如往年火爆 有商家表示“不漲價”

      封面新聞
      2025-12-21 10:33:14
      埃梅里:桑喬在嚴格要求自己,爭取在本賽季拿出最佳表現

      埃梅里:桑喬在嚴格要求自己,爭取在本賽季拿出最佳表現

      懂球帝
      2025-12-22 00:15:16
      戰滿3局遺憾失利!王祉怡無緣衛冕總決賽,安洗瑩奪賽季第11冠

      戰滿3局遺憾失利!王祉怡無緣衛冕總決賽,安洗瑩奪賽季第11冠

      全景體育V
      2025-12-21 18:28:30
      江蘇2766人逾期未資格認證將被暫停養老待遇

      江蘇2766人逾期未資格認證將被暫停養老待遇

      揚子晚報
      2025-12-21 22:33:26
      經常和中俄在一起的中亞五國,這次都屁顛的跑去日本,被策反了?

      經常和中俄在一起的中亞五國,這次都屁顛的跑去日本,被策反了?

      我心縱橫天地間
      2025-12-21 18:05:52
      死神來了:日本夫妻在桑拿房里被活活蒸死……

      死神來了:日本夫妻在桑拿房里被活活蒸死……

      日本物語
      2025-12-20 20:34:22
      2025-12-22 00:59:00
      賽博禪心
      賽博禪心
      拜AI古佛,修賽博禪心
      218文章數 12關注度
      往期回顧 全部

      科技要聞

      生態適配已超95% 鴻蒙下一關:十萬個應用

      頭條要聞

      必勝客牛排口感奇怪遭質疑"到底用的什么肉" 官方介入

      頭條要聞

      必勝客牛排口感奇怪遭質疑"到底用的什么肉" 官方介入

      體育要聞

      勇士火箭贏球:王牌之外的答案?

      娛樂要聞

      星光大賞太尷尬!搶話擋鏡頭,場地還小

      財經要聞

      老房子“強制體檢”,政府出手了

      汽車要聞

      -30℃,標致508L&凡爾賽C5 X冰雪"大考"

      態度原創

      藝術
      房產
      游戲
      本地
      軍事航空

      藝術要聞

      130米!韓國最“女性化”的摩天樓,曲線美艷

      房產要聞

      中交·藍色港灣一周年暨藍調生活沙龍圓滿舉行

      誰說游戲里只能打怪?這游戲讓你做鬼差推因果,善惡全由你定

      本地新聞

      云游安徽|訪黃山云海古村,讀一城山水風骨

      軍事要聞

      石破茂:擁核絕不會給日本帶來正面影響

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产成人精品亚洲| 99re6在线视频精品免费下载 | 91高清视频在线| 97se综合| 国产午夜视频在线观看| 伊人毛片| 成人无码h真人在线网站| 亚洲欧洲AV| 久久国产成人精品av| 新疆| 天天爽天天爽夜夜爽毛片| 日本理伦片午夜理伦片| 大香伊蕉在人线国产av| 国产婷婷综合在线视频中文| 成在线人免费| 女人高潮被爽到呻吟在线观看| 毛片24种姿势无遮无拦| 吉安市| 精品国产一区二区三区国产馆| 欧美va免费高清在线观看| 国产精品人成视频免| 91资源在线| 新建县| 宁南县| 免费在线观看A| 开心久久婷婷综合中文字幕| 国产日韩欧美| 国产人妻aⅴ色偷| 97在线视频免费人妻| 国产区二区三区在线观看| 新婚少妇无套内谢国语播放| 亚洲精品蜜桃久久久久久| 欧美日韩导航| 久久精品无码精品免费专区| 大地资源网中文第五页| 亚洲人成网站999久久久综合| 午夜欧美精品久久久久久久 | 在线亚洲人成电影网站色www| 国产AV一区二区三区| 乌兰察布市| 国产成人精品亚洲午夜|