<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      百度大模型又支棱起來了嗎?文心一言 5.0 我實測了

      0
      分享至

      免責:

      本文純個人觀點,僅測試文本理解、代碼生成能力,結果不代表 ERNIE 5.0 完整、真實水平。

      省流

      • 1、生成速度很慢

      • 2、網頁版居然沒有 html 預覽功能,這事兒不難啊,Kimi、Qwen 都可以

      • 3、各種拉垮,6 個題目,沒有 1 個可以與 Kimi K2 Thinking 掰手腕,只有最后1題完成度高,能勉強與Qwen-3Max對比

      • 4、它對指令的理解很差,但凡與圖像生成沾邊的都會忽略指令,開始直接 AI 繪圖,即便你已經明確告訴它了實現方式也不行。

      • 5、或許我不應該測試它最新這個多模態版 ERNIE 5.0,1022 版本的文心 5.0 號稱文本能力更強,我沒再測。但是話說回來了,多模態就可以不遵守指令嗎?

      • 6、它太喜歡畫畫了

      大家好,我是 Ai 學習的老章

      最近一周國產大模型還是很熱鬧的

      阿里更新了 Qwen DeepResearch、微博開源了基于 Qwen2.5-Math-1.5B 微調 VibeThinker 1.5B 大模型

      最讓我感興趣的是“支棱起來”的百度 ERNIE 5.0 來了,對標 ChatGPT,原生全模態支持。

      官方宣稱的模型特色之處:

      原生統一多模態建模技術,結合文本、圖像、音頻和視頻進行理解和生成 采用超過 2.4T 的 MoE 架構,每次推理激活不到 3 個,降低計算量同時提升推理效率 在 40 多項基準測試中表現出前沿水平的性能

      基準測試對比情況

      1、文本處理,各項基準平均值,穩贏 DeepSeek-V3.2-Exp 和 Gemini-2.5-Pro,還有幾個基準能打贏 GPT-5


      2、視覺理解各種領先,N 多項上 Gemini-2.5-Pro、GPT-5 都手下敗將


      3、圖像生成秒殺 GPT-image 和谷歌的 Nano-Banana、視頻生成與 Veo3 旗鼓相當


      4、音頻理解、STT、語音識別都各種強過 GPT-4o-Audio、Gemini-2.5-Pro


      真實水平咋樣呢,我就直接單測試其文本處理、代碼能力吧

      這些題目與之前我測試 K2 Thinking 和 Qwen3-Max 一致,更容易看出模型差距

      測試平臺為官方網站:https://ernie.baidu.com/

      模型選擇文心 5.0 Preview


      ERNIE 5.0 1022 預覽版具有更強的文字能力,ERNIE 5.0 預覽版是最新版本 測試 1:總結朱自清《背影》繪制 SVG

      字都出格了,跟 Kimi K2 Thinking 沒法比,也比不上一樣沒能正確識別出 4 次背影但繪制 svg 正常的 Qwen3-Max,

      Kimi K2 Thinking
      Qwen3-Max


      測試 2:生成器官分布

      怎么就出發了繪圖功能呢?


      即便告訴它給我 svg 代碼,依然失敗



      測試 3:用 html 創建一個帶有旋轉星云和動態光照的 3D 粒子星系。

      思考過程看,也是用 Three.js 創建 3D 場景、相機和渲染器,但是太太太簡陋了

      完敗與 K2 Thinking 和 Qwen3-Max


      沒有對比就沒有傷害


      測試 4:發揮你的最大才能,用你最擅長的工具,生成一組數據后繪制數據大屏,主題自擬。

      ERNIE 5.0 不像 K2 和 Qwen,它先用 Python 腳本生成 csv 數據集,但是可視化時,它告訴我要用Power BI實現。。。


      K2 Thinking 生成的是"未來智慧城市運營中心"主題的數據大屏,包含動態生成的多維度城市運營數據。一共 285 行代碼。前兩次均報 bug,第三次成功生成!


      對比 Qwen3-Max??,它第一次的代碼也報錯,第二次成功


      測試 5:3D 動畫演示月食原理及全過程

      不遵指令,后面我追問了,給我 html 代碼,依然是繪圖



      Kimi K2??

      測試 6:生成一個動態網頁,展現絢麗多彩的煙花盛況,樣式要多,顏色要炫

      這次遵守指令了,思考過程是用 html+CSS+js 實現,效果如下,除了相比 K2 和 Qwen 功能上少了,完成度還不錯,甚至比 Qwen3-Max 還要好點的感覺

      K2 Thinking 碾壓 Qwen3-Max 的視頻

      最后再說一句,即便是我切換成 10 月份擅長文本生成的文心 5.0,它的指令遵循也不穩定,它太喜歡畫畫了,思考過要用 html5 和 webgl 實現后,pia 一下直接 AI 繪畫了


      最后再推薦一個我正在學習的強化學習課程



      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中國批準稀土出口,日媒歡呼:對華反制措施見效,下一秒遭打臉

      中國批準稀土出口,日媒歡呼:對華反制措施見效,下一秒遭打臉

      書紀文譚
      2026-02-10 18:32:15
      上海洗浴中心成新頂流,俄羅斯美女博主被圈粉,還有海外游客專門飛來打卡

      上海洗浴中心成新頂流,俄羅斯美女博主被圈粉,還有海外游客專門飛來打卡

      界面新聞
      2026-02-11 18:31:08
      四川成都一佳人好漂亮, 身高169cm,體重48kg 美的讓人移不開眼

      四川成都一佳人好漂亮, 身高169cm,體重48kg 美的讓人移不開眼

      喜歡歷史的阿繁
      2026-02-07 14:21:17
      退伍回村救了個落水女人,2天后縣長突然來電:明天來我辦公室

      退伍回村救了個落水女人,2天后縣長突然來電:明天來我辦公室

      秋風專欄
      2025-08-13 15:54:55
      頭部朝下落地!中國33歲冬奧老將出意外:被抬出雪場 目前意識清醒

      頭部朝下落地!中國33歲冬奧老將出意外:被抬出雪場 目前意識清醒

      風過鄉
      2026-02-11 20:52:27
      女子8年拒絕8次男友求婚,男友無奈另娶她人,女友:憑什么?

      女子8年拒絕8次男友求婚,男友無奈另娶她人,女友:憑什么?

      小蔣愛嘮嗑
      2026-02-11 05:33:41
      特朗普下達最后通牒,要求臺當局立即付款,否則將取消對臺軍售

      特朗普下達最后通牒,要求臺當局立即付款,否則將取消對臺軍售

      東極妙嚴
      2026-02-11 12:54:31
      亞馬爾連續5場破門+西甲24球,打破梅西和姆巴佩兩項紀錄

      亞馬爾連續5場破門+西甲24球,打破梅西和姆巴佩兩項紀錄

      晚霧空青
      2026-02-11 08:41:59
      從一晚三千到無人接盤,五星級酒店集體被甩賣,這場泡沫該誰買單

      從一晚三千到無人接盤,五星級酒店集體被甩賣,這場泡沫該誰買單

      青眼財經
      2026-01-19 23:37:28
      萬斯:伊朗人民想推翻政權,那得靠他們自己

      萬斯:伊朗人民想推翻政權,那得靠他們自己

      桂系007
      2026-02-11 23:38:09
      笑麻了!以為兩人相伴了一輩子,其實厭煩了幾十年!

      笑麻了!以為兩人相伴了一輩子,其實厭煩了幾十年!

      墻頭草
      2026-02-09 16:37:03
      生圖能打!孟子義青島逛街被偶遇,路人驚呼:白到發光比精修還美

      生圖能打!孟子義青島逛街被偶遇,路人驚呼:白到發光比精修還美

      心靈得以滋養
      2026-02-11 21:50:42
      女演員千萬別整容!看《夜色正濃》里40歲江疏影和36歲藍盈瑩

      女演員千萬別整容!看《夜色正濃》里40歲江疏影和36歲藍盈瑩

      章眽八卦
      2026-02-11 12:40:57
      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      就一點
      2025-11-22 10:36:39
      我去!塔圖姆被下放了!!

      我去!塔圖姆被下放了!!

      柚子說球
      2026-02-11 17:20:08
      利物浦遭重創!后場萬金油被擔架抬下 面臨長期傷停

      利物浦遭重創!后場萬金油被擔架抬下 面臨長期傷停

      球事百科吖
      2026-02-12 07:23:26
      3人共禁賽13場!這大概是年度最兇沖突了!

      3人共禁賽13場!這大概是年度最兇沖突了!

      柚子說球
      2026-02-12 07:52:13
      這跟不穿有什么區別?王楚然裙子太短露膚度極高,胡意旋身材曼妙

      這跟不穿有什么區別?王楚然裙子太短露膚度極高,胡意旋身材曼妙

      樂悠悠娛樂
      2026-02-10 12:44:32
      比賭博還狠的“隱形毒藥”,正慢慢掏空中國家庭,無數人被它拖垮

      比賭博還狠的“隱形毒藥”,正慢慢掏空中國家庭,無數人被它拖垮

      千秋文化
      2026-02-10 20:55:47
      梁朝偉過安檢可憐眼神向劉嘉玲求救前所未見 老婆搞笑反應曝光

      梁朝偉過安檢可憐眼神向劉嘉玲求救前所未見 老婆搞笑反應曝光

      達達哥
      2026-02-10 21:52:25
      2026-02-12 08:35:00
      機器學習與Python社區 incentive-icons
      機器學習與Python社區
      機器學習算法與Python
      3247文章數 11085關注度
      往期回顧 全部

      科技要聞

      Meta將斥資超100億美元建設數據中心

      頭條要聞

      環球:高市"豪賭"大勝 軍工業恐成日本經濟"搖錢樹"

      頭條要聞

      環球:高市"豪賭"大勝 軍工業恐成日本經濟"搖錢樹"

      體育要聞

      搞垮一個冬奧選手,只需要一首歌?

      娛樂要聞

      大孤山風波愈演愈烈 超50位明星扎堆

      財經要聞

      廣州前首富被判無期 200億集資窟窿何償

      汽車要聞

      比亞迪最美B級SUV? 宋Ultra這腰線美翻了

      態度原創

      健康
      親子
      家居
      時尚
      軍事航空

      轉頭就暈的耳石癥,能開車上班嗎?

      親子要聞

      寒假在家卷運動,手眼協調練一練

      家居要聞

      簡雅閑居 靜享時光柔

      其實你不需要這么多褲子,留這3條就夠用!

      軍事要聞

      特朗普:若美伊談判失敗 或再派一支航母打擊群

      無障礙瀏覽 進入關懷版