<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      基于非英偉達卡訓練,實測美團開源模型與DeepSeek、阿里 Qwen 3誰更強?

      0
      分享至

      作者|子川

      來源|AI先鋒官

      這個夏天最爽的事情,莫過于熱熱鬧鬧的外賣大戰!

      實在是太省錢啦!

      當大家還在推測這場補貼大戰還要持續多久之時,美團忽然把方向盤一打。

      宣布:我要發布個開源大模型啦!


      就在昨天,美團發布了其首款開源大模型LongCat-Flash,這是一款擁有5600億個總參數的MoE(混合專家)模型。


      為什么會推出這款來源大模型?

      美團CEO王興在不久前的年報電話會上,曾給出清晰的戰略框架。

      王興將美團的AI戰略闡述為三個層次:第一層是工作中的AI ,用以提升內部員工的生產力;第二層是產品中的AI ,用AI升級現有服務并推出全新的AI原生產品;最后是自研大語言模型 。

      LongCat-Flash正是第三層戰略的直接體現。

      在這個戰略藍圖下,美團核心本地商業CEO王莆中曾公開確認稱,正打造的“ 專屬生活小秘書 ”,就是那個最核心的AI原生產品。

      而且,尤其值得關注的是,LongCat-Flash的訓練,并非基于英偉達GPU完成。

      在其官方報告中,美團使用了“數萬個加速卡”的模糊表述。

      由于一些原因,該硬件廠商的具體名字不方便透露。

      意義重大。

      產品方面,據介紹,LongCat-Flash采用 Shortcut-connected MoE 架構和 “零計算專家” 雙重機制,使總參數 5600 億的模型在推理時僅僅激活 18.6B–31.3B 參數。

      能實現每秒 100 tokens 以上的單卡推理速度, 比DeepSeek-V3 還快 50%。

      別看美團是外賣公司,但其開源的LongCat-Flash模型紙面實力一點都不弱。


      它在Agent工具調用、指令遵循的表現超過國內數一數二的DeepSeek-V3.1、Qwen3 MoE-2507,甚至比閉源的Claude4 Sonnet還要好。

      不過LongCat-Flash在通用領域、編程等場景的能力和、Kimi-K2、Qwen3 -2507還有一定差距。

      價格上,LongCat-Flash屬于物美價廉,據美團龍貓團隊介紹,輸出成本低至 5 元/百萬 Token。

      那效果到底如何,我們來測試一番,作為初來乍到的模型,當然得把之前模型踩過的坑都再踩一遍,看它能不能hold得住。

      首先,是一道曾難倒無數模型的比大小問題——9.11和9.8誰大?


      遺憾,開局不利,LongCat-Flash回答錯誤,比大小失敗。

      接下來,是另一個經典的坑——數字母。

      我們讓它數“Strawberry”這個詞中有幾個字母“r”,為了防止數據被提前訓練,我們特意在原詞基礎上多加了一個“r”。


      在加了一個字母“r”的情況下,LongCat-Flash依舊回答正確,扳回一局!

      為了驗證它是否是真的會數字母,換一個詞”assessments“,讓它數里面有幾個字母“s"。


      這次就沒有回答正確,”assessments"有5個字母“s”,而它給出的回答是4次。

      再來看看下一道題,一根8米的繩子,可以通過寬2米,長2米的門嗎?


      還是翻車,依舊回答錯誤,LongCat-Flash給出的回答是“一根8米的棍子無法直接通過寬2米,長2米的門”。

      很遺憾,在這些曾用于刁難其他模型的經典測試題中,LongCat-Flash的表現并沒有想象中的那么好

      不過,這并不能代表該模型的全部實力,直接進入下一趴,和其他模型來場PK。

      此次派出的選手分別是Deepseek R1和Qwen3 -2507,看看LongCat-Flash能否真的辣么厲害。

      為了防止它們這三兄弟“開掛”,測試過程中不開搜索。

      試題一:高三摸底試卷題


      這道題是一道多選題,正確答案是:A、B、D,看看哪位選手能做對,為了測試的準確性,將題目轉換成了LaTeX格式。

      LongCat-Flash:


      Deepseek R1:


      Qwen3 -2507:


      Qwen3 -2507和Deepseek R1都回答準確,出個了正確答案:ABD,反觀LongCat-Flash回答錯誤,露了一個A。

      測試題二:天氣卡片

      提示詞:
      Create a single HTML file containing CSS and JavaScript to generate an animated weather card. The card should visually represent the following weather conditions with distinct animations: Wind: (e.g., moving clouds, swaying trees, or wind lines) Rain: (e.g., falling raindrops, puddles forming) Sun: (e.g., shining rays, bright background) Snow: (e.g., falling snowflakes, snow accumulating) Show all the weather card side by side The card should have a dark background. Provide all the HTML, CSS, and JavaScript code within this single file. The JavaScript should include a way to switch between the different weather conditions

      經典老題,測試模型的美感,看誰生成的更加好看。

      LongCat-Flash:

      Deepseek R1:

      Qwen3 -2507:

      從上面的視頻不難看出,LongCat-Flash生成的效果真不賴,不過如果要說誰生成的效果更好看,那自然是Qwen3 -2507。

      測試題三:3D山脈


      提示詞:創建一個 3D HTML 山脈場景,包含懸崖、河流和晝夜光照變化。支持拖動和縮放、動畫過渡、真實感漸變色,并可切換等高線顯示。

      這道題主要是測試模型的編程能力,因為測試了很多模型,發現有很多模型面對這道題,生成的效果都不咋樣,看看它們是否能交出一個滿意的答卷。

      LongCat-Flash:

      Deepseek R1:

      Qwen3 -2507:

      這次測試不知道為什么,連續生成了3次,DeepSeek R1都沒有生成完整的山脈,而LongCat-Flash和Qwen3 -2507則是生成出來了,但LongCat-Flash生成的效果更好。

      測試題四:邏輯推理題


      提示詞:給
      甲、乙、丙三人各發一個正整數,并告訴他們他們三人的數字之和為14。甲對乙和丙說:我知道你們兩人的數字一定不相等。
      乙想了想,對甲說:我們兩人的數字之差一定比丙大。
      丙聽完甲和乙的話后,依舊沉默不語。
      若甲乙丙三人都很聰明,且只要他們能推斷出三人的數字分別是什么,那個人會在第一時間說出。(不考慮甲、乙見到丙沉默之后是否知曉)
      那么,丙的數字是多少?

      先說答案:4。

      LongCat-Flash:


      Deepseek R1:


      Qwen3 -2507:


      全部回答準確。

      雖然此次測試沒有基準測試那么全面,但也可以看出各個模型的優缺點。

      目前美團的LongCat-Flash模型已經上線Hugging Face、GitHub等開源平臺,技術報告同步發布。

      同時,美團也提供了LongCat-Flash模型的網頁版體驗鏈接。

      傳送門:longcat.ai/

      感興趣的小伙伴可以去試一試。

      掃碼邀請進群,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。

      往期文章回顧

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      廣州人注意!陽性率上升,傳染性強!目前暫無疫苗或者特效藥!

      廣州人注意!陽性率上升,傳染性強!目前暫無疫苗或者特效藥!

      羊城攻略
      2026-01-24 22:58:42
      每體:門前表現出色,特爾施特根幫助赫羅納保住了一分

      每體:門前表現出色,特爾施特根幫助赫羅納保住了一分

      懂球帝
      2026-01-27 13:19:31
      俄羅斯迎來黑暗一天!

      俄羅斯迎來黑暗一天!

      安安說
      2026-01-24 10:48:00
      賣掉5年油車換電車,開2年后坦言:這些網上說法都是真的

      賣掉5年油車換電車,開2年后坦言:這些網上說法都是真的

      復轉這些年
      2026-01-24 22:57:39
      好友相繼緬懷拼湊出,何晴生命最后時光:拮據、變樣、舍不下兒子

      好友相繼緬懷拼湊出,何晴生命最后時光:拮據、變樣、舍不下兒子

      阿郎娛樂
      2025-12-17 07:38:57
      現貨白銀日內漲7%

      現貨白銀日內漲7%

      每日經濟新聞
      2026-01-27 10:27:06
      廣東打工大齡未婚男子回到湖南農村,無人問津:沒必要找老婆了

      廣東打工大齡未婚男子回到湖南農村,無人問津:沒必要找老婆了

      心軒專欄
      2026-01-25 22:11:55
      外交部宣布:奧爾西將訪華

      外交部宣布:奧爾西將訪華

      環球時報國際
      2026-01-26 19:43:41
      51歲迪拜前王妃哈雅現身,又老又胖,女兒逃離王室后面相也變了

      51歲迪拜前王妃哈雅現身,又老又胖,女兒逃離王室后面相也變了

      笑傲春秋
      2026-01-12 15:19:36
      司令部收到情報難分真假,毛主席:去看看街上有沒有官太太賣東西

      司令部收到情報難分真假,毛主席:去看看街上有沒有官太太賣東西

      顧史
      2026-01-26 16:15:16
      本賽季要怎樣才算成功?弗林蓬:贏得足總杯和歐冠冠軍

      本賽季要怎樣才算成功?弗林蓬:贏得足總杯和歐冠冠軍

      懂球帝
      2026-01-28 00:20:06
      向太曝馬伊琍已再婚:當年文章過不了心理那關

      向太曝馬伊琍已再婚:當年文章過不了心理那關

      娛樂看阿敞
      2025-12-12 15:50:00
      得道多助!美國乒乓球職業聯賽創始人公開質疑樊振東排名缺失問題

      得道多助!美國乒乓球職業聯賽創始人公開質疑樊振東排名缺失問題

      鳳幻洋
      2026-01-27 16:14:11
      后續!武漢師傅跨500公里送發動機:錢款已退回,車主正臉曝光

      后續!武漢師傅跨500公里送發動機:錢款已退回,車主正臉曝光

      離離言幾許
      2026-01-27 14:38:53
      我軍總攻諒山,蘇軍大將不信邪非去觀戰,結果差點連人帶車被炸飛

      我軍總攻諒山,蘇軍大將不信邪非去觀戰,結果差點連人帶車被炸飛

      芊芊子吟
      2026-01-27 23:35:03
      12斤肉3個月甩凈!全紅嬋減重到離譜,這哪是減肥,是拿命拼金牌

      12斤肉3個月甩凈!全紅嬋減重到離譜,這哪是減肥,是拿命拼金牌

      做一個合格的吃瓜群眾
      2025-12-31 07:41:05
      給《太平年》演技最好的演員排個名:朱亞文第七,倪大紅第三

      給《太平年》演技最好的演員排個名:朱亞文第七,倪大紅第三

      另子維愛讀史
      2026-01-27 19:44:33
      萬歷的怠政有多奇葩

      萬歷的怠政有多奇葩

      無心鏡
      2026-01-25 08:24:32
      抗癌小王子豪豪離世,笑著對抗六年病痛,父親回應:孩子解脫了

      抗癌小王子豪豪離世,笑著對抗六年病痛,父親回應:孩子解脫了

      云景侃記
      2026-01-28 00:13:21
      步大S后塵?蔣欣減肥暴瘦引擔憂,健康亮紅燈恐成下一個悲劇!

      步大S后塵?蔣欣減肥暴瘦引擔憂,健康亮紅燈恐成下一個悲劇!

      老特有話說
      2026-01-27 23:59:27
      2026-01-28 01:16:49
      AI先鋒官 incentive-icons
      AI先鋒官
      AIGC大模型及應用精選與評測
      421文章數 41關注度
      往期回顧 全部

      科技要聞

      馬化騰3年年會講話透露了哪些關鍵信息

      頭條要聞

      因樓下鄰居關閉水閥女子家中斷水400天 起訴索賠被駁

      頭條要聞

      因樓下鄰居關閉水閥女子家中斷水400天 起訴索賠被駁

      體育要聞

      冒充職業球員,比賽規則還和對手現學?

      娛樂要聞

      張雨綺風波持續發酵,曝多個商務被取消

      財經要聞

      多地對壟斷行業"近親繁殖"出手了

      汽車要聞

      標配華為乾崑ADS 4/鴻蒙座艙5 華境S體驗車下線

      態度原創

      健康
      數碼
      教育
      家居
      軍事航空

      耳石脫落為何讓人天旋地轉+惡心?

      數碼要聞

      這事你怎么看 索尼與TCL簽署意向備忘錄 網友:Sony變Tony了

      教育要聞

      再創歷史新高!南京高三期末調研考劃線及成績出爐

      家居要聞

      現代古典 中性又顯韻味

      軍事要聞

      美海軍"林肯"號航母打擊群抵達中東地區

      無障礙瀏覽 進入關懷版