網易首頁 > 網易號 > 正文申請入駐

“日本最強AI”光速塌房，都怪中國DeepSeek太強？

2026-03-19 16:24:26　來源: 藍字計劃

廣東舉報

分享至

作者｜Hayward

原創首發｜藍字計劃

連日本人自己都繃不住了。

3月17日，日本科技公司樂天高調發布了新一代AI大模型Rakuten AI 3.0，宣稱是日本最大、性能最強的AI大模型。

這款模型來頭不小：一方面，它背后有日本經濟產業省支持的GENIAC項目站臺，算是“國家隊”級別的大模型；另一方面，它還擁有一個相當唬人的標簽，7000億參數。

這什么概念？

哪怕按更具體的口徑來看，它的總參數規模也有671B，依然屬于當前開源模型里的第一梯隊，和DeepSeek V3坐一桌。

背靠日本國內最大靠山，參數又非常突出，對于這款模型的發布，樂天底氣十足，連“（日本）國產模型的逆襲”都喊出來了。

但是，日本網友還沒來得及為Rakuten AI 3.0開香檳，一場來自開源社區的技術打假就給他們澆了一盆冷水。

這款號稱“日本最強、性能最強”的大模型，竟然是咱們中國開源大模型，DeepSeek-V3的日語“套殼版”。

日本的榮光，卻出身不良

和絕大多數的打假“后知后覺”不同，Rakuten AI 3.0的吹牛行為甚至挺不過一個下午。

就在模型出來的幾個小時里，開源社區的大神們就發現，這款加上了非常多牛逼限定詞的AI大模型，有貓膩。

甚至樂天都沒有過多的“掩飾”，因為Rakuten AI 3.0赫然在Hugging Face上的config.json文件里寫著：

model_type: deepseek_v3

architectures: DeepseekV3ForCausalLM

這就相當于明牌告訴大家，這款模型的底層架構來自DeepSeek V3。

當然，DeepSeek V3作為一款開源模型，被學習、借鑒、使用來作為模型架構也正常不過，畢竟這就是開源的初心；

但Rakuten AI 3.0的問題在于，在發布的時候它絲毫沒有提及使用了DeepSeek V3的架構，還搬出了“自主研發”“日本最強”“日本最大”等限定詞，看上去真的是由樂天從0到1，自主鼓搗出來的大模型。

這也是開源社區最不滿的地方：這款模型在上傳的時候，沒有充分保留DeepSeek原有的歸屬/許可證聲明；直到被社區抓包之后，才悄悄地補上了NOTICE文件。

樂天的這種做法，顯然是違背了開源精神，“需要保留原許可證和歸屬”的要求。

在使出這一招“亡羊補牢”之后，別說路人，連日本網友都好感都敗光了。對于這款模型，日本網友都評論基本都是：

“GENIAC項目花納稅人的錢，就做個DeepSeek的日語fine-tune版？”

“自稱日本最大高性能，卻是中國的日語版。”

那么這款模型的性能怎么樣呢？

根據樂天官方陸續公布的數據，Rakuten AI 3.0的紙面成績其實相當能打。

像Japanese MT-Bench這樣的日語綜合基準，它已經跑贏了GPT-4o；而在日本文化理解、敬語表達、商務郵件、報告寫作、文檔分析這些更偏本土語境的任務里，表現也明顯很強。

再加上它雖然總參數接近7000億，但因為用了MoE稀疏架構，單次推理實際激活的參數并不高，成本還能被壓到相當前沿閉源模型的10%左右。

也就是說，這模型不只是“成績好看”，而且用起來還非常省錢。

但熟悉大模型的人一眼就看出了：這些不都是DeepSeek本來的優勢嗎？

是的，畢竟是一款基于DeepSeek-V3架構、再做日語數據微調和本土化優化的大模型，Rakuten AI 3.0的表現越是厲害，就越是能證明DeepSeek厲害，這也是X上相當一部分日本網友破防的點：

“日本政府用了納稅人的錢來支持你們，你們卻用來證明中國的DeepSeek牛逼？”

估計梁文鋒看到這出戲，做夢都得笑醒。

司空見慣的“抄襲”

但是，日本的網友們可能也有點“失憶癥”了，畢竟從日本AI大模型的發展歷程來看，抄襲，或者優雅點說：“套殼”，不是常態嗎？

Rakuten AI 3.0可不是第一個使用了別家大模型架構作為基座的日本模型。

一個典型例子，是日本AI公司ABEJA在2025年4月左右推出的小型日語專精推理模型：ABEJA QwQ 32b。

光看這個名字，其實就已經名牌了。

畢竟連QwQ這個阿里千問系最標志性的前綴，它都懶得改。

而實際情況也差不多。

這款模型的底座，本來就是Qwen2.5 + QwQ-32B，ABEJA做的事情，說白了就是先拿千問模型做日語持續預訓練，再把推理能力整合進去，最后補一輪日語強化和微調。

本質上，它和樂天這次的路數并沒有什么不同：都是拿中國開源大模型當基座，再靠本土數據和場景去做一層“日本化”包裝。

只不過，ABEJA至少沒有把自己演成什么從0到1橫空出世的“日本最強原創模型”。

它不但把底座和訓練路徑寫清楚，連阿里那邊都沒有介意，阿里巴巴官方X賬號甚至還專門轉發慶祝，大意就是：ABEJA做的日語推理模型，成績已經超過了GPT-4o。

同樣是“套殼”，ABEJA當然也談不上多原創，只不過人家至少沒有一邊踩著別人的底座，一邊還忙著擦腳印。

除了ABEJA和樂天，不少日本公司其實也大體走的是這條路。

像Lightblue、ELYZA這些做日語模型的玩家，底下是Qwen、Llama等現成底座，有的也會結合DeepSeek、Mistral這類強模型能力做本土化，上面再糊一層更懂日本企業文檔、客服語料、敬語語境、制造業日志的數據，把它調成一個“更會說日本話、更會干日本活”的版本。

日經新聞網之前曾報道過，“「AIモデルスコア」で日本企業が開発した上位10モデルのうち、新興ABEJA（アベジャ）のモデルなど計6種がディープシークやQwenを基盤に開発されていた。”

翻譯過來，就是現在日本公司推出的前10大模型里，有6個都是基于DeepSeek或Qwen進行二次開發。

其實，這在AI圈本來也不算是什么原則性問題，全球AI行業現在本來就是這么玩的。

美國也好，歐洲也好，中國也好，別說二三線團隊了，很多一線團隊其實也在走這條路：拿Qwen做推理增強，拿DeepSeek做蒸餾和本地部署，拿Llama做行業版，拿Mistral做輕量化和邊緣場景。

畢竟，從頭訓練一個前沿基座，燒掉的是天文數字級別的算力、資金和人才；但如果你已經有了一個足夠強的開源底座，真正決定你能不能跑出來的，反而是后面的數據、場景和落地能力。

所以，樂天這次的“炎上”，本質不是因為“抄襲”而觸犯天條，而是干得太不體面了。

一邊吃著開源模型的紅利，一邊又拼命把自己往“自主研發”“日本最強”“日本最大”上靠；一邊站在DeepSeek的肩膀上，一邊又不愿把這件事說透，甚至連許可證和歸屬都都悄悄藏起來。

別人套殼，至少套得坦坦蕩蕩；樂天套殼，卻偏偏還想演成“全靠自己”。

又或許，樂天這次“不體面”的背后，折射出的，只是整個日本科技領域已經落后于世界的冰山一角。

日本IT業，失落的30年

1990年，隨著經濟泡沫被刺破，整個日本都仿佛被按下了暫停鍵。

股價暴跌、地價跳水、不良債權爆發、銀行惜貸、企業連鎖倒閉……整個日本經濟像多米諾骨牌一樣接連崩塌，正式跌入“平成不況”，并由此開啟了失落的10年、20年，乃至30年。

而在這樣的背景下，日本IT行業的軌跡，也幾乎成了這場長期停滯的縮影。

關于日本的“笑話”大家已經看到非常多了：

都2024年了，日本政府居然還在和軟盤“決戰到天明”。

直到去年6月，日本數字廳才終于廢掉了1034條還要求用軟盤等介質提交材料的規定，只剩下一條和汽車回收有關的規定沒處理完。

在AI、大模型、云計算都已經卷到天上的年代，日本政府居然還在認真討論“軟盤要不要退役”這種問題。

傳真機也差不多。

這些年外界老拿“日本還在用傳真”開涮，聽上去像段子，結果很多時候還真不是段子。

日本文部科學省自己給出的“教育DX”（DX，Digital Transformation，數字轉型）目標里，甚至把“原則上廢止學校之間通過傳真機往來和蓋章”單獨列成了KPI；而且這個目標之所以要專門寫出來，恰恰是因為現實里它遠遠沒有完成。

說白了，如果一個國家的教育系統到了2024年還要把“別再傳真、別再蓋章”寫成數字化改革目標，那它的問題顯然不是某個軟件沒裝好那么簡單了。

更尷尬的是，日本自己其實也不是沒意識到問題。

無論是成立數字廳，還是高調對軟盤、傳真“宣戰”，都說明日本政府很清楚自己在數字化這件事上慢了半拍。

可問題在于，知道歸知道，改起來卻總像在沼澤地里跑步：

一邊是官僚系統的慣性，一邊是紙質文件、印章文化、老舊流程的路徑依賴，再疊上高齡化和IT人才短缺，最后就變成了一個很別扭的局面：

大家都知道該變，但誰都沒辦法一下子把舊時代連根拔掉。

就連日本自己的政策討論里，也長期把數字人才不足當成結構性問題來看；經產省更早前的測算里，到2030年日本IT人才缺口最高可接近45萬人。

但程序員不夠，怎么辦？

從官方和產業界的表態來看，他們顯然也在把生成式AI當成另一條捷徑：既然程序員不夠，那就盡量讓更多懂業務的人，直接通過自然語言下指令，把需求更快變成代碼、文檔和系統。

所以，Rakuten AI 3.0這件事，理應是整個2026，日本AI圈的一個里程碑式事件。

因為它更像是日本IT困境的一次濃縮展示：政府給資源，企業拿補貼，嘴上喊著“日本最強”“本土自研”，結果掀開蓋子一看，底下還是DeepSeek V3。

這當然不說明日本公司不會做AI，也不說明日本沒有技術實力。

但卻反映了，那個曾經靠電子消費品、半導體、工業產品征服世界的日本，在今天這場由軟件、數據、云和大模型主導的新技術競賽里，已經很難再靠自己完整定義游戲規則了。

連最想證明“日本也有自己的旗艦大模型”的關鍵時刻，最后都得站在中國開源模型的肩膀上，這才是整件事最扎心的地方。

聲明：個人原創，僅供參考

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

大模型產業化最好的時代，中國AI「殺死」了參數崇拜

36氪 2026-02-11 12:47:57
0 跟貼 0
OpenAI重磅揭秘：你認為的AI幻覺，可能是模型故意出錯

新智元 2026-03-25 08:36:09
50 跟貼 50

養蝦省91%詞元！這家AI記憶公司用1億個多模態文件驗證了！

機器之心Pro 2026-03-25 11:01:48
2 跟貼 2

這個AI能自己造AI，十幾分鐘寫完代碼，一天交付可用模型

DeepTech深科技 2026-03-26 13:20:36
0 跟貼 0
AI寫CUDA算子國產芯片不行？上交方法直線拉升，DeepSeek也適用

機器之心Pro 2026-03-26 15:59:24
0 跟貼 0

一篇論文引發存儲芯片股暴跌，Google 的「DeepSeek 時刻」來了？

愛范兒 2026-03-26 13:50:20
0 跟貼 0

全球頂尖大模型一夜慘遭血洗！最難測試人類拿滿分，AI第一名得0.2%分

新智元 2026-03-26 18:14:12
0 跟貼 0
從根本上改變工作方式、價值創造模式、決策機制--AI正加速顛覆一切

華爾街見聞官方 2026-03-25 12:31:16
0 跟貼 0

在線等：如何優雅地分走鵝廠這600+萬？

量子位 2026-03-26 16:24:03
0 跟貼 0
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
1段話喊來13個“程序員”，阿里Qoder新模式讓我躺著當CTO

量子位 2026-03-26 15:42:32
0 跟貼 0
52天75次發布，A司這場“產品大爆炸”太猛烈了

鈦媒體APP 2026-03-26 19:50:22
0 跟貼 0
拒絕智能手機，炮轟ChatGPT，沒有他就沒有今天的互聯網

DeepTech深科技 2025-12-26 18:07:26
0 跟貼 0
10篇深度、1個專題頁，雷科技用AI發布了全球首個蘋果50年專題

雷科技 2026-03-26 19:14:31
0 跟貼 0
網易開了個壞頭？

虎嗅APP 2026-03-26 19:40:05
0 跟貼 0
00后小孩哥10天AI編程，陳天橋24小時砸3000萬！靠大四作業當上CEO

36氪 2026-03-08 17:24:08
0 跟貼 0
專訪姚洋：AI泡沫破裂是遲早的事，我們要更多關注短期問題

經濟觀察報 2026-03-26 19:44:43
0 跟貼 0
美國博主第一次來中國旅游，直言西方媒體沒有說謊，中國果然

小紅帽的丫丫 2026-03-25 14:31:16
9 跟貼 9
世界上的七大霸主，美國獨占三席，中國是什么霸主

阿毛生活 2026-03-25 09:03:24
0 跟貼 0
日本被指多年搞反華教育

北京日報 2026-03-25 09:16:49
78834 跟貼 78834
馬甲說｜一位母親與兒子的跨國追夢

安安觀世界 2026-03-25 11:59:40
0 跟貼 0
日本街頭搭訕小姐姐，我滴日本話，你滴明白

星河佰E際 2026-03-22 03:14:43
0 跟貼 0
日本的水面艦艇快速移動，這個國家雖無大德，但仍不容小覷！

搞笑者大聯盟 2026-03-24 10:01:57
1 跟貼 1
外國網友問：如今的中國，是他們歷史上最強大的中國嗎？

愛歌唱的叮當貓 2026-03-23 13:17:20
15 跟貼 15
20歲的老撾媳婦安娜，生了個孫女，中國公公高興的請全村人吃喜蛋

搞笑著哥 2026-03-24 02:28:46
0 跟貼 0
讓我們不討厭的幾個日本藝術家

娛記毒舌 2026-03-26 14:16:54
4 跟貼 4
印度為啥總愛跟中國比？它到底為啥這么自信？

愈來愈好 2026-03-25 05:25:07
0 跟貼 0
“盤點攝手虎拍攝的NBA中國行名場面”

左腳爆射得分 2026-03-25 16:45:57
0 跟貼 0
2025年度中國出口汽車總量首超日本背后從產品出差到生態出海

車視界科技 2026-03-25 15:54:21
1 跟貼 1
中國小伙用塑料日語勇闖日本的一天，女仆咖啡廳能接待我嗎？

子桑鷹脈 2026-03-26 01:58:51
0 跟貼 0
全世界都被中國驚到了，外媒爆料，中國正在瘋狂擴產殲-20、殲-35

霧切月夜 2026-03-25 02:21:07
1 跟貼 1
這里曾經是中國的故土，現在卻被印度控制，讓人太心酸

趣笑小行星 2026-03-25 11:09:24
1 跟貼 1
放棄中國的好日子不過跑回老撾如今連飯都吃不飽腸子都悔青了

搞笑梅姐 2026-03-25 01:25:48
0 跟貼 0
紐約時報：許多美國官員從未去過中國應該去中國看看

環球網資訊 2026-03-26 00:05:09
1916 跟貼 1916
外國老者說自己重返中國是因為喜歡這里的人！

愛歌唱的叮當貓 2026-03-22 13:19:22
1 跟貼 1
中國的十個世界第一，前九個當之無愧，最后一個存在爭議！

愛生活的坤 2026-03-22 08:48:17
0 跟貼 0
外國網友被中國升國旗震撼到了！法國網友說印度的是演雜技(1)

愛歌唱的叮當貓 2026-03-25 13:25:58
0 跟貼 0
福建艦航母編隊火力全開，能單挑日本海上自衛隊嗎？

小屁屁影視聚 2026-03-24 17:45:05
1 跟貼 1
伊朗網友：美國負責吹，中國負責實現

胡萊克修斯 2026-03-26 03:08:51
0 跟貼 0
發展中國家的意思是，把世界都發展成中國的家！

咖啡街拍PUB 2026-03-24 12:27:05
1 跟貼 1

藍字計劃

記錄智能時代的每一次浪潮！前沿科技捕手，AI產品深度洞察。

225文章數 3880關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

教育

手機

游戲

軍事航空

手機 / 數碼

房產 / 家居

“日本最強AI”光速塌房，都怪中國DeepSeek太強？

Meta高管狂分百億期權，700名員工卻下崗

張雪峰留巨額遺產:二婚妻子或拿50% 剩下的女兒占1/3

張雪峰留巨額遺產:二婚妻子或拿50% 剩下的女兒占1/3

申京努力了，然而杜蘭特啊

劉曉慶妹妹發聲！稱姐姐受身邊人挑撥

油價"馴服"特朗普？一到100美元就TACO

一汽奧迪A6L e-tron開啟預售 CLTC最大續航815km

態度原創

小米Book Pro 14超薄設計引爆市場！這家國產廠商立功了

來上課了——高考閱讀難題大綜合（細節+主旨+含義）（下）第1段

OPPO K15 Pro系列突然官宣：天璣9500s+主動散熱，4月1日發布

10萬獎池！2026 KKCS1.6 巔峰之路傳奇聯賽（春季賽）正式開賽！——KK官方對戰平臺

擔心特朗普突然停戰 以總理下令48小時盡力摧毀伊設施

擔心特朗普突然停戰以總理下令48小時盡力摧毀伊設施