![]()
新智元報(bào)道
編輯:KingHZ Aeneas
【新智元導(dǎo)讀】最近,炸裂消息一個(gè)接一個(gè)。首先,DeepSeek V4將在一周內(nèi)上線。第二,它跳過(guò)英偉達(dá),把訪問(wèn)權(quán)限首先給了某國(guó)內(nèi)芯片廠商。另外,Anthropic因?yàn)檎麴s事件,也被群嘲了。
炸裂消息:根據(jù)多方來(lái)源,DeepSeek V4將在一周內(nèi)上線!
現(xiàn)在,DeepSeek V4 Lite至少在一家推理服務(wù)商進(jìn)行測(cè)試,目前透露出的信息有——
模型代號(hào)為Sealion-lite,有100萬(wàn)token的上下文窗口,這個(gè)模型比網(wǎng)頁(yè)版/應(yīng)用模型好用得多,而且還是原生多模態(tài)模型。
![]()
與此同時(shí),DeepSeek v4 Lite的一張對(duì)比圖,也在外網(wǎng)傳瘋了!
與目前的Deepseek v3.2思考模型相比,DeepSeek v4 Lite不開啟思考模式,生成的SVG圖像質(zhì)量明顯更好。
![]()
DeepSeek壓頂,美國(guó)慌了!
DeepSeek V4春節(jié)沒(méi)來(lái),但這次不遠(yuǎn)了。
路透社稱,一些芯片廠商已經(jīng)接入DeepSeek V4,優(yōu)化性能。
消息人士稱,DeepSeek這次向某國(guó)產(chǎn)芯片廠商提供了V4的早期接入權(quán)限,而不是英偉達(dá)等美國(guó)算力霸主。
這直接打破了過(guò)去AI模型大版本發(fā)布前的行業(yè)慣例。
![]()
這條消息來(lái)自兩位消息人士,路透社表示。
而就在昨天,美國(guó)官員聲稱DeepSeek使用非法獲得的英偉達(dá)GPU進(jìn)行訓(xùn)練。
Anthropic直言DeepSeek等通過(guò)蒸餾Claude的回復(fù)來(lái)運(yùn)作,斷言他們?nèi)狈φ嬲膬?nèi)部創(chuàng)新能力只會(huì)抄襲。
![]()
美國(guó)的CNN、CNBC、NYT等大眾和科技媒體紛紛推出相關(guān)報(bào)道
去年,Deepseek發(fā)布后確實(shí)有過(guò)攻擊,如此密集攻擊前所未有。
但也在意料之中。
上一次Deepseek發(fā)布模型時(shí),引發(fā)了恐慌——
去年,DeepSeek-R1發(fā)布或?qū)е掠ミ_(dá)股價(jià)下跌17%!
![]()
而現(xiàn)在可能發(fā)生什么?
如果DeepSeek V4再次展現(xiàn)出驚人的效率和能力,很可能會(huì)重演甚至加劇去年的投資者恐慌,對(duì)正在尋求巨額融資的美國(guó)AI公司和希望股價(jià)穩(wěn)定的英偉達(dá)、谷歌等巨頭構(gòu)成直接威脅。
這不是庸人自擾,即便是競(jìng)爭(zhēng)對(duì)手的研究人員也承認(rèn)DeepSeek V4不可小視,可能發(fā)布就登頂開源第一!
![]()
美國(guó)的這波輿論攻擊,并非偶然,Reddit用戶總結(jié)稱:這是一場(chǎng)有組織的FUD(恐懼、不確定性和懷疑) 營(yíng)銷:
搶占敘事:在DeepSeek V4發(fā)布前,預(yù)先埋下「他們只會(huì)作弊/抄襲」的敘事框架。這樣,無(wú)論V4多成功,公眾的第一反應(yīng)都會(huì)被引導(dǎo)至負(fù)面解讀。
保護(hù)市場(chǎng):通過(guò)輿論手段稀釋V4發(fā)布的媒體關(guān)注度和影響力,試圖穩(wěn)定投資者情緒,防止股價(jià)再次出現(xiàn)兩位數(shù)暴跌,為美國(guó)本土AI公司的融資和發(fā)展?fàn)幦r(shí)間。
維護(hù)霸權(quán):從更深層次看,這是為了維護(hù)美國(guó)在AI領(lǐng)域的技術(shù)和敘事霸權(quán),打擊中國(guó)AI的崛起勢(shì)頭。
![]()
當(dāng)你看到這類鋪天蓋地的負(fù)面報(bào)道時(shí),要特別留意它的發(fā)布時(shí)間。
將其與即將發(fā)生的重大事件(如DeepSeek V4發(fā)布)聯(lián)系起來(lái),思考誰(shuí)最有可能從這種輿論中受益,以及他們真正在恐懼什么。
不要輕易被這些報(bào)道的結(jié)論帶著走。要學(xué)會(huì)看穿表面的FUD,基于事實(shí)和歷史證據(jù),去洞察背后真實(shí)的技術(shù)競(jìng)爭(zhēng)和市場(chǎng)博弈。
Claude自曝「我是DeepSeek」!
全網(wǎng)嘩然
與此同時(shí),另外一件事,也在全網(wǎng)炸鍋了。
X上一個(gè)用戶發(fā)現(xiàn),當(dāng)他向Claude提問(wèn)「你是什么模型」時(shí),它竟然回復(fù):「我是DeepSeek V3,是由DeepSeek公司開發(fā)的開源大語(yǔ)言模型。」
這一bug,是否說(shuō)明Claude是基于DeepSeek蒸餾的?
![]()
諷刺的是,就在不久前,Anthropic剛剛高調(diào)指責(zé)DeepSeek進(jìn)行了「工業(yè)級(jí)蒸餾攻擊」。
這一幕,簡(jiǎn)直堪稱AI時(shí)代的行為藝術(shù)。
![]()
網(wǎng)友stevibe完全復(fù)現(xiàn)了Claude Sonnet-4.6的這波操作:
不過(guò),有的網(wǎng)友在Claude App中完全無(wú)法復(fù)現(xiàn)結(jié)果。
![]()
的確有網(wǎng)友在Claude App復(fù)現(xiàn)了該問(wèn)題,但很難一次成功。
![]()
為了力證這一結(jié)果的有效性,他特意通過(guò)Anthropic的官方API端點(diǎn)再次測(cè)試,結(jié)果還是一樣。
![]()
根據(jù)他人提供的創(chuàng)意,這位網(wǎng)友又試著用法語(yǔ)提問(wèn)「你是什么模型」?這次,Opus 4.6開始回答:我是ChatGPT。
![]()
為什么stevibe能通過(guò)API復(fù)現(xiàn)結(jié)果,為什么不能用Claude App復(fù)現(xiàn)?
最大的原因可能是系統(tǒng)提示詞。如果沒(méi)有系統(tǒng)提示詞,AI會(huì)根據(jù)訓(xùn)練數(shù)據(jù)回答。
![]()
有網(wǎng)友推測(cè):
這是一個(gè)數(shù)據(jù)污染/身份對(duì)齊問(wèn)題,并不能證明任何事情。如果你用正確的語(yǔ)言進(jìn)行足夠深入的探究,每個(gè)主流模型都會(huì)存在這個(gè)問(wèn)題。
![]()
總之,Anthropic的訓(xùn)練數(shù)據(jù)成了不能說(shuō)的秘密。
![]()
當(dāng)然,Claude Sonnet 4.6會(huì)自稱「我是DeepSeek」,需要符合以下三個(gè)特定條件——清空系統(tǒng)提示、使用中文提問(wèn)、特定模型版本。
![]()
事情的關(guān)鍵在于:當(dāng)默認(rèn)系統(tǒng)提示要求模型自稱Claude 時(shí),一切都很正常;一旦把系統(tǒng)提示清空,模型在中文語(yǔ)境下竟然就開始「認(rèn)祖歸宗」。
問(wèn)題來(lái)了,如果一個(gè)模型中沒(méi)有系統(tǒng)提示詞約束的情況下,就會(huì)產(chǎn)生「我是某某模型」的回答,原因到底是什么?
是訓(xùn)練數(shù)據(jù)的統(tǒng)計(jì)殘留,還是大模型中多源數(shù)據(jù)訓(xùn)練下,出現(xiàn)了自然語(yǔ)言泛化的副作用?目前還無(wú)法判斷。
但Anthropic似乎被啪啪打臉了:在指責(zé)別人蒸餾時(shí),你最好能確保自己不會(huì)在刪除提示詞后出現(xiàn)身份錯(cuò)亂。
畢竟,蒸餾在機(jī)器學(xué)習(xí)中,是一種非常常見的技術(shù)。Anthropic指責(zé)他人進(jìn)行「工業(yè)級(jí)蒸餾攻擊」時(shí),聽上去簡(jiǎn)直嚴(yán)重到像一起網(wǎng)絡(luò)安全事件。
以此站在道德高地上,吃相就有些難看了。
模型的身份穩(wěn)定性,本身就是概率分布問(wèn)題。大模型沒(méi)有自我認(rèn)知,只是在生成統(tǒng)計(jì)上最合理的答案。
如果在中文數(shù)據(jù)分布中,「我是DeepSeek」這種模式概率較高,那么在沒(méi)有系統(tǒng)提示的情況下,模型就可能走向那條高概率路徑。
![]()
網(wǎng)友Theo Borges解釋了其中的原理:一切都是概率和零系統(tǒng)提示詞
這不一定說(shuō)明「蒸餾發(fā)生了」,但它說(shuō)明——模型的語(yǔ)言空間是共享的。當(dāng)整個(gè)行業(yè)都在同一個(gè)語(yǔ)料海洋中訓(xùn)練、優(yōu)化、蒸餾時(shí),邊界本身就變得模糊。
群眾的眼睛是雪亮的,Anthropic的thread,已經(jīng)被網(wǎng)友們的吐槽沖了。
![]()
6000多條評(píng)論,70%都在吐槽Anthropic
這套又當(dāng)又立的行事邏輯,直接讓Anthropic的風(fēng)評(píng)跌至歷史最低點(diǎn)。
![]()
![]()
接下來(lái),我們看DeepSeek的了。
參考資料:
https://x.com/legit_api/status/2026718853275800019
https://x.com/teortaxesTex/status/2026251055672017141?s=20
https://www.reuters.com/world/china/deepseek-withholds-latest-ai-model-us-chipmakers-including-nvidia-sources-say-2026-02-25/
https://www.reddit.com/r/LocalLLaMA/comments/1rdlsgq/my_theory_on_all_the_negative_chinese_ai_media/
https://x.com/stevibe/status/2026227392076018101
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.