文 | Judy
一家來自中國杭州、成立不到兩年的初創企業DeepSeek,以前所未有的速度觸及了全球大模型界敏銳的神經。
風險投資機構a16z創始人安德森將DeepSeek最新的推理模型R1描述為「人工智能的斯普特尼克時刻」,斯普特尼克是蘇聯在1957年先于美國發射的人造衛星,英偉達高級研究科學家Jim Fan則認為“Deepseek作為一家非美國公司真正踐行著 OpenAI最初的使命”。
DeepSeek還引發了華爾街的震動,從股市到科技巨頭的財報電話會上,分析師迫切想知道DeepSeek所帶來的影響。據「硅基研究室」不完全統計,DeepSeek 在本周至少九次在財報電話會議上被提及,微軟首席執行官薩蒂亞·納德拉(Satya Nadella)承認DeepSeek「確實有一些創新」,Meta創始人扎克伯格則在電話會上將這家中國公司視為新的競爭對手。
事實上,作為中國大模型玩家,DeepSeek的出圈并非是孤例。2024年至今,「神秘的東方力量」已經在硅谷AI圈多次受到關注。正如AI領域泰斗吳恩達所言:
“DeepSeek的創新表明,中美在生成式AI領域的差距正在迅速縮小,在某些領域中國已現領先跡象。”
本文主要論述三個核心趨勢:
1、反擊OpenAI,「中國AI復仇者聯盟」已經崛起
2、AI領域的「中國式創新」有三大核心關鍵詞
3、2025,中美AI競逐或迎來新敘事
一、反擊OpenAI,「中國AI復仇者聯盟」正在崛起
在全球目光聚焦DeepSeek的出圈背后,事實上,過去一段時間內,在追趕和反擊OpenAI這件事上,從大廠到創業公司,在多個技術領域里,「中國AI復仇者聯盟」已經在崛起。
比如在多模態領域的文生視頻上,去年2月,OpenAI發布Sora,但推動AI視頻真正落地的卻來自中國科技大廠——快手的可靈,可靈甚至在內測期就引發海外用戶集體跪求「中國賬號」;語音方面,字節跳動豆包的實時語音功能就曾以驚人的擬人效果,實現了GPT-4o想要追求語音助手「Her」的效果。
在更關鍵的大模型「幻覺」問題上,以百度為主的中國公司更是貢獻出明顯優于OpenAI的更優解決方案,以RAG(Retrieval-Augmented Generation檢索增強生成)技術為例,如今已成為主流大模型提升性能的共識。但實際上,早在2023年3月,百度發布文心一言時,就已提到了RAG是百度大模型的特色,而兩年過去,百度特色已成為行業追逐更優模型效果的共識。
實測文心一言和OpenAI也可能清晰地看到中國AI的能力躍升。我們以熱門春節檔電影為話題,分別問了文心一言和chatGPT兩個問題:在“做藕粉的過程中,出現了哪些讓哪吒感覺不適的操作?”和“在徐克的射雕電影中,黃蓉給歐陽鋒的九陰真經,是用什么語言寫的?”實測結果可以發現,文心一言都給出了詳細正確的解答,但chatGPT即便在聯網下也并未給出正確或詳細的解答。
![]()
這背后其實是百度針對RAG構建了一整套「理解-檢索-生成」的協同優化技術,百度CTO王海峰曾拆解過這一技術實現過程。所謂的「理解」就是拆解知識點,充分理解用戶的需求;「檢索」則是先找到最合適的信息,然后進行搜索排序優化,并將搜索返回的異構信息統一表示,再送給大模型;而「生成」則是會綜合不同來源的信息做出判斷,并基于大模型邏輯推理能力,解決信息沖突等問題,最終生成準確率高、時效性好且高質量的答案。
從構建更低成本的模型,到RAG、多模態、語音交互等多個技術領域的追趕超越,無論是DeepSeek此類創企,還是百度等科技大廠,可以肯定的是,在全球大模型競逐中,「中國AI復仇者聯盟」已經上桌了。
![]()
二、AI領域的「中國式創新」
墻內開花墻外也香,一系列中國AI玩家出圈背后,其實是AI領域「中國式創新」的復現。
我們可以將「中國式創新」總結為三個關鍵詞:應用優先、形態豐富、務實優先。
一是應用優先。百度創始人李彥宏曾說:“模型本身不產生直接價值,只有在模型之上開發各種各樣應用,在各種場景找到所謂的‘PMF’,才能真正產生價值。 ”這種「應用優先」的認知也隨著中國大模型玩家的洗牌和分化逐步成為關鍵共識。在廣闊的應用土壤中,中國AI更容易發現用戶實際需求、迅速迭代,找到OpenAI們不容易看到的創新落腳點。
二是形態豐富。對比海外大模型應用層的表現,隨著中國AI的應用形態的不斷豐富和能力迭代,跨越從「能用到好用」的鴻溝。 「AI產品榜」此前曾發布一份關于《2024全球AI產品付費用戶規模》的榜單,其中微軟Copilot以5574萬付費用戶規模位列全球第一,而中國AI產品百度文庫以4000萬規模位列全球第二,第三、第四為Canva和ChatGPT,而百度文庫的付費用戶規模是它們的2-4倍。
![]()
與免費用戶不同,付費用戶是愿意為企業成本買單的真用戶,而以百度文庫為代表的中國AI的上榜也印證了在中國AI的真價值。
三是務實優先。以OpenAI為代表的海外大模型企業擅長用「暴力美學」追求AGI,但中國AI企業在「有限資源」下,追求的是一條務實主義的路。
中國創企中DeepSeek就是務實的典型代表,R1它通過混合專家模型(MoE)、多頭潛在注意力極致(MLA)、多令牌預測(MTP)、長鏈式推理(CoT)等多種技術組合,且只進行了RL訓練,在數據精度、底層通信上做優化,最終實現了模型訓練高效率和低API成本。
李彥宏也曾對比國內和海外生態,他提到,“很多美國同行,他們做法是當做一個science,有一個AGI終極目標,就想盡各種辦法解決它”,但中國公司也有AGI夢想,但不同的是,中國AI是邊做邊解決問題,“我更多希望盡早接觸場景及接觸應用,在這個過程當中大家遇到的最多的問題,就是我們優先解決的問題。”
更多的投入并不代表就有更多的創新,百度和DeepSeek的諸多實踐成果其實都是中國技術公司工程能力優勢的體現。
三、2025,中美AI競逐或迎來新敘事
2023年,當OpenAI攜chatGPT橫空出世時,一位谷歌研究員曾發布一句流傳網絡的預測:“谷歌沒有護城河,OpenAI也沒有。”
如今隨著中國AI的崛起,這句話的含金量仍在上升。梁文鋒也曾說過:“技術沒有什么秘密,但重置需要時間和成本。”
而在今天,隨著大模型競逐正式進入第三年,中國AI一面專注模型迭代,一面聚焦成本效率優化,親手打破了「中國AI只跟隨、無創新」的質疑。
創新的落腳點可以是多方面的,中國的科技公司們已經在走這條路:一方面我們可以利用有限資源的極致高效利用,繞開「算力暴力美學」,實現彎道超車;另一面,豐富的實體產業應用場景和高質量的數據,都利于中國AI公司更務實的探索,通過讓AI落地千行百業,實現真正的「平權」,這將是中國公司的機會。
一位大模型產業人士認為,DeepSeek的出圈的最大意義在于,讓外界看到了中國AI的爆發能力,以及中國正在加速縮短與美國AI的差距,速度比人們想象中要更快。
新的中美大模型競逐還在繼續,OpenAI深夜推出o3-mini新模型已印證了這一點,但「DeepSeek風暴」也只是中國AI崛起的開始,CNBC的Jim Cramer就猜測百度是否會成為下一個吸引市場關注的中國科技巨頭。他在X上提出了這個問題,“首先是DeepSeek,然后是BABA,接下來可能是百度?”據「硅基研究室」了解,春節過后,百度或將推出文心模型的新版本。
![]()
一切跡象都在表明,2025年,AI領域的「中國式創新」也將會發揮更大的作用,中國的AI的創新價值,也在加速被世界重估。
偉大無法被計劃,真正的創新也不會因「出口管制」而停止,2025,不妨給中國AI多一點信心。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.