![]()
近日,多家國產模型廠商更新模型進展,包括DeepSeek開源新的OCR 2模型、Kimi發布并開源Kimi K2.5模型、阿里發布千問旗艦推理模型Qwen3-Max-Thinking,頭部模型的密集更新使中國模型在當日霸榜海外社交平臺X的熱點前三位。據一位行業人士透露,下周也有多款國產模型產品將更新發布。
2025年春節DeepSeek憑R1的出色表現引發破圈傳播,使得這一節點成為綜合流量窗口、商業競爭、技術節奏等多方面因素的集中展現,也讓大眾對2026年春節國產模型競賽翹首以盼。2026年春晚更是因字節跳動火山引擎與豆包大模型、騰訊元寶、百度的提前卡位鎖定熱度。
多位行業人士對第一財經表示,節前大模型行業的密集動作,是行業開始邁向工程化成熟期的關鍵信號,包括模型從參數競賽轉向工程優化,產品交付從實驗室Demo走向規模化服務,生態協同從單點突破走向系統協同。
![]()
聚焦多模態與推理方向
1月27日,DeepSeek與Kimi再次同日發布模型,此前已有數次模型與論文發布“撞車”,足見行業關注度爭奪之激烈。
Kimi官方將K2.5定義為公司迄今為止最智能的模型,包括Agent、代碼、圖像、視頻及一系列通用智能任務表現;同時,這也是Kimi迄今最全能的模型,包括原生多模態架構設計,同時支持視覺與文本輸入、思考與非思考模式、對話與 Agent任務。
同日發布的DeepSeek-OCR2模型是去年10月官方推出的DeepSeek-OCR模型的迭代版本,團隊采用了創新的DeepEncoder V2方法,讓AI能夠根據圖像的含義動態重排圖像的各個部分,而不再只是機械地從左到右掃描,這種方式模擬了人類在觀看場景時所遵循的邏輯流程。
升級后的OCR 2模型在處理布局復雜的圖片時,表現優于傳統的視覺語言模型。官方提到,DeepSeek的OCR模型主要面向兩大生產級應用場景:一是為DeepSeek大語言模型提供圖像/文檔讀取服務,二是用于批量 PDF 處理的預訓練數據流水線。
DeepSeek認為,第一代OCR的光學壓縮是邁向原生多模態的初步探索,而OCR 2 的類LLM編碼器架構是在這一方向上的進一步推進。看起來DeepSeek正在多模態領域進行更多技術探索,這正是當前DeepSeek所缺乏的部分,而業內普遍認為多模態是未來大模型行業的重要趨勢。
暖哇科技首席數據官陳鴻對第一財經表示,團隊正在評測DeepSeek最新推出的OCR2模型。DeepSeek第一代OCR更偏向于技術論文性質,主要是為了驗證其技術路線的理論可行性,實際應用效果囿于訓練數據和模型尺寸還比較有限。對于OCR2模型,他認為其核心是讓模型能理解圖像中的像素信息背后實則蘊含邏輯關聯與文本語義,這是OCR任務的本質,理應能帶來性能提升。
除了原生多模態深化外,推理工程化提效也是今年主流模型的一大趨勢。
1月早先時間,阿里開源多款模型,包括全系列語音合成模型Qwen3-TTS,專為多模態信息檢索與跨模態理解設計的Qwen3-VL-Embedding和Qwen3-VL-Reranker模型系列等,均在多模態領域實現了進一步的性能提升。從近期阿里大模型產品的發布來看,一方面,大模型能力提升仍是模型更新及競爭的主線;另一方面,近一年來,阿里對大模型布局的“全尺寸、全模態、全場景”戰略進一步加深,在多模態、跨模態領域的更新加快。
楓清科技創始人兼CEO高雪峰對第一財經表示,近一段時間,不論是DeepSeek發表的論文,還是阿里千問和Kimi發布的全新大模型,他們的技術創新都指向了一個核心點:進一步提升推理性能、降低推理成本和模型訓練門檻,讓AI大模型更易用、實用和好用。
![]()
性價比遠比“第一”更重要
大模型行業競爭日趨激烈,頭部公司積極卡位,爭取在競爭中占據更有利位置。高雪峰認為,這種良性的競爭,將進一步縮短國產大模型與國外大模型之間的差距。
各家模型都有自己的優勢場景,企業也不會只用一家模型。陳鴻對第一財經表示,模型優勢的變化很快,基本按月、季度迭代,每次基座模型的迭代和更新,團隊都會用實際任務去做評測,選擇對應最好的。
“2025年初我們還在使用海外的ChatGPT 4.5,當時它的效果最好,但DeepSeek 推出后,雖效果略遜一籌,價格卻僅為前者的十分之一,幾乎成為無可替代的選擇。”陳鴻對記者表示,業界可能執著于模型在基準測試中的排名,但對企業而言,性價比遠比“第一”更重要。
大模型的調用成本也在持續下降。陳鴻透露,從暖哇科技的業務來看,2025年初到年末,客戶的token調用量實現多倍增長,但token調用費用卻大大降低。
在暖哇科技的保險業務場景下,目前通用模型有兩個選項:一是豆包,更適合對話場景及需要高情商表達的交互;二是DeepSeek V3.2模型,性價比突出。此外,在編程領域,智譜的表現也受到行業認可,如果需要精調,千問是一個很好的基座選擇。陳鴻透露,暖哇科技目前的精調模型就是基于千問32B版本開發的。
高雪峰也發現,2025年大模型整體的Token成本明顯降低。DeepSeek、阿里、字節等主流的通用大模型在2025年都進行了大幅降價,目前,國內主流商用模型API已經進入“厘時代”。看向未來,成本的持續下降是AI技術創新發展的必然,也正因如此,AI才能真正從C端嘗鮮邁向B端規模化落地,從而發揮更大的作用和價值。
對于節前大模型行業的密集發布與更新,大模型生態社區OpenCSG(開放傳神)創始人陳冉則認為,這是行業進入了一個新的“工程化成熟期”的標志,從拼規模轉向拼效率與落地能力。
高雪峰對第一財經表示,開源正在加速技術迭代并大幅降低成本,使大模型從少數巨頭能力走向產業基礎設施。隨著成本持續下降,Agentic AI智能體將從“能對話”邁向“能執行、能創造價值”,智能體時代的黎明即將到來。
隨著巨頭的持續發力,高雪峰判斷,通用大模型行業的馬太效應將日益凸顯,呈現出強者恒強的局面,中小玩家的機會更多出現在細分行業和領域,如制造、金融、教育、醫療等領域的大模型。
陳鴻認為,各廠商的核心主線還是圍繞自身生態位推進。以DeepSeek為例,其技術核心一直聚焦效率優化,以極低的算力成本對外輸出服務,成為性價比極高的模型。而阿里作為大廠,旗下千問模型有明確的性能追求,在編程、推理、多模態多方向持續迭代,其開源版本是繼續精調模型的優秀基座。
不過,高雪峰認為,企業在推動AI大模型應用過程中,仍面臨模型存在幻覺、可解釋性和推理能力薄弱等挑戰,這也是楓清科技在解決的部分。
未來應用廠商更希望大模型在哪些方面實現突破?陳鴻認為,推理能力的動態優化是非常剛需的,當前模型的推理開關要么全開要么全關,缺乏靈活性,而人類會根據信息完備度動態決定是否深度思考。若模型能自主判斷是否需要推理、是否缺少信息,就能在更多業務場景中應用推理模型,避免不必要的算力消耗。
其次,多模態技術的落地優化很重要,當前多模態模型仍是“抽卡機制”,生成圖像、語音等內容時需反復調整提示詞,就像抽盲盒,難以滿足專業場景需求。
誰能解決這些問題,誰就能在應用領域更加向前一步。
![]()
模型廠商技術指標逐漸聚焦
技術方向上,多模態、Agent等方面已在行業內形成共識,但在實際落地過程中,成本把控能力、推理能力、工程化能力等方面逐漸成為考驗模型廠商的重要指標。
Kimi創始人楊植麟表示,Kimi本身預訓練策略乃至整個模型的設計策略,都是圍繞兩個維度展開:提升token efficiency(token效率)是Kimi團隊認為進行預訓練時一項極為重要的指標與優化方案;第二個維度是實現long context(長上下文),因為延長上下文能有效降低損失,這也解釋了為何當前許多復雜的Agent任務必須在超長上下文中才能完成——延長上下文必然會降低loss,而一個優秀的架構能使損耗下降得更多。
紫荊芯界產品副總裁邵巍注意到行業模型和應用發布的節奏正在加快,有公司提速至每半年一次發布旗艦模型,甚至縮短到了四五個月一次。這說明一方面,負責軟件開發的員工在不斷推進模型的研發;另一方面,負責應用開發的員工也在持續迭代更新。無論是長上下文還是Agent等方面的發展,實際上都對推理能力提出了更高的要求。
商湯小浣熊負責人賈安亞在實際服務產業客戶的過程中發現,軟件開發與辦公緊密關聯著企業的核心資產——代碼、文件及數據。不少企業客戶雖然對某些單一功能非常認可,但在實際落地過程中,平臺需要提供一個全面且高效的解決方案,包括整體延遲性能、精度等,整體方案效果需達到95%以上,且需要完全可用。這對于模型推理是一個較大的挑戰,因為企業對芯片的投資及推理投入都有一個綜合的性價比考量,這就要求平臺必須考慮如何將大模型以最高效率部署到機器上進行推理。
大模型的頻繁更新對需要完成硬件適配的企業用戶難言友好。賈安亞團隊近期正在合作一家頭部金融客戶,為其制定的整套解決方案旨在服務數千名員工,涵蓋從進銷存到日常運營等多個方面。對于這些一線業務人員來說,重要的是如何利用大量不同類型的數據(包括圖片、表格和PDF文件)在系統上實現高效且準確的端到端處理。從技術角度來看,這意味著不僅要進行語言推理,還需要處理多模態數據,并保證超長上下文的支持及各種文件類型的處理能力。此外,還需確保整個過程既快速又精確,并且用戶可以在過程中隨時檢查進度,并直接應用最終結果。
客戶既要求功能全面又要求性能卓越,這使得近期大模型行業除了產品的密集更新,還要在與產業鏈上下游加速聯動,在軟硬雙端從算法與架構層面降低行業成本上下功夫。
在浙江算力科技董事長錢敏勇看來,實施路徑上,推理成本的降低短期內仍依賴工程優化,包括整體架構、算法以及軟件棧的優化。但從長期角度來看,新型硬件和芯片的創新將會帶來更為深遠的影響。
煒燁智算董事長兼CEO周韡韡認為,AI已經從“看中學”階段發展到了“干中學”的階段。在基礎設施方面,基礎設施模型及其生態系統將會朝著基模生態一體化的方向發展。行業已經結束了模型的盲目競爭,進入了以推理能力為主導的時代。
(本報記者陳楊園對此文亦有貢獻)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.