<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      國產(chǎn)大模型密集發(fā)布,“春節(jié)AI競賽”提前開幕

      0
      分享至


      近日,多家國產(chǎn)模型廠商更新模型進(jìn)展,包括DeepSeek開源新的OCR 2模型、Kimi發(fā)布并開源Kimi K2.5模型、阿里發(fā)布千問旗艦推理模型Qwen3-Max-Thinking,頭部模型的密集更新使中國模型在當(dāng)日霸榜海外社交平臺X的熱點(diǎn)前三位。據(jù)一位行業(yè)人士透露,下周也有多款國產(chǎn)模型產(chǎn)品將更新發(fā)布。

      2025年春節(jié)DeepSeek憑R1的出色表現(xiàn)引發(fā)破圈傳播,使得這一節(jié)點(diǎn)成為綜合流量窗口、商業(yè)競爭、技術(shù)節(jié)奏等多方面因素的集中展現(xiàn),也讓大眾對2026年春節(jié)國產(chǎn)模型競賽翹首以盼。2026年春晚更是因字節(jié)跳動(dòng)火山引擎與豆包大模型、騰訊元寶、百度的提前卡位鎖定熱度。

      多位行業(yè)人士對第一財(cái)經(jīng)表示,節(jié)前大模型行業(yè)的密集動(dòng)作,是行業(yè)開始邁向工程化成熟期的關(guān)鍵信號,包括模型從參數(shù)競賽轉(zhuǎn)向工程優(yōu)化,產(chǎn)品交付從實(shí)驗(yàn)室Demo走向規(guī)模化服務(wù),生態(tài)協(xié)同從單點(diǎn)突破走向系統(tǒng)協(xié)同。


      聚焦多模態(tài)與推理方向

      1月27日,DeepSeek與Kimi再次同日發(fā)布模型,此前已有數(shù)次模型與論文發(fā)布“撞車”,足見行業(yè)關(guān)注度爭奪之激烈。

      Kimi官方將K2.5定義為公司迄今為止最智能的模型,包括Agent、代碼、圖像、視頻及一系列通用智能任務(wù)表現(xiàn);同時(shí),這也是Kimi迄今最全能的模型,包括原生多模態(tài)架構(gòu)設(shè)計(jì),同時(shí)支持視覺與文本輸入、思考與非思考模式、對話與 Agent任務(wù)。

      同日發(fā)布的DeepSeek-OCR2模型是去年10月官方推出的DeepSeek-OCR模型的迭代版本,團(tuán)隊(duì)采用了創(chuàng)新的DeepEncoder V2方法,讓AI能夠根據(jù)圖像的含義動(dòng)態(tài)重排圖像的各個(gè)部分,而不再只是機(jī)械地從左到右掃描,這種方式模擬了人類在觀看場景時(shí)所遵循的邏輯流程。

      升級后的OCR 2模型在處理布局復(fù)雜的圖片時(shí),表現(xiàn)優(yōu)于傳統(tǒng)的視覺語言模型。官方提到,DeepSeek的OCR模型主要面向兩大生產(chǎn)級應(yīng)用場景:一是為DeepSeek大語言模型提供圖像/文檔讀取服務(wù),二是用于批量 PDF 處理的預(yù)訓(xùn)練數(shù)據(jù)流水線。

      DeepSeek認(rèn)為,第一代OCR的光學(xué)壓縮是邁向原生多模態(tài)的初步探索,而OCR 2 的類LLM編碼器架構(gòu)是在這一方向上的進(jìn)一步推進(jìn)。看起來DeepSeek正在多模態(tài)領(lǐng)域進(jìn)行更多技術(shù)探索,這正是當(dāng)前DeepSeek所缺乏的部分,而業(yè)內(nèi)普遍認(rèn)為多模態(tài)是未來大模型行業(yè)的重要趨勢。

      暖哇科技首席數(shù)據(jù)官陳鴻對第一財(cái)經(jīng)表示,團(tuán)隊(duì)正在評測DeepSeek最新推出的OCR2模型。DeepSeek第一代OCR更偏向于技術(shù)論文性質(zhì),主要是為了驗(yàn)證其技術(shù)路線的理論可行性,實(shí)際應(yīng)用效果囿于訓(xùn)練數(shù)據(jù)和模型尺寸還比較有限。對于OCR2模型,他認(rèn)為其核心是讓模型能理解圖像中的像素信息背后實(shí)則蘊(yùn)含邏輯關(guān)聯(lián)與文本語義,這是OCR任務(wù)的本質(zhì),理應(yīng)能帶來性能提升。

      除了原生多模態(tài)深化外,推理工程化提效也是今年主流模型的一大趨勢。

      1月早先時(shí)間,阿里開源多款模型,包括全系列語音合成模型Qwen3-TTS,專為多模態(tài)信息檢索與跨模態(tài)理解設(shè)計(jì)的Qwen3-VL-Embedding和Qwen3-VL-Reranker模型系列等,均在多模態(tài)領(lǐng)域?qū)崿F(xiàn)了進(jìn)一步的性能提升。從近期阿里大模型產(chǎn)品的發(fā)布來看,一方面,大模型能力提升仍是模型更新及競爭的主線;另一方面,近一年來,阿里對大模型布局的“全尺寸、全模態(tài)、全場景”戰(zhàn)略進(jìn)一步加深,在多模態(tài)、跨模態(tài)領(lǐng)域的更新加快。

      楓清科技創(chuàng)始人兼CEO高雪峰對第一財(cái)經(jīng)表示,近一段時(shí)間,不論是DeepSeek發(fā)表的論文,還是阿里千問和Kimi發(fā)布的全新大模型,他們的技術(shù)創(chuàng)新都指向了一個(gè)核心點(diǎn):進(jìn)一步提升推理性能、降低推理成本和模型訓(xùn)練門檻,讓AI大模型更易用、實(shí)用和好用。


      性價(jià)比遠(yuǎn)比“第一”更重要

      大模型行業(yè)競爭日趨激烈,頭部公司積極卡位,爭取在競爭中占據(jù)更有利位置。高雪峰認(rèn)為,這種良性的競爭,將進(jìn)一步縮短國產(chǎn)大模型與國外大模型之間的差距。

      各家模型都有自己的優(yōu)勢場景,企業(yè)也不會只用一家模型。陳鴻對第一財(cái)經(jīng)表示,模型優(yōu)勢的變化很快,基本按月、季度迭代,每次基座模型的迭代和更新,團(tuán)隊(duì)都會用實(shí)際任務(wù)去做評測,選擇對應(yīng)最好的。

      “2025年初我們還在使用海外的ChatGPT 4.5,當(dāng)時(shí)它的效果最好,但DeepSeek 推出后,雖效果略遜一籌,價(jià)格卻僅為前者的十分之一,幾乎成為無可替代的選擇。”陳鴻對記者表示,業(yè)界可能執(zhí)著于模型在基準(zhǔn)測試中的排名,但對企業(yè)而言,性價(jià)比遠(yuǎn)比“第一”更重要。

      大模型的調(diào)用成本也在持續(xù)下降。陳鴻透露,從暖哇科技的業(yè)務(wù)來看,2025年初到年末,客戶的token調(diào)用量實(shí)現(xiàn)多倍增長,但token調(diào)用費(fèi)用卻大大降低。

      在暖哇科技的保險(xiǎn)業(yè)務(wù)場景下,目前通用模型有兩個(gè)選項(xiàng):一是豆包,更適合對話場景及需要高情商表達(dá)的交互;二是DeepSeek V3.2模型,性價(jià)比突出。此外,在編程領(lǐng)域,智譜的表現(xiàn)也受到行業(yè)認(rèn)可,如果需要精調(diào),千問是一個(gè)很好的基座選擇。陳鴻透露,暖哇科技目前的精調(diào)模型就是基于千問32B版本開發(fā)的。

      高雪峰也發(fā)現(xiàn),2025年大模型整體的Token成本明顯降低。DeepSeek、阿里、字節(jié)等主流的通用大模型在2025年都進(jìn)行了大幅降價(jià),目前,國內(nèi)主流商用模型API已經(jīng)進(jìn)入“厘時(shí)代”。看向未來,成本的持續(xù)下降是AI技術(shù)創(chuàng)新發(fā)展的必然,也正因如此,AI才能真正從C端嘗鮮邁向B端規(guī)模化落地,從而發(fā)揮更大的作用和價(jià)值。

      對于節(jié)前大模型行業(yè)的密集發(fā)布與更新,大模型生態(tài)社區(qū)OpenCSG(開放傳神)創(chuàng)始人陳冉則認(rèn)為,這是行業(yè)進(jìn)入了一個(gè)新的“工程化成熟期”的標(biāo)志,從拼規(guī)模轉(zhuǎn)向拼效率與落地能力。

      高雪峰對第一財(cái)經(jīng)表示,開源正在加速技術(shù)迭代并大幅降低成本,使大模型從少數(shù)巨頭能力走向產(chǎn)業(yè)基礎(chǔ)設(shè)施。隨著成本持續(xù)下降,Agentic AI智能體將從“能對話”邁向“能執(zhí)行、能創(chuàng)造價(jià)值”,智能體時(shí)代的黎明即將到來。

      隨著巨頭的持續(xù)發(fā)力,高雪峰判斷,通用大模型行業(yè)的馬太效應(yīng)將日益凸顯,呈現(xiàn)出強(qiáng)者恒強(qiáng)的局面,中小玩家的機(jī)會更多出現(xiàn)在細(xì)分行業(yè)和領(lǐng)域,如制造、金融、教育、醫(yī)療等領(lǐng)域的大模型。

      陳鴻認(rèn)為,各廠商的核心主線還是圍繞自身生態(tài)位推進(jìn)。以DeepSeek為例,其技術(shù)核心一直聚焦效率優(yōu)化,以極低的算力成本對外輸出服務(wù),成為性價(jià)比極高的模型。而阿里作為大廠,旗下千問模型有明確的性能追求,在編程、推理、多模態(tài)多方向持續(xù)迭代,其開源版本是繼續(xù)精調(diào)模型的優(yōu)秀基座。

      不過,高雪峰認(rèn)為,企業(yè)在推動(dòng)AI大模型應(yīng)用過程中,仍面臨模型存在幻覺、可解釋性和推理能力薄弱等挑戰(zhàn),這也是楓清科技在解決的部分。

      未來應(yīng)用廠商更希望大模型在哪些方面實(shí)現(xiàn)突破?陳鴻認(rèn)為,推理能力的動(dòng)態(tài)優(yōu)化是非常剛需的,當(dāng)前模型的推理開關(guān)要么全開要么全關(guān),缺乏靈活性,而人類會根據(jù)信息完備度動(dòng)態(tài)決定是否深度思考。若模型能自主判斷是否需要推理、是否缺少信息,就能在更多業(yè)務(wù)場景中應(yīng)用推理模型,避免不必要的算力消耗。

      其次,多模態(tài)技術(shù)的落地優(yōu)化很重要,當(dāng)前多模態(tài)模型仍是“抽卡機(jī)制”,生成圖像、語音等內(nèi)容時(shí)需反復(fù)調(diào)整提示詞,就像抽盲盒,難以滿足專業(yè)場景需求。

      誰能解決這些問題,誰就能在應(yīng)用領(lǐng)域更加向前一步。


      模型廠商技術(shù)指標(biāo)逐漸聚焦

      技術(shù)方向上,多模態(tài)、Agent等方面已在行業(yè)內(nèi)形成共識,但在實(shí)際落地過程中,成本把控能力、推理能力、工程化能力等方面逐漸成為考驗(yàn)?zāi)P蛷S商的重要指標(biāo)。

      Kimi創(chuàng)始人楊植麟表示,Kimi本身預(yù)訓(xùn)練策略乃至整個(gè)模型的設(shè)計(jì)策略,都是圍繞兩個(gè)維度展開:提升token efficiency(token效率)是Kimi團(tuán)隊(duì)認(rèn)為進(jìn)行預(yù)訓(xùn)練時(shí)一項(xiàng)極為重要的指標(biāo)與優(yōu)化方案;第二個(gè)維度是實(shí)現(xiàn)long context(長上下文),因?yàn)檠娱L上下文能有效降低損失,這也解釋了為何當(dāng)前許多復(fù)雜的Agent任務(wù)必須在超長上下文中才能完成——延長上下文必然會降低loss,而一個(gè)優(yōu)秀的架構(gòu)能使損耗下降得更多。

      紫荊芯界產(chǎn)品副總裁邵巍注意到行業(yè)模型和應(yīng)用發(fā)布的節(jié)奏正在加快,有公司提速至每半年一次發(fā)布旗艦?zāi)P停踔量s短到了四五個(gè)月一次。這說明一方面,負(fù)責(zé)軟件開發(fā)的員工在不斷推進(jìn)模型的研發(fā);另一方面,負(fù)責(zé)應(yīng)用開發(fā)的員工也在持續(xù)迭代更新。無論是長上下文還是Agent等方面的發(fā)展,實(shí)際上都對推理能力提出了更高的要求。

      商湯小浣熊負(fù)責(zé)人賈安亞在實(shí)際服務(wù)產(chǎn)業(yè)客戶的過程中發(fā)現(xiàn),軟件開發(fā)與辦公緊密關(guān)聯(lián)著企業(yè)的核心資產(chǎn)——代碼、文件及數(shù)據(jù)。不少企業(yè)客戶雖然對某些單一功能非常認(rèn)可,但在實(shí)際落地過程中,平臺需要提供一個(gè)全面且高效的解決方案,包括整體延遲性能、精度等,整體方案效果需達(dá)到95%以上,且需要完全可用。這對于模型推理是一個(gè)較大的挑戰(zhàn),因?yàn)槠髽I(yè)對芯片的投資及推理投入都有一個(gè)綜合的性價(jià)比考量,這就要求平臺必須考慮如何將大模型以最高效率部署到機(jī)器上進(jìn)行推理。

      大模型的頻繁更新對需要完成硬件適配的企業(yè)用戶難言友好。賈安亞團(tuán)隊(duì)近期正在合作一家頭部金融客戶,為其制定的整套解決方案旨在服務(wù)數(shù)千名員工,涵蓋從進(jìn)銷存到日常運(yùn)營等多個(gè)方面。對于這些一線業(yè)務(wù)人員來說,重要的是如何利用大量不同類型的數(shù)據(jù)(包括圖片、表格和PDF文件)在系統(tǒng)上實(shí)現(xiàn)高效且準(zhǔn)確的端到端處理。從技術(shù)角度來看,這意味著不僅要進(jìn)行語言推理,還需要處理多模態(tài)數(shù)據(jù),并保證超長上下文的支持及各種文件類型的處理能力。此外,還需確保整個(gè)過程既快速又精確,并且用戶可以在過程中隨時(shí)檢查進(jìn)度,并直接應(yīng)用最終結(jié)果。

      客戶既要求功能全面又要求性能卓越,這使得近期大模型行業(yè)除了產(chǎn)品的密集更新,還要在與產(chǎn)業(yè)鏈上下游加速聯(lián)動(dòng),在軟硬雙端從算法與架構(gòu)層面降低行業(yè)成本上下功夫。

      在浙江算力科技董事長錢敏勇看來,實(shí)施路徑上,推理成本的降低短期內(nèi)仍依賴工程優(yōu)化,包括整體架構(gòu)、算法以及軟件棧的優(yōu)化。但從長期角度來看,新型硬件和芯片的創(chuàng)新將會帶來更為深遠(yuǎn)的影響。

      煒燁智算董事長兼CEO周韡韡認(rèn)為,AI已經(jīng)從“看中學(xué)”階段發(fā)展到了“干中學(xué)”的階段。在基礎(chǔ)設(shè)施方面,基礎(chǔ)設(shè)施模型及其生態(tài)系統(tǒng)將會朝著基模生態(tài)一體化的方向發(fā)展。行業(yè)已經(jīng)結(jié)束了模型的盲目競爭,進(jìn)入了以推理能力為主導(dǎo)的時(shí)代。

      (本報(bào)記者陳楊園對此文亦有貢獻(xiàn))

      聲明:包含AI生成內(nèi)容

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      四川女生半夜吃衛(wèi)龍辣條中了一根金條,衛(wèi)龍客服:確有此活動(dòng),金條價(jià)值3000元

      四川女生半夜吃衛(wèi)龍辣條中了一根金條,衛(wèi)龍客服:確有此活動(dòng),金條價(jià)值3000元

      極目新聞
      2026-01-28 17:04:14
      蘇嘉全就任海基會董事長致詞時(shí)稱“中國大陸”,國臺辦回應(yīng)

      蘇嘉全就任海基會董事長致詞時(shí)稱“中國大陸”,國臺辦回應(yīng)

      京彩臺灣
      2026-01-28 12:45:38
      運(yùn)費(fèi)暴漲10倍也不給運(yùn)?比亞迪們被逼急了:那我就自己造一支艦隊(duì)

      運(yùn)費(fèi)暴漲10倍也不給運(yùn)?比亞迪們被逼急了:那我就自己造一支艦隊(duì)

      阿訊說天下
      2026-01-28 13:30:37
      王祖賢入駐某音:一條7秒視頻吸粉55萬,評論區(qū)舊照片發(fā)不停

      王祖賢入駐某音:一條7秒視頻吸粉55萬,評論區(qū)舊照片發(fā)不停

      素素娛樂
      2026-01-28 09:24:44
      美國吃華人絕戶財(cái)富已經(jīng)成為一個(gè)公開的密碼了!

      美國吃華人絕戶財(cái)富已經(jīng)成為一個(gè)公開的密碼了!

      達(dá)文西看世界
      2026-01-24 15:32:33
      獨(dú)家|40倍杠桿斷裂!水貝一黃金預(yù)定價(jià)平臺兌付困難,投資者稱涉資超百億

      獨(dú)家|40倍杠桿斷裂!水貝一黃金預(yù)定價(jià)平臺兌付困難,投資者稱涉資超百億

      第一財(cái)經(jīng)資訊
      2026-01-28 10:28:11
      原解放軍總后勤部李丕璋娶親后,得知前妻和兒子還活著,他怎么做

      原解放軍總后勤部李丕璋娶親后,得知前妻和兒子還活著,他怎么做

      大運(yùn)河時(shí)空
      2026-01-27 17:40:03
      河北省委常委武衛(wèi)東、副省長時(shí)清霜當(dāng)選省政協(xié)副主席

      河北省委常委武衛(wèi)東、副省長時(shí)清霜當(dāng)選省政協(xié)副主席

      澎湃新聞
      2026-01-28 12:17:04
      侵華14年,日本一共來了多少部隊(duì),被消滅了有多少?

      侵華14年,日本一共來了多少部隊(duì),被消滅了有多少?

      泠泠說史
      2026-01-10 16:20:40
      3679元起!蘋果突然上架多款 iPhone

      3679元起!蘋果突然上架多款 iPhone

      科技堡壘
      2026-01-27 11:49:24
      央視提醒!這種插線板早已被禁用!家里有的盡快扔掉!

      央視提醒!這種插線板早已被禁用!家里有的盡快扔掉!

      閃電新聞
      2026-01-27 09:20:41
      現(xiàn)貨黃金漲破5300美元!機(jī)構(gòu):金價(jià)將高位強(qiáng)勢運(yùn)行

      現(xiàn)貨黃金漲破5300美元!機(jī)構(gòu):金價(jià)將高位強(qiáng)勢運(yùn)行

      中新經(jīng)緯
      2026-01-28 16:44:16
      人在醫(yī)院能愚蠢到啥程度?網(wǎng)友:完美詮釋了不作不死的真義

      人在醫(yī)院能愚蠢到啥程度?網(wǎng)友:完美詮釋了不作不死的真義

      帶你感受人間冷暖
      2026-01-27 00:10:05
      喬治今日命中9記三分,追平76人隊(duì)史紀(jì)錄

      喬治今日命中9記三分,追平76人隊(duì)史紀(jì)錄

      懂球帝
      2026-01-28 14:06:06
      世界倒退最快的國家:從全球第六到一貧如洗,僅僅用了5年

      世界倒退最快的國家:從全球第六到一貧如洗,僅僅用了5年

      老謝談史
      2025-12-03 13:42:30
      “留學(xué)一年嘴都變大了”,女學(xué)生面相變化圖走紅,牢A果然權(quán)威

      “留學(xué)一年嘴都變大了”,女學(xué)生面相變化圖走紅,牢A果然權(quán)威

      離離言幾許
      2026-01-26 16:18:04
      英國千人斬女網(wǎng)紅宣布新挑戰(zhàn)延期:怕不能走路

      英國千人斬女網(wǎng)紅宣布新挑戰(zhàn)延期:怕不能走路

      環(huán)球趣聞分享
      2026-01-28 14:13:39
      很土很老的方子,但很補(bǔ)很補(bǔ)根子,起夜次數(shù)從4次降至0次!

      很土很老的方子,但很補(bǔ)很補(bǔ)根子,起夜次數(shù)從4次降至0次!

      江江食研社
      2026-01-27 16:30:07
      我們聊聊一個(gè)新群體——零負(fù)債人群。

      我們聊聊一個(gè)新群體——零負(fù)債人群。

      流蘇晚晴
      2026-01-16 17:57:29
      張維為說只有國人才可以大口吃肉不可悲,可悲的是下面站滿了滿臉陶醉的聽眾

      張維為說只有國人才可以大口吃肉不可悲,可悲的是下面站滿了滿臉陶醉的聽眾

      林中木白
      2026-01-27 17:49:23
      2026-01-28 18:51:00
      第一財(cái)經(jīng)資訊 incentive-icons
      第一財(cái)經(jīng)資訊
      第一財(cái)經(jīng)官方賬號
      242820文章數(shù) 621346關(guān)注度
      往期回顧 全部

      科技要聞

      它是神也是毒!Clawdbot改名卷入千萬詐騙

      頭條要聞

      斯塔默:中國已崛起 英國需要承認(rèn)這種現(xiàn)實(shí)的對華政策

      頭條要聞

      斯塔默:中國已崛起 英國需要承認(rèn)這種現(xiàn)實(shí)的對華政策

      體育要聞

      沒天賦的CBA第一小前鋒,秘訣只有一個(gè)字

      娛樂要聞

      王祖賢入駐某音:一條7秒視頻吸粉55萬

      財(cái)經(jīng)要聞

      從萬科退休20天后,郁亮疑似失聯(lián)

      汽車要聞

      新手必看!冰雪路面不敢開?記住這4點(diǎn) 關(guān)鍵時(shí)刻真能保命

      態(tài)度原創(chuàng)

      教育
      數(shù)碼
      旅游
      公開課
      軍事航空

      教育要聞

      寒假必備!這11部科幻題材的書和電影,看了3遍,還想再看

      數(shù)碼要聞

      英特爾確認(rèn)XeSS-MFG多幀生成2月將支持銳炫Arc B580顯卡

      旅游要聞

      2025年新疆全年接待游客3.23億人次,創(chuàng)歷史新高

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗豎起巨幅宣傳畫:一艘美軍航母被炸

      無障礙瀏覽 進(jìn)入關(guān)懷版