![]()
作者|參商 西梅汁
編輯|星奈
媒體|AI大模型工場(chǎng)
![]()
國(guó)內(nèi)大模型發(fā)展趨勢(shì)|8月份解讀
DeepSeek引爆寒武紀(jì)股價(jià),國(guó)產(chǎn)算力抱團(tuán)
算力與生態(tài)正逐漸走向“國(guó)產(chǎn)抱團(tuán)”。
從DeepSeek宣布其新一代模型DeepSeek-V3.1采用了UE8M0 FP8 Scale后,拉升寒武紀(jì)股價(jià),資本市場(chǎng)的狂熱讓這家公司一度超越貴州茅臺(tái)。同時(shí),8月22日,在寒武紀(jì)的帶領(lǐng)下,多只國(guó)產(chǎn)算力股強(qiáng)勢(shì)漲停,科創(chuàng)板大漲近10%,各大芯片ETF漲幅均在10%左右。
可以看到,國(guó)產(chǎn)算力廠商開(kāi)始重新定義標(biāo)準(zhǔn),推動(dòng)產(chǎn)業(yè)鏈凝聚,試圖把長(zhǎng)期依賴(lài)英偉達(dá)的局面,轉(zhuǎn)變成一個(gè)可自主演進(jìn)的技術(shù)體系。
產(chǎn)業(yè)鏈上下游正在尋找英偉達(dá)之外的另一條路徑。英偉達(dá)中國(guó)區(qū)營(yíng)收大幅下滑24.49%(2026財(cái)年Q2),在制裁與替代的雙重壓力下,英偉達(dá)在中國(guó)市場(chǎng)的優(yōu)勢(shì)正在被侵蝕。這為國(guó)產(chǎn)算力廠商打開(kāi)了窗口期,也讓本土化算力開(kāi)始成為產(chǎn)業(yè)共識(shí),而非應(yīng)急選項(xiàng)。
一方面,DeepSeek在業(yè)內(nèi)率先拋出UE8M0 FP8的標(biāo)準(zhǔn),明確指向即將發(fā)布的國(guó)產(chǎn)芯片,讓市場(chǎng)看到國(guó)產(chǎn)算力的技術(shù)信心。資本市場(chǎng)隨即給出回應(yīng),寒武紀(jì)股價(jià)連續(xù)飆升,市值甚至一度超越貴州茅臺(tái),這背后的象征性遠(yuǎn)大于實(shí)際估值本身。更重要的是,阿里等大廠也宣布自研AI芯片,試圖補(bǔ)齊被英偉達(dá)“卡脖子”的底層短板。
另一方面,算力、存儲(chǔ)、網(wǎng)絡(luò)的廠商也在同步抱團(tuán)。不同于單點(diǎn)突圍,這一次的行業(yè)動(dòng)作更像是一次“生態(tài)合圍”,上游芯片廠商、下游大模型公司、以及云計(jì)算和存儲(chǔ)網(wǎng)絡(luò)廠商,正在嘗試形成一個(gè)國(guó)產(chǎn)算力閉環(huán)。大模型的迭代需要海量算力,而只有通過(guò)產(chǎn)業(yè)鏈協(xié)同,國(guó)產(chǎn)廠商才有機(jī)會(huì)擺脫對(duì)單一供應(yīng)商的依賴(lài)。
總體來(lái)看,8月的大模型動(dòng)態(tài)釋放了一個(gè)信號(hào),在全球AI算力重塑的背景下,國(guó)產(chǎn)廠商已經(jīng)從補(bǔ)位走向主動(dòng)競(jìng)爭(zhēng)。英偉達(dá)這次的“失落”并不意味著短期內(nèi)失去主導(dǎo),但國(guó)內(nèi)產(chǎn)業(yè)鏈借機(jī)完成了一次集體的“覺(jué)醒”,算力本土化的共識(shí)正在快速形成。
未來(lái)辦公入口之爭(zhēng),AI Agent的勝負(fù)手
這個(gè)8月更多體現(xiàn)在應(yīng)用層的落地較量。
AI Agent 成為這一波浪潮的關(guān)鍵載體,而最先被卷入戰(zhàn)場(chǎng)的,是原本已經(jīng)趨于穩(wěn)定的辦公協(xié)同軟件。釘釘、飛書(shū)和企業(yè)微信,開(kāi)始把 AI 辦公推到臺(tái)前,把這個(gè)過(guò)去被視為工具化的功能,重塑為“數(shù)字員工”的入口。
8月25日,釘釘召開(kāi)8.0發(fā)布會(huì),推出下一代AI辦公應(yīng)用釘釘ONE,該產(chǎn)品被設(shè)計(jì)成人與AI通過(guò)自然語(yǔ)言對(duì)話(huà)的統(tǒng)一入口,打造以Agent驅(qū)動(dòng)的工作信息流。飛書(shū)則更新了AI與多維表格功能,宣布"多維表格"將登陸釘釘、企業(yè)微信平臺(tái),打破協(xié)同辦公封閉生態(tài),展現(xiàn)出跨平臺(tái)整合的戰(zhàn)略意圖。頭部辦公平臺(tái)的競(jìng)爭(zhēng)已從單一功能比拼轉(zhuǎn)向生態(tài)系統(tǒng)的全面較量。
與此同時(shí),企業(yè)微信也加速AI能力的落地,上線(xiàn)"智能表格"功能,與釘釘?shù)?AI表格"、飛書(shū)的"多維表格"形成三足鼎立之勢(shì)。三大平臺(tái)均聚焦于自動(dòng)生成、數(shù)據(jù)分析等AI功能,但實(shí)現(xiàn)路徑各有側(cè)重。
釘釘強(qiáng)調(diào)以Agent驅(qū)動(dòng)的工作信息流,飛書(shū)注重多維表格與AI的深度結(jié)合,企業(yè)微信則更側(cè)重于與微信生態(tài)的無(wú)縫銜接。當(dāng)前協(xié)同辦公市場(chǎng)競(jìng)爭(zhēng)已白熱化,數(shù)據(jù)顯示釘釘月活約2億居首,企業(yè)微信約1億排第二,飛書(shū)緊隨其后,三方在AI能力上的比拼將成為決定未來(lái)市場(chǎng)格局的關(guān)鍵。
然而,同質(zhì)化趨勢(shì)已經(jīng)出現(xiàn),自動(dòng)生成、智能分析、語(yǔ)義搜索,這些功能亮點(diǎn)可能很快會(huì)被彼此追平。未來(lái)或許是,誰(shuí)能把 AI Agent 和企業(yè)的業(yè)務(wù)場(chǎng)景深度綁定,形成穩(wěn)定的、可復(fù)用的“行業(yè)解法”。換句話(huà)說(shuō),勝負(fù)手不在工具,而在落地的能力;更不在功能數(shù)量,而在是否能成為企業(yè)日常運(yùn)行的“數(shù)字骨干”。
這場(chǎng) AI Agent 的辦公戰(zhàn)爭(zhēng)才剛剛開(kāi)始。它既是協(xié)同軟件的一次自我重構(gòu),也是大模型廠商的一次應(yīng)用突圍。未來(lái)幾年,當(dāng)企業(yè)習(xí)慣了用自然語(yǔ)言驅(qū)動(dòng)流程,當(dāng) AI真正能替代部分職場(chǎng)工作時(shí),這場(chǎng)競(jìng)爭(zhēng)才會(huì)顯露出真正的贏家。
小模型才是智能體的未來(lái)?
在模型圈競(jìng)賽里,小模型正在成為最具代表性的黃金尺寸。
騰訊混元一次性開(kāi)源 0.5B/1.8B/4B/7B 多尺寸 Dense 模型,強(qiáng)調(diào)可在消費(fèi)級(jí)設(shè)備上運(yùn)行;阿里通義千問(wèn)推出 Qwen3-4B 的 Instruct 與 Thinking 新版本;英偉達(dá)在自家Jet-Nemotron系列中就有Jet-Nemotron-2B和Jet-Nemotron-4B大小,并公開(kāi)論證“小模型是可規(guī)模化 Agent 的關(guān)鍵”。這些動(dòng)作高度同頻,這背后包含的是成本、延遲、部署等方面的考量。
為什么是小模型?一方面,它足夠小,在筆記本、手機(jī)、車(chē)端等場(chǎng)景下,可以省掉大量延遲與帶寬開(kāi)銷(xiāo);另一方面,規(guī)模又不至于過(guò)小,具備較好的實(shí)用性,能靈活嵌入到業(yè)務(wù)流程和工具鏈中。騰訊的開(kāi)源強(qiáng)調(diào)“消費(fèi)級(jí)顯卡可跑、低功耗場(chǎng)景可用”,英偉達(dá)也補(bǔ)上了“長(zhǎng)上下文、單卡可用”的指標(biāo),比如 128k 上下文和單 GPU 優(yōu)化。
以通義千問(wèn)的 Qwen3-4B 為例,官方稱(chēng) Instruct-2507 版本在非推理類(lèi)任務(wù)全面超過(guò)閉源 GPT-4.1-Nano,Thinking-2507 在推理上可逼近 30B 級(jí)別的自家思考模型,并已在魔搭與 Hugging Face 開(kāi)源,也就是說(shuō),結(jié)合工具使用與檢索,4B 可以覆蓋大量日常 Agent 事務(wù)。
像英偉達(dá)提出的小模型方案、騰訊和阿里在開(kāi)源生態(tài)中給出的全套尺寸的選擇權(quán)。這些這意味著,未來(lái)的智能體系統(tǒng)不會(huì)依賴(lài)某個(gè)“大腦”,而更像流水線(xiàn),由大量輕量模型承擔(dān)日常任務(wù),大模型只在需要復(fù)雜跨域推理時(shí)出現(xiàn)。
不可否認(rèn),大模型依舊在開(kāi)放域推理、長(zhǎng)鏈路決策、跨領(lǐng)域中擁有不可替代的價(jià)值。但在企業(yè)級(jí)和消費(fèi)級(jí)的真實(shí)負(fù)載中,從知識(shí)問(wèn)答到自動(dòng)化執(zhí)行,小模型已經(jīng)性能夠用且成本更優(yōu)。
所以說(shuō),更現(xiàn)實(shí)的答案不是大和小的較量,而是以小為主,按需所取。這或許是為什么從阿里到騰訊,再到英偉達(dá),都在用開(kāi)源、產(chǎn)品化和硬件綁定的方式,把小模型推向產(chǎn)業(yè)的中心。
國(guó)內(nèi)主要大模型進(jìn)展
阿里
8 月,阿里旗下釘釘、高德、通義團(tuán)隊(duì)、阿里云等相繼推出并升級(jí) AI 相關(guān)產(chǎn)品,涵蓋協(xié)同辦公、編程、圖像編輯、地圖服務(wù)及大模型平臺(tái),展現(xiàn)多場(chǎng)景 AI 布局。
8月29日,在 2026 財(cái)年 Q1 財(cái)報(bào)電話(huà)會(huì)上,阿里 CEO 吳泳銘宣布過(guò)去四個(gè)季度 AI 基礎(chǔ)設(shè)施及研發(fā)投入超 1000 億元,AI 相關(guān)收入占云外部商業(yè)化收入比例超 20%。同期,高德、釘釘?shù)葮I(yè)務(wù)全面 AI 化,如釘釘推出 Agent 驅(qū)動(dòng)的工作流 “釘釘 ONE”。
8月 27 日消息,阿里云宣布開(kāi)源全新多模態(tài)視頻生成模型通義萬(wàn)相 Wan2.2-S2V,僅需一張靜態(tài)圖片和一段音頻,即可生成面部表情自然、口型一致、肢體動(dòng)作絲滑的電影級(jí)數(shù)字人視頻。
據(jù)介紹,該模型單次生成的視頻時(shí)長(zhǎng)可達(dá)分鐘級(jí),大幅提升數(shù)字人直播、影視制作、AI 教育等行業(yè)的視頻創(chuàng)作效率。
8月25日,釘釘召開(kāi)發(fā)布會(huì)推出8.0版本,宣布全面轉(zhuǎn)向AI原生。釘釘CEO無(wú)招表示,此次升級(jí)是“AI釘釘?shù)?.0”,團(tuán)隊(duì)以歸零心態(tài)重構(gòu)產(chǎn)品,標(biāo)志著這一用戶(hù)規(guī)模最大的協(xié)同辦公APP正式進(jìn)入AI驅(qū)動(dòng)時(shí)代。此前在6月的生態(tài)大會(huì)上,釘釘已宣布對(duì)所有大模型廠商開(kāi)放,構(gòu)建開(kāi)放AI生態(tài),支持通義千問(wèn)等模型接入。
8月22日,阿里發(fā)布新一代 AI 編程平臺(tái) Qoder,集成全球頂尖編程模型,支持AI 自主研發(fā)模式(Quest Mode)。開(kāi)發(fā)者僅需輸入需求描述,Qoder 即可自動(dòng)生成從設(shè)計(jì)文檔到可運(yùn)行代碼的全鏈路交付物,開(kāi)發(fā)效率提升 10 倍以上。
8月19日,通義團(tuán)隊(duì)推出圖像編輯模型Qwen-Image-Edit,基于 20B 參數(shù)的 Qwen-Image 模型進(jìn)一步訓(xùn)練,實(shí)現(xiàn)雙語(yǔ)文本精準(zhǔn)編輯、風(fēng)格遷移及物體旋轉(zhuǎn)等功能。
例如,用戶(hù)可直接在圖片中修改中文標(biāo)識(shí)的字體、顏色,或一鍵將寫(xiě)實(shí)風(fēng)格的產(chǎn)品圖轉(zhuǎn)化為卡通風(fēng)格。該模型在 Hugging Face 開(kāi)源社區(qū)上線(xiàn)首日即登頂熱度榜,下載量超 10 萬(wàn)次,成為設(shè)計(jì)師群體的 “爆款工具”。
8月7日,通義千問(wèn)Qwen宣布推出兩款更小尺寸的新模型:Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507。其中,Qwen3-4B-Thinking-2507的推理能力可媲美中尺寸模型;Qwen3-4B-Instruct-2507在知識(shí)、推理、編程、對(duì)齊以及agent能力上全面超越了閉源的小尺寸模型GPT-4.1-nano。
此次發(fā)布的“2507”版本的Qwen3-4B模型對(duì)手機(jī)等端側(cè)硬件部署較為友好,目前已在魔搭社區(qū)和Hugging Face正式開(kāi)源。
8月4日,高德地圖發(fā)布全球首個(gè)AI 原生地圖應(yīng)用 “高德地圖 2025”,整合通義大模型簇構(gòu)建出行生活智能體 “小高老師”。該智能體可自主規(guī)劃多天跨城自駕游路線(xiàn),自動(dòng)匹配機(jī)場(chǎng)貴賓廳權(quán)益、餐廳預(yù)訂等服務(wù),用戶(hù)交互轉(zhuǎn)化率提升 40%。技術(shù)層面,其通過(guò)動(dòng)態(tài)時(shí)空推理模型,實(shí)時(shí)分析交通數(shù)據(jù)與用戶(hù)偏好,實(shí)現(xiàn) “行前 - 行中 - 行后” 全旅程閉環(huán)服務(wù)。這一產(chǎn)品被行業(yè)視為 “地圖服務(wù)從工具向智能體進(jìn)化的里程碑”。
字節(jié)跳動(dòng)
8月29日,字節(jié)跳動(dòng)推出新一代AI視頻生成模型OmniHuman-1.5,首次實(shí)現(xiàn)業(yè)界領(lǐng)先的"雙人音頻驅(qū)動(dòng)"功能,支持兩個(gè)數(shù)字人同時(shí)對(duì)戲;模型不僅精準(zhǔn)還原口型與表情,更能實(shí)時(shí)解析語(yǔ)音情緒并反饋匹配的表情與肢體語(yǔ)言,從"說(shuō)得好"到"演得像"實(shí)現(xiàn)質(zhì)變;支持通過(guò)文本提示詞控制視頻風(fēng)格和動(dòng)作,實(shí)現(xiàn)長(zhǎng)達(dá)一分鐘以上視頻的時(shí)序連貫性和角色一致性,標(biāo)志數(shù)字人技術(shù)邁入"多模態(tài)情感化"新階段。
8月25日,據(jù)申媽朋友圈報(bào)道,字節(jié)Seed大模型視覺(jué)基礎(chǔ)研究團(tuán)隊(duì)負(fù)責(zé)人馮佳時(shí)已正式離職。根據(jù)其在字節(jié)的職級(jí)體系判斷,他的級(jí)別應(yīng)在4-1或4-2之間,屬于公司最為稀缺的核心研究序列。馮佳時(shí)后續(xù)去向或是AI創(chuàng)業(yè)
8 月 21 日,字節(jié)跳動(dòng)開(kāi)源Seed-OSS-36B 大模型,采用 Apache-2.0 協(xié)議,參數(shù)規(guī)模 360 億,支持512K 原生長(zhǎng)上下文和可控思維預(yù)算機(jī)制。在 MATH、GSM8K 等推理基準(zhǔn)測(cè)試中,其準(zhǔn)確率超越 Llama 3-70B,且訓(xùn)練僅用 12T tokens(行業(yè)平均 20T+),刷新效率記錄。模型提供基礎(chǔ)版(woSyn)和指令微調(diào)版(Instruct),支持 vLLM、llama.cpp 等框架部署,企業(yè)可通過(guò)火山引擎獲取 “模型 - 算力 - 工具” 全棧支持。
8 月 5 日,字節(jié)跳動(dòng)開(kāi)源項(xiàng)目 AIBrix 發(fā)布 v0.4.0 版本,首次實(shí)現(xiàn)P/D 解耦(Prefill/Decode 分離)與專(zhuān)家并行(EP)支持,并引入多引擎協(xié)同機(jī)制。通過(guò)分層調(diào)度和動(dòng)態(tài)路由策略,AIBrix 在 Qwen-32b 模型推理中,首次令牌生成時(shí)間(TTFT)中位數(shù)降低 44%,尾延遲優(yōu)化 31%。新版本還支持 vLLM、SGLang 等多推理引擎,允許企業(yè)靈活選擇技術(shù)棧,同時(shí)通過(guò) KVCache 事件同步提升多模態(tài)任務(wù)的上下文復(fù)用效率。
百度
百度在 2025 年 8 月密集發(fā)布多模態(tài)模型、開(kāi)源框架與行業(yè)解決方案,技術(shù)迭代周期縮短至季度級(jí),遠(yuǎn)超行業(yè)平均水平。
8月28日,在 2025 百度云智大會(huì)上,百度集團(tuán)執(zhí)行副總裁沈抖宣布百度智能云百舸 AI 計(jì)算平臺(tái) 5.0 和千帆企業(yè)級(jí) AI 開(kāi)發(fā)平臺(tái) 4.0 升級(jí)發(fā)布,前者在網(wǎng)絡(luò)、算力、推理系統(tǒng)及訓(xùn)推一體系統(tǒng)等方面實(shí)現(xiàn)全面提升,后者打造以 Agent 為核心的一站式企業(yè)級(jí)服務(wù)平臺(tái)。同時(shí),百度還發(fā)布了基于慧播星數(shù)字人的 “吳彥祖數(shù)字英語(yǔ)教練” 以及一見(jiàn)視覺(jué)大模型平臺(tái)的工序合規(guī)分析能力。此外,數(shù)據(jù)顯示 2025 年第二季度,受 AI 驅(qū)動(dòng),百度涵蓋智能云在內(nèi)的 AI 新業(yè)務(wù)收入首次超過(guò) 100 億元,同比增長(zhǎng) 34%。
8月26日,百度近期上線(xiàn)了一款新應(yīng)用「梯子AI」(「Tizzy AI」),官方定位為一款輕量級(jí)搜索工具。相比傳統(tǒng)搜索,它強(qiáng)調(diào)簡(jiǎn)潔的交互和結(jié)果直達(dá)的體驗(yàn),試圖在移動(dòng)端場(chǎng)景下為用戶(hù)提供更順暢的信息獲取方式。
從功能來(lái)看,梯子AI提供了兩種搜索模式。自動(dòng)模式側(cè)重于快速反饋日常問(wèn)題,例如天氣、地址或基礎(chǔ)資訊;深度模式則針對(duì)更復(fù)雜的需求進(jìn)行處理,通過(guò)多輪推理和整合來(lái)幫助用戶(hù)做出更全面的判斷。這種雙模式設(shè)計(jì)讓搜索不再局限于單一的信息返回,而是根據(jù)場(chǎng)景靈活切換。
8 月 21 日,百度發(fā)布全球首個(gè)中文音視頻一體化模型 “百度蒸汽機(jī) 2.0”,支持多人對(duì)話(huà)、語(yǔ)音與唇形同步等技術(shù)突破,全系版本開(kāi)放且定價(jià)為行業(yè)同類(lèi)產(chǎn)品的 70%(如 Turbo 有聲版 1.4 元 / 5 秒)。
同日,百度移動(dòng)生態(tài)商業(yè)負(fù)責(zé)人陳一凡表示,蒸汽機(jī) 2.0 已應(yīng)用于一汽 - 大眾、伊利等企業(yè)的營(yíng)銷(xiāo)視頻制作,成本壓縮 90%。8 月 22 日,百度申請(qǐng) “數(shù)據(jù)處理方法及多模態(tài)大模型訓(xùn)練” 專(zhuān)利,進(jìn)一步強(qiáng)化技術(shù)壁壘。
8 月 20 日,百度發(fā)布 2025 年第二季度財(cái)報(bào),AI 新業(yè)務(wù)收入首次突破 100 億元,同比增長(zhǎng) 34%,智能云業(yè)務(wù)連續(xù)六年位居中國(guó) AI 公有云市場(chǎng)第一。財(cái)報(bào)同時(shí)披露,文心大模型 4.5 系列已于 6 月開(kāi)源,包含 10 款不同架構(gòu)模型,企業(yè)可通過(guò)千帆平臺(tái)調(diào)用 API 服務(wù)。李彥宏在財(cái)報(bào)電話(huà)會(huì)中透露,下一代文心大模型旗艦版本正在開(kāi)發(fā),將在關(guān)鍵功能上實(shí)現(xiàn)重大改進(jìn)。
8月5日,百度AI Day開(kāi)放日現(xiàn)場(chǎng),百度智能云宣布推出全球首批AI數(shù)字員工,涵蓋營(yíng)銷(xiāo)經(jīng)理、還款助理、汽車(chē)銷(xiāo)售、促銷(xiāo)專(zhuān)員、產(chǎn)品經(jīng)理、課程顧問(wèn)、招聘專(zhuān)員核心業(yè)務(wù)職能。依托百度智能云領(lǐng)先的AI全棧能力,數(shù)字員工深度融合了大模型、數(shù)字人技術(shù)及行業(yè)Know-How三大業(yè)務(wù)優(yōu)勢(shì),能夠?qū)崿F(xiàn)開(kāi)箱即用,上崗即勝任,精準(zhǔn)賦能垂直業(yè)務(wù)場(chǎng)景的同時(shí)持續(xù)沉淀崗位能力,以“懂業(yè)務(wù)、給結(jié)果、可進(jìn)化”三大特性重新定義企業(yè)級(jí)智能服務(wù)能力,真正成為企業(yè)可信賴(lài)的數(shù)字業(yè)務(wù)伙伴。
騰訊
騰訊于8月密集開(kāi)源并發(fā)布多款覆蓋音視頻、游戲、辦公及3D生成領(lǐng)域的AI工具,覆蓋多個(gè)專(zhuān)業(yè)領(lǐng)域。
8月28日,騰訊混元開(kāi)源端到端視頻音效生成模型HunyuanVideo-Foley。基于該模型,用戶(hù)只需輸入視頻和文字,就能為視頻匹配電影級(jí)音效。
HunyuanVideo-Foley不僅打破了 AI 生成的視頻只能 “看” 不能 “聽(tīng)” 的局限,讓無(wú)聲AI視頻成為歷史,更是真正做到了 “看懂畫(huà)面、讀懂文字、配準(zhǔn)聲音” ,帶來(lái)沉浸式視聽(tīng)體驗(yàn)。這款音效生成工具可廣泛應(yīng)用于短視頻創(chuàng)作、電影制作、廣告創(chuàng)意和游戲開(kāi)發(fā)等場(chǎng)景。
即日起,用戶(hù)可在Github,HuggingFace下載模型,也可以在混元官網(wǎng)直接體驗(yàn)。
8 月 21 日,騰訊游戲在科隆游戲展發(fā)布 AI 創(chuàng)作工具 VISVISE,通過(guò) “Go Skinning” 和 “Motion Blink” 技術(shù),將角色綁定與動(dòng)畫(huà)生成時(shí)間從數(shù)天壓縮至 10 秒,效率提升 8 倍。該工具已應(yīng)用于《無(wú)畏契約》手游等 90 余款游戲,解決了傳統(tǒng)流程中骨骼預(yù)測(cè)、服裝變形等痛點(diǎn)。
8月20日,企業(yè)微信5.0今日正式發(fā)布。新版本全新推出了智能搜索、智能總結(jié)、智能機(jī)器人三大核心AI功能,幫助用戶(hù)解決辦公場(chǎng)景中方方面面的問(wèn)題。比如AI可自動(dòng)關(guān)聯(lián)聊天、文檔、會(huì)議、郵件等場(chǎng)景,精準(zhǔn)定位文檔最終版本,自動(dòng)匯總數(shù)據(jù)等,讓搜索這件事變得更加高效、準(zhǔn)確;智能總結(jié)可實(shí)現(xiàn)自動(dòng)整合群聊、文檔、會(huì)議記錄,生成項(xiàng)目進(jìn)展報(bào)告,跳過(guò)中間環(huán)節(jié),讓項(xiàng)目進(jìn)展匯總更高效;智能機(jī)器人支持企業(yè)將業(yè)務(wù)SOP、規(guī)章制度、產(chǎn)品介紹、客戶(hù)案例添加進(jìn)來(lái),讓AI學(xué)習(xí)并實(shí)現(xiàn)零門(mén)檻問(wèn)答。
騰訊公司副總裁、企業(yè)微信負(fù)責(zé)人黃鐵鳴現(xiàn)場(chǎng)公布數(shù)據(jù)顯示,截至目前,企業(yè)微信已接入超過(guò)1400萬(wàn)企業(yè)與組織,每天通過(guò)企業(yè)微信服務(wù)的微信用戶(hù)數(shù)超過(guò)7.5億。
8 月 15 日,推出混元 3D 世界模型 1.0 Lite 版,通過(guò)動(dòng)態(tài) FP8 量化技術(shù)將顯存需求從 26GB 降至 17GB 以下,首次實(shí)現(xiàn)消費(fèi)級(jí)顯卡流暢運(yùn)行 3D 世界生成。該模型支持 “一句話(huà)生成可漫游虛擬世界”,并兼容 Unity、Unreal Engine 等工具,直接推動(dòng)游戲開(kāi)發(fā)、VR 體驗(yàn)及數(shù)字內(nèi)容創(chuàng)作的平民化。同日,混元 3D 世界模型 1.0 Lite 版全面開(kāi)源,在 Hugging Face 平臺(tái)下載量迅速攀升,技術(shù)報(bào)告登頂論文熱榜。
8 月 4 日,騰訊混元開(kāi)源四款小尺寸模型,參數(shù)分別為 0.5B、1.8B、4B、7B,消費(fèi)級(jí)顯卡即可運(yùn)行。這些模型適用于筆記本電腦、手機(jī)、智能座艙等低功耗場(chǎng)景,且支持垂直領(lǐng)域低成本微調(diào),已在 Github 和 Hugging Face 等開(kāi)源社區(qū)上線(xiàn)。
360集團(tuán)
8月15日,360 集團(tuán)二十周年慶典上,創(chuàng)始人周鴻祎宣布 “All in Agent” 戰(zhàn)略,發(fā)布納米 AI 多智能體蜂群最新進(jìn)展:L3 級(jí)智能體可連續(xù)執(zhí)行 100 步復(fù)雜任務(wù)零出錯(cuò),L4 級(jí)蜂群支持 1000 步協(xié)作任務(wù)(Token 消耗 500 萬(wàn) - 3000 萬(wàn)),成功率 95.4%。同時(shí)推出 “智能體超市”,企業(yè)可像招聘員工一樣調(diào)用內(nèi)外部智能體完成任務(wù)。
8月6日,在 ISC.AI 2025 互聯(lián)網(wǎng)安全大會(huì)上,360 集團(tuán)發(fā)布全球首個(gè) L4 級(jí)企業(yè)智能體工廠 ——SEAF,支持無(wú)代碼定制 L3 級(jí)推理型智能體及 L4 級(jí)多智能體蜂群。通過(guò) “自然語(yǔ)言指令 + 模塊化組裝” 模式,企業(yè)可快速構(gòu)建專(zhuān)屬智能體團(tuán)隊(duì),完成復(fù)雜業(yè)務(wù)流程(如合同審核、漏洞分析),任務(wù)成功率超 98%。
科大訊飛
8 月 22 日,科大訊飛發(fā)布 2025 年半年報(bào),營(yíng)收首次突破百億(109.11 億元,同比 + 17.01%),C 端業(yè)務(wù)增長(zhǎng) 38%,學(xué)習(xí)機(jī)業(yè)務(wù)翻番。星火大模型在高考作文、數(shù)學(xué)測(cè)評(píng)中表現(xiàn)優(yōu)異(作文得分第一、數(shù)學(xué)超 140 分),并在 MedBench 醫(yī)療大模型評(píng)測(cè)中總分第一。
8 月 18-20 日,科大訊飛在全球智慧教育大會(huì)展示 “AI + 教育” 新范式,星火大模型深度融入高考評(píng)閱、課堂互動(dòng)、體育心理等場(chǎng)景。其 “人機(jī)協(xié)同” 模式通過(guò)教育數(shù)據(jù)反哺模型迭代,實(shí)現(xiàn) “從 AI 賦能教育到教育賦能 AI” 的閉環(huán)。例如,基于星火大模型的 “數(shù)學(xué)智能教師系統(tǒng)” 已在多地高中落地,解題準(zhǔn)確率提升 12%。
昆侖萬(wàn)維
8 月 22 日宣布向子公司 SkyworkAI 增資 5 億元,并獲得銀行授信、關(guān)聯(lián)方可轉(zhuǎn)債等多渠道資金支持,為大模型研發(fā)與商業(yè)化提供資金保障。
8 月 11 日至 15 日,昆侖萬(wàn)維舉辦SkyWork AI 技術(shù)發(fā)布周,每日發(fā)布一款模型,覆蓋視頻生成、世界模型、多模態(tài)交互、智能體及音樂(lè)創(chuàng)作五大領(lǐng)域:
1.SkyReels-A3(8 月 11 日):音頻驅(qū)動(dòng)的數(shù)字人視頻生成模型,支持單分鏡 60 秒以上、多分鏡無(wú)限時(shí)長(zhǎng)創(chuàng)作,解決動(dòng)作不自然、音畫(huà)不同步等痛點(diǎn),已應(yīng)用于一汽 - 大眾等企業(yè)的營(yíng)銷(xiāo)視頻制作,成本壓縮 90%。
2.Matrix-Game 2.0 與 Matrix-3D(8 月 12 日):開(kāi)源國(guó)內(nèi)首個(gè)對(duì)標(biāo)谷歌 Genie 的交互式視頻生成模型(25FPS 實(shí)時(shí)生成)和 3D 場(chǎng)景生成模型(單圖生成可探索 3D 世界),推動(dòng)游戲開(kāi)發(fā)、元宇宙等領(lǐng)域的實(shí)時(shí)內(nèi)容生產(chǎn)效率提升 8 倍。
3.Skywork UniPic 2.0(8 月 13 日):開(kāi)源多模態(tài)統(tǒng)一模型,支持圖文聯(lián)動(dòng)編輯與跨模態(tài)任務(wù),在廣告設(shè)計(jì)、醫(yī)療影像等場(chǎng)景的推理成本降低 60%,代碼與權(quán)重全開(kāi)放。
4.Skywork Deep Research Agent v2(8 月 14 日):天工超級(jí)智能體核心引擎,支持深度信息研究與多模態(tài)內(nèi)容生成,在 GAIA 評(píng)測(cè)中以 82.42 分位列全球榜首,調(diào)用成本僅為競(jìng)品 40%。
5.Mureka V7.5(8 月 15 日):AI 音樂(lè)大模型,融合中文音樂(lè)文化語(yǔ)境,音色真實(shí)度提升 44%,良品率從 43.4% 躍升至 57.7%,已接入網(wǎng)易云音樂(lè)等平臺(tái),日均生成曲目超 10 萬(wàn)首。
智譜
8月20日,智譜發(fā)布全球首個(gè)手機(jī)通用智能體 AutoGLM 2.0,基于 GLM-4.5 與 GLM-4.5V 驅(qū)動(dòng),支持跨 40 + 應(yīng)用執(zhí)行任務(wù)(如美團(tuán)點(diǎn)餐、攜程訂票),單次任務(wù)成本僅 0.2 美元(降幅 93%)。該智能體采用 “云手機(jī) + 異步執(zhí)行” 模式,用戶(hù)可離線(xiàn)托管任務(wù)(如 24 小時(shí)監(jiān)控電商價(jià)格波動(dòng)),并通過(guò) API 接入汽車(chē)、AI 眼鏡等硬件終端。
8月 11日,智譜開(kāi)源全球首個(gè) 100B 級(jí)視覺(jué)推理模型 GLM-4.5V,參數(shù)規(guī)模 106B,在 ImageNet-Vid、MS-COCO 等 41 個(gè)視覺(jué)任務(wù)中刷新 SOTA 紀(jì)錄。該模型支持 “圖文聯(lián)動(dòng)推理 + 多模態(tài)指令生成”,在發(fā)票識(shí)別場(chǎng)景中實(shí)現(xiàn) 100% 正確率,推理耗時(shí)僅 22 秒。同時(shí),智譜宣布 GLM-4.5V 代碼與權(quán)重在魔搭社區(qū)和 Hugging Face 全量開(kāi)放。
DeepSeek
8 月 21 日,DeepSeek 通過(guò)官方渠道發(fā)布了 DeepSeek-V3.1 模型,V3.1 模型采用了混合推理架構(gòu),即 “思考與非思考” 模式。同時(shí),V3.1 將上下文窗口從原本的 64k 擴(kuò)展至 128k,使得模型能夠處理篇幅更長(zhǎng)、結(jié)構(gòu)更復(fù)雜的文檔與代碼。此外,DeepSeek-V3.1還在多語(yǔ)言處理能力上進(jìn)行了全面優(yōu)化,可處理超過(guò) 100 種語(yǔ)言。
DeepSeek 宣布從 2025 年 9 月 6 日起,調(diào)整開(kāi)放平臺(tái) API 接口調(diào)用價(jià)格。輸入價(jià)格方面,緩存命中時(shí)為 0.5 元 / 百萬(wàn) tokens,緩存未命中時(shí)漲至 4 元 / 百萬(wàn) tokens;輸出價(jià)格調(diào)整為 12 元 / 百萬(wàn) tokens。同時(shí),取消了夜間時(shí)段優(yōu)惠。
8月21日,快手發(fā)布 2025 年第二季度財(cái)報(bào),營(yíng)收同比增長(zhǎng) 13.1% 至 350 億元,經(jīng)調(diào)整凈利潤(rùn) 56 億元(同比 + 20.1%),毛利率與凈利潤(rùn)率均創(chuàng)歷史新高。AI 技術(shù)成為核心驅(qū)動(dòng)力,可靈 AI 單季度收入突破 2.5 億元,商業(yè)化規(guī)模快速增長(zhǎng),全年收入目標(biāo)較年初翻倍。推薦大模型 OneRec 全量上線(xiàn),通過(guò)端到端生成式架構(gòu)優(yōu)化用戶(hù)推薦效率,用戶(hù)總使用時(shí)長(zhǎng)同比增長(zhǎng) 7.5%,日均活躍用戶(hù)達(dá) 4.09 億。
愛(ài)詩(shī)科技
8 月 27 日,愛(ài)詩(shī)科技正式發(fā)布新一代自研大模型 PixVerse V5,并同步上線(xiàn)全新 Agent 創(chuàng)作助手。PixVerse V5 實(shí)現(xiàn)多項(xiàng)技術(shù)突破,視頻生成速度最快達(dá) 5 秒,1 分鐘可生成 1080P 高清視頻,通過(guò)擴(kuò)大模型參數(shù),顯著提升畫(huà)面真實(shí)感和動(dòng)作自然度,還支持文本、圖片、視頻多模態(tài)輸入生成。
新上線(xiàn)的 Agent 創(chuàng)作助手大幅降低使用門(mén)檻,用戶(hù)僅需上傳一張圖片即可自動(dòng)生成 5-30 秒視頻。發(fā)布首日,超百萬(wàn)用戶(hù)更新體驗(yàn)新版本。目前,PixVerse(拍我 AI)全球用戶(hù)規(guī)模已突破 1 億,用戶(hù)已累計(jì)生成超 8 億個(gè)視頻,廣泛應(yīng)用于廣告、電商、游戲及影視領(lǐng)域。
群核科技
8月22日,群核科技更新港股招股書(shū),2025 年上半年實(shí)現(xiàn)經(jīng)調(diào)整凈利潤(rùn) 1783 萬(wàn)元(首次扭虧為盈),AI 業(yè)務(wù)收入同比增長(zhǎng) 188%,其中電商 AI 解決方案營(yíng)收增速領(lǐng)跑行業(yè),3D AI 設(shè)計(jì)工具 “酷家樂(lè)電商棚拍” 帶動(dòng)跨境電商營(yíng)銷(xiāo)成本降低 90%。公司明確 “空間編輯工具 - 空間數(shù)據(jù) - 空間大模型” 三大核心布局,截至 6 月 30 日已沉淀4.41 億個(gè) 3D 模型及 5 億個(gè)結(jié)構(gòu)化 3D 場(chǎng)景,形成全球最大室內(nèi)空間數(shù)據(jù)庫(kù)。
8月25日,在首屆技術(shù)開(kāi)放日(TechDay)上,群核科技發(fā)布空間語(yǔ)言模型 SpatialLM 1.5與空間生成模型 SpatialGen,并宣布開(kāi)源計(jì)劃:
SpatialLM 1.5:支持通過(guò)自然語(yǔ)言生成結(jié)構(gòu)化 3D 場(chǎng)景(如 “去客廳餐桌拿藥” 指令可自動(dòng)規(guī)劃?rùn)C(jī)器人路徑),生成場(chǎng)景物理正確且富含語(yǔ)義信息,解決機(jī)器人訓(xùn)練數(shù)據(jù)短缺問(wèn)題。
SpatialGen:基于擴(kuò)散模型架構(gòu),可根據(jù)文字描述生成多視角圖像及 3D 高斯場(chǎng)景,支持渲染可漫游視頻,首次實(shí)現(xiàn) AI 生成內(nèi)容的時(shí)空一致性(如視角切換無(wú)物體偏移)。
開(kāi)源進(jìn)展:SpatialGen 當(dāng)天在 Hugging Face 開(kāi)放下載,SpatialLM 1.5 計(jì)劃以 “SpatialLM-Chat” 形式開(kāi)源,吸引超 5000 名開(kāi)發(fā)者參與生態(tài)共建。
值得買(mǎi)科技
8月27日,值得買(mǎi)科技CTO王云峰在舉行AI進(jìn)展分享會(huì)上對(duì)外分享了“海納”MCP Server最新進(jìn)展及對(duì)AI行業(yè)的深入洞察,同時(shí)特別邀請(qǐng)中國(guó)人民大學(xué)高瓴人工智能學(xué)院長(zhǎng)聘副教授宋睿華作為對(duì)談嘉賓,就“AI多模態(tài)領(lǐng)域發(fā)展”話(huà)題進(jìn)行探討。
現(xiàn)場(chǎng),王云峰分享了“海納”MCP Server8月最新上線(xiàn)的接口——知識(shí)圖譜,該接口通過(guò)將碎片化信息進(jìn)行結(jié)構(gòu)化、系統(tǒng)化整合,將海量的消費(fèi)事實(shí)和概念以圖譜的方式連接起來(lái),從而支持大模型進(jìn)行深度“理解”與精準(zhǔn)“推理”,為用戶(hù)提供全域視角的真實(shí)消費(fèi)評(píng)價(jià)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.