![]()
昨天,可靈AI 官宣正式邁入「3.0 時代」,圍繞視頻與圖片兩大核心能力進行全面升級,重點提升敘事能力、可控性、一致性與畫質表現(xiàn),并首次引入多模態(tài)一體化的原生創(chuàng)作流程。
根據(jù)谷歌發(fā)布的2025年第四季度財報,其人工智能聊天機器人Gemini的月活躍用戶(MAU)已突破7.5億。這一數(shù)字表明Gemini迅速被消費者接受,并已迅速成為人工智能領域的重要參與者。
過去一天,國內外AI行業(yè)還有更多熱點可以關注,硅基君帶你一起看看。
大模型
1)OpenAI「備戰(zhàn)負責人」官宣上任,加速布局前沿模型風險防護
昨天,OpenAI CEO 山姆 · 奧特曼(Sam Altman)宣布 Dylan Scand 加入公司,出任全新的「備戰(zhàn)負責人」(Head of Preparedness)一職,負責前沿模型的高風險場景評估與緩解工作。
奧特曼稱,Scandrett 是該崗位「迄今為止最合適的人選」,并強調他將主導 OpenAI 針對潛在高影響風險的準備與防護工作,包括對前沿 AI 系統(tǒng)可能帶來的嚴重威脅進行評估、建模與應對。
2)面壁智能發(fā)布 MiniCPM-o 4.5
昨天,面壁智能正式開源新一代全模態(tài)旗艦模型MiniCPM-o 4.5。據(jù)介紹,該模型以 9B 參數(shù)體量實現(xiàn)全模態(tài)、全雙工、端到端的交互能力,定位為行業(yè)首個支持「即時自由對話」的大模型,旨在讓 AI 從傳統(tǒng)的「對講機式」回合交互邁向類人連續(xù)感知與主動表達。MiniCPM-o 4.5 的核心升級集中在三方面:
全模態(tài)全時感知能力,模型在輸出內容的同時仍可持續(xù)「看」與「聽」,避免信息丟失;
原生全雙工交互機制,模型無需依賴VAD 等外部工具即可根據(jù)環(huán)境變化自主判斷發(fā)言時機,實現(xiàn)主動提醒、主動評論等能力;
語音生成質量全面提升,音色、情緒與擬人度均更自然,長語音合成穩(wěn)定性顯著增強,同時支持基于數(shù)秒樣本的聲音克隆。
MiniCPM-o 4.5 已在 GitHub、Hugging Face 等平臺開源,并提供 int4 與 GGUF 在內的多種量化版本,支持 llama.cpp、Ollama、vLLM、SGLang 等推理框架。
3)可靈 AI 發(fā)布 3.0 版本:視頻與圖片能力全面升級
昨天,可靈AI 官宣正式邁入「3.0 時代」,圍繞視頻與圖片兩大核心能力進行全面升級,重點提升敘事能力、可控性、一致性與畫質表現(xiàn),并首次引入多模態(tài)一體化的原生創(chuàng)作流程。
可靈AI 表示,本次更新覆蓋從生成到編輯的完整鏈路,旨在讓創(chuàng)作者以更低門檻獲得電影級敘事體驗。更新內容包括視頻 3.0、視頻 3.0 Omni、圖片 3.0、圖片 3.0 Omni 四大模塊。
AI應用
1)谷歌的Gemini應用月活躍用戶已超過7.5億
根據(jù)谷歌發(fā)布的2025年第四季度財報,其人工智能聊天機器人Gemini的月活躍用戶(MAU)已突破7.5億。這一數(shù)字表明Gemini迅速被消費者接受,并已迅速成為人工智能領域的重要參與者。
上個季度,谷歌公布Gemini的月活躍用戶數(shù)達到6.5億,表明其在短時間內實現(xiàn)了顯著增長。相比之下,Meta AI的月活躍用戶數(shù)接近5億。然而,盡管Gemini正在迅速發(fā)展,但仍落后于其最大的競爭對手ChatGPT,后者預計到2025年底的月活躍用戶數(shù)將達到約8.1億。
投融資情報
1)Positron 完成 2.3 億美元融資
據(jù)TechCrunch 報道,半導體創(chuàng)業(yè)公司 Positron 近日完成 2.3 億美元 B 輪融資。今年的這筆融資由卡塔爾投資局(QIA)參與,相關人士稱資金將用于加速其高速內存芯片的部署。
PS:如果你對AI大模型領域有獨特的看法,歡迎掃碼加入我們的大模型交流群。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.