網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

硅基AI日報：可靈 AI 發(fā)布 3.0 版本；谷歌的Gemini應用月活躍用戶已超過7.5億

2026-02-05 19:17:37　來源: 硅基觀察Pro

北京舉報

分享至

昨天，可靈AI 官宣正式邁入「3.0 時代」，圍繞視頻與圖片兩大核心能力進行全面升級，重點提升敘事能力、可控性、一致性與畫質表現(xiàn)，并首次引入多模態(tài)一體化的原生創(chuàng)作流程。

根據(jù)谷歌發(fā)布的2025年第四季度財報，其人工智能聊天機器人Gemini的月活躍用戶（MAU）已突破7.5億。這一數(shù)字表明Gemini迅速被消費者接受，并已迅速成為人工智能領域的重要參與者。

過去一天，國內外AI行業(yè)還有更多熱點可以關注，硅基君帶你一起看看。

大模型

1）OpenAI「備戰(zhàn)負責人」官宣上任，加速布局前沿模型風險防護

昨天，OpenAI CEO 山姆 · 奧特曼（Sam Altman）宣布 Dylan Scand 加入公司，出任全新的「備戰(zhàn)負責人」（Head of Preparedness）一職，負責前沿模型的高風險場景評估與緩解工作。

奧特曼稱，Scandrett 是該崗位「迄今為止最合適的人選」，并強調他將主導 OpenAI 針對潛在高影響風險的準備與防護工作，包括對前沿 AI 系統(tǒng)可能帶來的嚴重威脅進行評估、建模與應對。

2）面壁智能發(fā)布 MiniCPM-o 4.5

昨天，面壁智能正式開源新一代全模態(tài)旗艦模型MiniCPM-o 4.5。據(jù)介紹，該模型以 9B 參數(shù)體量實現(xiàn)全模態(tài)、全雙工、端到端的交互能力，定位為行業(yè)首個支持「即時自由對話」的大模型，旨在讓 AI 從傳統(tǒng)的「對講機式」回合交互邁向類人連續(xù)感知與主動表達。MiniCPM-o 4.5 的核心升級集中在三方面：

全模態(tài)全時感知能力，模型在輸出內容的同時仍可持續(xù)「看」與「聽」，避免信息丟失；

原生全雙工交互機制，模型無需依賴VAD 等外部工具即可根據(jù)環(huán)境變化自主判斷發(fā)言時機，實現(xiàn)主動提醒、主動評論等能力；

語音生成質量全面提升，音色、情緒與擬人度均更自然，長語音合成穩(wěn)定性顯著增強，同時支持基于數(shù)秒樣本的聲音克隆。

MiniCPM-o 4.5 已在 GitHub、Hugging Face 等平臺開源，并提供 int4 與 GGUF 在內的多種量化版本，支持 llama.cpp、Ollama、vLLM、SGLang 等推理框架。

3）可靈 AI 發(fā)布 3.0 版本：視頻與圖片能力全面升級

可靈AI 表示，本次更新覆蓋從生成到編輯的完整鏈路，旨在讓創(chuàng)作者以更低門檻獲得電影級敘事體驗。更新內容包括視頻 3.0、視頻 3.0 Omni、圖片 3.0、圖片 3.0 Omni 四大模塊。

AI應用

1）谷歌的Gemini應用月活躍用戶已超過7.5億

上個季度，谷歌公布Gemini的月活躍用戶數(shù)達到6.5億，表明其在短時間內實現(xiàn)了顯著增長。相比之下，Meta AI的月活躍用戶數(shù)接近5億。然而，盡管Gemini正在迅速發(fā)展，但仍落后于其最大的競爭對手ChatGPT，后者預計到2025年底的月活躍用戶數(shù)將達到約8.1億。

投融資情報

1）Positron 完成 2.3 億美元融資

據(jù)TechCrunch 報道，半導體創(chuàng)業(yè)公司 Positron 近日完成 2.3 億美元 B 輪融資。今年的這筆融資由卡塔爾投資局（QIA）參與，相關人士稱資金將用于加速其高速內存芯片的部署。

PS：如果你對AI大模型領域有獨特的看法，歡迎掃碼加入我們的大模型交流群。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.