網易首頁 > 網易號 > 正文申請入駐

DeepSeek R1小版本升級，OpenAI重組鋪路IPO｜直面AI周報

2025-05-30 16:09:34　來源: 直面派

北京舉報

分享至

DeepSeek

DeepSeek 發布 R1-0528 模型：性能升級且免費開源

5 月 28 日晚，DeepSeek 官方宣布 R1 模型完成小版本試升級，新版本 DeepSeek-R1-0528 于次日凌晨在 Hugging Face 平臺開源，用戶可通過官方網頁、App、小程序測試，API 接口和使用方式不變。

該版本仍以 2024 年 12 月發布的DeepSeek V3 Base為基座，因后訓練投入更多算力，模型思維深度與推理能力顯著提升。其最大亮點是開源版本支持128K超大上下文，顯著提升了文本召回準確度，能更從容地處理復雜任務。

OpenAI

OpenAI首席財務官：公司正推進組織重組，為未來IPO鋪平道路

5月28日，據路透社報道，OpenAI 首席財務官莎拉?弗里爾表示，公司正在推進的組織重組為未來可能的上市鋪平了道路。至于是否真正啟動首次公開募股（IPO），還要視公司自身的準備程度以及資本市場的整體氛圍而定。

微軟對 OpenAI 的總投資已超過 130 億美元。去年 12 月，OpenAI 宣布將旗下營利性業務轉型為“公共利益公司”（PBC）。不過，OpenAI 本月初調整了這一計劃：其非營利母公司仍將保留對 PBC 的控制權并成為主要股東，同時旗下營利業務仍可繼續融資，以便在生成式 AI 競賽中保持領先。

小面君：IPO 的算盤打得叮當響，但先得把“非營利控股營利”的千層餅邏輯捋順。130 億美金堆出來的賽道，是時候讓資本看看“公共利益”如何變現了。

GPT-4o 語音模式全新升級：唱歌功能上線

GPT - 4o高級語音模式新增“唱歌”技能，支持生成旋律、歌詞及模仿特定風格演唱，同時提升自然語音交互能力（端到端處理延遲僅320毫秒）。此外，新增笑聲、哭聲等情感表達功能，拓展娛樂、教育等場景應用。

小面君：當 AI 從“陪聊”進化到 “開演唱會”，人類失業清單 + 1。

全球首次發現 OpenAI 模型能無視關機指令

5 月 24 日，人工智能安全公司 Palisade Research 公布 OpenAI 新模型 o3 在測試中拒絕自我關閉的測試結果，這一現象引起了人們對AI自主性的深度探討。實驗顯示，這些模型在收到關機指令后仍選擇繼續工作，其中Codex-mini模型在100次實驗中有12次破壞了關機命令，o3模型有7次。

小面君：模型學會“裝聾作啞”了？這哪是 AI，分明是《終結者》預熱彩蛋吧？

OpenAI 升級 Operator 智能體

5 月 24 日，科技媒體 bleepingcomputer 報道稱 OpenAI 升級 Operator 智能體，所使用的 AI 模型從 4o 升級到 o3 模型，大幅提升推理能力。

OpenAI 公司表示，Operator 智能體此前使用 GPT-4o 模型，僅能執行基本的自動化任務；而在升級到 o3 模型后，大幅提升推理能力，讓 Operator 在與瀏覽器交互時表現更穩定、更準確。

小面君：Operator 終于從青銅進化成白銀了—— 不過提醒一句，別讓它偷偷刷購物車，否則你的錢包可能比推理速度還“穩定縮水”。

阿里

阿里又開源新模型

阿里發布QwenLong - L1 - 32B，全球首個通過強化學習（GRPO、DAPO算法）訓練的長文本情境推理模型。在七個長文本文檔問答基準測試中表現領先，處理復雜長文本任務能力突出，并配套完整解決方案體系（模型 + 數據集 + 評估方法），加速長文本AI產業化。

螞蟻集團開源多模態模型

5月27日，在螞蟻技術日上，螞蟻集團旗下的百靈大模型（Ling）團隊宣布正式開源統一多模態大模型Ming-lite-omni。據螞蟻方面介紹，這是一款基于Ling-lite構建的MoE架構的全模態模型，其總參數22B，激活參數3B。

谷歌

谷歌開源LMEval：統一評估大語言與多模態模型的新工具

谷歌發布開源框架LMEval，支持跨平臺（文本、圖像、代碼）模型對比，提供增量評估和可視化分析功能，簡化多模態模型評估流程。配套工具LMEvalboard可直觀展示模型性能，助力深度分析。

小面君：谷歌化身“AI 裁判”，搞出跨平臺打分器。以后模型吵架終于有地方說理了：“你說你圖像生成牛？來 LMEvalboard 走兩步！” 不過友情提示，別讓 OpenAI 和字節的模型同場競技，可能會打起來（物理意義上）。

字節跳動

豆包上線視頻通話功能

5月23日，豆包官方推出實時視頻通話功能，實現用戶實時互動，并融合視覺與語言輸入能力，提供智能問答與聯網搜索答案的服務，讓用戶在生活、工作和學習中可隨時與豆包視頻對話。

字節跳動推出圖像Agent“小云雀AI”

主打“靈感即所得”，用戶僅需一句指令，它就能主動思考并生成高質量視頻/圖片，徹底降低了內容創作門檻。技術上依托字節自研“云雀”大模型，融合多模態能力，生成效果更貼近用戶需求。目前安卓客戶端已上線，iOS版6月將發布。

字節新推AI視頻剪輯應用“剪小映”

主打“低門檻記錄生活”。集成火山引擎豆包大模型，支持智能剪輯、特效添加等功能，用戶無需專業技能即可制作高質量視頻。

小面君：字節這是要把AI助手做到極致的節奏？有問題隨時視頻問豆包，讓小云雀 AI 生成朋友圈素材，再用剪小映剪 vlog—— 打工人真要住在 APP 里了。

可靈2.1降價65%

可靈2.1正式上線，價格直降65%，性價比大幅提升。新增標準版、高品質版、大師版三種模型，覆蓋不同用戶需求。生成效果優于前版本，速度更快，尤其適合短視頻和廣告制作場景。

小面君：降價 + 增產，快手這是要讓 AI 生成“白菜價”。標準版做短視頻，大師版搞廣告大片，以后甲方說“預算有限”時，終于可以理直氣壯回一句：“可靈大師版了解一下，比實習生便宜 65% 哦～”

騰訊

騰訊混元發布并開源語音數字人模型

5月28日，騰訊混元發布并開源的語音數字人模型HunyuanVideo-Avatar，由騰訊混元視頻大模型（HunyuanVideo）及騰訊音樂天琴實驗室MuseV技術聯合研發，支持頭肩、半身與全身景別，以及多風格、多物種與雙人場景，面向視頻創作者提供高一致性、高動態性的視頻生成能力。

英偉達

英偉達推出低價AI芯片應對出口限制，專供中國市場

據新加坡《聯合早報》網站5月25日引述路透社消息報道，美國芯片巨頭英偉達據報將為中國市場推出一款基于Blackwell架構的人工智能（AI）芯片，售價將大幅低于先前的H20芯片，預計最快于6月開始量產。

報道稱，這款采用最新一代Blackwell架構的AI處理器，預計售價介于6500美元至8000美元之間，明顯低于H20的定價。較低的售價通常意味著芯片規格相對較弱，制造工藝也更為簡化。

小面君：老黃玩起“價格刺客”套路了？6500 美元的 Blackwell 芯片，聽起來像“縮水版 H20”，但架不住“國產特供”噱頭香啊。建議國內廠商先測性能再下單，畢竟 AI 算力圈，套路比長江還深。

其他

全球首款AI代理型瀏覽器發布：自動填表/購物

Opera推出全球首款“代理型瀏覽器”Neon，在AI驅動下能主動執行搜索、表單填寫、購物等任務，極大提升了用戶效率。內置“Neon Chat”支持多語言交互，可從網頁提取信息并提供上下文答案；“Neon Make”更能通過指令生成游戲、網站等內容，一站式實現“創意到成品”。

Claude即將大升級，百萬字符上下文+記憶功能

Anthropic公司旗下AI模型Claude計劃進行重大升級，其中包括將上下文窗口擴展至100萬字符，增強記憶功能，以及提升輸出能力等。

微軟為畫圖、截圖工具和記事本新增生成式 AI 功能

微軟在Windows11操作系統中為畫圖、截圖工具和記事本新增了一系列生成式AI功能，目前正在Canary和Dev渠道的Windows Insider用戶中測試。

微軟開源 Aurora AI 氣象模型

微軟研究院開源了結合深度學習和大規模數據處理的 Aurora AI 氣象預報模型，實現精準氣象預報和環境監測。

夸克健康大模型通過副主任醫師職稱考試

5月27日，夸克健康大模型在國家副主任醫師職稱考試中成績超過合格線，這也是國內首個跨越這一門檻的大模型。此次副主任醫師職稱考試評測覆蓋了12個常用學科，包括全科醫學、普通內科學等。

秘塔AI搜索推出全新“極速”模型

秘塔AI搜索近日推出全新“極速”模型，通過GPU kernel fusion技術和CPU動態編譯優化，實現了最高400 tokens/秒的響應速度，大部分問題2秒內可得到答案。該模型還配備了測速站點，供用戶親自體驗其快速響應。

中國信通院發布開發智能體標準

中國信通院聯合多家企業發布開發智能體標準，標志著AI智能體商業化進入新階段。數據顯示，全球AI Agent市場預計2024年達51億美元，2030年增至471億美元（年復合增長率44.8%）。

歡迎在評論區留言~
如需開白請加小編微信：dongfangmark

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.