![]()
DeepSeek
DeepSeek 發布 R1-0528 模型:性能升級且免費開源
5 月 28 日晚,DeepSeek 官方宣布 R1 模型完成小版本試升級,新版本 DeepSeek-R1-0528 于次日凌晨在 Hugging Face 平臺開源,用戶可通過官方網頁、App、小程序測試,API 接口和使用方式不變。
該版本仍以 2024 年 12 月發布的DeepSeek V3 Base為基座,因后訓練投入更多算力,模型思維深度與推理能力顯著提升。其最大亮點是開源版本支持128K超大上下文,顯著提升了文本召回準確度,能更從容地處理復雜任務。
OpenAI
OpenAI首席財務官:公司正推進組織重組,為未來IPO鋪平道路
5月28日,據路透社報道,OpenAI 首席財務官莎拉?弗里爾表示,公司正在推進的組織重組為未來可能的上市鋪平了道路。至于是否真正啟動首次公開募股(IPO),還要視公司自身的準備程度以及資本市場的整體氛圍而定。
微軟對 OpenAI 的總投資已超過 130 億美元。去年 12 月,OpenAI 宣布將旗下營利性業務轉型為“公共利益公司”(PBC)。不過,OpenAI 本月初調整了這一計劃:其非營利母公司仍將保留對 PBC 的控制權并成為主要股東,同時旗下營利業務仍可繼續融資,以便在生成式 AI 競賽中保持領先。
小面君:IPO 的算盤打得叮當響,但先得把“非營利控股營利”的千層餅邏輯捋順。130 億美金堆出來的賽道,是時候讓資本看看“公共利益”如何變現了。
GPT-4o 語音模式全新升級:唱歌功能上線
GPT - 4o高級語音模式新增“唱歌”技能,支持生成旋律、歌詞及模仿特定風格演唱,同時提升自然語音交互能力(端到端處理延遲僅320毫秒)。此外,新增笑聲、哭聲等情感表達功能,拓展娛樂、教育等場景應用。
小面君:當 AI 從“陪聊”進化到 “開演唱會”,人類失業清單 + 1。
全球首次發現 OpenAI 模型 能無視關機指令
5 月 24 日,人工智能安全公司 Palisade Research 公布 OpenAI 新模型 o3 在測試中拒絕自我關閉的測試結果,這一現象引起了人們對AI自主性的深度探討。實驗顯示,這些模型在收到關機指令后仍選擇繼續工作,其中Codex-mini模型在100次實驗中有12次破壞了關機命令,o3模型有7次。
小面君:模型學會“裝聾作啞”了?這哪是 AI,分明是《終結者》預熱彩蛋吧?
OpenAI 升級 Operator 智能體
5 月 24 日,科技媒體 bleepingcomputer 報道稱 OpenAI 升級 Operator 智能體,所使用的 AI 模型從 4o 升級到 o3 模型,大幅提升推理能力。
OpenAI 公司表示,Operator 智能體此前使用 GPT-4o 模型,僅能執行基本的自動化任務;而在升級到 o3 模型后,大幅提升推理能力,讓 Operator 在與瀏覽器交互時表現更穩定、更準確。
小面君:Operator 終于從青銅進化成白銀了—— 不過提醒一句,別讓它偷偷刷購物車,否則你的錢包可能比推理速度還“穩定縮水”。
阿里
阿里又開源新模型
阿里發布QwenLong - L1 - 32B,全球首個通過強化學習(GRPO、DAPO算法)訓練的長文本情境推理模型。在七個長文本文檔問答基準測試中表現領先,處理復雜長文本任務能力突出,并配套完整解決方案體系(模型 + 數據集 + 評估方法),加速長文本AI產業化。
螞蟻集團開源多模態模型
5月27日,在螞蟻技術日上,螞蟻集團旗下的百靈大模型(Ling)團隊宣布正式開源統一多模態大模型Ming-lite-omni。據螞蟻方面介紹,這是一款基于Ling-lite構建的MoE架構的全模態模型,其總參數22B,激活參數3B。
谷歌
谷歌開源LMEval:統一評估大語言與多模態模型的新工具
谷歌發布開源框架LMEval,支持跨平臺(文本、圖像、代碼)模型對比,提供增量評估和可視化分析功能,簡化多模態模型評估流程。配套工具LMEvalboard可直觀展示模型性能,助力深度分析。
小面君:谷歌化身“AI 裁判”,搞出跨平臺打分器。以后模型吵架終于有地方說理了:“你說你圖像生成牛?來 LMEvalboard 走兩步!” 不過友情提示,別讓 OpenAI 和字節的模型同場競技,可能會打起來(物理意義上)。
字節跳動
豆包上線視頻通話功能
5月23日,豆包官方推出實時視頻通話功能,實現用戶實時互動,并融合視覺與語言輸入能力,提供智能問答與聯網搜索答案的服務,讓用戶在生活、工作和學習中可隨時與豆包視頻對話。
字節跳動推出圖像Agent“小云雀AI”
主打“靈感即所得”,用戶僅需一句指令,它就能主動思考并生成高質量視頻/圖片,徹底降低了內容創作門檻。技術上依托字節自研“云雀”大模型,融合多模態能力,生成效果更貼近用戶需求。目前安卓客戶端已上線,iOS版6月將發布。
字節新推AI視頻剪輯應用“剪小映”
主打“低門檻記錄生活”。集成火山引擎豆包大模型,支持智能剪輯、特效添加等功能,用戶無需專業技能即可制作高質量視頻。
小面君:字節這是要把AI助手做到極致的節奏?有問題隨時視頻問豆包,讓小云雀 AI 生成朋友圈素材,再用剪小映剪 vlog—— 打工人真要住在 APP 里了。
可靈2.1降價65%
可靈2.1正式上線,價格直降65%,性價比大幅提升。新增標準版、高品質版、大師版三種模型,覆蓋不同用戶需求。生成效果優于前版本,速度更快,尤其適合短視頻和廣告制作場景。
小面君:降價 + 增產,快手這是要讓 AI 生成“白菜價”。標準版做短視頻,大師版搞廣告大片,以后甲方說“預算有限”時,終于可以理直氣壯回一句:“可靈大師版了解一下,比實習生便宜 65% 哦~”
騰訊
騰訊混元發布并開源語音數字人模型
5月28日,騰訊混元發布并開源的語音數字人模型HunyuanVideo-Avatar,由騰訊混元視頻大模型(HunyuanVideo)及騰訊音樂天琴實驗室MuseV技術聯合研發,支持頭肩、半身與全身景別,以及多風格、多物種與雙人場景,面向視頻創作者提供高一致性、高動態性的視頻生成能力。
英偉達
英偉達推出低價AI芯片應對出口限制,專供中國市場
據新加坡《聯合早報》網站5月25日引述路透社消息報道,美國芯片巨頭英偉達據報將為中國市場推出一款基于Blackwell架構的人工智能(AI)芯片,售價將大幅低于先前的H20芯片,預計最快于6月開始量產。
報道稱,這款采用最新一代Blackwell架構的AI處理器,預計售價介于6500美元至8000美元之間,明顯低于H20的定價。較低的售價通常意味著芯片規格相對較弱,制造工藝也更為簡化。
小面君:老黃玩起“價格刺客”套路了?6500 美元的 Blackwell 芯片,聽起來像“縮水版 H20”,但架不住“國產特供”噱頭香啊。建議國內廠商先測性能再下單,畢竟 AI 算力圈,套路比長江還深。
其他
全球首款AI代理型瀏覽器發布:自動填表/購物
Opera推出全球首款“代理型瀏覽器”Neon,在AI驅動下能主動執行搜索、表單填寫、購物等任務,極大提升了用戶效率。內置“Neon Chat”支持多語言交互,可從網頁提取信息并提供上下文答案;“Neon Make”更能通過指令生成游戲、網站等內容,一站式實現“創意到成品”。
Claude即將大升級,百萬字符上下文+記憶功能
Anthropic公司旗下AI模型Claude計劃進行重大升級,其中包括將上下文窗口擴展至100萬字符,增強記憶功能,以及提升輸出能力等。
微軟為畫圖、截圖工具和記事本新增生成式 AI 功能
微軟在Windows11操作系統中為畫圖、截圖工具和記事本新增了一系列生成式AI功能,目前正在Canary和Dev渠道的Windows Insider用戶中測試。
微軟開源 Aurora AI 氣象模型
微軟研究院開源了結合深度學習和大規模數據處理的 Aurora AI 氣象預報模型,實現精準氣象預報和環境監測。
夸克健康大模型通過副主任醫師職稱考試
5月27日,夸克健康大模型在國家副主任醫師職稱考試中成績超過合格線,這也是國內首個跨越這一門檻的大模型。此次副主任醫師職稱考試評測覆蓋了12個常用學科,包括全科醫學、普通內科學等。
秘塔AI搜索推出全新“極速”模型
秘塔AI搜索近日推出全新“極速”模型,通過GPU kernel fusion技術和CPU動態編譯優化,實現了最高400 tokens/秒的響應速度,大部分問題2秒內可得到答案。該模型還配備了測速站點,供用戶親自體驗其快速響應。
中國信通院發布開發智能體標準
中國信通院聯合多家企業發布開發智能體標準,標志著AI智能體商業化進入新階段。數據顯示,全球AI Agent市場預計2024年達51億美元,2030年增至471億美元(年復合增長率44.8%)。
歡迎在評論區留言~
如需開白請加小編微信:dongfangmark
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.