![]()
日前,據海外博主「Chetaslua」消息,智譜下一代模型(或為 GLM-5)將采用 DeepSeek 同款架構。
據Chetaslua 分析,GLM-5 將采用了 DeepSeek-V3/V3.2 架構,其中包含稀疏注意力機制(DSA)和多 Token 預測(MTP);模型總參數量達 745B,將會是上一代 GLM-4.7 的 2 倍。
據一位知情人士向TechCrunch 透露,人工智能視頻生成初創公司Runway已完成 3.15 億美元的 E 輪融資,估值幾乎翻了一番,達到 53 億美元。
過去一天,國內外AI行業還有更多熱點可以關注,硅基君帶你一起看看。
大模型
1)智譜新模型架構曝光:DeepSeek 同款稀疏注意力
日前,據海外博主「Chetaslua」消息,智譜下一代模型(或為 GLM-5)將采用 DeepSeek 同款架構。
據Chetaslua 分析,GLM-5 將采用了 DeepSeek-V3/V3.2 架構,其中包含稀疏注意力機制(DSA)和多 Token 預測(MTP);模型總參數量達 745B,將會是上一代 GLM-4.7 的 2 倍。
值得一提的是,近期有一個名為「Pony Alpha」的神秘模型上線全球模型服務平臺 OpenRouter,并且引發較高熱度。其中不乏有人分析指出,該模型或為智譜新的模型。
而據第一財經消息,智譜目前有相關保密項目在推進中,該神秘模型,是智譜即將發布新一代模型GLM-5。
2)字節上架圖像生成新模型 Seedream 5
近期,字節跳動旗下AI 視頻生成大模型 Seedance 2.0 走紅。而在昨日,字節又上線了最新生圖模型「Seedream 5.0」。據悉,Seedream 5.0 擁有聯網實時檢索、編輯精準可控、智能邏輯推理 三大亮點。
3)騰訊混元推出 0.3B 端側模型
2 月 10 日,騰訊混元推出面向消費級硬件場景的「極小」模型 HY-1.8B-2Bit。該模型基于 1.8B 參數的小尺寸模型,通過 2Bit 量化技術,等效參數量約為 0.3B,實際存儲占用僅約 600MB,比常用的一些手機應用還小,實現了端側部署的新突破。
4)千問上線新生圖模型
昨天,阿里千問大模型推出新一代圖像生成基礎模型Qwen-Image-2.0。性能方面,在 AI Arena 的測試中,Qwen-Image-2.0 作為一個生圖編輯二合一的模型,同一模型在文生圖和圖生圖基準中獲得優越性能。
AI應用
1)ChatGPT 廣告上線
據CNBC 報道,OpenAI 計劃在昨日開啟 ChatGPT 的廣告測試。
報道援引知情人士消息,OpenAI 預計廣告收入在長期內的表現,不會超過其收入的一半。
根據OpenAI 此前的說法,ChatGPT 將會在免費以及 Go 訂閱用戶中打廣告,且廣告不會影響 ChatGPT 的回答,并會確保用戶的對話對廣告商保密,但還指出廣告仍將「根據對您最有幫助的內容進行優化」。
投融資情報
1)AI視頻初創公司Runway融資3.15億美元,估值達53億美元
據一位知情人士向TechCrunch 透露,人工智能視頻生成初創公司Runway已完成 3.15 億美元的 E 輪融資,估值幾乎翻了一番,達到 53 億美元。
根據Runway公司在其博客文章中宣布的融資消息,這筆新資金將使該公司能夠“預訓練下一代世界模型,并將其應用于新產品和行業”。世界模型是一種人工智能系統,它能夠構建環境的內部表征,從而預測未來事件。許多頂尖專家認為,世界模型對于突破大型語言模型的局限至關重要。
2)Hauler Hero 的人工智能廢物管理軟件籌集了 1600 萬美元
據TechCrunch 報道,總部位于紐約的初創公司 Hauler Hero 在由 Frontier Growth 領投的 A 輪融資中籌集了 1600 萬美元,K5 Global 和 Somersault Ventures 等也參與了投資。迄今為止,Hauler Hero 已累計獲得超過 2700 萬美元的風險投資。
Hauler Hero 為廢物管理公司開發了一款功能齊全的一體化軟件平臺,涵蓋客戶關系管理、計費和路線規劃等多種功能。現在,和許多其他軟件公司一樣,Hauler Hero 也計劃向其客戶提供人工智能代理服務。
PS:如果你對AI大模型領域有獨特的看法,歡迎掃碼加入我們的大模型交流群。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.