
—— ·要點速覽· ——
1、蘋果發布 Pico-Banana-400K 數據集:含 40 萬張圖像,幫助訓練 AI 圖像編輯模型
2、探跡科技推出針對AI數字員工打造的大模型智能體平臺
3、酷開旗下創視科技發布AI物業服務平臺
4、打造 AI 編程界“瑞士軍刀”:GitHub 推 Agent HQ,目標統一管理所有智能體
5、英偉達最新宣布!量子計算板塊大爆發
更聚焦的科技行業交流群,捕捉每一條科技動態,誠摯邀請創業者、發燒友加入我們。微信掃碼進群:
進群后,你有機會得到:
最新、最熱的科技資訊;
最精準的行業資源對接;
論壇、沙龍、企業游學門票。
![]()
1、智慧教育服務提供商「溫納斯」完成1000萬元天使輪融資。
溫納斯是一家智慧教育服務提供商,聚焦教育信息化,依托自研的計算機視覺AI技術和圖像識別算法,打造理化生實驗教學云平臺與AI智能測評方案,推動實驗教學全流程的可視化與集成化管理。通過自主研發的智能終端設備,公司持續深化“互聯網+教育”場景應用,助力校園智能化轉型。
2、營銷Agent視頻生成工具開發商「極致上下文」完成數百萬美元股權融資,投資方為HT investment,百度風投。
極致上下文是一家營銷Agent視頻生成工具開發商,前端通過多模態交互理解企業品牌調性和需求,后端整合各種AI模型能力,直接交付成品視頻。
3、非侵入式腦機接口技術解決方案供應商「BrainCo強腦科技」完成2000萬美元股權融資,投資方為三七互娛。
強腦科技是一家非侵入式腦機接口技術解決方案供應商,是首家入選哈佛大學創新實驗室(HarvardInnovation Lab)的中國團隊,致力于腦機接口技術底層技術的突破,通過在大腦和外部設備之間建立信號傳送通路實現兩者信息交換的方式為殘疾人康復、孤獨癥等腦疾病提供了解決方案。產品線主要圍繞醫療康復、健康管理及教育科技領域展開:智能仿生假肢、開星果社交溝通訓練系統、神經電子消費品等。
4、智能AMR系統提供商「松智達機器人」完成500萬元天使輪融資,投資方為中楝投資。
松智達機器人是一家智能AMR系統提供商,專注于智能制造與柔性物流系統技術,公司以“復合機器人”技術為核心,融合激光SLAM、視覺識別、物聯網與邊緣計算等前沿技術,致力于為制造業客戶提供從移動底盤、機械臂協同作業到整場調度的全流程自動化解決方案。產品已廣泛應用于汽車、電子、鋰電池、半導體、醫藥、光伏等多個行業。
5、毫米波雷達芯片研發商「矽杰微電子」完成C1輪融資,由中信建投資本領投,啟泰資本、元科創投跟投。
矽杰微電子是一家毫米波雷達芯片研發商,公司孵化于上海微技術工業研究院,專注于毫米波雷達芯片開發,深耕毫米波雷達傳感器在消費領域、工業領域、以及汽車領域中應用落地。矽杰微電子已經完成24/60/77GHz三個毫米波雷達芯片產品線的開發,面向六個細分領域的應用場景,實現了數百萬顆的產品交付,客戶包括世界500強以及細分行業全球前10的企業。
![]()
1、蘋果發布 Pico-Banana-400K 數據集:含 40 萬張圖像,幫助訓練 AI 圖像編輯模型
10 月 29 日消息,蘋果公司發布了 Pico-Banana-400K,這是一個包含 40 萬張圖像的研究數據集,有趣的是,該數據集是利用谷歌的 Gemini-2.5 模型構建的。
據了解,蘋果的這個研究成果名為《Pico-Banana-400K:面向文本引導圖像編輯的大規模數據集》(Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing),該公司還發布了由此生成的包含 40 萬張圖像的完整數據集。該數據集采用非商業性研究許可(non-commercial research license)發布,意味著研究人員和學術機構可自由使用,但不得用于商業用途。
數月前,谷歌推出了 Gemini 2.5-Flash-Image 模型,也被稱為 Nanon-Banana,該模型在圖像編輯任務中表現出色,被廣泛認為是當前最先進的圖像編輯模型之一。盡管近年來多個模型在圖像生成與編輯方面取得顯著進展,蘋果的研究團隊指出:“盡管技術不斷進步,開放研究仍受限于缺乏大規模、高質量且可完全共享的圖像編輯數據集。現有數據集往往依賴專有模型生成的合成數據,或僅包含有限的人工篩選子集。此外,這些數據集普遍存在領域偏移(domain shifts)、編輯類型分布不均以及質量控制不一致等問題,嚴重阻礙了魯棒圖像編輯模型的發展。”
為解決這一瓶頸,蘋果團隊著手構建一個更全面、更具代表性的圖像編輯數據集。
Pico-Banana-400K 的構建過程
研究團隊首先從 OpenImages 數據集中選取了大量真實照片,確保涵蓋人物、物體及含文字場景等多樣化內容。
![]()
然后,團隊設計了 35 種不同類型的圖像修改指令,并將其歸入八大類別,包括:
像素與光度調整(Pixel & Photometric):如添加膠片顆粒或復古濾鏡;
以人為中心的編輯(Human-Centric):例如將人物轉換為 Funko-Pop 風格的玩具形象;
場景構成與多主體編輯(Scene Composition & Multi-Subject):如改變天氣條件(晴天 / 雨天 / 雪天);
對象級語義修改(Object-Level Semantic):如移動物體位置或調整空間關系;
圖像縮放(Scale):如放大畫面(Zoom in)等。
接下來,研究人員會將一張原始圖像連同一條編輯指令輸入至 Nanon-Banana 模型進行圖像編輯。生成結果隨后交由 Gemini 2.5-Pro 模型進行自動評估,判斷其是否準確遵循指令并具備良好視覺質量。只有通過雙重驗證的結果才會被納入最終數據集。
![]()
Pico-Banana-400K 不僅包含單輪編輯(single-turn edits,即一次提示完成編輯)的樣本,還涵蓋了多輪連續編輯序列(multi-turn edit sequences),以及“偏好對”(preference pairs)—— 即成功與失敗編輯結果的對比樣本,幫助模型學習區分理想與不良輸出。
盡管研究團隊承認 Nanon-Banana 在精細空間控制、布局外推和文字排版處理方面仍存在局限,但他們強調,Pico-Banana-400K 的目標是為下一代文本引導圖像編輯模型提供一個堅實、可復現的訓練與評測基礎。
目前,相關研究論文已發布于預印本平臺 arXiv,而完整的 Pico-Banana-400K 數據集也已在 GitHub 上向全球研究者免費開放。(IT之家)
2、探跡科技推出針對AI數字員工打造的大模型智能體平臺
10月29日消息,探跡科技推出針對AI數字員工打造的大模型智能體平臺,這些數字員工具備類人思考、自主執行、精通業務、適應性強等特征。覆蓋B2B、B2C核心業務場景的AI Agent同步推出,如集成銷售、營銷、觸達與分析能力的Agent組合等,推動企業從“人力驅動”邁向“智能驅動”,開啟人機協同。目前,探跡科技已與華為、小米、vivo等頭部硬件廠商達成合作,打造覆蓋多終端、服務多場景的協同生態體系。(廣角觀察)
3、酷開旗下創視科技發布AI物業服務平臺
高通正攜新型芯片和計算機進軍利潤豐厚的AI數據中心市場,旨在在該行業增長最快的領域挑戰英偉達。該公司表示,AI200芯片將于明年開始出貨,可作為獨立組件、可插入現有設備的擴展卡,或作為由高通提供的整機機架服務器的一部分。該產品的首位客戶是沙特阿拉伯的人工智能初創公司Humain,該公司計劃從2026年開始基于這款新芯片部署200兆瓦的算力。(新浪財經)
4 、 打造 AI 編程界“瑞士軍刀”:GitHub 推 Agent HQ,目標統一管理所有智能體
10 月 29 日消息,科技媒體 Windows Report 發布博文,報道稱 GitHub 推出全新平臺 Agent HQ,其核心目標是統一管理各類 AI 編程智能體,并將其原生集成至 GitHub 的工作流中。
GitHub 官方表示當前開發者在調用 AI 智能體過程中,面臨工具分散、上下文頻繁切換以及需要管理多個訂閱等痛點,而 Agent HQ 的初衷源于開發者的切身體會,希望工具能真正輔助而非阻礙開發者。
![]()
援引博文介紹,此次發布恰逢 GitHub 平臺開發者總數突破 1.8 億的里程碑。數據顯示,高達 80% 的新晉開發者在加入平臺的第一周內便會使用 Copilot 輔助編程。
Agent HQ 的核心是一個名為 Mission Control 的統一指揮中心。開發者通過該中心,可以協調來自不同提供商的多個 AI 智能體,實現任務分配、進度跟蹤和 AI 項目管理。這一操作可以在 GitHub 網站、VS Code、移動端甚至是命令行界面中無縫完成。
此外,平臺還內置了名為 Plan Mode 的功能,支持 Copilot 在執行任務前主動提問,以確保充分理解上下文、識別缺失步驟,從而顯著提升代碼質量。
為滿足不同場景的需求,Agent HQ 支持開發者通過創建 AGENTS.md 文件,來構建具有特定規則和行為的自定義智能體。
同時,為了打造強大的 AI 生態,GitHub 已宣布與 OpenAI、Anthropic、谷歌、Cognition 及 xAI 等多家行業領先者展開合作,計劃將它們的編碼智能體直接整合進 Copilot 訂閱服務中。
作為合作的初步成果,Copilot Pro+ 訂閱用戶從即日起即可在 VS Code Insiders 版本中率先體驗 OpenAI Codex 的諸多功能。(IT之家)
![]()
1、英偉達最新宣布!量子計算板塊大爆發
![]()
量子計算板塊在10月29日表現強勢,其中天融信、神州信息漲停;科大國創、國盾量子大漲超10%;西部超導、普源精電也漲幅靠前。
消息面上,北京時間10月29日凌晨,在全球市值最高上市公司英偉達舉辦的GTC大會上,黃仁勛展示了基于CUDAQ核心構建的開放式系統架構NVQLink,用于連接傳統GPU和量子計算機,共同加速量子計算。
不久前,谷歌量子人工智能(AI)實驗室研究團隊在英國《自然》雜志上發表論文宣布,在谷歌自研的適用于量子計算機的“威洛”芯片上,其新研發的“量子回聲”算法實現了首個可驗證的量子優勢。該研究團隊表示,“量子回聲”算法運行速度比世界上最快的超級計算機之一——美國“前沿”計算機運行的經典算法快1.3萬倍。
公開資料顯示,A股不少上市公司正直接或間接參與量子計算,比如國盾量子,作為量子計算龍頭企業,正致力于量子信息技術的全面產業化。科大國創、格爾軟件、吉大正元等也積極參與量子計算領域。而ST復華、銅牛信息、天融信則與相關量子公司簽訂了戰略合作協議。還有部分公司通過投資間接參與了量子計算領域,比如博實股份(持有本源量子部分股權)、浙江東方(旗下基金投資國盾量子)等。
國金證券表示,2024年全球量子計算產業規模已達50.4億美元,預計在2024至2030年間將以87.64%的年平均增長率(CAGR)快速增長。隨著專用量子計算機在特定領域相較于經典計算的顯著優勢逐步顯現,預計2027年量子計算產業規模將躍升至111.8億美元。此后,在專用量子計算機的深度應用與通用量子計算機技術持續進步的雙重推動下,產業規模有望迎來爆發式增長,預計2035年將突破8000億美元,量子計算產業將邁向全面成熟與商業化。(東方財富研究中心)
![]()
“AI命運掌握在實踐者手里。 ”
更多干貨分享敬請關注我們的公眾號與視頻號~超多精彩對話內容等待您的解鎖!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.