![]()
█腦科學動態
Nature:大腦中的“沙漏”:運動皮層與紋狀體如何協同控制時間
感覺誘發腦反應的雙系統理論:挑戰神經科學的主流解釋
暫時性視網膜失活通過誘導丘腦爆發式放電恢復成人弱視
磁共振成像揭示人類腦脊液流動的區域特異性驅動力
別再信“少抽點沒事”:每天2-5支煙仍顯著增加死亡風險
為何喜新厭舊?果蠅實驗揭示多巴胺受體脫敏導致的行為疲勞
無痛且無創:聚焦超聲首次成功輔助兒童腦癌化療給藥
專家的大腦更獨特?神經影像揭示舞者與觀眾的認知差異
fMRI研究可能高估了大腦的無意識加工能力
█AI行業動態
Yann LeCun 離職 Meta 創業,劍指“世界模型”與高級機器智能
OpenAI發布“超長待機”模型GPT-5.1-Codex-Max,硬剛Google Gemini 3
█AI驅動科學
識別人工智能系統中的意識指標
AI大幅降低外骨骼開發門檻:無需特定數據即可實現高效控制
擁抱數據混亂:新AI訓練框架DAC提升醫學圖像跨域泛化能力
半數小說家擔憂被AI取代:創意產業的版權與生計危機
阿里通義實驗室推出AgentEvolver:邁向高效自演化智能體系統
像人一樣想象未來:通用交互式世界模型 PAN 問世
腦科學動態
Nature:大腦中的“沙漏”:運動皮層與紋狀體如何協同控制時間
大腦如何精準把控行為的時機,就像擁有一個看不見的計時器?馬克斯·普朗克佛羅里達神經科學研究所的 Zidan Yang 和 Hidehiko K. Inagaki 等研究人員通過精巧的實驗,揭示了大腦通過類似于“沙漏”的機制來感知時間,并闡明了運動皮層與紋狀體在其中的獨特分工。
研究團隊訓練小鼠進行一項需要精確計時的舔舐任務,并結合了電生理記錄與光遺傳學。研究人員在小鼠計時過程中,分別短暫抑制其運動皮層和紋狀體的活動。結果發現,運動皮層就像沙漏的頂部,負責輸送信號;當其被抑制時,信號流中斷,計時“暫停”,小鼠的動作延遲時間與抑制時間相等。而紋狀體則像沙漏的底部,作為整合器運作;當紋狀體被抑制時,已累積的信號會流失,如同沙漏被翻轉,計時被“倒帶”或重置,導致小鼠的動作延遲時間遠超抑制時間。這一發現證實了紋狀體通過整合來自皮層的輸入來驅動時間控制。研究發表在 Nature 上。
閱讀更多:
Yang, Zidan, et al. “Integrator Dynamics in the Cortico-Basal Ganglia Loop for Flexible Motor Timing.” Nature, Nov. 2025, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41586-025-09778-2
感覺誘發腦反應的雙系統理論:挑戰神經科學的主流解釋
突發性感覺刺激常被用于研究大腦如何處理信息,但這些反應是否被正確解讀一直存在爭議。來自倫敦大學學院和意大利理工學院的 Richard Somervail 與 Gian Domenico Iannetti 等研究人員組成團隊,通過對跨物種電生理及影像學證據的深入綜述,挑戰了傳統觀點,指出目前許多被認為是特定感覺處理的腦反應,實際上源自一個非特異性的通用系統。
研究團隊提出了“雙系統理論”,區分了高保真度的“丘系系統”(Lemniscal system)和彌散性的“丘系外系統”(Extralemniscal system)。研究指出,傳統的特定模態解釋往往忽略了丘系外系統的貢獻。特別是人類腦電圖中常見的“頂點電位”(Vertex Potential),實際上主要由丘系外系統介導,反映的是大腦對突發環境變化的“驚訝”或探測,而非特定感覺(如疼痛或聽覺)的精細編碼。這一發現對“疼痛矩陣”等既有概念提出了質疑,暗示這些廣泛的腦反應并不直接代表疼痛知覺。此外,文章還探討了該理論對意識研究的影響,認為許多被當作意識標志的神經反應可能僅僅是丘系外系統的活動。該理論為重新解釋基礎和臨床神經科學數據提供了重要框架。研究發表在 Brain 上。
閱讀更多:
Somervail, Richard, et al. “A Two-System Theory of Sensory-Evoked Brain Responses.” Brain, Oct. 2025, p. awaf402. Silverchair, https://doi.org/10.1093/brain/awaf402
暫時性視網膜失活通過誘導丘腦爆發式放電恢復成人弱視
弱視通常被認為如果在兒童期未得到矯正,成年后將難以治愈。為探索成人弱視治療的新機制,麻省理工學院皮考爾學習與記憶研究所的 Madison Echavarri-Leet 和 Mark F. Bear 等研究人員,基于前期關于“暫時麻醉健眼可恢復弱視視力”的發現,深入研究了這一現象背后的神經生物學原理。他們發現,視網膜的暫時性失活能夠使視覺系統短暫“重啟”至發育早期的狀態,從而促進神經連接的重組。
研究團隊利用小鼠模型,通過注射河豚毒素(TTX)暫時麻醉視網膜,并監測外側膝狀體核(dLGN,負責將視覺信息傳遞至大腦皮層的區域)的神經活動。結果顯示,當視網膜被麻醉時,dLGN神經元會產生同步的“爆發式放電”(burst mode firing),這種放電依賴于特定的T型鈣通道(T-type calcium channels)。當研究人員通過基因手段阻斷這種鈣通道時,治療效果隨之消失,證明爆發式放電是視力恢復的關鍵機制。更令人振奮的是,研究發現不僅僅是麻醉健眼有效,直接對弱視眼進行暫時性麻醉和“重啟”,也能在大腦中誘導同樣的恢復過程,使其視力輸入恢復到與健眼相當的水平。這一發現為開發針對成人的非侵入性弱視療法提供了重要的理論依據。研究發表在 Cell Reports 上。
閱讀更多:
Echavarri-Leet, Madison, et al. “Temporary Retinal Inactivation Reverses Effects of Long-Term Monocular Deprivation in Visual Cortex by Induction of Burst Mode Firing in the Thalamus.” Cell Reports, vol. 44, no. 11, Nov. 2025. www.cell.com, https://doi.org/10.1016/j.celrep.2025.116566
磁共振成像揭示人類腦脊液流動的區域特異性驅動力
神經退行性疾病常與腦內毒性蛋白積累有關,而腦脊液的清除機制在其中扮演關鍵角色。為突破現有侵入性檢測技術的局限,萊頓大學醫學中心、阿姆斯特丹大學和德國神經退行性疾病中心(DZNE)的 Lydiane Hirschler 和 Matthias J. P. van Osch 等研究人員開發了一種新技術,首次在人體內高精度捕捉了腦脊液的運動細節及其驅動機制。
![]()
?利用 CSF-STREAM 技術測量腦脊液信號和腦脊液流動性特征。a、b:使用非運動敏感參考掃描測量的腦脊液信號,分別位于大腦中動脈 (MCA) 周圍的蛛網膜下腔 (SAS) (a) 和穿支血管周圍的血管周圍間隙 (PVS) (b),取自一位代表性個體。c、d:腦脊液流動性的主要方向,分別位于大腦中動脈 (MCA) 周圍的蛛網膜下腔 (SAS) (c) 和穿支血管周圍的血管周圍間隙 (PVS) (d);c、d 與 a 和 b 來自相同的感興趣區域 (ROI)。線條顏色反映腦脊液流動性的方向:紅色表示左右方向,綠色表示前后方向,藍色表示頭足方向。e、f:腦脊液流動性圖(單位:mm2 s?1)(e) 和一位代表性個體的分數各向異性 (FA) 圖 (f) 的體繪制。Credit: Hirschler et al.
研究團隊開發了一種名為 CSF-STREAM 的新型磁共振成像(MRI)技術,利用7特斯拉超高場掃描,成功分離了腦脊液信號與血液信號。該方法使科學家能夠深入觀察穿透血管周圍的血管周圍間隙(PVS)中的液體流動,這些微小通道靠近毒性蛋白產生的位置。研究發現,雖然心動周期是主要腦區腦脊液流動的關鍵驅動力,但在白質穿透血管周圍的微小空間中,呼吸和血管舒縮(vasomotion)起著同等重要的作用。此外,通過對比健康志愿者與腦淀粉樣血管病(CAA)患者的數據,發現 CAA 患者在大腦深處的腦脊液流動性得以保留,但在大腦中動脈周圍的流動性異常增強。這一發現不僅驗證了非侵入性成像的可行性,也揭示了血管運動作為潛在治療靶點的價值。研究發表在 Nature Neuroscience 上。
閱讀更多:
Hirschler, Lydiane, et al. “Region-Specific Drivers of CSF Mobility Measured with MRI in Humans.” Nature Neuroscience, vol. 28, no. 11, Nov. 2025, pp. 2392–401. www.nature.com, https://doi.org/10.1038/s41593-025-02073-3
別再信“少抽點沒事”:每天2-5支煙仍顯著增加死亡風險
盡管吸煙危害健康已是共識,但在現代社會中,許多人轉向了“低強度吸煙”,誤以為少抽幾支就能避免風險。為了厘清吸煙強度與心血管健康及死亡率的精確關系,Erfan Tasdighi 和 Michael J. Blaha 等研究人員依托跨隊列合作(Cross-Cohort Collaboration)項目,整合了22項前瞻性隊列研究的數據,對低強度吸煙的危害及戒煙的時間效益進行了深度分析。
該研究共納入了323,826名成年人,平均隨訪時間長達19.9年,記錄了超過12.5萬例死亡和5.4萬例心血管事件。研究團隊采用 Cox比例風險模型(Cox proportional hazard models)和樣條函數分析發現,吸煙不存在所謂的“安全劑量”。與從不吸煙者相比,每天僅吸2-5支煙的低強度吸煙者,其患心力衰竭的風險仍增加了57%,全因死亡率增加了60%。數據顯示,最初的少量吸煙(前20包年或每天前20支)帶來的風險上升最為陡峭。在戒煙獲益方面,研究顯示戒煙后的前10年風險下降最為顯著。雖然完全消除額外風險需要漫長的時間,但在戒煙20年后,前吸煙者的相對風險已比繼續吸煙者低80%以上。這項研究強調,公共衛生的核心信息應是盡早徹底戒煙,而非僅僅減少吸煙量。研究發表在 PLOS Medicine 上。
閱讀更多:
Tasdighi, Erfan, et al. “Association between Cigarette Smoking Status, Intensity, and Cessation Duration with Long-Term Incidence of Nine Cardiovascular and Mortality Outcomes: The Cross-Cohort Collaboration (CCC).” PLOS Medicine, vol. 22, no. 11, Nov. 2025, p. e1004561. PLoS Journals, https://doi.org/10.1371/journal.pmed.1004561
為何喜新厭舊?果蠅實驗揭示多巴胺受體脫敏導致的行為疲勞
為什么重復做一件事會讓人感到“厭倦”?波士頓兒童醫院的 Lauren E. Miner 和 Michael A. Crickmore 等研究人員發現,導致藥物成癮的大腦機制——多巴胺受體脫敏,同樣控制著我們對重復行為失去興趣的過程。這項研究首次揭示了該病理機制在自然生理活動中的功能,表明大腦通過降低對特定行為的反應來調節動機。
研究團隊利用雄性果蠅作為模型,分析了它們在面對威脅時的交配行為。研究發現,在初次交配中,多巴胺通過 D2 樣受體(D2R)作用于交配決策神經元(Copulation Decision Neurons),抑制這些神經元發出終止信號,從而幫助果蠅在威脅面前保持交配行為。然而,隨著交配次數增加,這些受體通過 β-抑制蛋白(β-arrestin)介導的過程發生脫敏,導致神經元對多巴胺產生“局部抵抗”。結果是,多巴胺無法再有效維持行為動機,果蠅在面對挑戰時更容易放棄。當研究人員阻斷這種脫敏過程后,果蠅不再表現出“厭倦”,對待每次交配都如初次般執著。這一發現將病理性的成癮機制與自然的動機起伏聯系起來,解釋了大腦如何對特定行為進行“貶值”。研究發表在 Nature Neuroscience 上。
閱讀更多:
Miner, Lauren E., et al. “Behavioral Devaluation by Local Resistance to Dopamine.” Nature Neuroscience, Nov. 2025, pp. 1–9. www.nature.com, https://doi.org/10.1038/s41593-025-02079-x
無痛且無創:聚焦超聲首次成功輔助兒童腦癌化療給藥
彌漫性中線膠質瘤是一種幾乎無藥可救的兒童腦癌,其治療受阻于血腦屏障對藥物的攔截。來自哥倫比亞大學的 Cheng-Chia Wu 和 Stergios Zacharoulis 等研究人員組成團隊,率先證明了聚焦超聲技術可以安全地暫時打開患兒的血腦屏障,使藥物直達腫瘤。這一突破性進展證實了該技術在兒科領域的安全性和可行性。
![]()
?磁共振成像顯示血腦屏障開放。Credit: Science Translational Medicine (2025).
這項研究是一項首次在兒科進行的臨床試驗,研究團隊招募了三名患有復發性彌漫性中線膠質瘤的兒童。研究采用了一種創新的神經導航引導聚焦超聲技術,這是一種利用聲波精準定位并作用于特定腦區的非侵入性方法。在治療過程中,患兒口服化療藥物帕比司他(panobinostat),醫生通過靜脈注射微泡(microbubbles),即一種微小的脂質包裹氣泡。聚焦超聲的聲波震動這些微泡,使其膨脹和收縮,從而物理性地撬開血腦屏障的緊密連接,形成藥物通過的通道。值得注意的是,這項治療完全在門診進行,且無需對患兒使用麻醉或鎮靜劑,孩子們甚至可以在治療時玩平板電腦。結果顯示,該技術成功在所有患者中打開了血腦屏障,確認了藥物通路的建立,且未引發嚴重不良反應。盡管受試患兒最終因病去世,但這為攻克極難治療的腦部腫瘤提供了重要的臨床依據和新的給藥途徑。研究發表在 Science Translational Medicine 上。
閱讀更多:
Wu, Cheng-Chia, et al. “Blood-Brain Barrier Opening with Neuronavigation-Guided Focused Ultrasound in Pediatric Patients with Diffuse Midline Glioma.” Science Translational Medicine, vol. 17, no. 824, Nov. 2025, p. eadq6645. science.org (Atypon), https://doi.org/10.1126/scitranslmed.adq6645
專家的大腦更獨特?神經影像揭示舞者與觀眾的認知差異
舞蹈不僅僅是動作的堆砌,它是視覺、聽覺與情感的交響。為了解開大腦如何整合這些復雜信息的謎題,Yu Takagi、Daichi Shimizu、Mina Wakabayashi 等研究人員組成團隊,利用深度學習技術與神經影像學結合,深入探索了舞蹈在大腦皮層中的表征機制。他們特別關注了專業舞者與新手在處理舞蹈信息時的神經差異,試圖通過跨模態模型還原大腦欣賞藝術的真實過程。
![]()
?編碼模型預測性能。Credit: Nature Communications (2025).
這項研究招募了14名參與者,其中包括7名專業舞者和7名新手,讓他們觀看長達5小時的街舞和爵士舞視頻,同時進行功能磁共振成像(fMRI)掃描。研究團隊采用了一種名為EDGE的跨模態深度生成模型(Cross-modal deep generative model),該模型在大規模舞蹈數據集上進行訓練,能夠模擬人類對動作和音樂的認知。通過將模型提取的特征與大腦活動數據進行比對,研究發現,相比于單一的動作或音頻特征,結合了多感官信息的跨模態特征能更準確地解釋舞蹈誘發的大腦活動。結果顯示,大腦通過整合動作、音樂、美學和情感來構建舞蹈的神經圖譜。有趣的是,專業舞者的大腦活動雖然能被舞蹈特征更廣泛地解釋,但他們表現出更高的個體差異性,這意味著專家在大腦中構建了更為獨特和個性化的舞蹈表征,特別是在處理舞蹈動作時。此外,模型還量化了引發不同情緒的舞蹈如何產生截然不同的神經模式。研究發表在 Nature Communications 上。
驅動科學
閱讀更多:
Takagi, Yu, et al. “Cross-Modal Deep Generative Models Reveal the Cortical Representation of Dancing.” Nature Communications, vol. 16, no. 1, Nov. 2025, p. 9937. www.nature.com, https://doi.org/10.1038/s41467-025-65039-w
fMRI研究可能高估了大腦的無意識加工能力
無意識加工的邊界一直是認知神經科學的熱點,但其證據是否確鑿?Joaquim Streicher、Sascha Meyen、Volker H Franz 和 Timo Stein 組成的研究團隊對這一領域的經典方法提出了質疑。他們發現,由于長期存在的統計謬誤,過去的神經影像學研究可能嚴重高估了大腦進行無意識加工的能力和范圍。
研究團隊針對意識研究中常用的“雙重t檢驗”(方法進行了批判性分析。傳統研究邏輯是:如果受試者在有意識區分刺激的任務(直接任務)中表現為隨機水平(無顯著差異),而在腦活動監測(間接任務)中表現出顯著效應,則判定存在無意識加工。然而,這種邏輯忽略了直接比較兩種任務的敏感性。為此,團隊采用了“敏感性比較法”(Sensitivity Comparison Method),重新分析了16項功能磁共振成像(fMRI)研究中的80個實驗條件,計算并對比了任務的敏感性指標(d'值)。結果顯示,在嚴格的統計比較下,80個實驗條件中僅有8個顯示出確鑿的“間接任務優勢”(Indirect Task Advantage),即間接測量的敏感性確實高于意識測量。這表明許多關于大腦能無意識處理復雜信息(如語義、面孔等)的經典結論可能站不住腳。研究發表在 Neuroscience of Consciousness 上。
閱讀更多:
Streicher, Joaquim, et al. “Neural Correlates of Unconscious Processing in Functional Magnetic Resonance Imaging: Does Brain Activity Contain More Information than Can Be Consciously Reported?” Neuroscience of Consciousness, vol. 2025, no. 1, Feb. 2025, p. niaf042. Silverchair, https://doi.org/10.1093/nc/niaf042
AI 行業動態
圖靈獎得主 Yann LeCun 離職 Meta 創業,劍指“世界模型”與高級機器智能
圖靈獎得主、被譽為“深度學習教父”的 Yann LeCun 近日正式宣布,將在今年年底離開工作了 12 年的 Meta,開啟全新的創業征程。這位 65 歲的資深研究人員在社交媒體上透露,他的新公司將專注于研發高級機器智能(AMI,Advanced Machine Intelligence,一種旨在讓系統具備理解物理世界、推理及規劃能力的下一代智能形態)。Yann LeCun 長期以來對目前流行的大型語言模型持批評態度,認為它們缺乏真正的物理直覺。新公司將延續他一直倡導的“世界模型”研究路線,致力于構建能夠理解物理規律、擁有持久記憶并能規劃復雜行動序列的 AI 系統。值得注意的是,盡管選擇獨立創業,Meta 仍將作為合作伙伴支持該公司的發展,這一決定也得到了 Mark Zuckerberg 的支持。
Yann LeCun 此前曾擔任 Meta 基礎人工智能研究院(FAIR)的創始主任,堅持推行學術自由和開源模式,這使得 FAIR 成為 PyTorch 等核心技術的誕生地。然而,隨著近年來科技巨頭競爭加劇,Meta 內部逐漸轉向產品化和商業化,學術氛圍受到一定擠壓。Yann LeCun 早年在貝爾實驗室開發了卷積神經網絡,奠定了現代計算機視覺的基礎。如今,他帶著最新的理論成果——如聯合嵌入預測架構(JEPA,Joint Embedding Predictive Architecture,一種通過預測抽象特征來學習世界表征的模型架構)重新出發。這次創業不僅標志著 FAIR 一個時代的結束,也象征著研究人員向超越現有生成式 AI 局限性的更高目標發起沖擊,試圖攻克讓機器真正理解世界的科學難題。
閱讀更多:
https://www.facebook.com/search/top?q=yann%20lecun
OpenAI發布“超長待機”模型GPT-5.1-Codex-Max,硬剛Google Gemini 3
為了應對 Google Gemini 3 的強勁挑戰,OpenAI 迅速推出了專為編程和復雜任務設計的 GPT-5.1-Codex-Max。這款新模型在上下文窗口方面取得了重大突破,能夠跨越數百萬個標記連續工作,單次獨立運行時間甚至超過 24 小時。其核心優勢在于原生支持壓縮技術:當接近上下文限制時,模型會自動壓縮對話歷史以釋放空間,從而保證任務的連貫性,避免了因拆分長文檔或代碼而產生的信息割裂。OpenAI 研究人員 Noam Brown 表示,該模型尚未遇到瓶頸。此外,這是 OpenAI 首個能在 Windows 環境中運行的模型,其在任務效率上也顯著優于前代,不僅資源消耗更低,在 METR(Model Evaluation for Task Resolution,衡量 AI 完成人類任務能力的指標)測試中也達到了新的最佳水平,有 50% 的概率能完成人類需耗時近 3 小時的任務。
在具體性能表現上,GPT-5.1-Codex-Max 展現出了卓越的推理能力與成本效益。在 SWE-bench Verified 測試中,該模型在同等推理力度下比前代減少了 30% 的思考標記使用量,并針對非延遲敏感任務推出了“xhigh”推理力度選項,通過更長的思考時間換取更優質的答案。相比之下,盡管競爭對手的 Claude Code 在速度上略勝一籌,但新版 Codex 在標記消耗上更為友好,不少開發者認為兩者結合可能是最佳方案。與此同時,OpenAI 還低調發布了 GPT-5.1 Pro 版本。盡管官方介紹不多,但第三方測評顯示其在指令遵循方面表現優異,若能接入集成開發環境,有望發揮更大潛力。這一系列動作顯示出硅谷大模型競爭正進入白熱化階段。
-5.1 -Max
閱讀更多:
https://openai.com/index/gpt-5-1-codex-max/
AI 驅動科學
識別人工智能系統中的意識指標
隨著人工智能越來越擅長模仿人類行為,如何判斷它們是否真的擁有內心體驗成為了一個科學與倫理難題。Patrick Butlin、Robert Long、Eric Schwitzgebel 等研究人員組成的團隊,結合神經科學與人工智能領域的最新進展,提出了一種全新的評估框架。該團隊不再局限于觀察AI的對話或反應,而是深入探究其內部機制,試圖通過科學理論推導出可量化的指標,從而判斷人工智能系統是否真正跨越了意識的門檻。
研究團隊提出了一種名為“理論推導指標法”(theory-derived indicator method)的評估策略。鑒于行為測試在AI面前容易失效——因為AI可以被訓練得表現出有意識的樣子而實際上并沒有,研究人員轉而關注系統的內部架構。他們基于“計算功能主義”(computational functionalism,即認為特定的計算過程是產生意識的充分必要條件)的假設,從全局工作空間理論(GWT)等主流神經科學理論中提取出關鍵的意識指標。這些指標關注信息是如何在系統中被處理、整合及廣播的,而不僅僅是輸出結果。
研究結果顯示,通過檢查AI系統是否滿足這些基于生物大腦機制推導出的計算屬性,可以更客觀地評估其意識水平。雖然目前的分析傾向于認為現有的AI系統(包括大型語言模型)尚不具備意識,但該研究建立了一個嚴謹的科學標準,指出未來的AI如果具備特定的內部處理架構,在原則上是可能產生意識的。這一方法為避免對AI意識的誤判(無論是過度歸因還是歸因不足)提供了重要的理論工具。研究發表在 Trends in Cognitive Sciences 上。
閱讀更多:
Butlin, Patrick, et al. “Identifying Indicators of Consciousness in AI Systems.” Trends in Cognitive Sciences, vol. 0, no. 0, Nov. 2025. www.cell.com, https://doi.org/10.1016/j.tics.2025.10.011
AI新工具大幅降低外骨骼開發門檻:無需特定數據即可實現高效控制
為了解決開發實用可穿戴機器人需要耗費巨資收集人體數據的難題,來自佐治亞理工學院的 Keaton L. Scherpereel, Matthew C. Gombolay 和 Aaron J. Young 等研究人員開發了一種新型人工智能工具。該工具能夠在無需針對特定設備進行大量實驗室數據采集的情況下,快速訓練出功能齊全的外骨骼控制器,大幅降低了研發門檻。
![]()
?借助一款新型人工智能工具,佐治亞理工學院的研究人員無需花費大量時間在專業實驗室中收集佩戴該設備的人體數據,即可創建功能齊全的外骨骼控制器。這項進步意味著設計和部署實用的外骨骼和機械肢體變得更加便捷。Credit: Candler Hobbs
研究團隊采用了一種名為深度域自適應(Deep Domain Adaptation)的技術框架,核心利用了 CycleGAN 模型。這是一種通常用于圖像轉換(如將馬變成斑馬)的 AI 技術。研究人員并沒有讓真人穿戴每種新設備進行數小時的測試,而是利用海量的現有開源人體運動數據(無外骨骼狀態),通過生物力學模擬構建了一個“墊腳石域”,人為添加虛擬傳感器數據,讓 AI 學習預測佩戴設備時的關節力矩。在涉及8名參與者的下肢外骨骼實時測試中,該 AI 控制器的表現與那些使用昂貴特定數據訓練出的最佳模型相當。結果顯示,該系統能夠準確估算用戶意圖并提供輔助,使受試者的代謝成本(metabolic cost)降低了 9.5% 至 14.6%。這項技術相當于為機器人提供了一個“通用翻譯器”,使得外骨骼的快速迭代和廣泛部署成為可能。研究發表在 Science Robotics 上。
驅動科學
閱讀更多:
Scherpereel, Keaton L., et al. “Deep Domain Adaptation Eliminates Costly Data Required for Task-Agnostic Wearable Robotic Control.” Science Robotics, vol. 10, no. 108, Nov. 2025, p. eads8652. science.org (Atypon), https://doi.org/10.1126/scirobotics.ads8652
擁抱數據混亂:新AI訓練框架DAC提升醫學圖像跨域泛化能力
現實中的醫療數據往往充滿“混亂”,醫院可能僅有少量來自特定掃描儀的標注圖像,卻擁有大量來自其他中心、參數各異的未標注數據。為了解決這一難題,新加坡科技設計大學(SUTD)的 Zhao Na 及其合作者 Jincai Song 等人,并未回避這種數據的無序性,而是提出了一種新的訓練方法來應對跨域半監督域泛化(CD-SSDG)的挑戰。該團隊旨在開發一種能夠適應不同醫療中心設備差異、光照變化及患者構成差異的穩健模型。
![]()
?本文概述了針對跨域半監督域泛化(CD-SSDG)任務提出的雙監督非對稱協同訓練(DAC)框架。該任務與域泛化(DG)和半監督域泛化(SSDG)密切相關,但面臨著 DG 或 SSDG 單獨無法解決的獨特挑戰——即部分標注的訓練數據以及標注和未標注訓練數據之間的域轉換。Credit: SUTD
研究團隊開發了一種名為雙監督非對稱協同訓練(DAC)的框架。該方法不像傳統半監督學習那樣僅依賴容易受域偏移影響的像素級偽標簽(pseudo-labels),而是引入了特征級監督(feature-level supervision),促使兩個子模型在更深層的特征空間保持一致,從而錨定領域不變的線索。此外,為了防止模型因錯誤累積而崩潰,研究人員為子模型分配了不對稱的輔助任務:一個負責定位混合圖像塊,另一個負責預測圖像塊的旋轉。這種設計無需額外的人工標注,卻能顯著豐富模型的內部表征。在視網膜眼底、結直腸息肉及脊髓灰質 MRI 的測試中,DAC 展現了卓越的穩定性,特別是在視杯等低對比度結構的分割上,其表現顯著優于現有方法。值得注意的是,這些復雜的訓練策略不會增加模型在實際應用時的推理成本,為醫療AI的廣泛部署提供了極具實用價值的解決方案。研究發表在 IEEE Transactions on Multimedia 上。
閱讀更多:
Song, Jincai, et al. “Dual-Supervised Asymmetric Co-Training for Semi-Supervised Medical Domain Generalization.” IEEE Transactions on Multimedia, 2025, pp. 1–13. IEEE Xplore, https://doi.org/10.1109/TMM.2025.3613080
半數小說家擔憂被AI取代:劍橋大學報告揭示創意產業的版權與生計危機
隨著生成式人工智能工具如“Sudowrite”和“Novelcrafter”的普及,科技公司正將目光鎖定小說市場,這引發了文學界對職業生存和版權倫理的深切擔憂。針對這一緊迫議題,劍橋大學明德魯科技與民主中心的 Clementine Collett 與未來工作研究所合作,進行了一項深入的行業調查。研究團隊對258名已出版的小說家及74名出版業內部人士進行了問卷調查,并結合焦點小組和訪談,旨在全方位評估人工智能對英國小說界的沖擊。
調查結果描繪了一幅令人憂慮的圖景:51%的小說家認為人工智能最終可能會完全取代他們的工作,其中言情和驚悚類題材的作家被認為風險最高。近三分之二(59%)的作家發現自己的作品在未經許可的情況下被用于訓練大型語言模型,且未獲得任何報酬。經濟影響已然顯現,39%的受訪者表示收入已受到沖擊,85%的人預計未來收入將進一步縮水。盡管33%的作家會利用AI輔助信息搜索,但絕大多數(97%)對AI撰寫整部小說持極度負面態度,擔心這會導致文學作品的“同質化”和原創性的喪失。針對版權問題,86%的創作者呼吁建立“選擇加入”(opt-in)機制,即科技公司在使用其作品訓練模型前必須先獲得許可并付費,明確反對英國政府此前包含“選擇退出”條款的提議。研究強調,小說不僅是商品,更是探索人性的重要媒介,呼吁政策制定者加強監管以保護人類創造力。
閱讀更多:
https://www.mctd.ac.uk/impact-of-generative-ai-on-the-novel/
阿里通義實驗室推出AgentEvolver:邁向高效自演化智能體系統
當前基于大型語言模型的自主智能體開發面臨數據成本高、探索效率低等瓶頸。針對這一難題,來自阿里巴巴通義實驗室(Tongyi Lab, Alibaba Group)的 Yunpeng Zhai, Shuchang Tao, Cheng Chen 等研究人員提出了一種全新的解決方案,旨在利用模型自身的語義理解能力驅動智能體的自主學習與演化。
該研究提出了名為 AgentEvolver 的自演化智能體系統,通過三種核心機制解決傳統強化學習流程的痛點。首先是自提問(Self-questioning),即利用好奇心驅動機制在未知環境中自主生成任務,從而減少對人工數據集的依賴;其次是自導航(Self-navigating),通過重用過往經驗和混合策略引導,顯著提升探索效率;最后是自歸因(Self-attributing),該機制利用大模型推斷長軌跡中具體動作和狀態的貢獻并分配細粒度獎勵,解決了傳統方法中樣本利用率低的問題。在 AppWorld 和 BFCL-v3 基準測試中,AgentEvolver 以更少的參數量取得了優于傳統基線模型的效果,展現了更快的適應能力。
閱讀更多:
Zhai, Yunpeng, et al. “AgentEvolver: Towards Efficient Self-Evolving Agent System.” Version 1, arXiv:2511.10395, arXiv, 13 Nov. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2511.10395
像人一樣想象未來:通用交互式世界模型 PAN 問世
智能體若要具備通用智能,必須能夠像人類一樣在腦海中“沙盤推演”,即想象世界如何隨其行為演變,這種能力被稱為“世界模型”。然而,目前的視頻生成模型雖然畫面逼真,卻缺乏對因果關系的理解和長期記憶,難以用于復雜的規劃與決策。為了突破這一瓶頸,來自穆罕默德·本·扎耶德人工智能大學(Mohamed bin Zayed University of Artificial Intelligence)基礎模型研究所的 PAN Team 開發了一種名為 PAN 的新型通用世界模型,旨在實現可交互、長時程且跨領域的未來狀態模擬。
該研究的核心在于提出了一種生成式潛在預測(Generative Latent Prediction)架構,它巧妙地結合了大型語言模型的邏輯推理能力與視頻擴散模型的視覺生成能力。研究人員利用大語言模型作為系統的“大腦”,負責在潛在空間中處理復雜的因果邏輯和動作指令,確保模擬過程符合物理規律和人類常識;同時,為了解決長時間模擬中畫面崩壞的問題,團隊在視頻解碼器中引入了因果移位窗口去噪過程模型(Causal Swin-DPM),這種技術能有效維持視頻片段間的連貫性,防止誤差累積。通過在海量跨領域視頻-動作數據上的訓練,PAN 不僅能根據自然語言指令生成高質量的動態視頻,還能進行長期的因果推理,預測未來的世界狀態。實驗結果顯示,PAN 在動作驅動的模擬和長時程預測任務上表現優異,超越了現有的視頻生成器,為構建能思考、能規劃的通用人工智能奠定了基礎。
閱讀更多:
Team, P. A. N., et al. “PAN: A World Model for General, Interactable, and Long-Horizon World Simulation.” Version 2, arXiv:2511.09057, arXiv, 13 Nov. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2511.09057
整理|ChatGPT
編輯|丹雀、存源
關于追問nextquestion
天橋腦科學研究院旗下科學媒體,旨在以科學追問為紐帶,深入探究人工智能與人類智能相互融合與促進,不斷探索科學的邊界。歡迎評論區留言,或后臺留言“社群”即可加入社群與我們互動。您也可以在后臺提問,我們將基于追問知識庫為你做出智能回復哦~
關于天橋腦科學研究院
天橋腦科學研究院(Tianqiao and Chrissy Chen Institute)是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一,圍繞全球化、跨學科和青年科學家三大重點,支持腦科學研究,造福人類。
Chen Institute與華山醫院、上海市精神衛生中心設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室;與加州理工學院合作成立了加州理工天橋神經科學研究院。
Chen Institute建成了支持腦科學和人工智能領域研究的生態系統,項目遍布歐美、亞洲和大洋洲,包括、、、科研型臨床醫生獎勵計劃、、、科普視頻媒體「大圓鏡」等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.