![]()
█腦科學動態
Cell:用自然語言構建“虛擬細胞實驗室”
Cell:兩個關鍵基因可促進大腦體積增大與連接復雜化
大腦如何將一次舊傷變成永久的恐懼與疼痛開關
百萬級基因研究鎖定57個口吃“風險基因”
完整解析涼爽感知的神經通路
飲食攝入更多銅與老年人認知能力更強相關
人類CLOCK基因的額外功能:增強大腦連通性與思維靈活性
GLP-1全面綜述:GLP-1類藥物的健康益處遠超降糖減肥
█AI行業動態
全球首個"原生記憶力"大模型Yan 2.0
階躍星辰Step 3:開源多模態推理之王,性能與成本雙突破
█AI驅動科學
清華大模型僅憑體檢報告預測衰老與疾病風險
模擬人類思維的機器人路徑規劃新范式
人工智能攻克復雜科學方程,加速藥物與材料設計
TrainCheck:一款主動檢測深度學習訓練中靜默錯誤的自動化工具
超越上下文限制:為長時程推理引入“潛意識線程”
腦科學動態
Cell:用自然語言構建“虛擬細胞實驗室”
如何預測數萬億細胞在人體內的復雜互動?傳統的計算機建模技術門檻高,限制了其在生物學研究中的應用。由印第安納大學、約翰·霍普金斯醫學院、馬里蘭大學醫學院等機構的Paul Macklin, Genevieve Stein-O'Brien, Elana J. Fertig領導的團隊,開發了一種全新的框架,允許科學家使用簡單的自然語言來構建細胞行為的“數字孿生”,極大地降低了技術壁壘。
該研究的核心是創建了一種“細胞行為假說語法”,它允許科學家像填寫電子表格一樣,用“如果...那么...”的簡單邏輯語句描述細胞行為規則(例如:隨著氧氣濃度增加,此細胞分裂加速)。研究團隊開發的PhysiCell軟件能夠自動將這些人類可讀的“語法”翻譯成復雜的數學方程,并構建成基于代理的模型。這種方法讓不具備高深編程技能的生物學家也能在幾小時內搭建起復雜的細胞模擬系統。
為驗證其有效性,研究人員模擬了免疫細胞侵襲乳腺腫瘤的過程,模型預測腫瘤生長與癌細胞移動能力增強有關,這一結果在后續的活體細胞實驗中得到證實。此外,團隊還利用公共數據庫成功構建了首個大腦皮層發育的動態模型。這項技術最終旨在創建一個“虛擬細胞實驗室”,作為真實實驗的“數字孿生”,用以快速測試藥物反應、基因相互作用等假說,優先篩選出最有希望的研究方向,從而大幅加速生物醫學的探索進程。研究發表在 Cell 上。
#AI驅動科學 #計算模型與人工智能模擬 #數字孿生 #系統生物學
閱讀更多:
Johnson, Jeanette A. I., et al. “Human Interpretable Grammar Encodes Multicellular Systems Biology Models to Democratize Virtual Cell Laboratories.” Cell, vol. 0, no. 0, Jul. 2025. www.cell.com, https://doi.org/10.1016/j.cell.2025.06.048
Cell:兩個關鍵基因可促進大腦體積增大與連接復雜化
加州大學戴維斯分校的Daniela C. Soto和Megan Y. Dennis等人,利用最新發布的完整人類基因組圖譜,系統性地研究了此前難以分析的基因重復序列區域。他們的研究成功鑒定出兩個關鍵的人類特有基因,分別調控著大腦體積的增加和神經連接的復雜化。
該研究首先利用了前沿的端粒到端粒(T2T-CHM13)完整人類基因組序列,從中鑒定出上千個人類特有的旁系同源基因(paralog,即由基因重復產生的副本基因)。為了驗證這些基因的功能,研究團隊創新地構建了“人源化”斑馬魚模型。他們通過CRISPR基因編輯技術敲除斑馬魚體內與人類候選基因相對應的基因,再注入編碼人類特有基因的信使核糖核酸(mRNA),從而觀察這些“外來”基因對斑馬魚大腦發育的影響。結果清晰地表明,人類特有的GPR89B基因能以劑量依賴的方式(gene dosage-mediated,即基因數量越多,效果越明顯)顯著增大斑馬魚的大腦體積。而另一個名為FRMPD2B的基因,則通過影響突觸信號轉導來增加神經連接的復雜度。這項研究為理解人類大腦演化的遺傳基礎提供了直接證據。研究發表在 Cell 上。
#神經科學 #神經機制與腦功能解析 #人類進化 #基因重復
閱讀更多:
Soto, Daniela C., et al. “Human-Specific Gene Expansions Contribute to Brain Evolution.” Cell, vol. 0, no. 0, Jul. 2025. www.cell.com, https://doi.org/10.1016/j.cell.2025.06.037
大腦如何將一次舊傷變成永久的恐懼與疼痛開關
為何一次身體創傷能在痊愈后仍留下長期影響,甚至導致慢性疼痛或焦慮?多倫多大學密西沙加分校的Jennet Baumbach和Loren J. Martin團隊通過小鼠實驗發現,過去的損傷會重塑大腦的應激回路,使其對未來的壓力產生過度反應,并揭示了其中的關鍵分子通路。
![]()
?Credit: Current Biology (2025).
研究人員首先對小鼠進行一次性的局部損傷,以建立“疼痛啟動”(pain-priming)模型。待其完全康復后,再將它們暴露于天敵的氣味中,這是一種純粹的心理壓力。結果顯示,與從未受過傷的同伴相比,這些有過“創傷史”的小鼠表現出極度夸張的恐懼,并產生了長達六個多月的慢性疼痛,甚至連從未受傷的另一側肢體也出現痛覺超敏。
進一步的機制研究發現,這一現象的核心在于應激激素皮質酮與TRPA1受體(TRPA1 receptor,一種能感知芥末等刺激物的“警報”蛋白)之間的相互作用。過去的損傷使這一通路變得敏感,當再次遭遇壓力時,該通路被激活,從而放大了恐懼與疼痛信號。更有趣的是,研究發現恐懼和疼痛的長期化是由不同機制驅動的:阻斷TRPA1受體能消除過度的恐懼,卻無法緩解慢性疼痛;而抑制皮質酮則能同時消除兩者。這表明大腦中存在著獨立處理恐懼和疼痛的平行通路。研究發表在 Current Biology 上。
#疾病與健康 #神經機制與腦功能解析 #慢性疼痛 #應激 #心理健康與精神疾病
閱讀更多:
Baumbach, Jennet L., et al. “A History of Injury Enhances Affective and Sensory Responses to Predator Threat by Sensitizing Corticosterone Release through TRPA1 Receptor Signaling.” Current Biology, vol. 0, no. 0, Jul. 2025. www.cell.com, https://doi.org/10.1016/j.cub.2025.07.005
百萬級基因研究鎖定57個口吃“風險基因”
口吃的成因數百年來眾說紛紜,常被誤解為心理或家庭問題。為揭示其生物學基礎,范德比爾特大學醫學中心的Jennifer (Piper) Below、韋恩州立大學的Shelly Jo Kraft及同事與基因公司23andMe合作,開展了迄今最大規模的口吃遺傳學研究。這項研究不僅為口吃的遺傳根源提供了確鑿證據,還發現了其與孤獨癥、抑郁癥等疾病的內在聯系。
該研究采用全基因組關聯研究技術,分析了超過一百萬人的基因數據。研究人員在99,776名自我報告有口吃史的人群和超過一百萬的對照組中,成功定位了57個與口吃風險顯著相關的基因組區域。研究發現,口吃的遺傳基礎與孤獨癥、抑郁癥以及音樂節奏感存在重疊,表明控制言語、情緒和音樂能力的大腦通路可能共享相似的遺傳根源。例如,在男性中風險信號最強的基因VRK2,也被證實與節拍同步能力有關。此外,研究還揭示了口吃遺傳風險的性別差異,這或許能解釋為何口吃在成年男性中更為普遍。基于男性遺傳數據構建的多基因風險評分(polygenic risk score)能夠有效預測口吃風險,為未來的早期識別和干預提供了可能。研究發表在 Nature Genetics 上。
#疾病與健康 #個性化醫療 #口吃 #基因組學 #神經科學
閱讀更多:
Polikowsky, Hannah G., et al. “Large-Scale Genome-Wide Analyses of Stuttering.” Nature Genetics, Jul. 2025, pp. 1–13. www.nature.com, https://doi.org/10.1038/s41588-025-02267-2
完整解析涼爽感知的神經通路
涼爽的感覺為何如此獨特?我們的大腦如何精確區分一絲涼意和刺骨寒冷?密歇根大學的Bo Duan及其研究團隊,包括Hankyu Lee, Chia Chun Hor, Lorraine Horwitz等人,利用小鼠模型進行研究,首次完整描繪出了一條從皮膚到大腦的、專門用于傳遞涼爽感覺的神經通路,并發現脊髓中存在一個關鍵的“信號放大器”。
該研究揭示,涼爽感知的旅程始于皮膚上表達瞬時受體電位褪黑素8型(Transient receptor potential melastatin type 8,TRPM8)分子的感覺神經元。當皮膚接觸到15至25攝氏度的無害低溫時,這些神經元被激活,并將信號發送至脊髓。研究團隊發現了一個前所未知的關鍵步驟:在脊髓中,一類特定的興奮性中間神經元(Trhr+ interneurons)接收到這個初始信號后,會像放大器一樣將其增強。這一步至關重要,如果通過基因技術移除這些“放大器”神經元,小鼠便會失去對涼爽的感知能力,但其對溫暖或冷痛的反應則不受影響,證明了該回路的高度特異性。
隨后,被放大的信號被傳遞給另一群脊髓投射神經元,最終抵達大腦的臂旁外側核,從而產生涼爽的感覺。這條完整的“皮膚-脊髓-大腦”通路為感覺的“標記線理論”(labeled-line theory,即不同感覺有其專屬通路)提供了強有力的證據。這一發現不僅加深了我們對基本感覺機制的理解,也為未來開發針對化療引起的冷痛等感覺異常疾病的靶向療法奠定了基礎。研究發表在 Nature Communications 上。
#神經科學 #神經機制與腦功能解析 #感覺通路 #溫度感知
閱讀更多:
Lee, Hankyu, et al. “A Dedicated Skin-to-Brain Circuit for Cool Sensation in Mice.” Nature Communications, vol. 16, no. 1, Jul. 2025, p. 6731. www.nature.com, https://doi.org/10.1038/s41467-025-61562-y
飲食攝入更多銅與老年人認知能力更強相關
溫州醫科大學附屬麗水市中心醫院的Weiai Jia, Kangsheng Zhu, Jingpu Shi及Fangfang Yong等研究人員,利用美國大型健康調查數據,分析了飲食中的銅攝入量與老年人認知健康的關系,發現二者存在顯著正相關,但同時指出這種關聯受到多種社會經濟因素的影響,其直接因果關系尚待進一步厘清。
該研究是一項橫斷面觀察性研究,分析了來自美國國家健康與營養檢查調查(NHANES)的2420名60歲以上成年人的數據。研究人員通過詳細的飲食日記評估了參與者的銅攝入量,并采用數字符號替換測試(DSST)和動物流暢性測試(AFT)等一系列標準化工具來衡量其認知功能。結果顯示,較高的膳食銅攝入量(常見于貝類、堅果、黑巧克力等食物)與更好的認知表現顯著相關。然而,這種關系并非簡單的線性增長,而是呈現出倒“L”形曲線,表明銅的益處在達到一個拐點后便不再增加,研究建議的最佳攝入范圍為每天1.22至1.65毫克。研究團隊也強調,高銅攝入人群往往收入更高、生活方式更健康,這些混雜因素使得難以斷定銅是改善認知的直接原因。其他研究顯示阿爾茨海默病患者血液中銅含量偏高,但大腦關鍵記憶區域卻缺銅,這表明疾病本身可能擾亂了銅的代謝平衡,凸顯了銅與大腦健康關系的復雜性。研究發表在 Scientific Reports 上。
#疾病與健康 #疾病預防 #營養學 #阿爾茨海默病 #認知功能
閱讀更多:
Jia, Weiai, et al. “Association between Dietary Copper Intake and Cognitive Function in American Older Adults: NHANES 2011–2014.” Scientific Reports, vol. 15, no. 1, Jul. 2025, p. 24334. www.nature.com, https://doi.org/10.1038/s41598-025-09280-9
人類CLOCK基因的額外功能:增強大腦連通性與思維靈活性
生物鐘基因CLOCK除了調節睡眠和覺醒,是否還有其他功能?德克薩斯大學西南醫學中心的Yuxiang Liu, Genevieve Konopka及其同事,針對該基因在人類大腦皮層中獨特的非節律性高表達模式展開研究。他們發現,人類特有的CLOCK基因表達模式能夠增強神經連接和認知靈活性。
![]()
?野生型小鼠大腦皮層興奮性神經元示例圖,顯示樹突減少。 Credit: Dr. Yuxiang Liu
研究團隊首先構建了一種人源化小鼠模型(humanized mouse model),使其大腦皮層中的CLOCK基因表達模式與人類相似。在行為測試中,這種小鼠表現出更強的認知靈活性。為了探究其神經機制,研究人員運用單核RNA測序等技術分析發現,在人源化小鼠的興奮性神經元中,負責促進神經連接的基因被激活了。通過顯微成像和電生理記錄,他們進一步證實這些神經元長出了更復雜的樹突,突觸棘密度也更高,這直接證明了其大腦連接性的增強。為了在人類細胞中驗證這一發現,團隊利用CRISPR技術敲除了人類誘導多能干細胞(iPSC)中的CLOCK基因,結果觀察到神經元的樹突復雜性顯著降低。這項研究有力地證明了CLOCK基因通過在進化中獲得新的表達模式,促進了大腦連接和高級認知功能的發展。研究發表在 Nature Neuroscience 上。
#神經科學 #神經機制與腦功能解析 #認知科學 #進化
閱讀更多:
Liu, Yuxiang, et al. “Human CLOCK Enhances Neocortical Function.” Nature Neuroscience, Jun. 2025, pp. 1–13. www.nature.com, https://doi.org/10.1038/s41593-025-01993-4
GLP-1全面綜述:GLP-1類藥物的健康益處遠超降糖減肥
GLP-1研究領域的先驅、加拿大內分泌學家Daniel J. Drucker與合作者Maria J. Gonzalez-Rellan全面回顧了GLP-1類藥物在心血管、腎臟、肝臟等多種疾病治療中的最新臨床證據,并探討了其潛在作用機制。
這篇評論文章,系統梳理了多項大型3期臨床試驗的關鍵數據,揭示了GLP-1類藥物的“超適應癥”潛力。在心血管和腎臟保護方面,SELECT試驗發現,司美格魯肽可將無糖尿病的肥胖癥患者的主要不良心血管事件(MACE,指心血管死亡、非致命性心肌梗死或非致命性中風的復合終點)風險降低20%;而FLOW試驗則證實,該藥物能使2型糖尿病合并慢性腎病患者的腎臟重大疾病事件風險降低24%。這些益處被發現部分獨立于體重減輕的程度。
此外,研究還總結了其在其他領域的顯著療效:在代謝功能障礙相關脂肪性肝炎(MASH)患者中,司美格魯肽和替爾泊肽均能有效改善肝臟炎癥和纖維化;在肥胖合并骨關節炎(osteoarthritis)患者中,司美格魯肽能顯著減輕疼痛;在肥胖合并中重度阻塞性睡眠呼吸暫停(obstructive sleep apnea)患者中,替爾泊肽也顯示出卓越的治療效果。作者指出,GLP-1類藥物廣泛的器官保護作用可能源于其強大的抗炎能力和對全身代謝的直接調節,而不僅僅是減重的間接效應。
#疾病與健康 #健康管理與壽命延長 #GLP-1 #肥胖
閱讀更多:
Gonzalez-Rellan, Maria J., and Daniel J. Drucker. “The Expanding Benefits of GLP-1 Medicines.” Cell Reports Medicine, vol. 6, no. 7, Jul. 2025. www.cell.com, https://doi.org/10.1016/j.xcrm.2025.102214
AI 行業動態
全球首個"原生記憶力"大模型Yan 2.0亮相WAIC,挑戰Transformer霸權
近期,世界人工智能大會(WAIC)上,中國AI創企RockAI展示了基于全新架構Yan 2.0 Preview的多模態大模型。這款僅3B參數的模型能在樹莓派等低算力設備離線運行,其獨特之處在于具備"原生記憶"能力——通過可微的神經網絡記憶單元,將用戶交互信息內化為模型參數,實現類似人類的時間維度記憶。相比之下,傳統Transformer模型每次對話都需重新加載上下文,而經過裁剪的端側Transformer模型更是喪失了持續學習能力。RockAI CEO劉凡平指出,這種內生記憶機制能實現真正的個性化服務,使設備從工具進化為"數字大腦"。
RockAI團隊耗時兩年研發的Yan架構,從根本上解決了Transformer的"數據墻"和"算力依賴"問題。該架構通過降低計算復雜度,實現了"訓推同步"——模型在推理時仍可學習更新,如同兒童在互動中成長。現場演示中,搭載Yan 2.0的機器狗能記住學過的動作,即使重啟對話窗口也不遺忘。CTO楊華強調,這種離線自主學習能力是群體智能的基礎,未來硬件價值將取決于"智能進化能力"而非靜態配置。目前已有多個硬件廠商與RockAI合作,推動非Transformer架構的商業化落地。
從早期遭受質疑到如今引發行業關注,RockAI始終堅守"讓每臺設備擁有自主智能"的愿景。CMO鄒佳思透露,團隊正在挑戰更底層的反向傳播算法,以提升學習效率。這種長期主義研發策略,與OpenAI早期探索scaling law的路徑相似。隨著記憶能力成為AI進化關鍵,Yan架構或將為AGI發展提供新范式——當海量數據紅利見頂時,具備持續進化能力的"數字生命體"可能開啟智能新時代。
#人工智能 #大模型 #Transformer #記憶能力 #端側AI
閱讀更多:
https://www.rockai.net/
階躍星辰Step 3:開源多模態推理之王,性能與成本雙突破
在2025世界人工智能大會(WAIC)前夕,階躍星辰(StepFun)正式推出新一代基座模型Step 3,被譽為“開源多模態推理之王”。該模型在MMMU、MathVision等基準測試中超越同類開源模型,甚至能與OpenAI o3、Gemini 2.5 Pro等閉源模型一較高下。Step 3以“多開好省”為核心特點:支持文本和視覺多模態能力(多)、7月31日全球開源(開)、性能優異(好)、推理效率高且成本低(省)。其國產芯片適配優化使推理成本僅為業界領先開源模型的三分之一,為AI商業化應用提供了新范式。
實測顯示,Step 3在多模態任務中表現驚艷。無論是識別貓的品種、解讀網絡熱梗,還是整合多張圖片生成故事,其視覺理解和推理能力均達到頂尖水平。此外,階躍AI App的智能視頻通話功能也展現了強大的實時多模態交互能力。Step 3的底層采用原創MFA架構(多矩陣分解注意力),結合MoE(混合專家)技術,并通過Attention-FFN Disaggregation(AFD)方案優化分布式推理,實現了性能與效率的完美平衡。
階躍星辰還聯合華為昇騰、沐曦等10家芯片廠商成立“模芯生態創新聯盟”,推動國產算力生態發展。2025年上半年,其智能終端多模態模型調用量環比增長超800%,預計年收入接近10億元。從Step 1到Step 3,階躍星辰完成了從技術深耕到商業落地的跨越,為AI行業提供了兼具性能與成本效益的“最優解”。
#階躍星辰 #Step3 #多模態模型 #開源AI #國產芯片
閱讀更多:
https://www.stepfun.com/company
AI 驅動科學
清華大模型僅憑體檢報告預測衰老與疾病風險
清華大學的底騫、馬為之及新疆維吾爾自治區人民醫院的楊毅寧等研究人員,開發了一種基于大語言模型(LLM)的新框架,僅需普通體檢報告即可精準預測個體的整體及器官生物學年齡。
該研究創建了一個創新性評估框架,首先將個體的常規體檢數據轉化為結構化的文字報告,然后將其輸入到大語言模型中。模型利用其強大的預訓練醫學知識進行綜合分析,無需預設公式即可推斷出個體的整體生物學年齡以及心臟、肝臟等六大器官系統的專屬年齡。研究團隊利用全球六個大型數據庫中超過1000萬人的數據對該方法進行了驗證。結果顯示,該模型在預測全因死亡率(all-cause mortality)方面的準確率(C-index為0.757),顯著優于表觀遺傳時鐘(epigenetic clocks)等傳統衰老生物標志物。模型計算出的“年齡差”(即預測生物學年齡與實際年齡的差值)是關鍵的健康預警信號,年齡差每增加1歲,未來死亡風險便上升5.5%。此外,該模型還能識別與加速衰老相關的蛋白質生物標志物(protein biomarkers),并為270種疾病構建了風險預測模型,在精準健康管理方面展現出巨大潛力。研究發表在 Nature Medicine 上。
#AI驅動科學 #預測模型構建 #健康管理與壽命延長 #大模型技術
閱讀更多:
Li, Yanjun, et al. “Large Language Model-Based Biological Age Prediction in Large-Scale Populations.” Nature Medicine, Jul. 2025, pp. 1–14. www.nature.com, https://doi.org/10.1038/s41591-025-03856-8
模擬人類思維的機器人路徑規劃新范式
現有機器人導航方法在面對迷宮等復雜環境時往往效率低下或不夠可靠。浙江大學湖州研究院的Zhichao Han、Fei Gao等人受人類尋路模式啟發,開發了一種創新的分層規劃框架,該框架結合了人工智能的快速直覺與傳統算法的精確可靠,旨在讓機器人在任何復雜環境中都能高效、穩定地導航。
![]()
?涉及腿式機器人在迷宮環境中導航的實驗。Credit: Science Robotics (2025).
該研究的核心是一種模仿人類“直覺先行,后精細調整”思維模式的分層規劃方法。首先,一個輕量級深度神經網絡作為前端規劃器,它通過學習大量專家數據,能像人一樣“一眼”看穿環境,直接在地圖圖像上快速生成一條可行的大致路徑。這種基于學習的方式保證了規劃時間不隨環境復雜度的增加而大幅波動,實現了可預測的計算效率。隨后,該粗略路徑被傳遞給一個作為后端優化器的新型時空軌跡優化器。該優化器采用經典的數值優化技術,將前端給出的路徑“打磨”成一條機器人能夠平穩、安全執行的、無奇異點的高質量運動軌跡。這種“AI預測+經典優化”的混合模式,成功結合了深度學習的高效率和傳統方法的可靠性。在對腿式機器人和無人機進行的大規模迷宮導航實驗中,該系統展現了卓越的魯棒性和高效率,即使在極度復雜的環境中也能穩定輸出高質量的導航路徑。研究發表在 Science Robotics 上。
#AI驅動科學 #機器人及其進展 #路徑規劃 #人機融合
閱讀更多:
Han, Zhichao, et al. “Hierarchically Depicting Vehicle Trajectory with Stability in Complex Environments.” Science Robotics, vol. 10, no. 103, Jun. 2025, p. eads4551. science.org (Atypon), https://doi.org/10.1126/scirobotics.ads4551
人工智能攻克復雜科學方程,加速藥物與材料設計
許多前沿科學研究因求解復雜的物理方程(如薛定諤方程)而進展緩慢,德克薩斯農工大學(Texas A&M University)的Shuiwang Ji、Xuan Zhang聯合來自15所頂尖高校的60余位研究者,共同完成了一篇里程碑式的綜述論文,系統闡述了如何利用人工智能(AI)攻克這些難題。
這篇綜述性研究詳細闡述了如何運用人工智能,特別是深度學習模型,來替代傳統方法,從而高效地近似求解這些復雜方程。其核心思想是訓練AI模型直接學習物理系統的行為規律,例如,利用AI求解著名的薛定諤方程。為了保證AI模型的預測符合物理現實,一個關鍵的技術挑戰是讓模型內嵌物理學基本原理,尤其是對稱性。研究者們深入探討了實現等變性(equivariance,指當系統輸入發生旋轉或平移等對稱變換時,模型輸出也相應變換的特性)的多種AI技術。通過這種方式,AI不僅能處理傳統方法無法企及的大規模系統,還能將計算時間從數年縮短至幾分之一。研究發表在 Foundations and Trends in Machine Learning 上。
#AI驅動科學 #預測模型構建 #跨學科整合 #材料科學
閱讀更多:
Zhang, Xuan, et al. “Artificial Intelligence for Science in Quantum, Atomistic, and Continuum Systems.” Foundations and Trends? in Machine Learning, vol. 18, no. 4, Jul. 2025, pp. 385–912. www.nowpublishers.com, https://doi.org/10.1561/2200000115
TrainCheck:一款主動檢測深度學習訓練中靜默錯誤的自動化工具
深度學習模型訓練中難以察覺的“靜默錯誤”會導致模型性能下降并浪費大量計算資源,密歇根大學(University of Michigan)的Yuxuan Jiang、Ryan Huang等人,開發了一款名為TrainCheck的開源自動化框架,它通過監控“訓練不變量”來主動、快速地識別這些錯誤及其根本原因。
![]()
?BLOOM-176B 訓練中的靜默錯誤。Credit: arXiv (2025).
傳統上,開發者通過監控損失(loss)或準確率(accuracy)等高層指標來判斷訓練狀態,但這些方法難以區分正常的訓練波動和由靜默錯誤(silent error,即不導致程序崩潰但會悄悄影響模型最終性能的漏洞)引起的問題。TrainCheck采取了一種全新的主動檢測策略。其核心是利用“訓練不變量”(training invariants),即在正常訓練過程中必須恒成立的規則,例如“在張量并行訓練中,不同GPU上的某些模型權重應保持一致”。該框架能自動從正確的訓練代碼中推斷出這些不變量,然后在新的訓練任務中實時監控它們。一旦某個不變量被違反,TrainCheck會立刻發出警報,并提供詳細的調試信息。在一項包含20個真實世界靜默錯誤的評估中,TrainCheck成功檢測到18個,而傳統方法僅發現2個。更重要的是,它為其中10個錯誤找到了確切的根本原因,并顯著縮小了其余8個錯誤的排查范圍。此外,該工具還發現了流行訓練庫中6個此前未知的錯誤。研究發表在 USENIX Symposium on Operating Systems Design and Implementation (OSDI) 上。
#大模型技術 #自動化科研 #深度學習 #錯誤檢測
閱讀更多:
Jiang, Yuxuan, et al. Training with Confidence: Catching Silent Errors in Deep Learning Training with Automated Proactive Checks. arXiv:2506.14813, arXiv, 6 Jun. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2506.14813
超越上下文限制:為長時程推理引入“潛意識線程”
來自MIT CSAIL、普林斯頓大學、特拉維夫大學以及Subconscious Systems Technologies公司的Hongyin Luo、James Glass等人,提出了一種名為TIM的線程推理模型及其推理引擎TIMRUN,通過將推理過程建模為可修剪的“任務樹”,成功突破了上下文限制。
該研究的核心思想是顛覆傳統LLM將語言視為線性序列的處理方式,轉而將其建模為一棵遞歸的任務樹。基于此,團隊構建了線程推理模型(TIM, Thread Inference Model)并為其開發了專用推理引擎TIMRUN。其工作機制如同人腦的“潛意識”:在推理過程中,TIMRUN會動態維護一個工作記憶。當一個子任務完成后,其在KV緩存(KV cache,存儲Transformer模型注意力機制中關鍵信息的核心內存區域)中的狀態會被智能地修剪和釋放,從而為后續更重要的推理步驟騰出寶貴的GPU資源。這種動態的內存管理機制,使得模型能夠處理理論上無限長的推理鏈條,有效克服了傳統LLM在輸出長度、位置編碼和GPU顯存方面的三重限制。該架構還極大地簡化了需要多次調用外部工具的復雜工作流,將多次調用整合到單次模型推理中。實驗表明,該系統在處理長時程數學推理和多跳(multi-hop)信息檢索任務時表現出色,并且即使在動態管理高達90%的KV緩存時,也能保持高推理吞吐量。
#大模型技術 #計算模型與人工智能模擬 #長文本處理 #AI智能體
閱讀更多:
Luo, Hongyin, et al. Beyond Context Limits: Subconscious Threads for Long-Horizon Reasoning. arXiv:2507.16784, arXiv, 22 Jul. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2507.16784
整理|ChatGPT
編輯|丹雀、存源
由天橋腦科學研究院主辦的首屆AI驅動科學年度研討會(AIAS 2025)將于10月27–28日在美國舊金山舉行。會議面向全球征集論文,聚焦能夠在科學領域開辟全新研究模式、假設生成及實驗方法的變革性人工智能創新。如果您希望與諾貝爾獎得主Jennifer Doudna,David Baker,知名學者Animashree Anankumar,Heather J. Kulik,以及業界領袖Tom Miller一同登臺分享,請點擊閱讀原文提交您的論文:https://aias2025.org/call-for-papers/!征稿截止日期為8月1日。
![]()
關于追問nextquestion
天橋腦科學研究院旗下科學媒體,旨在以科學追問為紐帶,深入探究人工智能與人類智能相互融合與促進,不斷探索科學的邊界。歡迎評論區留言,或后臺留言“社群”即可加入社群與我們互動。您也可以在后臺提問,我們將基于追問知識庫為你做出智能回復哦~
關于天橋腦科學研究院
天橋腦科學研究院(Tianqiao and Chrissy Chen Institute)是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一,圍繞全球化、跨學科和青年科學家三大重點,支持腦科學研究,造福人類。
Chen Institute與華山醫院、上海市精神衛生中心設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室;與加州理工學院合作成立了加州理工天橋神經科學研究院。
Chen Institute建成了支持腦科學和人工智能領域研究的生態系統,項目遍布歐美、亞洲和大洋洲,包括、、、科研型臨床醫生獎勵計劃、、等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.