![]()
如今的系統神經科學和神經回路模擬研究領域,一篇論文可能包含數百萬個數據點、上千頁補充材料,以及復雜到令人生畏的多維分析結果。
這些數據量之龐大,已經超出了普通人類的認知極限——很多有價值的洞見常常被數百頁的補充圖表淹沒,想要找到自己關心的細節,往往需要花費大量的時間和精力搜索。我們就像在試圖用茶匙舀干大海,只能勉強掬取一小部分信息。
好在技術的進步為我們提供了新的可能:一種被稱為“論文機器人”(Paper-bot)的智能工具。設想一下,通過引入這種強大的AI工具,科學家們不僅能夠更高效地處理海量數據;還能讓讀者直接與研究數據互動,從而獲得個性化的科學見解;甚至,還能跨越研究進行數據整合,探索科學領域的全貌。
這將不僅是技術的進步,更是科學傳播方式的一場革命。本文將開放性地探討,科學出版模式從傳統線性論文向交互式“論文機器人”的轉變,將如何徹底改變我們理解、分析和交流復雜科學研究成果的方式。
![]()
未來論文的數據復雜性日益增加
系統神經科學論文,最終會是什么樣的?
根據系統神經科學在過去一個世紀的發展軌跡,我們或許可以這樣設想:
首先,論文將匯總人類從出生到死亡每個神經元的活動情況。利用更完善的“分子記錄帶”(molecular ticker tape)技術,神經元每發出一個電脈沖,都會在其蛋白鏈上加上一段熒光分子。通過對這些蛋白鏈進行測序,可以獲得神經元整個生命周期內神經活動的完整歷史記錄。同時對每個神經元的mRNA進行測序,可以確定它屬于10.4萬個神經元類型中的哪一種。
![]()
?《人生七年》系列紀錄片. 圖片來源:豆瓣
論文還將詳細報告個體行為的每一個細節。利用肌肉內的分子傳感器預測肌肉運動:通過分析控制每只眼球的三對肌肉的收縮模式,推斷眼球運動;下巴、喉部、嘴唇和舌頭的肌肉收縮模式,推測言語活動;甚至,通過視網膜安裝的攝像頭、納米級耳蝸植入裝置以及穿在衣物上的柔性二維攝像片,捕捉個體所見所聞的一切。
基于這一前多未有的數據集,論文將訓練一個擁有1000層和2萬億參數的深度網絡,稱為“變換器生成式深度動力學網絡”(Transformer Generative Deep Dynamics network,TraGeDy Net),基于神經活動預測個體余生每時每刻的行為,且決定系數(R^2)可達到0.99。
最終,這樣的“終極論文”可以成功地將人類生命周期的神經元級別神經活動完整映射到其實時行為軌跡上。
那么,這個關于“終極論文”的思想實驗給我們帶來了怎樣的啟示?
未來的數據只會變得更加復雜。在這個由860億個神經元構成的人類大腦中,每一個電脈沖加起來會生成令人望而生畏的高維數據。
![]()
?《神經沖動:2.1秒內穿越大腦的史詩之旅》,Mark Humphries著作. 圖源:Princeton University Press
在《神經沖動:2.1秒內穿越大腦的史詩之旅》一書中曾做過一個粗略的計算,僅僅是皮層中,一個普通人類的一生會產生約340億次神經沖動。如果將這些數據可視化,這將是一幅讓人頭暈目眩的柵格圖。而行為數據還遠不止于此——僅是每隔幾毫秒捕捉一幀像素的圖像,其數據規模就已經難以應付。
這樣的論文確實震撼人心,但恐怕沒有人會愿意去讀。數據量實在是太大了!
![]()
“論文機器人”解決論文線性化
而科學非線性化發展的矛盾
事實上,我們已經邁入了這樣一個時代:越來越多的系統神經科學研究,尤其是神經回路巨型模擬相關論文,已經復雜到超出了任何一個研究者從頭到尾全面理解的程度。一些研究論文動輒超過100頁,附帶數十張補充圖表——簡直就像一篇“偽裝成期刊論文”的博士論文全文。
PDF文本,顯然并不是如此復雜數據的最佳傳遞方式。我們的出版模式勢必要改變,并且最好在到達“終極論文”之前就完成轉型。

?利用連接組數據工具觀察觸角葉中神經元和突觸之間的連接. 圖源:CATMAID
從已有的一些數據密集型研究中,我們已經可以窺見未來出版模式的雛形:
- FlyWire團隊通過一個門戶網站CATMAID,發布成年雌性果蠅大腦的完整連接組數據,同時詳細說明數據收集的過程,并提供訪問和查詢數據的工具。
- 艾倫腦科學研究所(Allen Brain Institute)已經追求這種模式超過十年,針對不同物種的神經元類型和神經元連接數據集提供了接口。
- 藍腦計劃(Blue Brain Project)同樣提供了針對小鼠大腦細胞類型和數量的綜合界面。
然而,這些資源的發布仍然以固定的、密集的論文文本形式最終輸出。后續科學研究基于這些論文展開,產生更多論文,描述日益復雜的數據。這種傳統的科學交流形式和出版模式需要突破,為新時代的復雜數據和動態研究提供支持。
那么,如何邁出下一步,徹底擺脫傳統論文的束縛?答案是:用一個“論文機器人”(paper-bot)來取而代之。
![]()
?目前已推出的一款“論文機器人”. 圖源:bestlifetimo
如今,我們對大語言模型(LLMs)的強大功能已經耳熟能詳。它們不僅能繪制數據圖表,還可以解答特定來源的問題,綜合分析甚至批判論文內容。下一步就是將這種能力直接應用于數據——讓LLM成為數據門戶的交互接口。
設想一下,科學家在進行人類生命周期的假說研究時,可以利用LLM來“馴服”高度復雜的數據集。通過“論文機器人”界面,可以輕松理解這項研究的核心內容。可以預設一些常見的查詢,比如“總結主要結果”或“展示預測行為的證據”。也可以自由提問,例如“視網膜攝像頭收集了哪些數據?具體是如何采集的?某些特定分析的結果是什么?”——通過這種方式,就可以從研究中提取科學見解,而不僅僅是接受作者的觀點。
論文機器人解決了論文線性化與科學非線性發展的矛盾,讓人不必受分散在論文正文與補充材料中的碎片化結果困擾。舉例來說,想知道“TraGeDy Net和正則化回歸模型的對比表現”,只需提問,“論文機器人”就能即時生成文本和圖表,清晰地總結兩者的預測能力,而無需在數百個補充圖中艱難搜索。進一步追問“TraGeDy Net是否顯著優于對照模型”,機器人會提供恰當的比較結果和統計分析,即便這些可能是作者在論文中遺漏的。
從靜態文本轉變為一個“數據+機器人”的發布形式后,每一次新的數據發布和對應的“論文機器人”更新,便成為科學成果的“代幣”——對應的是目前的“論文”。研究者的職責也從寫作和提交傳統論文,變成數據的收集、分析和為“論文機器人”配置預設查詢,提供他們對研究背景、結果和意義的看法。如果想知道具體貢獻占比?直接問“論文機器人”,它會告知誰負責了哪些部分。
這種“機器人化”的發布模式將是強大的。通過“論文機器人”,可以對人類生命周期數據提出自己的問題,比如研究行為變量之間的相關性。這意味著,新的科學發現可以直接通過“論文機器人”從數據中產生,而無需再經歷繁瑣的分析、寫作和審稿周期。
更進一步,我們可以開發“元機器人”(meta-bots),跨越不同研究整合數據,幫助我們回答復雜的問題并探索領域知識的全貌。不難想象,未來甚至會有AI科學家專門為這些“論文機器人”設計高級查詢,拼接新知識。
![]()
“論文機器人”
是否會真正終結“傳統論文”
未來的科學出版模式,會是“論文機器人”還是“傳統論文”?這要看科學界的選擇。
未來,或許你會滿意于閱讀一個人工智能機器人生成的研究報告,或許也會傾向于回歸論文的初創模式,即作者發布關于其研究精髓的簡短總結,而核心工作直接托管在數據門戶中。
不論未來的形式如何,有一點可以確定:如果存在一篇“終極論文”,它絕不會是一篇傳統的紙質論文。
譯者按:
在使用“論文機器人”時,我們必須謹慎評估其準確性。盡管AI系統可以高效生成實時內容,但由于缺乏人工編輯審查,生成的回答可能存在不準確之處。我們應通過驗證引用來源、與可靠來源交叉驗證、咨詢專家、并借助事實檢查工具等手段,確保信息的質量和可信度。
https://www.thetransmitter.org/systems-neuroscience/imagining-the-ultimate-systems-neuroscience-paper/
![]()
![]()
![]()
![]()
![]()
關于追問nextquestion
天橋腦科學研究院旗下科學媒體,旨在以科學追問為紐帶,深入探究人工智能與人類智能相互融合與促進,不斷探索科學的邊界。如果您有進一步想要討論的內容,歡迎評論區留言,或添加小助手微信questionlab,加入社群與我們互動。
關于天橋腦科學研究院
天橋腦科學研究院(Tianqiao and Chrissy Chen Institute)是由陳天橋、雒芊芊夫婦出資10億美元創建的世界最大私人腦科學研究機構之一,圍繞全球化、跨學科和青年科學家三大重點,支持腦科學研究,造福人類。
Chen Institute與華山醫院、上海市精神衛生中心設立了應用神經技術前沿實驗室、人工智能與精神健康前沿實驗室;與加州理工學院合作成立了加州理工天橋神經科學研究院。
Chen Institute建成了支持腦科學和人工智能領域研究的生態系統,項目遍布歐美、亞洲和大洋洲,包括、、、科研型臨床醫生獎勵計劃、、中文媒體追問等。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.