你有沒有想過,我們大腦里的獎勵學習和動作執行是如何精準分工的?比如當我們想去買杯奶茶,大腦既需要記住奶茶是獎勵的學習信號,又需要指揮身體移動的運動信號,這兩種信號如何不混淆?
![]()
2026年3月25日,美國紐約大學Christine M. Constantinople團隊在《Nature Neuroscience》上發表的研究《Acetylcholine demixes heterogeneous dopamine signals for learning and moving》,就解開了這一大腦奧秘:
背內側紋狀體中乙酰膽堿是多巴胺的調度員,它和多巴胺的相位關系,決定了多巴胺是調控學習還是運動。多巴胺滯后乙酰膽堿下降時調控獎勵學習,超前時則無學習作用,與乙酰膽堿爆發同步時預測動作強度。
![]()
多巴胺和乙酰膽堿的信號有何不同?
研究者讓大鼠做時間賭博決策任務,同時用光纖光度法實時記錄背內側紋狀體里的多巴胺和乙酰膽堿的釋放。
結果發現,兩種信號在不同行為事件中,表現完全相反!獎勵線索出現時:多巴胺升高,乙酰膽堿下降;大鼠轉頭運動時:多巴胺升高,乙酰膽堿爆發。
也就是說,兩種神經遞質在學習和運動相關場景下,信號表現完全不同。
![]()
多巴胺什么時候決定學習?
研究者仔細分析獎勵線索處兩種信號的相位關系,發現一個關鍵的規律:當多巴胺滯后乙酰膽堿下降約100毫秒時,多巴胺信號能預測大鼠后續的試次啟動行為,符合獎勵預測誤差的學習功能;當多巴胺超前乙酰膽堿下降約50毫秒時,多巴胺信號無法預測學習相關行為,也不影響大鼠的等待決策。
也就是說,只有多巴胺 “慢一步” 跟隨乙酰膽堿變化時,才能真正發揮獎勵學習的調控作用,相位超前則會喪失該功能。
![]()
學習時,大腦里發生了哪些變化?
接下來,作者采用Neuropixels電生理記錄監測背內側紋狀體神經元的放電,發現當學習相關的多巴胺信號出現時,約51.6% 的神經元放電率發生逐次變化,而且這種變化在試次間持續存在,這就是在體可塑性,是記憶形成的神經基礎。這些神經元分為兩類:一類放電增強,一類放電減弱,推測對應不同的多巴胺受體亞型。
也就是說,學習相關的多巴胺信號會讓紋狀體神經元產生持久的放電變化,這是大腦實現學習的神經基礎。
![]()
多巴胺什么時候決定運動?
在大鼠轉頭運動時,多巴胺和乙酰膽堿同步爆發,多巴胺信號的峰值比頭部運動速度的峰值早約100毫秒。而且,多巴胺信號的幅度能精準預測運動強度,想跑得快,信號就強;想走得慢,信號就弱。更關鍵的是,這個運動相關的多巴胺信號,不會引發神經元可塑性,與學習信號的作用完全區分。
也就是說,二者信號同步時,多巴胺專門負責指揮動作的快慢,不再參與學習過程。
![]()
全文總結
學習模式:獎勵線索 → 乙酰膽堿下降 → 多巴胺滯后100ms → 多巴胺信號觸發神經元可塑性 → 記憶形成;
運動模式:準備運動 → 乙酰膽堿和多巴胺同步爆發 → 多巴胺信號預測運動強度 → 執行動作,無記憶形成。
乙酰膽堿就像一個調度員,通過調整和多巴胺的相位關系,決定多巴胺今天負責學習還是負責運動。該研究還證實了學習相關多巴胺信號的在體可塑性機制,揭示了大腦內神經遞質協同調控行為的精準方式。
小編寄語:
多巴胺是神經科學里最出名的分子之一。它管獎勵、管學習、管運動、管動機……管的事太多,以至于科學家一直困惑:它到底是怎么同時管這么多事的?
紐約大學Christine M. Constantinople團隊的這項研究,給出了一個精妙的答案:不是多巴胺自己管的,是乙酰膽堿幫它分的工。在背內側紋狀體里,多巴胺和乙酰膽堿的時間關系,決定了多巴胺今天扮演什么角色。多巴胺滯后乙酰膽堿100毫秒時,它負責獎勵預測誤差,觸發學習;多巴胺和乙酰膽堿同步爆發時,它負責指揮運動強度,不觸發學習。同一個分子,兩種功能,全看時間差。
因此,大腦的復雜功能,不一定要靠復雜的分子系統,只需要給同一個分子配一個調度員協調就可以了。
![]()
https://doi.org/10.1038/s41593-026-02227-x
![]()
歡迎轉發分享
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.