多巴胺是什麼?多巴胺的作用&好處?它如何影響人類從正面和負面經驗中學習

最後更新時間 / 2024-01-03

人類的行為和決策受到大腦中多巴胺水平的影響。

最近,一項新的研究揭示了人腦中多巴胺釋放的快速變化如何編碼獎勵和懲罰的預測錯誤,並指導人類的行為適應。

多巴胺是什麼

認識多巴胺是什麼?它是一種神經傳導物質,可以在大腦和身體的神經細胞之間傳遞化學信號。多巴胺參與了運動、認知和學習等多種功能。

科學家們一直在研究多巴胺如何在人類從正面和負面經驗中學習的過程中發揮作用。

多巴胺的作用

多巴胺是一種在大腦中產生的神經傳導物質,多巴胺的作用可以作為化學信使,促進大腦和身體神經細胞之間的溝通。多巴胺涉及運動、認知和學習等功能。雖然多巴胺因其與正面情緒的關聯而聞名,但科學家們也在探索它在負面經驗中的作用。

多巴胺在大腦中的釋放與獎勵和懲罰的預測錯誤有關。預測錯誤是指大腦對某種情況的預期與實際發生的結果之間的差異。

當預期的獎勵或懲罰比實際的更大時,大腦會產生正向的預測錯誤;當預期的獎勵或懲罰比實際的更小時,大腦會產生負向的預測錯誤。正向的預測錯誤會增加多巴胺的釋放,而負向的預測錯誤會減少多巴胺的釋放。

多巴胺的作用中,它的釋放對於大腦從經驗中學習和調整行為是至關重要的。多巴胺可以增強或減弱大腦中的神經連接,從而影響大腦對不同選擇的偏好和價值。多巴胺也可以影響大腦的注意力、動機和記憶,從而影響大腦的學習能力。

多巴胺的測量

要測量人腦中多巴胺的釋放,科學家們需要使用一種稱為快速掃描循環伏安法(FSCV)的電化學技術。這種技術可以通過插入一根碳纖維微電極到大腦的特定區域,每秒測量多達 10 次的多巴胺水平。

然而,這種方法具有挑戰性,只能在深部腦部刺激(DBS)腦部手術等侵入性手術中進行。DBS 通常用於治療帕金森氏症、原發性震顫、強迫症和癲癇等疾病。

pexels photo 3758119

為了利用 FSCV 技術,維克森林大學醫學院的研究人員與 Atrium Health Wake Forest Baptist 神經外科醫生 Stephen B. Tatter(醫學博士)和 Adrian W. Laxton(醫學博士)合作,他們也是維克森林大學醫學院神經外科系的教員。他們在接受 DBS 手術的患者的大腦中插入碳纖維微電極,並在手術室清醒時測量他們的多巴胺水平。

多巴胺的研究

研究人員在 12 月 1 日在《科學進展》上發表了他們的研究結果,表明人腦中的多巴胺釋放在編碼獎勵和懲罰預測錯誤方面發揮著至關重要的作用。這意味著多巴胺參與從正面和負面經驗中學習的過程,使大腦能夠根據這些經驗的結果來調整和適應其行為。

研究人員讓參與者玩了一個簡單的電腦遊戲,測量他們的多巴胺水平。遊戲分為三個階段,參與者從正面或負面的回饋中學習,做出最大化獎勵和最小化懲罰的選擇。在遊戲過程中,參與者的選擇要么受到獎勵,要么受到實際貨幣收益或損失的懲罰。在遊戲的三個階段中,每 100 毫秒一次,連續測量多巴胺水平。

研究人員發現,多巴胺的釋放與獎勵和懲罰的預測錯誤呈現出不同的時間動態。當參與者獲得比預期更大的獎勵時,多巴胺的釋放會在 200 毫秒內達到峰值;當參與者

獲得比預期更大的獎勵時,多巴胺的釋放會在 200 毫秒內達到峰值;當參與者獲得比預期更小的獎勵時,多巴胺的釋放會在 400 毫秒內達到谷值。

相反,當參與者受到比預期更大的懲罰時,多巴胺的釋放會在 400 毫秒內達到谷值;當參與者受到比預期更小的懲罰時,多巴胺的釋放會在 200 毫秒內達到峰值。

這些結果表明,多巴胺的釋放不僅反映了獎勵和懲罰的大小,而且反映了它們的不確定性和驚喜程度。

pexels photo 4914980

多巴胺的好處

研究人員還發現多巴胺的好處,多巴胺的釋放與人工智慧(AI)模型中使用的最佳教學信號有關。教學信號是指用於指導 AI 系統學習和改進的回饋信號。

研究人員使用了一種稱為 Q-learning 的 AI 模型,該模型可以根據獎勵和懲罰的預測錯誤來更新其對不同選擇的價值估計。

研究人員發現,多巴胺的釋放與 Q-learning 模型的教學信號高度一致,這意味著多巴胺可以作為一種自然的教學信號,幫助大腦學習和適應。

多巴胺的意義

這項研究是第一個直接測量人腦中多巴胺如何編碼獎勵和懲罰的研究,也是第一個顯示多巴胺是否反映了 AI 研究中使用的最佳教學信號的研究。

這項研究為理解多巴胺在人類學習和行為中的作用提供了新的見解,也為探索多巴胺在精神和神經疾病中的變化提供了新的方向。

「我們的研究表明,多巴胺不僅在大腦中傳遞正面和負面經歷的信號,而且在試圖從這些結果中學習時,它似乎以一種最佳的方式發揮作用。同樣有趣的是,它似乎以一種最佳的方式發揮作用。就像大腦中可能存在獨立的通路,分別與多巴胺系統進行獎勵和懲罰體驗。我們的結果揭示了一個令人驚訝的結果,即這兩個通路可能在時間尺度上僅相隔 200 到 400 毫秒的稍微變化的時間尺度上編碼獎勵和懲罰體驗」,維克森林大學醫學院生理學、藥理學和神經外科副教授 Kenneth T. Kishida 博士說。

Kishida 認為,這種程度的理解可能有助於更好地理解多巴胺系統如何影響患有精神和神經疾病的人類。Kishida 說,需要進行更多研究來了解多巴胺訊號在精神和神經疾病中是如何改變的。

pexels photo 908602

「傳統上,多巴胺通常被稱為『快樂神經傳導物質』,」Kishida 說。「然而,我們的工作提供的證據表明,這並不是思考多巴胺的方式。相反,多巴胺是一個複雜系統的重要組成部分,它教導我們的大腦並指導我們的行為。多巴胺也參與教導我們的大腦有關懲罰性經驗的過程。這是一項重要的發現,可能會提供新的研究方向,幫助我們更好地了解憂鬱症、成癮以及相關精神和神經疾病的機制。」