學院新聞 - beat365官方网站

2025年1月14日，beat365官方网站、麥戈文腦科學研究所和北大-清華生命科學聯合中心的張航課題組在《Cognitive Psychology》發表了一項題為“Exploring the bounded rationality in human decision anomalies through an assemblable computational framework”的研究，為理解人類看似非理性的決策行為提供了新的視角。

人類決策中常出現一些看似非理性的異常現象，例如“花生效應”（peanuts effect）。這一現象最早由Markowitz（1952）提出，描述了人們在面對小額獎勵時更傾向于選擇風險較高的賭注，而在面對大額獎勵時則更偏好确定的收益。例如，當被問及是否願意選擇10美分的确定收益，還是有十分之一概率獲得1美元時，許多人會選擇後者。然而，若将選項擴大至1000美元與1萬美金的十分之一概率，大多數人則會更傾向于确定的1000美元。這種随獎勵規模變化而反轉的偏好模式，長期以來被視為決策研究中的經典難題。

花生效應揭示了價值與概率加工之間的相互依賴性，挑戰了傳統決策模型的解釋力。為了更好地理解這一現象，研究團隊借鑒了資源理性理論，将認知加工建模為有限通道中的信息傳輸過程，并提出了一種名為“可組裝的資源理性模塊”（Assemblable Resource-Rational Modules, ARRM）的計算框架。該框架明确界定了資源理性模型的各個模塊（如認知資源、先驗信息、編碼與解碼機制），使得研究者能夠分析多種環境因素（如刺激分布和獎勵）對資源分配的聯合影響，并整合不同假設構建新的資源理性模型。

在該框架下，研究團隊檢驗了兩種關鍵假設：

理性疏忽假設：大腦在資源有限的情況下，會根據潛在獎勵調整對概率的認知資源分配。在評估較高價值的賭注時，人們會投入更多認知資源，做出更精确的估計。
結構先驗假設：長期經驗塑造了人們對概率和價值之間關系的先驗信念，“風險越高，回報越大”。因此人們可能會利用價值與概率之間的關聯進行輔助決策。

研究團隊通過分析兩個不同任務範式下的新數據和已發表數據，驗證了ARRM框架的有效性。結果顯示，基于有限理性假設的模型成功複現了“花生效應”的兩個關鍵特征，并在拟合人類決策行為方面優于以往的模型。這一發現表明，人類決策中的異常現象并非單純的認知缺陷，而是大腦在資源有限條件下進行優化的結果。

圖1：ARRM框架示意圖，展示了不同資源理性模塊的組裝與交互過程

張航課題組已畢業的博士生盧義龍博士（現為北京通用人工智能研究院研究員）為本文第一作者，博士生陸楊帆為第二作者，已畢業的博士生任祥娟博士（現為德國馬普人類發展研究所和漢堡大學博士後）為第三作者，張航研究員為通訊作者。本研究獲得科技創新2030-“腦科學與類腦研究”重大項目、國家自然科學基金委及北大-清華生命科學聯合中心的資助。

原文鍊接：Lu, Y.-L., Lu, Y.-F., Ren, X., & Zhang, H. (2025). Exploring the bounded rationality in human decision anomalies through an assemblable computational framework. Cognitive Psychology, 156, 101713. https://doi.org/10.1016/j.cogpsych.2025.101713

2025-02-06

張航課題組構建“可組裝的資源理性模塊”破解人類決策悖論