2025年1月14日,beat365官方网站、麥戈文腦科學研究所和北大-清華生命科學聯合中心的張航課題組在《Cognitive Psychology》發表了一項題為“Exploring the bounded rationality in human decision anomalies through an assemblable computational framework”的研究,為理解人類看似非理性的決策行為提供了新的視角。

人類決策中常出現一些看似非理性的異常現象,例如“花生效應”(peanuts effect)。這一現象最早由Markowitz(1952)提出,描述了人們在面對小額獎勵時更傾向于選擇風險較高的賭注,而在面對大額獎勵時則更偏好确定的收益。例如,當被問及是否願意選擇10美分的确定收益,還是有十分之一概率獲得1美元時,許多人會選擇後者。然而,若将選項擴大至1000美元與1萬美金的十分之一概率,大多數人則會更傾向于确定的1000美元。這種随獎勵規模變化而反轉的偏好模式,長期以來被視為決策研究中的經典難題。

花生效應揭示了價值與概率加工之間的相互依賴性,挑戰了傳統決策模型的解釋力。為了更好地理解這一現象,研究團隊借鑒了資源理性理論,将認知加工建模為有限通道中的信息傳輸過程,并提出了一種名為“可組裝的資源理性模塊”(Assemblable Resource-Rational Modules, ARRM)的計算框架。該框架明确界定了資源理性模型的各個模塊(如認知資源、先驗信息、編碼與解碼機制),使得研究者能夠分析多種環境因素(如刺激分布和獎勵)對資源分配的聯合影響,并整合不同假設構建新的資源理性模型。

在該框架下,研究團隊檢驗了兩種關鍵假設:

  1. 理性疏忽假設:大腦在資源有限的情況下,會根據潛在獎勵調整對概率的認知資源分配。在評估較高價值的賭注時,人們會投入更多認知資源,做出更精确的估計。

  2. 結構先驗假設:長期經驗塑造了人們對概率和價值之間關系的先驗信念,“風險越高,回報越大”。因此人們可能會利用價值與概率之間的關聯進行輔助決策。

研究團隊通過分析兩個不同任務範式下的新數據和已發表數據,驗證了ARRM框架的有效性。結果顯示,基于有限理性假設的模型成功複現了“花生效應”的兩個關鍵特征,并在拟合人類決策行為方面優于以往的模型。這一發現表明,人類決策中的異常現象并非單純的認知缺陷,而是大腦在資源有限條件下進行優化的結果。


圖1:ARRM框架示意圖,展示了不同資源理性模塊的組裝與交互過程

張航課題組已畢業的博士生盧義龍博士(現為北京通用人工智能研究院研究員)為本文第一作者,博士生陸楊帆為第二作者,已畢業的博士生任祥娟博士(現為德國馬普人類發展研究所和漢堡大學博士後)為第三作者,張航研究員為通訊作者。本研究獲得科技創新2030-“腦科學與類腦研究”重大項目、國家自然科學基金委及北大-清華生命科學聯合中心的資助。

原文鍊接:Lu, Y.-L., Lu, Y.-F., Ren, X., & Zhang, H. (2025). Exploring the bounded rationality in human decision anomalies through an assemblable computational framework. Cognitive Psychology, 156, 101713. https://doi.org/10.1016/j.cogpsych.2025.101713


2025-02-06