2025年1月14日,北京大學(xué)心理與認(rèn)知科學(xué)學(xué)院、麥戈文腦科學(xué)研究所和北大-清華生命科學(xué)聯(lián)合中心的張航課題組在《Cognitive Psychology》發(fā)表了一項題為“Exploring the bounded rationality in human decision anomalies through an assemblable computational framework”的研究,為理解人類看似非理性的決策行為提供了新的視角。
人類決策中常出現(xiàn)一些看似非理性的異常現(xiàn)象,例如“花生效應(yīng)”(peanuts effect)。這一現(xiàn)象最早由Markowitz(1952)提出,描述了人們在面對小額獎勵時更傾向于選擇風(fēng)險較高的賭注,而在面對大額獎勵時則更偏好確定的收益。例如,當(dāng)被問及是否愿意選擇10美分的確定收益,還是有十分之一概率獲得1美元時,許多人會選擇后者。然而,若將選項擴大至1000美元與1萬美金的十分之一概率,大多數(shù)人則會更傾向于確定的1000美元。這種隨獎勵規(guī)模變化而反轉(zhuǎn)的偏好模式,長期以來被視為決策研究中的經(jīng)典難題。
花生效應(yīng)揭示了價值與概率加工之間的相互依賴性,挑戰(zhàn)了傳統(tǒng)決策模型的解釋力。為了更好地理解這一現(xiàn)象,研究團隊借鑒了資源理性理論,將認(rèn)知加工建模為有限通道中的信息傳輸過程,并提出了一種名為“可組裝的資源理性模塊”(Assemblable Resource-Rational Modules, ARRM)的計算框架。該框架明確界定了資源理性模型的各個模塊(如認(rèn)知資源、先驗信息、編碼與解碼機制),使得研究者能夠分析多種環(huán)境因素(如刺激分布和獎勵)對資源分配的聯(lián)合影響,并整合不同假設(shè)構(gòu)建新的資源理性模型。
在該框架下,研究團隊檢驗了兩種關(guān)鍵假設(shè):
-
理性疏忽假設(shè):大腦在資源有限的情況下,會根據(jù)潛在獎勵調(diào)整對概率的認(rèn)知資源分配。在評估較高價值的賭注時,人們會投入更多認(rèn)知資源,做出更精確的估計。
-
結(jié)構(gòu)先驗假設(shè):長期經(jīng)驗塑造了人們對概率和價值之間關(guān)系的先驗信念,“風(fēng)險越高,回報越大”。因此人們可能會利用價值與概率之間的關(guān)聯(lián)進行輔助決策。
研究團隊通過分析兩個不同任務(wù)范式下的新數(shù)據(jù)和已發(fā)表數(shù)據(jù),驗證了ARRM框架的有效性。結(jié)果顯示,基于有限理性假設(shè)的模型成功復(fù)現(xiàn)了“花生效應(yīng)”的兩個關(guān)鍵特征,并在擬合人類決策行為方面優(yōu)于以往的模型。這一發(fā)現(xiàn)表明,人類決策中的異?,F(xiàn)象并非單純的認(rèn)知缺陷,而是大腦在資源有限條件下進行優(yōu)化的結(jié)果。
圖1:ARRM框架示意圖,展示了不同資源理性模塊的組裝與交互過程
張航課題組已畢業(yè)的博士生盧義龍博士(現(xiàn)為北京通用人工智能研究院研究員)為本文第一作者,博士生陸楊帆為第二作者,已畢業(yè)的博士生任祥娟博士(現(xiàn)為德國馬普人類發(fā)展研究所和漢堡大學(xué)博士后)為第三作者,張航研究員為通訊作者。本研究獲得科技創(chuàng)新2030-“腦科學(xué)與類腦研究”重大項目、國家自然科學(xué)基金委及北大-清華生命科學(xué)聯(lián)合中心的資助。
原文鏈接:Lu, Y.-L., Lu, Y.-F., Ren, X., & Zhang, H. (2025). Exploring the bounded rationality in human decision anomalies through an assemblable computational framework. Cognitive Psychology, 156, 101713. https://doi.org/10.1016/j.cogpsych.2025.101713
2025-02-06