逻辑学视野中的认知研究
上QQ阅读APP看书,第一时间看更新

第二节 贝叶斯推理中的概率信息

人们在现实生活中面临的绝大多数决策情境都存在或多或少的不确定性因素,贝叶斯推理就是人们处理这种不确定情境的一个重要方式。概率,特别是主观概率在贝叶斯推理中扮演着重要角色,因为现实世界中存在的这些不确定性因素或随机事件通常都不能重复发生,也就不满足随机试验的条件,因而无法用经典概率理论来刻画,其发生概率只能由个体的主观判断来确定。在这种决策情境下,人们通常会根据问题情境和相应策略给出主观概率,并据此进行推理判断。艾森克(Eysenck)等在《认知心理学》(第四版)中写道:“由于我们的很多判断都是以不确定性或者模糊信息为基础的,所以我们处理的必然是概率而不是确定性。……正是因为这些不确定性,对决策不管是否涉及最佳选择的解释常常强调主观概率的重要性。”[34]“主观概率判断指的是人们根据已有的知识和可获得的证据对事件发生概率进行主观估计的过程,它是人们对事物做出最终判断和决策的依据之一。”[35]主观概率判断是众多判断现象里的一种,它是贝叶斯推理中的一个重要环节,或者说它就是一种贝叶斯推理。

一 贝叶斯推理中的三种概率

贝叶斯推理涉及三个概率信息的加工:基础概率、击中率和误报率(也有文献称之为虚报率)。关于概率信息在贝叶斯推理中的作用,主要存在以下几种不同看法。

爱德华兹等人(Edwards, etc, 1968)认为,在面对贝叶斯推理问题时,人们的推理过程基本上遵循贝叶斯规则,只是其推理结果更偏向于保守,所以,人是保守的贝叶斯主义者。斯洛维克等人(Slovic, Fischoff & Lichtenstein, 1977)的研究结果进一步支持了这一观点,他们的研究发现,人们的推理结果和按贝叶斯规则计算的结果在肯定和否定的方向上是一致的,只是人们的推理结果更为保守。因此,他们认为,在贝叶斯推理过程中,人们可以综合考虑各个概率信息,然后按照贝叶斯规则进行精确的计算,最终得出准确的估计值。[36]

凯尼曼和特沃斯基(Kahneman & Tversky, 1972)率先发现了“基础概率忽略”(base-rate neglect)现象。之后,关于基础概率作用机制的争论就一直没有停止过。大致可分为以下三种观点:(1)过分重视基础概率。爱德华兹等人(Edwards etc, 1968)发现,人们对基础概率并非熟视无睹,反而格外重视。因为实验结果显示,当“基础概率”很低而“击中率”较高时,被试给出的估计值甚至比根据贝叶斯公式计算的标准值更低,由此,他们认为,人们其实是“保守的贝叶斯”。(2)完全忽视基础概率。凯尼曼和特沃斯基(Kahneman & Tversky, 1972)在“出租车问题”和“律师—工程师”问题的研究中发现,人们进行直观推理的结果与贝叶斯法则有很大的差距,人们完全忽视基础概率,主要根据击中率来判断。近年来,有学者从双加工的角度对此做了更为细致的研究,结果表明,基础概率总是被忽略或不受重视的原因在于人们在推理过程中仅仅运用了直觉系统,并没有动用分析系统的缘故(Pennycook, Trippas, Handley &Thompson, 2014)。(3)考虑了基础概率,但低估了其作用。许多研究表明,人们在后验概率的估计中,确实没有足够重视基础概率,只是低估了其作用(Koehler, 1996; Evans, 2002;杨莉,2007)。麦克纳和菲尼(McNair &Feeney, 2015)进一步指出,人们在进行概率推理的时候,确实低估了基础概率的作用,但这取决于被试的知识构成,对于熟练掌握概率和统计基本概念的个体而言,澄清各个外显信息的因果关系便能大大改善人们的贝叶斯推理成绩。[37]张向阳(2003)做了进一步的研究,通过控制题干中基础概率的高低水平和不同位置发现,基础概率的高低(有无)对被试的后验概率估计存在影响,在推理过程中,被试并没有完全忽视基础概率,但明显低估了其作用。此外,他还发现了有趣的“跷跷板”效应,即当基础概率较低时,被试倾向于对后验概率值进行高估,而基础概率较高时,被试则倾向于对后验概率值进行低估。通过对后验概率估计值和反应时间等指标进一步分析发现,被试在进行概率估计时,首先考虑的是击中率信息,其次是基础概率,最后是误报率。基于此,张向阳对贝叶斯推理问题中的三个外显信息在后验概率估计中的重要程度做了如下排序:击中率>基础概率>虚报率。[38]唐源鸿和史滋福(2011)同时操纵基础概率和击中率的水平,通过对后验概率估计值进行分析发现,对于基础概率和击中率,任何一者的值一旦发生变化都会起作用。进一步分析表明,在不同的推理情境中,击中率所起的作用体现出明显的差异性:在低基础概率的中彩情境中,开始阶段,被试的后验概率估计值呈现出与击中率变化相一致的趋势,集中率增高,被试的后验概率值也不断增高;但之后却发生反转,当击中率的值上升到一个高度后,被试的后验概率估计值却急转直下,这种发展的趋势和走向就好像一个倒立的英文字母“V”,研究者把之称为“自击中率参照抑制”现象。之所以出现这种现象,是由于在该情境中,过高的集中率与我们的日常生活经验相违背,而且随着击中率的增加,这种背离的程度也越大,因此影响了推理者对集中率一直以来的依赖感和认同感。而在高基础概率肝炎情境下却完全不同,由于在人们的习惯性思维中,很多时候都将“阳性”等同于“有病”,因此高击中率水平与我们的日常生活经验是相吻合的,而且击中率水平越高,这种契合的程度就越大,所以,被试的后验概率估计值体现出与击中率完全相一致的变化趋势。[39]

研究表明,在贝叶斯推理的三种概率信息中,基础概率和击中率是两种起主要作用的概率信息(Evans,Handley,Over & Perham,2002),误报率信息对贝叶斯推理的影响不显著(张向阳,2003)。目前,关于基础比率和击中率信息在贝叶斯推理中的作用仍存在争议,但研究表明,不管被试的推理结果正确与否,基础概率和击中率都会对被试的推理过程都会产生不同的影响,而且,基础概率和击中率信息共同起作用。[40]

二 贝叶斯推理中的概率格式

20世纪70年代初,贝叶斯推理中的“基础概率忽略”现象被广泛研究和描述。凯尼曼和特沃斯基(Kahneman & Tversky, 1972, 1973, 1982)的研究结果一致认为,人们不能加工包括贝叶斯推理在内的所有概率问题。而吉格伦泽和霍夫拉吉(Gigerenzer & Hoffrage, 1995)关于变换概率信息数据格式的研究结果却有力地驳斥了这一观点。他们指出,个体并不是不能加工概率信息,仅仅是由于通常情况下概率信息呈现的形式(百分比)不适合人们加工而已。因为在人类历史长河发展的初期便是用自然频数进行计数和计算的,自然频数更适合人类的思维。因此,他们预测,只要把以标准概率呈现的概率信息变换成自然频数,那么,个体的贝叶斯表现便可以大大地改善和提升。这从他们的实验结果中也得到了验证。他们采用文本格式,使用15个与乳腺癌问题相类似的问题(以标准概率和自然频数两种格式呈现)作为实验材料,以回答的正确率为因变量统计指标,结果显示,被试在自然频数格式下的推理成绩(46%)显著好于在标准概率格式下的推理成绩(16%)(Gigerenzer & Hoffrage, 1995)。斯洛曼和奥弗(Sloman & Over etc, 2003)把这种在自然频数条件下贝叶斯推理成绩得到改善的现象称为贝叶斯促进效应(Bayesian Facilitation)。科思迈德和图柏(Cosmides & Tooby etc, 1996, 1998)的研究也获得了与之相一致的结果。到目前为止,变换概率表征确实可以大大地促进被试的贝叶斯表现,在这一观点上已毋庸置疑(廖紫祥,2015: 6—7)。对于这种促进效应的解释,学者们基于各自的实验结果,从不同的方面提出了不同的解释,其中影响最大的当属生态理性框架(Ecological Rationality Framework, ERF)和嵌套集合假设(Nested Sets Theory, NST)两种观点。[41]

吉格伦泽和霍夫拉吉(Gigerenzer & Hoffrage, 1995)率先从人类进化的角度对此进行了阐述。他们认为,人类的思维还没有进化到可以对单个事件的概率(以百分数的形式呈现)进行加工的地步,因为概率不是自然环境的组成部分。相反,自然频数却能与自然环境很好地匹配。科思迈德和图柏(Cosmides & Tooby et al., 1996)在这一观点上走得更远,由于深受马尔(Marr, 1982)和福多(Fodor, 1983)“模块论”观点(人类的思维由执行不同功能的不同模块组成,而且这些模块已高度进化,能独立执行任务)的影响,他们认为,人类的推理任务是由一个高度分化的模块来完成的,该模块能够自动编码自然频数,却不能加工以百分数表示的标准概率信息。后人把以上观点加以总结概括,统一称之为生态理性框架。尽管该理论的支持者在某些观点上的认同程度上不一,但一个核心观点是:人类的推理由一个天生的、高度分化的模块所组织,该模块能够加工以自然频数表示的概率信息但不能加工以百分数表示的标准概率信息,且加工是自动的,不需要认知资源的参与。[42]

另一颇具影响的理论是由凯尼曼和特沃斯基(Kahneman & Tversky, 1982)提出的嵌套集合理论,并获得众多学者的有力支持(Sloman, Over, Slovak & Stibel, 2003; Barbey & Sloman, 2007;史滋福,邱江,张庆林, 2006)。他们认为,造成标准概率格式比自然数格式更困难的原因不是由于标准概率和自然频数之间的差别,真正对推理改善有效的是集合嵌套关系的形象化,因为个体在自然频数的条件下更容易形成清晰的子集心理模型。例如,在经典乳癌问题中,击中的数目嵌套在患有癌症的数目当中,而误报数嵌套在健康妇女的数目之中。当集合之间关系非常清晰的时候,正确的答案便相对容易计算出来(击中数除以击中数和误报数之和)。在此基础上,巴比和斯洛曼(Barbey & Sloman, 2007)把嵌套集合假设放在双加工的框架下来解释贝叶斯促进。双加工理论认为,人类推理由两个不同的系统协调来解决,一个是启发系统,另一个是分析系统。启发系统的加工过程是自动的,不需要意识的参与,也不需要付出任何努力。而分析系统的加工需要意识的参与,与个体的认知资源如流体智力和工作记忆密切相关。在贝叶斯推理过程中,启发系统先产生一个未完成的答案,然后,该答案进入意识层面,交由分析系统来执行。之所以自然频数条件下的推理成绩更好,是因为自然频数能够激发嵌套集合表征,进而触发分析系统动用执行资源来计算正确答案;而在标准概率条件下的集合表征却很模糊,没能触发分析系统。[43]

上述两种理论假设的最大区别在于:可获得的执行认知资源的作用。生态理性框架认为:人们在自然频数条件下表现更好是因为一个高度分化的模块自动加工自然频数。由于这个模块的功能与认知资源无关,因此认知能力和贝叶斯推理成绩两者之间没有任何关联,即使是低认知能力的个体在自然频数的条件下也能够获得正确的答案。嵌套集合理论在双重加工模型的基础上提出,使得问题集合结构清晰的格式将会触发分析系统。该系统将使用执行认知资源来计算正确的答案。因此,人们在自然频数条件下表现更好的原因是他们能够动用自己的分析能力。这也就是说,在激起清晰嵌套集合表征的条件下,被试的推理成绩应该与个体的一般认知能力有关联:认知资源越多,越有可能获得正确答案。相反,在嵌套集合表征比较模糊的条件下,问题格式就不能激发被试的分析系统。[44]

三 贝叶斯推理中的概率呈现方式

在实验室环境下,被试所接收到的绝大部分概率信息都是以整理收集或记录好了的文本数据来呈现的。但在日常生活中,我们有时也可以从自己经历过的事件中来主动获取这类概率信息。基于此,有的学者认为,概率信息的呈现方式也许可以解释其中的某些现象。比如洛维特和舒恩(Lovett &Schunn, 1999)借鉴“建筑棒任务”的方法令被试在实验中主动获取贝叶斯问题中的各类概率信息,然后再来估计题目的后验概率值。虽然结果不尽相同,但大部分的研究结果均一致表明,被试是没有忽视基础概率的。这也说明,概率信息的呈现方式对被试做出后验概率估计是存在影响的,具体而言,与被动地从事先提供的文本材料中获得的基础概率信息相比,个体对通过自身的实践经验获得的基础概率信息更为敏感,进而使得基础概率在推理的过程中起到更显著的作用和效果。[45]

特沃斯基和凯勒(Tversky & Koehler, 1994)等提出的支持理论(support theory)是关于主观概率理论的一个新理论。该理论认为,任何既定事件发生的概率或多或少取决于事件的描述方式。他们认为,“判断事件发生的概率与事件本身无关,而与事件的表述方式有关……事件发生的概率取决于它表述的明确程度。”(Tversky&Koehler, 1994: 548)也就是说,人们对于同一事件的不同描述能够产生不同的判断。[46]

艾森克和基恩(Eysenck & Keane)的《认知心理学》(第四版)指出:“支持理论最引人瞩目的预测是:表述明确的事件比表述不明确的事件在主观上有更高的发生频率。这一预测的主要依据有以下两个方面原因:(1)事件表述明确可以使人们注意事件原来表述不明确的方面。(2)记忆的局限性意味着,如果没有提供信息,人们是记不住所有相关信息的。”[47]

在约翰逊等人(Johnson、Hershey、Meszaros & Kunreuther, 1993)的研究里,同样证明了不同描述方式对主观概率判断的影响。该研究给被试提供两份虚拟的健康保险由其选择,一份的内容是负责赔偿任何原因导致的住院治疗费用,另一份的内容是赔偿因任何疾病和事故导致的住院治疗费用。结果发现,被试都愿意为第二份保险付更多的保金。研究者们认为这可能是因为第二份保险明确提到了疾病和事故,因而凸显住院治疗的必要性,从而提高了自身被保险的价值。[48]

研究发现,这种因为更明确的描述方式导致主观概率判断被高估的现象不但发生在普通人身上,也同样发生在一些专家身上。雷德尔迈尔等(Redelmeier, Koehler, Liberman & Tversky, 1995)向斯坦福大学的医生们描述了一位妇女的腹痛症状,要求一半医生判断,该妇女得胃肠炎和宫外孕的概率分别为多少,得其他病的可能性为多少。要求另一半医生分别判断包括胃肠炎和宫外孕在内的5种疾病的概率以及其他病的可能性。结果发现,前一半的医生判断该妇女得其他病的概率(除肠胃炎和宫外孕之外)为0.50,后一半的医生判断该妇女得其他病的概率(不包括胃肠炎和宫外孕,但包括另三种要求分别诊断的疾病)为0.69。这表明,即使对专家来说,明确表述的事件的主观概率也比较高。[49]