警惕心理学研究中的统计误用论文范本
1从赌徒的谬误谈起
首先让我们来看一个有趣的例子:一名赌徒在打赌硬币是正面朝上或是背面朝上时的情景。如果硬币正面朝上或朝下确实是随机的话,那么该名打赌者在任何一次压注时赢的概率都是0.5。假设这个人接连赌了5次,每次他都赌硬币正面朝上,而每次结果却都是背面朝上。现在他要赌第6次了,他该赌正面朝上还是背面朝上呢?或者说这时硬币正面朝上的概率大还是背面朝上的概率大呢?显然,投掷硬币时连续5次背面朝上是很不寻常的,这样的事件发生的概率非常低,赌徒注意到了这一点,所以,在下一次压注时,他加大了筹码,依然赌了正面向上,在硬币连续5次背面朝上后,他愈发相信硬币将正面向上了。结果很不幸,这位打赌者又一次输了。打赌者的错误就在于对概率规律的应用,一枚真的硬币应该有一半的时候正面朝上,这些规律只有在无数次大量的事件后才可能成立。对于很少的尝试次数而言,这些规律不适用。那名赌徒所忽略的是,每次硬币投掷都是一个独立事件,前面抛掷中发生的情况对接下来将要发生的事件没有任何影响。其实,赌徒对于第6次的尝试不会比前面的5次更有把握。正面朝上的概率依然没变。从某种程度上讲,赌徒的错误是很自然的事,他们确实是依据正确的概率规律所作的结论,经过大量的投掷,对一面真正的硬币而言,的确有50%的结果是正面向上,错就在把适用于大量事件发生时才有效的规律运用到了很少的事件上。在6次投掷中全部正面朝上或全部背面朝上并不是绝对不可能,因为概率还没有小到可以忽略不计。赌徒的谬误同样可能发生在心理学研究中。
科学心理学的目的在于理解人们的所思所想。为了达成此目的,心理学工作者收集信息和提供理论解释时使用的是大量的完备技术。正是对这些技术的恰当运用和对所得数据的合理分析构成了科学心理学的支柱。科学方法在心理学研究中的作用是显而易见的。因为科学心理学强调经验观察,而只有科学方法所确立的信念才是建立在经验观察之上,其他方法所确立的信念都不是建立在经验基础上的。经验观察的正确方法包括收集数据的科学程序和分析数据的科学程序,因而对数据加以分析的程序——统计的使用和理解在心理学研究中就变得非常关键和重要的。正如Wells所言:统计思维的能力有朝一日将如同阅读与书写的能力一样,成为一名合格公民的必须[1]。但是在心理学研究中存在着大量统计误用和乱用的现象,其原因是多方面的:有时仅仅是研究者出于某种目的和需要,有时是对统计学本身理解得不透彻、不深入,有时则是由于统计学本身的逻辑性造成的。统计在心理学研究中的重要性不能成为我们在任何时候任何场合可以误用或乱用统计学的理由。如果不对这些现象作深入的剖析,如果容忍这样的错误一犯再犯,那么统计学在心理学研究中的作用越大,造成的后果也就越严重。甚至可能为阻碍心理学的发展。因此要警惕心理学研究中的各种统计误用和乱用的现象。应该使自己在从事心理学研究时不会因为不小心而落入统计学的陷阱,也不人为地为别人设计统计学陷阱,同时在阅读他人的研究报告时也要注意不落入别人设下的统计学陷阱。本人把该文定名为警惕心理学研究中的统计学误用,其用意也正因为此。
2心理学研究中常见的统计误用
统计的方法是如此地有用,以至于有时我们似乎可以借助统计的方法使任何的观点站住脚。许多人都用统计来支持他们各自的观点。难怪有人这样说,世界上有3种谎言——谎言、该诅咒的谎言和统计。统计会说谎吗?其实统计本身并不会说谎,但它们却可以被人利用而给人以误导。以下是本人认为容易发生在心理学研究中的一些统计误用和乱用现象。
2.1小或有偏样本的使用
在心理学研究中,我们希望利用统计分析推论出普遍的结论,因此我们常常使用大样本的研究范式。在大样本研究范式里,有非常多的被试,因而任何一个不寻常的参与者都不会对结果形成多大影响,这样我们就可以得到一个相对普遍的结论。大样本研究设计已经成为心理学研究的一个标准。因此取样问题是心理学研究中一个非常重要的问题:我们在对数据作统计分析时就要想一想这些数据是怎么得来的,它的取样合理吗?所有的统计分析都是建立在数据的取得是合理、正确的前提下,如果取样不合理,无论多么高深和精美的统计方法都是无计于事的。合理的样本、准确的测量是使统计结论正确可靠的前提。但我们在进行研究时,有意无意地,在取样的合理性问题上总会打折扣。下面两种取样的问题在研究中就经常会发生:(1)样本过小;(2)有偏样本的使用。许多广告就会用小样本或有偏样本来误导消费者,比如说在电视上有一位明星说他喜欢喝某一品牌的饮料。广告商这样做的目的就是要给大家一个印象,因为这位明星喜欢这种品牌的饮料,所以所有的人(总体)也会喜欢它。而回归假象效应这一现象也说明了有偏样本的使用会导致我们得出错误的结论。所谓回归假象是指向平均数的回归,当我们从总体中挑选出极端分数组进行重测时,第二次测得的分数更接近于整个总体的平均数。我们在研究中经常会使用匹配技术,这时就可能有回归假象效应存在。如果在第一次测验的基础上对两组进行匹配,倘若研究者从通常做得很差的组中挑出高分者,从通常做得很好的组中挑出低分者,即使没有给予两组不同的实验处理,研究者仍可以预期他们在第二次测验中得分会很不同,其原因仅仅是因为向平均数回归。这方面一个典型的例子就是20世纪60年代在美国的一个“领先计划”研究。因此,无论何时你自己在进行研究和阅读别人的研究报告时,你都要问两个有关抽样的问题:(1)样本有多大?(2)样本是如何被选中的?
2.2在统计学的基础:概率的理解上存在偏差
应用于心理学研究中的定量研究方法大部分是基于概率理论之上的,概率是统计学的基础。我们借助于概率达到对未来的预测。如气象学家会说,明天有80%的几率会下雨,或有20%的可能会下雪。如我们前面提到的赌徒的例子。但倘若我们对概率的理解不透彻,就有可能犯错误,赌徒的谬论就是典型的例子。即使给予事件将要发生的先决条件,我们也很难有绝对的把握认为此事件必然发生,我们所能知道的仅仅是发生机会的比率或是一特定的概率。如根据我们的研究发现具有某一心理特点的人中有90%难以完成某一水准的学业,我们能否就可以据此来预测一个具有这样心理特点的人就不能完成学业呢[2]?显然我们并不能得出这样的结论。基于概率和统计学基础上得出的结论是从总体中得出的,我们在总结自己的某一研究时,总会这样表述:从总体上说,什么是怎么怎么样的……总体上得出的结论在具体用到某一个人身上不能过分绝对化。
鉴于此,人们对大样本研究范式也提出了批评,认为个体的心理活动是非常独特的,这种独特性并非都能作出普遍的概括。经过充分混合个体分数的“统计磨合机”的加工,这些独特性就丧失殆尽了。单靠统计未必就能够抓住事物的本质特征[3]。斯金纳就曾呼吁在操作性研究中使用小样本设计,因为他想强调削弱统计分析的重要性。他认为人们把统计的作用夸大了,统计分析通常被看成了目的而不是帮助实验者推出实验结论的工具。
2.3显著性检验问题
众所周知,统计显著性检验在心理统计学教科书中是作为推断统计的重要组成部分而引进的,它和参数估计组成了推断统计的两大基石[4]。心理学家有一个约定俗成的规定,即如果统计检验的计算表明虚无假设可能正确的概率小于0.05,那么我们就可以拒绝它而接受另一个假设。因为拒绝虚无假设可能犯错误的机会如此微小,我们有理由认为这么做是安全的。简单地就,推断统计被用于确定两种条件的结果差别是由自变量还是随机因素造成的。如果不同实验条件下所得的结果之间差异很大,而且这种差异由偶然因素导致的概率低于0.05时,那么研究者可以排除偶然因素导致该结果的可能性,而认为结果是自变量造成的。心理学家一般都认为推断统计比描述统计更能反映事物的本质,因为它用了概率论的知识,从样本数据到总体性质作了科学的推断。但是简单的显著性检验在应用中却会产生这样或那样的问题。尽管结论在统计上被认为是可信的,但由偶然因素(统计信度仍保持5%的错误概率)、一些未被注意到的混淆因素、或者实验者误差所造成的可能性仍然存在。例如,大多数聪明或大多数低智商的被试碰巧被分在一种条件中。尽管这些可能性不太容易出现,但有时它们确实发生了。
不少人对显著性检验存在误解,误认为经过显著性检验后其科学性就得到了保证,自己的观点就万无一失了。但事实上并非如此。近年来,人们对心理学研究中的显著性检验有诸多争议,Cohen在其著名的《地球是圆的(p<.05)》[5]一文中对此进行了列举。有鉴于此,美国心理学会统计推断特别工作小组发表了《心理学杂志中的统计方法——指导方针及其解释》[6]一文,以期引起人们对于显著性检验的思考。流行于研究者间的一句格言是“重复一次抵得上一千次t检验”,这句格言的要旨是许多研究者都相信实验验证要好于应用于初次实验结果的推断统计,这是非常有道理的。
2.4夸大的统计图
统计作为一种工具,往往为受到使用者本人主观意愿的制约。有人曾感叹统计学家会说话。确实,人们在统计指标的选择、统计图表的制作、统计方法的选用上都可能会带有自己的个人目的,具有一定的功利性。这一点可以从下面的例子中可见一斑。有一所高校近3年内因心理问题而被迫中断学业的人数从13增加到17、20人,学校的心理咨询中心为了呼吁人们对大学生心理健康问题的重视,因而想让人们知道该校学生的心理问题正变得越来越严重,单单因心理问题而中断学业的人数就在不断增加,所以他们以年份为横坐标,以心理问题而中断学业的人数为纵坐标绘制了一张统计图,通过把Y轴的标尺拉得很短,使学校心理问题而中断学业的人数的增加看上去很突出。而学校当局则往往不愿意这样来宣传自己的学校,于是根据同样的数据可以绘制了另外一张统计图,他们通过把Y轴的标尺拉得很长,给人以学校因心理问题而中断学业的人数相当稳定的感觉。两张图显示的结果都是正确的,但要说明的问题却大相径庭。
本文标签:
[!--temp.ykpl--]