信号检测论——评价法

信号检测论——评价法信号检测论——评价法姓名（上海师范大学应用心理学，上海，201418）摘要本实验采用信号检测论中的一个基础实验程序——评价法，考察男女两名不同被试对汉字再认的准确性和判断标准。实验发现：（1）击中率和虚报率会随先定概率的提高而增加；（2）被试一的判断标准β相较于被试二的判断标准β更为严格，不易将测验项目判断为目标项目；（3）在同一先定概率下，被试一的辨别力d’要大于被试二，而被试一的判断标准β要小于被试二。关键词信号检测论；评价法；ROC曲线；辨别力d’；判定标准β 1 导言传统心理物理学创造性的提出...

信号检测论——评价法姓名（上海师范大学应用心理学，上海，201418）摘要本实验采用信号检测论中的一个基础实验程序——评价法，考察男女两名不同被试对汉字再认的准确性和判断标准。实验发现：（1）击中率和虚报率会随先定概率的提高而增加；（2）被试一的判断标准β相较于被试二的判断标准β更为严格，不易将测验项目判断为目标项目；（3）在同一先定概率下，被试一的辨别力d’要大于被试二，而被试一的判断标准β要小于被试二。关键词信号检测论；评价法；ROC曲线；辨别力d’；判定标准β 1 导言传统心理物理学创造性的提出“阈限”概念来反映心理量和物理量之间的对应关系，并将阈限定义为能引起心理感受（绝对感受或差别感受）的物理刺激强度。但在实际研究中，非感觉因素对阈限测量的影响往往是难以排除的。信号检测论挑战了传统的阈限定义，以一个“反应阈限”来取代感觉阈限作为被试报告有无刺激的分界点。具体地说，信号检测论认为对信号的知觉包括感觉和决策两个过程。被试先根据所侦测到的信号强度产生相应的心理感受，再将感觉强度与事先确立的判断标准进行比较，当感觉强度超过上述标准时，才会报告刺激或差异的存在，而该报告标准即“反应阈限”。由于能有效分离个体客观的感受性与主观的反应偏向，信号检测论已经成为现代心理物理学总占据主导地位的理论。信号和噪音是信号检测论中最基本的两个概念。在心理学领域，信号检测论所指的信号可以理解为刺激。而噪音就是信号所伴随着的背景。信号检测论假定，噪音总是存在于系统之中，无法消除——无论这个系统是一个收音机，还是人的神经系统。信号检测论有三个基础的实验程序：有无法、迫选法和评价法。在评价法中，先定概率或/和奖惩办法恒定时，根据确信程度将回答分为n个评价等级，即让感觉强度划归到上述n个等级，从而要求被试同时考虑（n-1）个判断标准。因此需对每个判断标准，分别极端感受性和反应倾向的指标。对于最严格的判断标准以下的各个标准所对应的击中率，都应是该标准以上各等级的击中率的累积。因为若能根据某一感觉强度百分之百地确信“SN刺激存在”，在较为宽松的标准（如80%）下一定也能据此确信“SN刺激存在”。同理，各标准在的虚惊率都应是该标准以上各等级的虚惊率的累积。将击中概率作为虚惊率的函数，根据不同判断标准对同一信号的反应而得到的曲线，就是接受者操作特征曲线，简称ROC曲线。ROC曲线的曲率（即由对角线到曲线中点的距离）约等于辨别力指标d’。ROC曲线上任意一点的切线斜率，即该点的决策标准β。本实验考察被试的再认能力，在再认实验中，指标d’用于衡量被试的再认辨别力，d’越大，表示再认能力越高；指标β用于反应标准的评估，β越大，表示判断标准越严格，即被试不轻易将测验项目判断为目标项目；β越低，表示判断标准越宽松，即被试容易将测验项目判断为目标项目。对于项目的再认记忆是再认研究的主要课题之一，运用评价法来得出对于项目再认记忆的ROC曲线时，不仅要求被试对呈现的测验项目进行新（信号）旧（噪音）判断，还要求被试给出对上述再认判断的肯定程度。例如，同一种先定概率和奖惩办法下，若将被试的反应分为5种（肯定看过；可能看过；不能确定；可能没看过；肯定没看过），则要求被试确立4种确定程度不同的判断标准。本实验中，我们将选择汉字作为实验材料，运用评价法（5点评分）来进行新旧再认测验，绘制项目再认记忆的ROC曲线。目的在于掌握评价法和ROC曲线的绘制方法，并了解如何应用ROC曲线来检验再认记忆的模型。 2 方法 2.1被试两名上师大心理系本科生，一男一女 2.2仪器与材料仪器：计算机及PsyTech心理实验系统软件材料：信号汉字100个，噪音汉字100个 2.3实验程序登录并打开PsyTech心理实验软件主界面，选中实验列表中的“信号检测论（评价法）”。双击呈现实验简介，点击“进入实验”到“操作向导”。实验者可进行参数设置：改变刺激呈现时间等参数或默认参数。点击“开始实验”呈现本实验指导语。第一次指导语是：“这是一个用评价法进行的信号检测论实验。实验开始后屏幕会逐个呈现一系列汉字，请你认真看并尽量记住这些汉字。当你明白了上述指导语的意思后，就点击下面的‘正式实验’按钮‘开始’。”被试按任意键后，实验先呈现100个作为信号的汉字，被试只看并记忆，不作其它反应。呈现完毕，点“确定”再次出现指导语。第二次指导语是：“下面屏幕将再次逐个呈现一系列汉字。其中一半是你刚才看过的，一半是没有看过的。请你对这些呈现的汉字作出判断，是否你刚才看过的，并用鼠标对你判断的肯定程度作等级评价。如果100%肯定看过，请点击“1”；如果觉得可能（75%肯定）看过，请点击“2”；如果觉得不能确定（50%肯定）看到过，请点击“3”；如果觉得可能（25%肯定）没看过，请点击“4”；如果100%肯定没有看过，请点击“5”。当你明白了上述实验的步骤后，就请点击下面的“正式实验”按钮“开始”。” 将另外100个作为噪音的汉字与原来呈现过的汉字混合后再次随机呈现。被试按照实验指导语要求对每个呈现的汉字作出是“信号”还是“噪音”的判断，并要求被试按五个等级评价。实验结束，点击结束提示语中的确定可直接查看结果，也可以换被试继续实验，以后在主界面“数据”菜单中查看。 2.4数据处理采用了EXCEL 2010进行数据处理 3 结果 3.1 描述性统计结果表1 被试一（女）五种评价等级下对刺激的判断判断标准肯定看过可能看过不能确定可能没看过肯定没看过信号（SN） 0.59 0.08 0.02 0.09 0.22 噪音（N） 0.09 0.01 0.01 0.04 0.85 被试一对判断为“肯定看过”的信号汉字的概率为0.59，噪音汉字的概率为0.09；被试一对判断为“可能看过”的信号汉字的概率为0.08，噪音汉字的概率为0.01；被试一对判断为“不能确定”的信号汉字的概率为0.02，噪音汉字的概率为0.01；被试一对判断为“可能没看过”的信号汉字的概率为0.09，噪音汉字的概率为0.04；被试一对判断为“肯定没看过”的信号汉字的概率为0.22，噪音汉字的概率为0.85。表2被试二（男）五种评价等级下对刺激的判断判断标准肯定看过可能看过不能确定可能没看过肯定没看过信号（SN） 0.61 0.04 0.08 0.05 0.22 噪音（N） 0.23 0.02 0.07 0.06 0.62 被试二对判断为“肯定看过”的信号汉字的概率为0.61，噪音汉字的概率为0.23；被试二对判断为“可能看过”的信号汉字的概率为0.04，噪音汉字的概率为0.02；被试二对判断为“不能确定”的信号汉字的概率为0.08，噪音汉字的概率为0.07；被试二对判断为“可能没看过”的信号汉字的概率为0.05，噪音汉字的概率为0.06；被试二对判断为“肯定没看过”的信号汉字的概率为0.22，噪音汉字的概率为0.62。 3.2 两名被试在四种判断标准下的击中率和虚报率表3 被试一（女）四种判断标准下的击中率和虚报率判断标准 C1 C2 C3 C4 击中率 0.59 0.67 0.69 0.78 虚报率 0.09 0.10 0.11 0.15 被试一在判断标准C1下的击中率为0.59，虚报率为0.09；在判断标准C2下的击中率为0.67，虚报率为0.10；在判断标准C3下的击中率为0.69，虚报率为0.11；在判断标准C4下的击中率为0.78，虚报率为0.15。表4被试二（男）四种判断标准下的击中率和虚报率判断标准 C1 C2 C3 C4 击中率 0.61 0.65 0.73 0.78 虚报率 0.23 0.25 0.32 0.38 被试二在判断标准C1下的击中率为0.61，虚报率为0.23；在判断标准C2下的击中率为0.65，虚报率为0.25；在判断标准C3下的击中率为0.73，虚报率为0.32；在判断标准C4下的击中率为0.78，虚报率为0.38。 3.3 两名被试的辨别力d’和判定标准β 表5 被试一（女）四种判断标准下的辨别力d’和判断标准β 判断标准 C1 C2 C3 C4 辨别力d’ 1.568 1.721 1.722 1.809 判断标准β 0.844 0.803 0.793 0.746 被试一在判断标准C1下的辨别力为1.568，判定标准为0.844；在判断标准C2下的辨别力为1.721，判定标准为0.803；在判断标准C3下的辨别力为1.722，判定标准为0.793；在判断标准C4下的辨别力为1.809，判定标准为0.746。表6被试二（男）四种判断标准下的辨别力d’和判断标准β 判断标准 C1 C2 C3 C4 辨别力d’ 1.018 1.060 1.081 1.078 判断标准β 0.852 0.835 0.806 0.793 被试二在判断标准C1下的辨别力为1.018，判定标准为0.852；在判断标准C2下的辨别力为1.060，判定标准为0.835；在判断标准C3下的辨别力为1.081，判定标准为0.806；在判断标准C4下的辨别力为1.078，判定标准为0.793。 3.4 根据四对击中率和虚报率的数值，两名被试的ROC曲线图由图可看出，被试一（女）的击中率和虚报率都随先定概率的增大而增大。由图可看出，被试二（男）的击中率和虚报率都随先定概率的增大而增大。 4 讨论 4.1 讨论如果要比较7岁和10岁儿童对汉字记忆的能力，应如何用评价法进行实验；由于7岁和10岁的儿童认识的汉字数量及其有限，所以首先在设置汉字这一环节要特别注意，一定要选用他们学过并且记住的汉字，可以以他们的语文书为参考。而且儿童的记忆容量比成人的要小，所以在信号和噪音设置的数目上要有所减少。实验的评定等级可以还设为五个等级：肯定看过，可能看过，不能确定，可能没看过，肯定没看过。但是实验的指导语一定要简单易懂，并且主试要保证让儿童充分理解实验过程之后，这样儿童做出来的实验结果才有价值。 4.2 讨论评价法与有无法的主要不同之处；有无法实验需要事先确定SN刺激和N刺激，以及先定概率；然后随机呈现SN和N，并要求被试报告S刺激出现与否。针对一种先定概率或奖励办法，这种方法只要求被试确立一个刺激标准并据此报告：刺激引起的感觉强度高于判断标准则报告“有”，刺激引起的感觉强度低于判断标准则报告“无”。因此有无法会损失大量信息，如被试对上述反应的确信程度等。而在评价法实验中，既要求被试回答呈现的刺激是否信号，又要求被试说明对于回答的确信程度，因此用评价法进行一轮实验，就可以获得有无法多轮试验才能得到的结果。 4.3 讨论假若本实验的刺激换成图片，推测语词记忆和图片记忆的结果差异，并讨论差异的原因；个人认为，若将实验刺激换成图片，预测被试的再认能力会有所提高，原因在于：被试作为中国人，对于汉字的认识熟悉程度很高，且呈现的汉字刺激都是人们日常熟悉的汉字，极易混淆，如“天”与“大”，“土”与“士”的混淆，让被试不易分辨，哪些刺激是实验中呈现的刺激，哪些是本身就记住的语词，所以可能会导致被试在做出“不能确定”的判断增多；而对于图片而言，给被试呈现的图片，对被试来说，都是新刺激，所以当被试看过呈现的图片后，熟悉感就会提升，将这些图片放在陌生图片中时，预测被试可能会很快分辨出是否为刚刚的熟悉图片，所以，可能在做出“肯定看过”和“肯定没看过”的判断增多，在做出“不能确定”的判断减少。

                    本文档为【信号检测论——评价法】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

信号检测论——评价法

你可能还喜欢