购买

¥12.0

加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 心理测量学.ppt

心理测量学.ppt.ppt

心理测量学.ppt

Z视界
2019-03-17 0人阅读 举报 0 0 0 暂无简介

简介:本文档为《心理测量学.pptppt》,可适用于高等教育领域

心理测验学中国古代的心理测验思想在多年前我国古代教育家孟子通过自己的观察把学生分为中人中人以上和中人以下这实际上相当于现代测量学中的命名量表和次序量表。他还说ldquo权然后知轻重度然后知长短。物皆然心为甚。rdquo这明确指出了心理能力和心理特征与物理现象一样具有可测量的特性。公元世纪初叶南朝人刘勰(xie)在《新论middot专学篇》中提到ldquo使左手画方右手画圆无一时俱成rdquo其原因是ldquo由心不两用则手不并用也rdquo。他不仅观察到左手画方右手画圆不易实现这种现象而且认为其原因是一心不能二用这恐怕应算是世界上最早的ldquo分心测验rdquo。南北朝时代学问最通博、最有思想的学者颜之推十分关心儿童的心智发展并对民间有关周岁试儿的实践加以总结。他在《颜氏家训middot风操篇》中对此做了详细记载:ldquo江南风俗儿生一期(指一周岁)为制新衣舆浴装饰。男则用弓矢纸笔女则刀尺针缕并加饮食之物及珍宝服玩置之儿前观其发意所取以验贪廉智愚名之为试儿。rdquo这种针对婴儿期感觉运动发展的特点以实物为材料的近似标准化的测试方法可以说是年格塞尔(AGesell)婴儿发展量表的前导。中国民间广泛流行的ldquo七巧板rdquo在某些方面可作为创造力测验的一种方法。七巧板又称益智图它的操作属于典型的发散思维活动操作的成果是形象转化值得高度重视。九连环是另一种中国民间的智力游戏其设计之巧妙也可以和现代的魔方、魔棍相媲美。七巧板、九连环等后传入西方受到推崇如著名心理学家武德沃斯(RSWoodworth)就把九连环称作ldquo中国式的迷津rdquo七巧板则被称为ldquo唐图rdquo(Tangram)即ldquo中国的图板rdquo之意。七巧板类型的拼图任务现在几乎为当代多数智力测验和创造力测验所使用并且已发展成为标准化的纸笔型测验。隋炀帝大业二年(年)始置进士科是科举制度的开端。经隋唐宋元明至清代科举制度已相当成熟。当时的考试方法主要有:帖经(填补词句中的缺字)、口义(口试)、墨义(笔试)、策问(政事问答)和杂文(即诗赋)等其中科举考试中的帖经和对偶类似于现代西方言语测验中常见的填字和类比。世纪科举制度传入欧洲后很受西方新兴资产阶级的欢迎并用于他们的官吏考试制度中。科举制度作为中国特有的人才选拔方法可谓现代人才选拔制度的滥觞。观察法会谈法测验法心理评估对个体的心理现象作全面系统、深入客观的描述。面相与性格我国元朝王铎所著《写像秘诀》中把人的脸型归纳为八种。ldquo相之大概不外八格:田、由、国、用、目、甲、风、申是也。面扁方为田上削下方为由方者为国上方下大为用倒挂形长为目上方下削为甲扁阔为风上削下尖为申rdquo科学心理测验的产生与发展  首先倡导科学心理测验的学者是英国生物学家和心理学家高尔登(FGalton)。提出人的不同气质特点和智能是按身体特点的不同而遗传的。他设计了测量差异的方法。可视为心理测验的开端。他第一个提出了相关的概念并由他的学生皮尔逊(KPearson)加以发展创立积差相关法使心理测验的信度、效度和进行因素分析成为可能。  促进心理测验发展做出巨大贡献的是美国心理学家卡特尔(JMCattell)。年卡特尔在《心理》杂志上发表ldquo心理测验与测量rdquo一文这是心理测验第一次出现于心理学文献中。 年法国教育部委派许多教育家、医学家和其他科学家组成一个委员会专门研究公立学校中智力落后儿童的教育方法。作为委员之一比内(ABinet)极力主张用一种测验的方法去辨别和发现智力落后的儿童。经过他与助手西蒙(TSimon)的精心研究次年在《心理学年报》上发表了一篇文章题为ldquo诊断异常儿童智力的新方法rdquo在这篇文章中他介绍了一个包括个项目的量表。它是世界上第一个正式的心理测验。 世纪年代是高尔登的十年年代是卡特尔的十年世纪头十年则是比内的智力测验的十年。心理测验的发展史:世纪年代是高尔顿的十年年代是卡特尔的十年世纪头十年是比内的智力测验的十年此后心理测验主要在如下四个方面有发展:操作测验、团体智力测验、能力倾向测验和人格测验。高尔顿的理想卡特尔的研究比奈西蒙智力测验一、什么是测量?  测量三个主要的元素:⑴事物⑵数字⑶法则。 ldquo事物rdquo指的是我们要测量的对象更准确地说就是引起我们兴趣的事物的属性或特征。(心理能力、人格特点等)。  ldquo数字rdquo是代表某一事物或事物某一属性的量。这些数值具有自然数的特点如区分性即就是就是。数也有序列性或等级性如数也具有等距性和和之间的差的绝对值总是相等的。  ldquo法则rdquo代表的是测量所依据的规则和方法。例如用秤量物体的重量依据的是杠杆的原理用温度计测物体的温度。而人的心理特征的测量如智力测验就是根据智力理论编制以得分多少衡量智力水平。  法则有好坏之分使用较好的法则可以得到比较理想的结果而较差的法则所获得的结果则不令人满意。心理现象难以测量是因为我们很难设计清晰而良好的法则。随着人类认识的不断深入测量法则不断完善测量也就越来越精确。关于测量正确的说法是(A)测量就是心理测量(B)就是依据一定的法则用数字对事物加以确定。(C)就是用数字来描述事物的法则(D)就是用一些题目或数字来描述事物的属性二、测量要素测量都具备两个要素:即参照点和单位。㈠、参照点:确定事物量的计算起点就叫做参照点。参照点有两种一种是绝对零点如测量轻重、长度等以零点为参照点。另一种是相对零点如海拔高度就是以东海平面作为测量陆地高度的起点。理想的参照点是绝对零点。但心理测量中很难找到绝对零点多采用人为标定的绝对零点。如智力年龄为实际上指的是零岁儿童的一般智力水平而不能说没有智力。㈡、单位是测量的基本要求单位的种类、名称繁多即使是测量同一事物也可以用许多单位。如时间的单位有秒、分、时、日、月、年等。好的单位必须具备两个条件:一为有确定的意义。二为有相同的价值。一般来说心理测量的单位不够完善即无统一的单位也不符合等距的要求。如智龄是以年龄作为智力的单位因为智力发展的速度先快后慢岁与岁之间的差别明显大于岁与岁之间的差别。三、测量量表测量的本质是根据某一法则将事物数量化即在一个定有单位和参照点的连续体上把事物的属性表现出来这个连续体称为量表。如要测量某事物的属性只要将欲测量的该事物的属性放在这个连续体的适当位置上看它们距参照点的远近便会得到一个测量值这个测量值就是对这一属性的数量化的说明。由于制定量表的单位和参照点不同量表的种类也不同。根据量表的精确程度斯蒂文斯(SSStevens)将测量从低级到高级分成四种水平即命名量表、顺序量表、等距量表和等比量表。㈠命名量表这是测量水平最低的一种量表形式只是用数字来代表事物或把事物归类。.代号mdashmdash用数字来代表个别事物如学生和运动员的编号等。.类别mdashmdash用数字来代表某一具有某一属性的事物的全体即把某种事物确定到不同性质的类别中如用代表男用代表女或用不同数字代表不同职业等。在命名量表中数字只用来作标记和分类而不能作数量化分析既不能说ABC也不能做加、减、乘、除的运算。㈡顺序量表比命名量表水平高其中的数字不仅指明类别同时指明类别的大小或含有某种属性的程度如学生的考试名次、工资级别、能力等级、对某事物的喜爱程度等。这里的数字包含有数量关系代表符号是ldquordquo如ABC等主要用于分等或排出顺序。在顺序量表中既无相等单位又无绝对零点数字仅表示等级并不表示某种属性的真正量或绝对值。如米短跑比赛中李平得了第一名王红得了第二名这样我们可以知道李平排在王红的前面但是我们不知道李平比王红快多少。㈢等距量表量表不但有大小关系而且具有相等的单位其数值可以相互做加、减运算但没有绝对的零点因此不能做乘、除运算。等距量表的数值加或减一个常数或用一个常数乘或除不会破坏原来数据之间的关系因此一个量表上的数值可以转换为另一个具有不同单位的量表上的数值而且几个不同单位的数值可以转换到一个量表上以便于比较。㈣等比量表最高水平的量表既有相等单位又有绝对零点。此种量表在物理测量中比较常见长度、重量、时间等都是等比量表。所得的数值可以做加、减、乘、除运算。那么心理测量中使用的量表一般是什么量表呢?一般说来心理测量是在顺序量表上进行的。因为对于人的智力、性格、兴趣、态度等来说绝对零点是难以确定的。而且在心理测量中相等单位也是很难获得的。不过利用某种统计方法可以把这种顺序量表得到的数据换算为等距数据来进行统计。我们通常将学生的考试结果按名次排队这些名次属于()变量。A命名。B顺序。C等距。D等比。心理测验的定义  所谓心理测验就是依据心理学理论使用一定的操作程序通过观察人的少数有代表性的行为对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。(四方面)第一心理测验测量的是人的行为只是测量了做测验的行为一个人对测验题目的反应。测验即引起某种行为的工具。第二心理测验在测量个别差异的时候往往只是对少数经过慎重选择的行为样本进行观察来间接推知被试者的心理特征。所谓行为样本是指有代表性的样本或者说根据某些条件所取得的标准样本。由于所取得的标准样本只是代表某些心理功能并不能反映这种功能的全部所以不免有某种程度的偏差。 心理测验的定义第三为了使不同的被试者所获得的分数有比较的可能性测验的条件对所有的被试者都必须是相同的。指导语要尽量编得凡是足以影响测验作业的每一种情况都有详细的说明以保证被试者在反应时减少误差评分标准也要在测验编制时规定清楚必要时还应该举例说明以使主试者评分时都可以按同样的标准规则记分。第四个人在测验中所得到的原始分数并不具有什么意义只有将它与其他人的分数或常模相比较才有意义。常模的功用是给测验分数提供比较的标准。常模是否可靠关键是有无一个代表性的被试样本。心理测验的性质    ㈠、间接性:   我们还无法直接测量人的心理活动只能测量人的外显行为只能通过一个人对测验项目的反应来推论出他的心理特质。   如一个喜欢修自行车观看机器运转阅读机械方面的杂志的人就可以推论此人具有ldquo机械兴趣rdquo的特质。某人广闻博见谈吐流畅计算敏捷动作灵活学习优秀等就可以说此人有较高的智力特质。   ㈡、相对性:   对人的行为做比较没有绝对的标准我们有的只是一个连续的行为序列。所谓测验就是看每个人处在这个序列的什么位置上由此测得一个人智力的高低、兴趣的大小或性格的特性等。㈢、客观性:   测验的客观性就是测验的标准化。对一切测量的共同要求是测验工具的标准化。测验用的项目或作业、施测说明、施测者的言语态度及施测时的环境等都要求标准化。特别是对测验题目的选择不是随意的而是在预测基础上通过实证分析确定的。当然对投射测验来说它的客观性相对差些而选择题的客观性较好。最后分数转换和解释标准化对结果的推论应该是客观的。最后测验评分记分的原则和手续也要经过标准化使反应的量化是客观的。    心理测验的分类一、按测验的功能分类智力测验这类测验的功能是测量人的一般智力水平。如BinetSimon智力测验、StanfordBinet智力量表、Wechsler儿童和成人智力量表等都是现代常用的著名智力测量工具用于评估人的智力水平。特殊能力测验这类测验偏重测量个人的特殊潜在能力多为升学、职业指导以及一些特殊工种人员的筛选所用。常用的如音乐、绘画、机械技巧以及文书才能测验。这类测验在临床上应用的较少。人格测验这类测验主要用于测量性格、气质、兴趣、态度、品德、情绪、动机、信念等方面的个性心理特征亦即个性中除能力以外的部分。一般有两类一类是问卷法一类是投射法。前者如MMPI、PF、EPQ后者如罗夏测验、主题统觉测验(TAT)。心理测验的分类  二、按测验材料的性质分类  文字测验:所用的是文字材料它以言语来提出刺激被试者用言语做出反应。MMPI、EPQ、PF及Wechsler儿童和成人智力量表中的言语量表部分均属于文字测验。  操作测验:也称非文字测验。测验题目多属于对图形、实物、工具、模型的辨认和操作无须使用言语作答所以不受文化因素的限制用于学前儿童和不识字的成人。如罗夏测验、TAT、Raven测验及Wechsler智力量表中的操作量表部分均属于非文字测验。  有时两类测验常常结合使用。例如BinetSimon智力量表开始主要是文字测验但以后修订的BinetSimon智力量表特别是最近的修订本则增加了操作测验成分。Wechsler的三套智力量表(即幼儿、儿童和成人)每套均分成文字的和操作的两类测验。心理测验的分类  三、按测验材料的严谨程度分类  客观测验在此类测验中所呈现的刺激词句、图形等意义明确只需被试者直接理解无须发挥想象力来猜测和遐想故称客观测验。绝大多数心理测验都属这类测验。 投射测验在此类测验中刺激没有明确意义问题模糊对被试的反应也没有明确规定。被试者做出反应时一定要凭自己的想象力加以填补使之有意义。在这过程中恰好投射出被试者的思想、情感和经验所以称投射测验。投射测验种类较少具有代表性的有罗夏测验、主题统觉测验、自由联想测验和句子完成测验。心理测验的分类  四、按测验的方式分类  个别测验:指每次测验过程中是以一对一形式来进行的这是临床上最常用的心理测验形式。如BinetSimon智力量表、Wechsler智力量表。其优点在于主试对被试的言语和情绪状态有仔细的观察并且有充分的机会与被试合作所以其结果可靠。  团体测验:指每次测验过程中由一个或几个主试者对较多的被试者同时实施测验。心理测验史上有名的陆军甲种和乙种测验教育上的成就测验都是团体测验。这类测验的优点在于时间经济主试者不必接受严格的专业训练即可担任。   团体测验材料也可以个别方式实施如MMPI、EPQ、PF等。但个别测验材料不能以团体方式进行除非将实施方法和材料加以改变使之适合团体测验。心理测验的分类  五、按测验的要求分类  最高作为测验此类测验要求被试者尽可能做出最好的回答主要与认知过程有关有正确答案。智力测验、成就测验均属最高作为测验。  典型行为测验此类测验要求被试者按通常的习惯方式做出反应没有正确答案。一般来说各种人格测验均属典型行为测验。一般来说心理测验除()以外都有时限。A最高作为测验。B速度测验。C典型行为测验。D智力测验。错误的测验观㈠、测验万能论有人认为心理测验可以解决一切问题对测验甚至顶礼膜拜奉若神明。他们迷信测验把测验分数绝对化。 ㈡、测验无用论  心理测验是具有局限性和不足。 其一某些人格测验侵犯了个人隐私违背民主原则。  其二测验为宿命论和种族歧视提供了心理学依据。㈢、心理测验即智力测验心理测验=智力测验=智商(IQ)=遗传决定论。这也是一种误解心理测验长期受这一误解的支配蒙受了不少不白之冤。正确的测验观  ㈠、心理测验是重要的心理学研究方法之一是决策的辅助工具除实验法以外心理测验法的出现是心理科学发展史上的一大进步是心理学研究中不可缺少的研究方法之一。  ㈡、心理测验作为研究方法和测量工具尚不完善尽管心理测验是心理学研究的必要手段而且实际生活中也在广泛应用但是心理测验从理论到方法都还存在许多问题尤其过分夸大心理测验的科学性和准确性是不可取的。心理测验的最大问题是理论基础不够坚实。比如关于智力和人格的定义尚未争论清楚还没有得到一个统一公认的定义但智力测验和人格测验已被广泛使用。 心理测验在心理咨询中的应用心理咨询和治疗的有效性不仅取决于咨询人员对心理咨询的性质、过程的正确认识熟练掌握心理咨询的原则、方法和技能技巧同时还有赖于对求助者心理特性、行为问题性质的正确评估和诊断。一、智力测验吴天敏的中国比内量表龚耀先韦氏智力量表(WAISRC)林传鼎的韦氏儿童智力量表(WISCCR)张厚粲的瑞文标准型测验(SPM)等。二、人格测验艾森克人格问卷(EPQ)卡特尔人格因素问卷(PF)以及明尼苏达多项人格调查表(MMPI)等。三、心理评定量表心理评定量表主要包括有精神病评定量表、躁狂状态评定量表、抑郁量表、焦虑量表、恐怖量表等。常模团体的性质常模团体是由具有某种共同特征的人所组成的一个群体或者是该群体的一个样本。它用一个标准的、规范的分数表示出来以提供比较的基础。在制定常模时首先要确定常模团体在对常模参考分数作解释时也必须考虑常模团体的组成。对测验编制者而言常模的选择主要是基于对测验将要施测的总体的认识常模团体必须能够代表该总体。找一个有代表性的样本来代表目标总体也代表一般总体。满足所有条件后才可称为常模样本才真正具有代表性。常模团体的条件  ㈠、群体的构成必须明确界定在制定常模时必须清楚地说明所要测量的群体的性质与特征。如性别、年龄、职业、文化程度等。依据不同的变量确定群体便可得到不同的常模。 ㈡、常模团体必须是所测群体的代表性样本所以取样要适当。  ㈢、样本的大小要适当ldquo大小适当rdquo并没有严格的规定。一般来说样本越大越好但也要考虑具体条件(人力、物力、时间)的限制。总体数目小只有几十个人则需要的样本。如果总体数目大相应的样本也大一般最低不小于或个。全国性常模一般应有人为宜。  ㈣、标准化样组是一定时空的产物我们在一定的时间和空间中抽取的标准化样组它只能反映当时当地的情况。随着时间的推移地点的变更标准化的样组就失去了标准化的意义。取样的方法   取样即从目标人群中选择有代表性的样本。从统计学角度看取样的方法有随机抽样和非随机抽样两种。   ㈠、简单随机抽样   按照随机表顺序选择被试构成样本或者将抽样范围内的每个人或者每个抽样单位编号再随机选择可以避免由于标记、姓名、性别或其它社会赞许性偏见而造成抽样误差。   ㈡、系统抽样   有时在总体数目为N的情况下若要选择K分之一的被试作为样本则可以在抽样范围内选择每个第K个人来构成样本。例如K为则样本为总体的一半若K是则样本为总体的。   ㈢、分组抽样   有时总体数目较大无法进行编号而且群体又有多样性这时可以先将群体进行分组再在组内进行随机取样。   ㈣、分层抽样   确定常模时最常用的是分层抽样方法。它是先将目标总体按某种变量(如年龄)分成若干层次再从各层次中随机抽取若干被试最后把各层的被试组合成常模样本。   常模分数与常模   ㈠、常模分数   常模分数就是施测常模样本确立后将被试者的原始分数按一定规则转换出来的导出分数。   在心理测验中标准是由原始分数构成的分布转换而来的分数叫导出分数。导出分数具有一定的参照点和单位它实际上是一个有意义的测验量表它与原始分数等值可以进行比较。   ㈡、常模 常模(norm)是解释心理测验分数的基础。   常模有一般常模与特殊常模之分。测验手册上所列的常模通常为一般常模不一定适合使用者的具体情况。特殊常模是为非典型团体建立的一般比为小团体建立的常模范围更窄。其优点是可使被试的结果与最接近的人进行比较但这同时也是它的缺点不容许分数在较广的范围内作解释。一、发展常模人的许多心理特质如智力、技能等是随着时间以有规律的方式发展的所以可将个人的成绩与各种发展水平的人的平均表现相比较。根据这种平均表现所制成的量表就是发展常模亦称年龄量表。  ㈠、发展顺序量表   最直观的发展常模是发展顺序量表因为它告诉人们多大的儿童具备什么能力或行为就表明其发育正常最早的一个范例是葛塞尔发展程序表按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。   瑞士心理学家皮亚杰的发展理论引起了人们的重视。研究着重于从婴儿到十多岁儿童认知过程的发展尤其注重某些特殊概念的形成其中最著名的工作就是对守恒概念的研究。皮亚杰发现儿童不同时期出现不同守恒概念通常儿童到岁时才会理解质量守恒岁才会掌握重量守恒岁时才有容量守恒概念。  一、发展常模㈡、智力年龄   比内西蒙量表中首先使用智力年龄的概念。为每个年龄水平都编制一些适当的题目便可得到一个评价儿童智力发展水平的年龄量表。一个儿童在年龄量表上所得的分数就是最能代表他的智力水平的年龄。这种分数叫做智力年龄简称智龄。   ㈢、年级当量   年级当量实际上就是年级量表测验结果说明属哪一年级的水平在教育成就测验中最常用。二、百分位常模  百分位常模包括百分等级和百分点、四分位数和十分位数。    ㈠、百分等级:是应用最广的表示测验分数的方法。一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比。因此的百分等级表示在常模样本中有的人比这个分数要低。   ㈡、百分点:也称百分位数与百分等级的计算方法正好相反。百分等级是计算低于某测验分数的人数百分比而百分点则是计算处于某一百分比例的人对应的测验分数是多少。   在实际应用中我们一般既可以由原始分数计算百分等级又可以由百分等级确定原始分数。通过这样的双向方式编制的原始分数与百分等级对照表就是百分位常模。   ㈢、四分位数和十分位数:是百分位数的两个变式其含义相似。百分位数是将量表分成份而四分位数是将量表分成四等份相当于百分等级的、和对应的三个百分分成的四段。十分位数也可以依此类推出~为第一段~为第十段。当然我们还可以把百分位数再细分成千分位数、万分位数但常见的是四分位数和十分位数。百分等级计算方法小李的数学成绩分在全班名同学中排名第要求知道他的成绩的百分等级是?计算公式:PR=(*RN)其中R是原始分数排列顺序N是总人数。结果他的学习成绩的百分等级是百分点(百分位数)计算方法计算方法百分点的计算根据直线内插法。例如某次高考最高分其百分等级为最低分是百分等级为要录取的考生进大学百分等级为的百分位数(PP)可以用下面计算得出。或PPPPPP=。=百分点为三、标准分常模标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差所以叫标准分数。常见的标准分数有:z分数、Z分数、T分数、标准九分数、离差智商(IQ)等。标准分数可以通过线性转换也可以通过非线性转换得到:㈠、线性转换的标准分数   z分数为最典型的线性转换的标准分数。根据定义可通过下式将原始分数转换成标准分数:X为任一原始分数为样本平均数SD为样本标准差。由此可见z分数可以用来表示某一分数与平均数之差是标准差的几倍。由于在z分数中经常出现小数点和负数而且单位过大计算和使用很不方便所以通常需要将z分数转换成另一种形式的量表分数。Z=ABZ   Z为转换后的标准分数A、B为根据需要指定的常数。加上一个常数是为了去掉负值乘以一个常数是为了使单位变小从而去掉小数点。   Z=ABz式中Z为转换后的标准分A、B为根据需要指定的常数。加上一个常数是为了去掉()乘以一个常数是为了使单位变小从而去掉小数点。(A)整数(B)小数(C)负值(D)分值常见标准分数有z分数、Z分数、T分数、标准九分数、离差智商等。标准分常模㈡、非线性转换的标准分数   当原始分数不是常态分布时也可以使之常态化这一转换过程就是非线性的。常态化过程主要是将原始分数转化为百分等级再将百分等级转化为常态分布上相应的离均值并可以表示为任何平均数和标准差。计算步骤如下:   .对每个原始分数值计算累积百分比.在常态曲线面积表中求出对应于该百分比的z分数。所得的z分数可将分布分成几部分我们称之为分数以区别由线性转换所求得的z分数。  与线性导出分数一样常态化标准分数也可以被转换成任何方便的形式。当以为平均数(即加上一个常数)以为标准差(乘以一个常数)来表示时通常叫做T分数。   标准十分平均数为()(A):(B):。(C):。(D):。标准十分平均数为标准差为。标准二十分平均数为标准差为标准九分平均数为标准差为。最简单而且最基本的表示常模的方法是()有时也叫常模表(A)转换表(B)分布表(C)对照表(D)都不是四、智商及其意义在最早的比内西蒙智力测验中没有智商的概念只用ldquo心理年龄rdquo(mentalage简称MA)来表示被试智力的高低。但在使用中发现单纯用心理年龄来表示智力高低的方法缺乏不同年龄儿童间的可比性因此目前一般都用比率智商和离差智商来表示智力的高低。㈠比率智商美国斯坦福大学推孟教授于年对其修订而成斯坦福比内量表。它在心理年龄的基础上以智商表示测验结果即比率智商。比率智商(IQ)被定义为心理年龄(MA)与实足年龄(CA)之比。为避免小数将商数乘以:比率智商提出后普遍被心理学界和医学界所接受。但由于个体智力增长是一个由快到慢再到停止的过程即心理年龄与实足年龄并不同步增长所以比率智商并不适合于年龄较大的被试因而相同的比率智商分数在不同年龄就具有不同意义。智商及其意义㈡离差智商离差智商是一种以年龄组为样本计算而得的标准分数为使其与传统的比率智商基本一致韦克斯勒将离差智商的平均数定为标准差定为。所以离差智商建立在统计学的基础之上它表示的是个体智力在年龄组中所处的位置因而是表示智力高低的一种理想的指标。具体公式如下:必须指出从不同测验获得的离差智商只有当标准差相同或接近时才可以比较标准差不同其分数的意义便不同。从表中可以看到在不同标准差条件下相同的智商分数便具有不同的人数百分比。IQ=zrdquo=(XXrsquorsquo)SD()的计算公式(A)比率智商(B)标准分数(C)标准差(D)离差智商几种导出分数间的相互关系人数测验分数百分等级标准九分离差智商(SD=)CEEB分数T分数z分数从下图可以看出:的z分数的T分数的CEEB(美国大学入学考试)分数在韦氏测验中的离差智商分数都表示原始分数在它所在的分布中是高于平均数一个标准差对于常态化的标准分数或趋于常态分布的z分数来说这相当于的百分等级。如此类推的z分数的T分数的CEEB分数的离差智商分数则表示低于平均数两个标准差即相当于的百分等级。在对不熟悉标准分数的人解释测验分数时将其转化为百分位便很容易被理解。T分数公式中的SD为()。A任一原始分数。B样本平均数。C样本标准差。D标准分数。常模分数的表示方法一、转换表法最简单而且最基本的表示常模的方法就是转换表法有时也叫常模表。一个转换表显示出一个特定的标准化样组的原始分与其相对应的等值分数。利用此法可以将原始分转换为与其对应的导出分数对测验的分数作出有意义的解释。二、剖面图法剖面图是将测验分数的转换关系用图形表示出来。从剖面图上可以直观地看出被试在各个分测验上的表现及其相对的位置。信度的概念一、信度的定义(测验的稳定性)信度是指同一被试在不同时间内用同一测验重复测量所得的结果一致的程度。几次测量的分数相差悬殊便说明此测验的性能不稳信度低。二、信度的指标信度的指标有两大类共三种表示方法:㈠、信度系数与信度指数大部分情况下信度是以信度系数为指标它是一种相关系数。常常是同一被试样本所得的两组资料的相关理论上说就是真分数方差与实得分数的方差的比值真分数标准差与实得分数的标准差的比值称信度指数信度指数的平方就是信度系数。㈡、测量标准误 信度系数仅表示一组测量的实得分数与真分数的符合程度但并没有直接指出个人测验分数的变异量。由于存在误差一个人所得分数有时比真分数高有时比真分数低有时二者相等。我们可以用一组被试两次测量结果来代替对同一个人的反复施测于是有了信度的另一个指标SE为测量的标准误测量的标准误与信度之间有互为消长的关系:信度越高标准误越小信度越低标准误越大。信度评估的方法一、重测信度(testretestreliability)又称稳定性系数。它的计算方法是采用重测法即使用同一测验在同样条件下对同一组被试者前后施测两次测验求两次得分间的相关系数。用重测法估计信度的优点在于能提供有关测验是否随时间而变异的资料可作为被试将来行为表现的依据。其缺点是易受练习和记忆的影响。如果两次施测相隔的时间太短则记忆犹新练习的影响较大如果相隔的时间太长则身心的发展与学习经验的积累等足以改变测验分数的意义而使相关降低。最适宜的时距一般是两周到四周较宜间隔时间最好不超过六个月。二、复本信度(alternateformreliability)又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体然后求得被试者在两个测验上得分的相关系数这个相关系数就代表了复本信度的高低。复本信度的优点是能够避免重测信度的一些问题如记忆效果、学习效应等。但也有其局限性:其一如果测量的行为易受练习的影响其二由于第二个测验只改变了题目的内容已经掌握的解题原则可以很容易地迁移到同类问题。最后对于许多测验来说建立复本是十分困难的。信度评估的方法三、内部一致性信度(internalconsistencyreliability)内部一致性信度系数主要反映的是题目之间的关系表示测验能够测量相同内容或特质的程度。㈠。分半信度(splithalfreliability)分半信度指采用分半法估计所得的信度系数。这种方法估计信度系数只需一种测验形式实施一次测验。通常是在测验实施后将测验按奇、偶数分为等值的两半并分别计算每位被试在两半测验上的得分求出这两半分数的相关系数。这个相关系数就代表了两半测验内容取样的一致程度因而属于内部一致性信度系数。㈡。同质性信度(homogeneityreliability)同质性主要代表测验内部所有题目间的一致性。当各个测题的得分有较高的正相关时不论题目的内容和形式如何则测验为同质的。相反即使所有题目看起来好像测量同一特质但相关很低或为负相关时则测验为异质的。信度评估的方法几个计算同质性信度的公式如下:.库德理查逊公式:库德(GFKuder)和理查逊(MWRichardson)在年提出。.克伦巴赫alpha系数:库德理查逊公式只适用于答对一题记一分答错无分的测题不适用于多重记分的测题例如多项选择人格测验、态度量表等。针对此种需要克伦巴赫(JCronbach)首创alpha系数来计算同质性信度。同质性信度主要代表测验内部()间的一致性。A两半测验B所有题目C题目和分测验D分测验信度评估的方法四、评分者信度(scorerreliability)用于测量不同评分者之间所产生的误差。为了衡量评分者之间信度高低可随机抽取若干份测验卷由两位评分者按评分标准分别给分然后再根据每份测验卷的两个分数计算相关即得评分者信度。一般要求在成对的受过训练的评分者之间平均一致性达以上才认为评分是客观的。当多个评分者评定多个对象并以等级法记分时可采用肯德尔和谐系数(W)作为评分者信度的估计。估计信度的方法远不止上面介绍的几种实际上有多少误差的来源便有多少估计信度的方法。所以在考察测验的信度时应根据情况采用不同的信度指标原则上一个测验哪种误差大便应该用哪种误差估计。有时一个测验需要有几种信度系数这样我们就能把总分数的变异数分成不同的分支。信度与测验分数的解释  一、解释真实分数与实得分数的相关信度系数可以解释为测验的总变异中真分数造成的变异占百分之几。如当rxx=时我们可以说实得分数中有的变异是真分数造成的仅来自测验的误差。rxx=则表示完全没有测量误差所有的变异均来自真实分数同样信度系数也告诉测量的误差比例是多少。  二、确定信度可以接受的水平一个测验究竟信度多高才合适才让人满意呢?当然最理想的情况是rxx=但实际上是办不到的。根据多年的研究结果一般的能力测验和成就测验的信度系数都在以上有的可以达而人格测验、兴趣、态度、价值观等测验的信度一般在或更高些。一般原则是:当rxx时测验不能用于对个人做出评价或预测而且不能作团体比较当lerxx时可用于团体比较当rxxge时才能用来鉴别或预测个人成绩或作为。信度与测验分数的解释三、解释个人分数的意义   从信度可以解释个人分数的意义这就是测量标准误的应用。它有两个作用: 其一是估计真实分数的范围其二是了解实得分数再测时可能的变化情形。 人们一般采用的或然水平其置信区间为:X―SE<XTleXSE 就是说大约有的可能性真分数落在所得分数plusmnSE的范围内或有的可能性落在范围之外。  假设在一个智力测验中某个被试的IQ为这是否反映了他的真实水平?如果再测一次他的分数将改变多少?已知该智力测验的标准差为信度系数为则其IQ的测量标准误和可能范围分别为:   SE=IQ=plusmn=plusmnasymp   可以说这个被试的真实IQ有的可能性落在与之间。即若再测一次他的智商低于、高于的可能性不超过。四、比较不同测验分数的差异   测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。影响信度的因素 一、样本特征信度常用信度系数来表示信度系数就是相关系数相关系数受样本是否异质及样本团体平均能力水平的影响。  ㈠、样本团体异质性的影响任何相关系数都要受到团体中分数分布的范围所影响而分数范围与样本团体的异质程度有关。若获得信度的取样团体较为异质的话往往会高估测验的信度相反则会低估测验的信度。  ㈡、样本团体平均能力水平的影响测验的信度还受取样不同团体间平均能力水平的不同而不同。这是因为对于不同水平的团体题目具有不同的难度每个题目在难度上的微小差异累计起来便会影响信度。  显而易见每个信度系数都要求有对建立信度系数的团体的描述。在编制测验时应把常模团体按年龄、性别、文化程度、职业等分为更同质的亚团体并分别报告每个亚团体的信度系数这样测验才能适用于各种团体。   二、测验长度测验长度亦即测验的数量也是影响信度系数的一个因素。一般来说在一个测验中增加同质的题目可以使信度提高。  第一测验越长测验的测题取样或内容取样就越有代表性。第二测验越长被试的猜测因素影响就越小。长有时反而会引起被试的疲劳和反感而降低可靠性。   三、测验难度 难度对信度的影响只存在于某些测验中如智力测验、成就测验、能力倾向测验等对于人格测验、兴趣测验、态度量表等不存在难度问题因为这些测验的题目没有正确或错误答案之分。  在实际情况下如果某个测验适用范围很广其难度水平通常适合于中等能力水平的被试而对较高水平和较低水平的被试可能较易或较难使得分数分布范围缩小信度水平降低。因此一个标准化的测验应根据不同能力水平报告测验的难度以作为选择测验的参考。 四、时间间隔  时间间隔只对重测信度和不同时测量时的复本信度(重测复本信度)有影响对其余的信度来说不存在时间间隔问题。影响信度的因素效度的概念一、效度的定义效度是指所测量的与所要测量的心理特点之间符合的程度或者简单地说是指一个心理测验的准确性。效度是科学测量工具最重要的必备条件一个测验若无效度则无论其具有其他任何优点一律无法发挥其真正的功能。测量的效度除受随机误差影响外还受系统误差的影响。可信的测验未必有效而有效的测验必定可信。简言之信度是效度的必要条件。二、效度的性质   ㈠、效度具有相对性  任何测验的效度是对一定的目标来说的或者说测验只有用于与测验目标一致的目的和场合才会有效。每种测验各有其功能与限制世上没有一种对所有目的都有效的测验也没有一个测验编制者能把所有的心理特性都包含在他的一套测验之中。  ㈡、效度具有连续性测验效度通常用相关系数表示它只有程度上的不同而没有ldquo全有rdquo或ldquo全无rdquo的区别。因此我们评价一个测验时不应该说ldquo有效rdquo或ldquo无效rdquo而应该用效度较高或较低来评价。另外效度是针对测验结果的。举个例子来说当对某一儿童实施一套智力测验时儿童的父母首先可能会提出ldquo这个测验有效吗rdquo这样的问题。实际上他们是在问ldquo这个测验真的测得出智力吗测验的结果真的代表了孩子的智力水平吗rdquo可以看出测验的有效性是针对测验结果而言的即测验效度是ldquo测验结果rdquo的有效性程度。效度评估的方法考查效度的方法很多每种方法侧重的问题不同名称也随之而异。《教育与心理测量之标准》一书中将效度分为三大类:即内容效度、构想效度和效标效度。内容效度(contentrelatedvalidity) 内容效度指的是测验题目对有关内容或行为取样的适用性从而确定测验是否是所欲测量的行为领域的代表性取样。 想编制有较高内容效度的心理测验首先要对所测量的心理特性有个明确的概念并划定出哪些行为与这心理特性有关又较密切。这就需要通过查阅大量资料观察及询问来发现究竟哪些行为是受这种心理特性所制约。通过自己的观察及调查加以验证从而明确编制测量的内容。 要求内容效度的测验并不一定要求测验为同质的。例如智力测验通常包括了各种能力与技能高度同质性的规定将不实际且不需要。  效度评估的方法  .专家判断法  为了确定一个测验是否有内容效度最常用的方法是请有关专家对测验题目与原定内容的符合性做出判断看测验的题目是否代表规定的内容。由于这种估计效度的方法是一个逻辑分析的过程所以内容效度有时又称ldquo逻辑效度rdquo(logicalvalidity)。  ①、定义好测验内容的总体范围描述有关的知识与技能及所用材料的来源  ②、编制双向细目表确定内容和技能各自所占的比例并由测验编制者确定各题所测的是何种内容与技能  ③、制定评定量表来测量测验的整个效度如测验包括的内容、技能、材料的重要程度、题目对内容的适用性等。  效度评估的方法 .统计分析法  除描述性语言外内容效度的确定也可采用一些统计分析方法。例如计算两个评分者之间评定的一致性。两个独立的评判者符合程度越高越能反映测验的内容效度。  再测法也可用于内容效度的评估。  .经验推测法  这种效度是通过实践来检验效度如儿童发展量表是否有效经过对不同年龄阶段的儿童进行调查然后分析其结果。  内容效度的特性内容效度与所有效度的性质一样不是普遍适用的而是根据具体情况分析得来。如果测验分析者和测验使用者定义的内容范围相同则编制者报告的内容效度对使用者而言是有意义的否则就没有意义。  内容效度经常与表面效度(facevalidity)混淆。表面效度是由外行对测验作表面上的检查确定的它不反映测验实际测量的东西只是指测验表面上看来好像是测量所要测的东西而内容效度是由够资格的判断者(专家)详尽地、系统地对测验作评价而建立的。效度评估的方法 构想效度构想效度的概念是年提出来的有人也翻译成构思效度或结构效度。它主要涉及的是心理学的理论概念问题是指测验能够测量到理论上的构想或特质的程度即测验的结果是否能证实或解释某一理论的假设、术语或构想解释的程度如何。  建立构想效度必须先从某一构想的理论出发提出关于某一心理特质的假设然后设计和编制测验并进行施测最后对测验的结果采用相关或因素分析等方法进行分析验证与理论假设的符合程度。构想效度的估计方法。对测验本身的分析这类方法是通过研究测验内部结构来界定理论构想从而为构思效度提供证据。 2。测验间的相互比较通过分析几个测验间的相互关系找出其共同之处进而推断这些测验测量的特质是什么也可以确定这些测验构思效度如何。  区分效度(discriminatevalidity)是构思效度的又一个证据。一个有效的测验不仅应与其他测量同一构思的测验有相关而且还必须与测量不同构思的测验无相关。换言之测验要有效必须测量与其他变量无关的独立的构思。此种相关就是区分效度系数相关越低区分度越大。  因素分析法(factoranalysis)也是建立构思效度的常用方法。通过对一组测验进行因素分析可以找到影响测验分数的共同因素这种因素可能就是我们要测量的心理特质(构思)。如果是从众多测验中找出组成一个大构思的不同因素此时可以把因素分析得到的几个共同因素对应的各种测验组合起来构成一个新的测验。 效标效度一个测验若效标效度理想那么该测验所预测的效标的性质和种类就可以作为分析测验构思效度的指标。 实验法和观察法证实观察实验前和实验后分数的差异也是验证构思效度的方法。根据所要测量的特质的得到证实那就给构思效度提供了证据。效度评估的方法 效标效度(criterionrelatedvalidity)什么是效标效度效标效度又称实证效度反映的是测验预测个体在某种情境下行为表现的有效性程度。被预测的行为是检验效度的标准简称效标。由于这种效度是看测验对效标预测得如何所以叫效标效度。这种效度需在实践中检验所以又称实证效度。  根据效标资料是否与测验分数同时获得又可分为同时效度和预测效度两类。在检验一个测验的效标效度时难点在于找到合适的效标。因此效标的选择至关重要一个好的效标必须具备以下条件:  ①、效标必须能最有效地反映测验的目标即效标测量本身必须有效  ②、效标必须具有较高的信度稳定可靠不随时间等因素而变化  ③、效标可以客观地加以测量可用数据或等级来表示 ④、效标测量的方法简单省时省力经济实用。  效标效度的评估方法效标效度有多种评估方法:  .相关法:相关法是评估效标效度最常用的方法它是求测验分数与效标资料间的相关这一相关系数称为效度系数。  .区分法:区分法是检验测验分数能否有效地区分由效标所定义的团体的一种方法。 .命中率法命中率法是当测验用来做取舍的依据时用其正确决定的比例作为效度指标的一种方法。  使用命中率法可将测验分数和效标资料分为两类。在测验分数方面是确定一个临界分数(即分数线)高于临界分数者预测其成功低于临界分数者预测其失败。效度的功能一、预测误差效度系数的实际意义常常以决定性系数来表示意旨相关系数的平方它表示测验正确预测或解释的效标的方差占总方差的比例。另一种表达方法是估计的标准误估计的标准误可如同其他标准误一样解释。   二、预测效标分数如果X与Y两变量呈直线相关只要确定出二者间的回归方程就可以从一个变量推估出另一个变量。三、预测效率指数E值大小表明使用测验比盲目猜测能减少多少误差例如一个测验的效度系数为那么E=这表明预测误差仅为随机猜测所产生误差的。换句话说由于该测验的使用使得我们在估计被试的效标分数时减少了的误差。影响效度的因素影响效度的因素很多凡能产生随机误差和系统误差的因素都会降低测验的效度。现从三个方面讨论影响效度的因素:一、测验本身的因素测验取材的代表性、测验长度、试题类型、难度、区分度以及编排方式等都会影响效度。要保证测验具有较高效度要做好以下几点:.测验材料必须对整个内容具有代表性.测题设计时应尽量避免容易引起误差的题型(如是非题).测题难度要适中具有较高的区分度.测验长度要恰当即要有一定的测题量.测题的排列按先易后难顺序。二、测验实施中的干扰因素  ㈠、主试的影响因素  测验实施过程中主试的因素会影响效度。例如是否遵从测验使用手册的各项规定进行标准化的实施指导语是否统一正确测验的时限是否一致评分是否合理都会影响测验的效度。  ㈡、被试的影响因素  被试在测验时的兴趣、动机、情绪、态度和身心状况、健康状态以及是否充分合作与尽力而为等都会影响被试在测验情境中的反应因而影响测验结果的效度。被试的反应定势也会降低测验的效度。   影响效度的因素三、样本团体的性质  ㈠、样本团体的异质性  如果其他条件相同样本团体越同质分数分布范围越小测验效度就越低样本团体越异质分数分布范围越大测验效度就越高。其中有几种情况会影响样本团体的异质性。  选拔标准太高样本团体的同质性增加降低了测验的效度。  ㈡、干涉变量  样本团体的性质对效度的影响还表现在:对于不同性质的团体同一测验的效度会有很大的不同。这些性质包括年龄、性别、教育水平、智力、动机、兴趣、职业和任何有关的特征。由于这些特征的影响使得测验对于不同的团体具有不同的预测能力故测量学上称这些特征为干涉变量(moderatorvariable)。   对于如何确定干涉变量表面上的泛泛分析和观察很难发现美国心理学家吉赛利(EEGhiselli)提出的如何找出干涉变量的一套方法供参考:.用回归方程求得每个人的预测效标分数将该分数与实际效标分数相比较获得差异分数D。如果D的绝对值很大说明测验中可能存在干涉变量。.根据样本团体的组成分析找出对照组分别计算效度从而象上述关于出租汽车司机的例子一样找出干涉变量。.对于欲测团体根据某些易见的干涉变量将其区分为预测性高和预测性低的两个亚团体。对于预测性高的团体获得的测验效度会有所提高。   四、效标的性质效标效度是以测验分数与效标测量的相关系数来表示的因此效标的性质如何在评价测验的效度时是值得考虑的。群体构成的界定所测群体的代表性样本样本的大小适当标准化样组是时空的产物常模团体性质取样的方法常摸分数与常模简单随机抽样系统抽样分组抽样分层抽样常模的类型常模分数的表示方法发展常模百分位常模标准分常模智商及其意义转换表法剖面图法比率智商离差智商条件发展顺序量表智力年龄年级当量百分等级百分点四分位数十分位数线性转换非线性转换比例智商离差智商测验的常模信度的概念定义指标信度系数信度指数测量标准误信度评估

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

评分:

/87

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利