首页 评语大全之测量工作评语

评语大全之测量工作评语

评语大全之测量工作评语评语大全之测量工作评语测量工作评语【篇一：测量与评价问答题】测量的要素单位，参照值，量表。教育测量的含义它是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。教育测量特点1测量结果的间接性2度量单位的相对性3测量对象的复杂性4测量目的的针对性〕教育测量的功能：1、有利于提高教育、教学的水平2、有利于提高教育管理的水平3、有利于开展教育研究的方法。教育评价的含义是根据一定的教育价值或教育目标，运用可行的科学手段，通过系统的收集信息，分析解释，对教育现象进行价值判断，从而为不断优化教育和教育决策提供依据的过...

评语大全之测量工作评语测量工作评语【篇一：测量与评价问答题】测量的要素单位，参照值，量表。教育测量的含义它是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。教育测量特点1测量结果的间接性2度量单位的相对性3测量对象的复杂性4测量目的的针对性〕教育测量的功能：1、有利于提高教育、教学的水平2、有利于提高教育管理的水平3、有利于开展教育研究的方法。教育评价的含义是根据一定的教育价值或教育目标，运用可行的科学手段，通过系统的收集信息，分析解释，对教育现象进行价值判断，从而为不断优化教育和教育决策提供依据的过程。意义它是教育管理的重要组成局部，是深化教育改革的重要措施，是全面提高教育质量的重要手段。功能导向，监督检查，鼓励，筛选择优，诊断改良。教育测评的历史测量萌芽时期1864以前，蓬勃开展1864-1940，深入开展；评价开创时期1930-1958，大开展1958-1972，专业时期。衡量测量质量的四个指标信度，效度，难度，区分度如何提高信效区分度；信度指的是测量结果的稳定性或可靠的程度，亦即测量的结果是否真实、客观地反映了考生的实际水平。类型稳定性系数，等值性，内部一致性，论文式测验的信度系数，平分者信度1适当增加测验题目的数量2测验的难度要适中3测验的内容应尽量同质4测验的程序应统一5测验的时间要充分6评分要尽量做到客观化，减少评分误差效度指一个测验能够正确测量所要测量的属性或特征的程度。1控制系统误差2精心编制量表3妥善组织测验4扩充样本容量和代表性5合理处理效度和信度的关系6适当增加测验的长度区分度指试题能否将考生区别开来的量度指数。1使题目难度适中，是整个考试难度适中2着重考啥复杂的学习结果难度1考查知识点的多少2考查对题目的熟悉程度3考查能力的复杂程度或层次的上下4命题的技巧性20世纪50年代国外的教育目标的分类法布卢姆认知目标分类1知识2理解3应用4分析5综合6评价加涅教育目标分类智力技能，认知策略，言语信息，运动技能和态度。梶田叡一根底目标，提高目标，体验目标。确定目标应注意的问题1深入分析课程教学目标2正确选择目标领域及其类目3正确理解各类目标之间的关系教通用的题型是非题，配对题，选择题，填空题，改错题，名词解释题，简答题，计算题，论述题。怎样进行命题设计 1〕内容类测验目标模型的构建，〔2〕内容点测试目标表确实定3〕命题方案表的设计试题编制的质量要求1明确测验目标2题量尽可能大3掌握好试题的区分度4注意改良题型5每道试题的编写要讲究科学性6制定好标准答案，评分标准和评卷的具体要求7拼卷和检核试题编制的组织管理1组织领导与命题人员2命题过程的组织管理测试实施要抓好如下工作1指定专人做好考务工作2确定测验形式和审查学生测验资格3考场的组织4测验评卷与测验质量检查5补考教育评价的根本原那么1方向性原那么2公平性3客观性4科学性5可行性6指导性教育评价指标体系的结构1框架2模型3指标4标准〔效能，素质，职责〕5量化符号什么是评价指标体系的信度和效度？检验评价指标体系信度有那些方法？信度重评，评价者，事实信度。效度是指评价指标，评价标准，评价的量化符号等元素书记的准确性和代表性。如何构建教育评价指标体系？1掌握构件建教育评价指标体系的依据2掌握评价对象逐级分解的方法3掌握评价等级和标准确定的方法4掌握指标和等级数值分配的方法有哪些评价标准的编制方法？1期望评语式编写法2积分评语式编写法3隶属度式编写法4行为目标式编写法5量表式6量尺式教育评价方案的编写包括哪些局部？是以教育评价指标体系的撰写为核心的，包括前言，评价指标体系，和附录局部的编写。简述教育评价实施的根本步骤1准备工作〔思想准备，材料和工具的准备，组织准备〕2评价的实施〔自评，他评〕3评价结果的处理〔评价结果的分析判断，作出综合评价的结论，评价结果的信息反响，评价工作的总结〕五类教育评价方法1绝对评价法相对与个体内差异评价法2定性分析评价与定性综合判断法3行为目标评价法和临床督导评价法4指标评分法和等级还分法5加权平均法，模糊综合评判法，集体综合评价法和坐标综合图示法教育评价信息的收集标准1准确性2可靠性3时限性评价信息的收集方法1观察法2听汇法3调查访问4座谈会5收集文字资料6发问卷7测试教育评价定性分析描述方法等级评定法，评语鉴定法和写实分析法定量分析评判分为统计分析评判法1平均数2加权平均数3标准差4标准分数5t分数模糊综合评价法1确定判断的因素集u2确定因素权数2确定评价等级4建立因素集的模糊矩阵5选择评判模型6计算综合评价值教育评价结果的合成方法1单纯普通数据的合成方法2单纯模糊数据的合成方法3呼和数据的合成方法教育测量的数据有何特点一是数据的波动性二是数据的规律性教育测量的数据有哪些种类按数据来源分1点击数据2度量数据按照数据的连续分1间断性数据2连续性数据按数据的精确程度分1类别变量2等级变量3等距变量4比率变量统计表的结构有哪些表序，表题，标目，线条，数字，表注如何编制频数分布表1求全距2定组数3求组据4定组限5求组中值6归类划记简述标准分数的意义和公式百分数等级分数及计算教育测量分数的组合有哪些常用方法1直觉判断2加权求和3多重选择4多重回归多科测验分数加权平均标准化的意义和方法教育评价心理的分类一根据心理学范畴可分为评价的心理过程，心理状态，心理特征二根据评价过程的阶段可分为组织过程心理，设计过程心理，实施过程心理，评价过程心理和被评价者准备心理，自评心理，受评过程心理，结果反响心理三根据评价者或者被评价者的心理机制分为意识倾向，情意心理，认知倾向，个性心理特征评价者对被评价者的一般心理影响有哪些1对自信心和自我概念，自我知觉得影响2对情绪稳定和不安的影响3对意志和动机的影响4对要求水平和到达目标的影响5对评价者和被评价者之间关系的影响评价者心理对评价过程有何影响1对制定评价方案的影响2对收集和分析评价信息的影响3对测定与评价的影响4对评价结果解释的影响调控评价心理有何意义1通过心理调控，可以使教育评价的准备更加合理充分2通过心理调控，可以保证教育评价活动的事实得以顺利进行，更好的完成各个环节的任务3通过心理调控，可以使评价的功能得以全面发挥，圆满实现评价的目的评价者在准备过程中有何心理现象1角色心理2心理定势3新奇感4时尚效应5期望效应评价者在评价过程中有何心理现象1自尊心理2首因效应3近因效应4晕轮效应5参照效应6理想效应7顺序效应8趋中心理9成见效应10宽大效应11附和权威心理评价者在结果处理过程中有何心理现象1类群心理2从众心理3逆反心理4本位心理5模式效应被评价者在受评过程中有何心理现象1应付心理2迎合心理3自卫心理被评价者在结果反响中有何心理现象1敏感心理2护短心理3嫉妒心理4对评价进行评价心理科举考试的内容贴经，墨义，策问，论，诗赋现代与古代语文考试的不同点1品德测评的意义有利于学生思想上的自我教育和学校德育工作的顺利开展，2有利于鼓励先进和鞭策后进3有利于学生德育管理4品德测评时德育和行为科学研究的重要手段品德测评的类型1诊断性测评2形成性测评3总结性测评品德测评的要求1外显行为测评与道德认识测评相结合2单项测评与整体测评相结合3定性测评与定量测评相结合品德测评指标体系的依据1依据社会的需要2依据德育大纲3依据品德结构4依据学生年龄特征构建中小学生品德测评指标体系的根本要求1重视指标体系的开放性2重视指标体系的教育性3处理好普遍性和特殊性的关系4处理好稳定性和开展性的关系5处理好统一性和灵活性的关系品德测评的方法1定时考核法2问卷测评法3工程评分法4情境测验法5社会关系测量法6意向测评法7行为观测法教师评价的含义是对教师活动进行描述和价值判断的过程。对象是教师活动中抽象存在物和非抽象存在物特点1教师被评价者评价是一个活动过程它是一种特殊的连续活动，包括一系列的步骤和方法。2教师评价是有目的有方案的活动过程3教师评价的根本目标在与形成价值判断，进而做出选择4教师评价活动中评价者和被评价者事统一的教师评价的主体1教育行政部门，学校，教师参评2学生参评3家长参评4教师自评教师评价的模式有1实证范式评价〔行为目标评价模式，操作主义评价模式〕2人为范式评价〔开展性评价模式，主体性评价模式，团体性评价模式，教师校本评价〕教师评价的程序1确定评价目的2确定评价者3制定评价指标体系4确定评价方式5评价过程的实施教师评价指标体系应由三个维度素质评价指标〔1思想道德素质2文化理论3身体心理〕职责评价指标〔1育人管理职责2教学科研3协同工作〕绩效评价指标〔育人管理成效2教学科研成效3协同工作〕其中素质评价指标是教师实施教育教学的根底，职责评价指标是教师实施教育教学的关键，绩效评价指标是教师实施教育教学的最终目标。什么是教学工作评价？它有哪些主要功能？是对教学工作的过程和结果进行的价值判断。功能1检查2反响3鼓励4研究5定向6管理教学工作评价应注意什么问题？1关于教学工作量与质的关系问题2关于他评价和自评价的关系问题教学工作评价的宏观依据是什么？1依据教育方针和政策法规2依据教学大纲和教科书3依据教学规律与教学原那么4依据学生身心开展规律5参考新的思想观念教学工作评价的内容是什么？包括对教师备课上课批改作业课外辅导命题考试等教学工作根本环节的评价内容。还有两问什么是课程评价？泰勒目标达成模式的概括内容是什么？对泰勒目标达成模式做简要评价。简述课程评价模式的开展与课程，评价认识开展的关系？我国学校体育评价应该遵循什么原那么？1自主性原那么2动态性原那么3人文化原那么4多极化原那么你如何看待江苏省江阴一中进行体育评价改革？如何评价体育老师的教学质量？学生在课堂上的行为表现，情绪体验，知识获得以及交流合作等方面，包括学生参与教育的时机，时间长短，积极性和效果，以及学生对课堂的情绪体验，对教师行为的反响，学生在教学结束时知识掌握的情况，学生在课堂终具体的合作，探究行为等等，成为判断一堂课成功的主要依据。学校评价的目的及意义是什么？目的1改良学校管理，充分发挥学校效能2判断学校工作的好坏，评定学校的优劣。意义1中小学学校评价是现代学校教育开展的客观要求，也是我国根底教育改革的迫切需要2学校评价对学校教育起着重要的定向引导作用3学校评价可以促进学校领导和教职员工的开展4学校评价有利于调动社会各方面的力量关心学校教育现代中小学学校评价的内容有哪些变化？1学校的开展目标2学校的开展能力3学校开展的自我保障机制4学校的开展成效学校管理评价的涵义是什么？它包括哪些内容？含义指根据一定的教育目标，通过决策，方案，组织，指导和控制，有效地利用教育的各种要素，以实现培育人的学校管理活动。开展性学校评价的根本理念是什么？这些理念是如何指导学校评价的？理念1变一元标准为多元标准2重视学校开展过程3开展学校自主评价你认为在建筑开展性学校评价的模式时要注意的问题有哪些？1在学校自评与他评的关系上，要以学校自评为主，外部他评为辅2在形成性评价和终结性评价的结合上，要以注重过程的形成性评价为主3在开展过程和开展结果的关系上，要侧重于开展过程4在统一标准和办学特色的关系上，要强调办学特色5要重视评价结果的反响二、什么是形成性测量与评价、诊断性测量与评价和总结性测量与评价？它们的使用有何重要意义？答：形成性评价是指在教育、教学活动方案实施的过程中，对方案、方案执行的情况进行的评价。其目的是为了了解动态过程的效果，及时反响信息，及时调节，使方案、方案不断完善，以便顺利到达预期的目的。诊断性评价是指在教育、教学活动开始之前，为使方案更有效地实施而进行的预测性、摸底性评价。其目的是为了摸清评价对象的根底和情况，分析存在的问题，为解决问题搜集必要的资料，以找到解决问题的方法。总结性评价是指某一教育、教学活动工程告一段落或完成以后进行的评价。其目的是为了了解这项活动到达预期目标的情况以及它的最终效果或效益。六、如何理解教育目标与测验目标的关系？答：测验目标是测验编制者所编制的测验所要到达的某种具体的目的，它明确规定测验所要到达的预期结果或标准。测验目标确实定是以教育目标分类理论为根底的。布式的认知目标分类法一直被认为是测验目标分类的依据。七、试述设计测验蓝图的主要步骤。答：〔1〕内容类测验目标模型的构建，〔2〕内容点测试目标表确实定，〔3〕命题方案表的设计。八、试述布卢姆关于认知领域的教育目标分类的内容。答：布卢姆把教育目标分为认知领域、情感领域和动作技能领域，把认知领域分为知识、理解、应用、分析、综合和评价等六类。九、测验试题主要有哪些类型？试分析各类试题的测量功能与命题要求。答：题型可分为两大类，一类是封闭式，另一类是开放式。封闭式题型的答案是固定的，十分正确，评分客观、可靠。包括选择型和提供型，选择型包括是非题、配对题、选择题等，提供型包括填空题、改错题、名词解释题、简答题。开放式题型正确答案的自由度比拟大，由评分者掌握，不能用机器阅卷。包括计算题、证明题、论述题、写作题、设计题、翻译题等。是非题由一个陈述句构成，要求学生判断真或假，是或非，对或错，等等。主要功能是测量学生判断陈述句子的正确性能力。配对题是一种改造的选择题。它把一系列的题干列成一列，把配备的选项列在另一列，即数个题干共同使用相同的几个选项，要求所有选项均构成每一题干的似真项。主要功能是测量学生对字词的、事件、人物、地点、公式、原理等关系的识记能力和联结能力。选择题是由一个题干和几个选项所组成的试题，其功能是迷惑那些无法确定正确答案的考生，测量学生对问题的理解、再认、比拟与区分的能力，以及思维的敏捷性和准确的判断力。填空题是提供一个留有空隙的不完整的陈述句子，要求考生将空缺的字、词、句填补下去。主要功能是测量学生的记忆能力。改错题是提供有错误的陈述句子，要求考生在句子错误局部的下面画线，并将正确答案写在线下面。功能是测量学生的判断能力、记忆能力和理解能力。名词解释题是提供重要的名词或概念，要求考生作出正确的解释。功能是测量学生对一些重要术语、概念的掌握情况。简答题是提供问题要求考生对考题作出简要答复，它常常由一个直接问句或不完全表达句构成。功能是测量考生对重要知识的记忆程度。计算题是在试题中提供计算条件，提出计算要求，要求考生计算结果，有时还要求作出解答。功能是测量考生解决问题思维能力以及运算技巧的掌握程度。论述题是向考生提出较为复杂的问题，要求作出分析、说明、解释、论证，或作出结论，或提出自己的观点和见解。功能是测量考生组织知识、表达思维和分析问题、解决问题的能力。十一、多元智力理论的根本观点。答：美国哈佛大学心理学教授贾德纳的多元智力理论强调人类智慧至少应包括以下7种不同的智力〔1〕言语智力；〔2〕数理逻辑智力；〔3〕空间智力；〔4〕音乐智力；〔5〕体能智力；〔6〕人际智力；〔7〕自知智力。贾德纳认为，传统的智力测验只是测试了言语智力和数理逻辑智力，无视了其他的智力。在贾德纳的观念中，上述7种智力在人们的实际生活中是同等重要的，并无主次之分。他还指出，由于时代的不同和文化上的差异，这7种智力在人们心目中的重要性是常有转移的。十三、教育信息的特点和收集方法。答：特点：〔1〕准确性〔2〕可靠性〔3〕时限性。方法：〔1〕观察法〔2〕听汇报〔3〕调查访问〔4〕座谈会〔5〕收集文字资料〔6〕发问卷〔7〕测试【篇二：测量正确度评价】测量正确度评价南通大学附属医院王惠民测量正确度〔measurementtrueness〕简称正确度，指无穷屡次重复测量所得值的平均值与一个参考值间的一致程度[1]。正确度不是一个量，是个抽象概念，不能用数值表示，因为在实际工作中对同一被测对象不可能进行无穷次测量。正确度与系统误差有关，与随机误差无关。只可说正确度“好〞或“差〞，正确度的好差可用偏移来衡量，而偏移可用数量表示。“测量正确度〞不等同于“测量准确度〞。测量偏移〔measurementbias〕简称偏移，有的文献称为偏倚，指系统测量误差的估计值。常通过将测量结果的平均值减去参考值〔如有证参考物质的值〕获得，偏移可为正数或负数。可计算绝对偏移，也可计算相对偏移。正确度是方法学评价的重要内容。一、正确度评价的内容正确度评价实际上就是进行实验设计并计算偏移的过程。可通过与一个参考值比拟计算偏移，该参考值可来自于参考物质、室间质量评价〔eqa/pt〕的靶值、方法学比拟试验、回收试验等。正规的方法比拟实验是将常规测量程序与参考测量程序〔rmp〕比拟。建立rmp对于临床实验室来说，是一件十分困难的事，因此大多数情况下不能直接与rmp比拟，而只能与较好的方法或原有的方法进行比拟。clsiep9-a2?用患者标本进行方法比拟试验及偏移评估?[2]和ep15-a2?精密度和正确度性能的用户验证?[3]都介绍了用方法比拟试验进行正确度评价，其主要差异是，前者要求的实验次数较多，每天测8个标本，5天完成，共测定40份标本；后者测定20份标本，可在1天内完成。前者对数据进行严格的统计处理，而后者的计算较为简便。因此，ep9-a2更适用于方法学的正确度确认，而ep15-a2仅适用于方法学验证。clsiep10-a3?临床实验室定量检测方法的初步评价?[4]是同时评价精密度、正确度、线性、携带污染率的方法，是一种更简易评价正确度的方法。二、正确度的判断正确度的性能是通过偏移来进行判断的，对正确度性能进行评价也是通过实验确定偏移的大小，再根据相关原那么进行判断。测量程序的正确度是否可接受主要依据以下几种方法进1行判断：①与实验室自定标准比拟；②利用效能函数判断；③与国家标准比拟；④与clia’88推荐的允许总误差比拟；⑤与厂家声明的偏移比拟；⑥通过方法性能决定图判断。以往有作者在进行方法学比拟时，用统计学处理方法如配对t检验、相关系数〔r〕分析，但统计学差异显著的，并不表示该试验方法在临床上不被接受，反之亦然。t检验和相关系数不能用来进行正确度的判断。1.与实验室自定标准比拟2.利用效能函数判断en=x1-x2+u21223.与国家卫生标准的要求比拟卫生部于2021年中华人民共和国卫生行业标准ws/t403-2021?临床生物化学检验常规工程分析质量指标?[7]，规定了允许偏移的标准。表1国家卫生标准允许偏移〔%〕24.与clia’88的要求比拟与clia’88的允许总误差〔tea〕要求比拟，一般偏移1/2tea时，被认为属于可接受水平。5.与厂家声明的偏移比拟如实验室得到的偏移小于厂家声明的，说明该方法可在临床应用；如大于厂家声明的，那么需进行统计学处理后再进行比拟，如ep15-a2评价方案。6.通过方法性能决定图判断〔1〕方法性能决定图的意义精密度和正确度是方法性能中最重要的指标。应用westgard方法决定图，根据试验方法的偏移和不精密度找出其在方法决定图上的位置，用以判别方法性能。方法决定图是以tea为判断标准的一种方法，一般有四种判断标准：①偏移+2s，即bias+2stea；②偏移+3s，即+3stea；③偏移+4s，即+4stea；④偏移+6s，即+6stea。〔2〕方法性能决定图的使用①假设试验方法性能位于+2s线以外，属不可接受性能，该方法不能在临床应用；②方法性能点在+2s和+3s区域内被认为方法性能差；③方法性能点处于，方法性能属临界，该方法在实+3s和+4s线的区域〔包括在+4s线上的〕际使用中需要进行严格的质量控制；④方法性能点越接近左下方，其方法性能越好，假设方法性能点处于+6s以内，其方法性能已到达世界顶级水平〔worldclassperformance〕，这样的方法很容易管理和控制。3图1方法性能决定图〔3〕应用例如某测定白蛋白的方法，测定值35g/l处的cv为1.8%，偏移为0.2%；clia’88的质量要求是10%；x取1.8%，y为0.2%，即图中的“1〞点，如图2所示。因此它在方法性能决定图上的性能点位置清楚说明方法的性能属于优秀。图2方法性能决定图应用例如三、与参考物质比拟计算偏移1.常规方法将有证参考物质连续测量3～5天，每天测量3～5次，直接计算偏移的绝对值或相对偏移。用常规方法对标准物质连续进行5天测定，每天测定5次，获得如表2结果。表2常规方法测定肌酐标准物质结果〔mmol/l〕测定序次第1天第2天第3天第4天第5天123451401401401411401381391381371391431441441451431431431421431421421431411421434b=x-xcrm=141.4-142.1=-0.7〔mmol/l〕b%=b/xcrm=-0.7/142.1=-0.49%2.clsiep15-a2方法连续测量5天，每天测量2次，每天尽量由不同的操作者进行操作。根据可信限，计算出偏移的允许区间。例2：40mg/dl的血糖参考物质，试剂的来源及批号为mk243，校准品为rnc59lw。测量结果及计算见表3。表3血糖参考物质的测量结果及计算〔1〕计算均值x=∑xinin=(x1+x2+x3+x4+x5+x6+x7+x8+x9+x10)10=377=37.7mg/dl10〔2〕计算标准误5【篇三：测量、测试与评价】我们在工作中经常用到“测试〞、“测量〞、“考试〞、“测验〞、“评价〞等术语或说法。它们之间既有联系，又有区别，不能混为一谈。1．测量什么是测量？stevens〔195〕认为，“广义而言，测量〔measurement〕就是根据法那么赋予事物数量。〞也就是说，按照一定的规那么给事物的属性指派数字或符号的过程就是测量。这是迄今为止公认的测量定义。举例来讲，要测量一下桌子的高度，我们可以拿尺子来量一量，看看它有多高。尺子是人们根据一定的法那么制定的量具，利用它就可以把事物的属性，即桌子的高度用数字表示出来，如，0.75米。这种测量属于客观测量，因为它根本上不受观察者的主观判断的影响。由此可以看出，测量这一定义包含三个要素：①事物及其属性这是测量的对象或目标。上面提到的对桌子的高度进行测量，属于对物体进行测量，其属性——高度，是可以观察到的，可以进行客观测量的。在外语教学领域，我们感兴趣的是学生的语言能力，而学生的语言能力属于人的心理特征，是无法直接测量的，但是人的心理活动会在人的具体活动和行为中表达出来，所以只能通过测量其外显行为或外在表现特征来推论一个学生语言能力的上下。②指派数字或符号所谓指派数字或符号，就是用数字或符号来代表某一事物或事物的某一属性的量。如张三在本次阅读考试中得了87分，李四得了92分，我们说李四比张三多考了5分。数字本身没有意义，只是一种符号。我们用它来代表考生的阅读成绩，这时它就变成了量化的数，可以对其进行解释和分析。在一定的条件下，还可以对数据进行运算从而对事物的属性进行推测。③法那么法那么是指测量所依据的规那么和方法，是测量的关键。法那么不好或不可靠，得到的测量结果就会出偏差，失去测量的意义。简单来说，尺子不准，测量的结果就无法使人信服。对客观世界的物体进行测量时，由于有公认的测量法那么或尺度，如测量物体的高度、重量等；一般不会出现大的偏差。而对人的某些特性〔心理特征〕进行测量时，那么往往会出现较大的偏差。举例来讲，有几个评委对某学生的英语口语进行评定。评委a认为一个人的口语要好，必须发音准确，而该学生的发音好，所以他给打了个5分。评委b认为流利性最能表达一个人的口语水平，该同学尽管发音不错，但流利性差一些，所以她给他3分。同一名学生，让不同的评委去打分，成绩出现了偏差。这也很自然，原因是他们没有按照一个评定口语成绩的统一法那么〔rules〕去给这名学生打分，结果造成了偏差。这个例子提醒我们，在对人的某些心理特征，如口语表达能力、阅读理解能力等等进行测量时，首先要制定一个便于操作的，稳定的法那么或标准。这样得到的测量结果才可靠，才具有可比性。2．测试测试〔test〕又称测验。不同的心理学家对此下的定义不同。anastasi〔1982〕认为，“测试实质上是对行为样本所做的客观的标准化的测量。〞这个定义是人们公认的最权威的定义，它包含以下三个根本要素：①行为样本语言测试的目的是要测量受试者的语言能力。上面提到，语言能力是无形的，如何主测量？只能测量它的有形表现，这里所说的有形表现，是指语言表现，如说出来的话，写出来的句子，对测试题目所做的各种反响等等、这些行为，都是无形的语言能力的有形表现，用心理学术语叫“表征〞〔manifestation〕。所谓行为样本，是指对语言能力表现行为的有效的抽样。我们知道，一个人的语言能力的表现行为会有各种各样的形式，测试时不可能也没有必要把它的全部表现行为都测到，只能选取一局部有代表性的抽样进行测量，然后据此对受试者的语言能力作出推测。②客观的测量所谓客观的测量是指测量的标准是否符合实际。对于一项测试的客观性程度可以从这么几个方面去评价：⑴测试题目的难易度和区分度如何；⑵测试结果的可靠性程度如何？⑶测试结果的有效性如何？这几项指标是衡量一项测试质量的重要指标。③标准化的测量标准化的测量是指在测试题目的编制、测试的实施、记分以及对分数的解释等方面有一套严密的系统的程序。只有这样，测试才有统一的标准，对不同人的测量结果才有可比性。但凡不标准化的测量，都没有可比性。3．评价weiss〔1972〕认为，“评价〔evaluation〕是指为作出某种决策而收集资料，并对资料进行分析，作出解释的系统过程。〞与测量、测试相比，评价的含义更广、综合性更强。bachman〔1990〕指出，决策的正确与否，一方面取决与决策者本身的能力，另一方面那么取决于收集到的信息的质量。在其它条件等同的情况下，如果收集到的信息越可靠，相关性越强，那么，作出正确决策的可能性就越大。所以说，评价的一个很重要的方面就是要获得可靠的、相关的信息。在谈到评价与测量及测试的关系时，bachman指出，在对个体〔学生〕作出评价时，我们可以从质量和数量两个方面进行描述，或只描述其中一个方面。所谓质量方面的描述是指对学生的行为作出定性的描述，如某某学生的口头表达能力优秀，书面表达能力优良等；数量方面的描述那么是指某次测验的分数等。对于测试、测量及评价三者之间的关系，他用下面的图来表示。测试、测量及评价三者之间的关系一、对现行测评方法的评价〔一〕问题的提出随着国家人事制度改革的不断深入，人才测评已经有了一个可喜的开端，尽管尚有不尽人意之处。然而“如何测好〞的问题又刻不容缓地摆在我们面前。应该说，十年间，我们在探索科学、“如何评价〞人才选拔方面，已经取得了一定的进步。例如，在人才选拔过程中，重视思想政治素质，强调人才的实际能力，以及开始了向社会公开招考、择优录用的大胆尝试。但是仍然存在一些薄弱环节。例如，虽然建立了考试机制，但缺少统一的标准；在考试的内容上，多偏重于知识考查，无视开展潜能的预测；在考试技术上，沿用教育测量的作法多，借助于多种科学，引用新技术的尝试少。尽管考试录用人才的作法已赢得社会和用人部门的认可，但是高分低能的问题仍未能得到解决。总之我们的任务十分艰巨，要使人才测评工作再上一个台阶，我们有必要对考试方法进行新的探索和研究。〔二〕考试内容的分析既然我们选拔录用人才是以“因事择人，专用一致〞为原那么，那么岗位需要就是我们考试内容设计的依据。下面从影响工作成绩的因素出发，对人才录用中应该考查的内容做如下分析。1、智能因素：主要包括知识、智力、能力倾向、实践经验。①知识与工作成效知识是个人经过有目的、有选择地学习后，在头脑形成的有系统、有层次的结构体系。知识与工作绩效的关系密切，它是做好工作的根本条件；正因为如此，目前我们的人才录用考试在知识的考查上比重都较大。对知识的考查，一是看容量，二是结构的合理性。后者对工作绩效的影响更为直接。这两年来，对学识的考查有过争论，有人主张学识并不是推测潜能的指标，而智力与能力倾向测验对潜能的预测才更有意义。这种观点认为，管理人员的开展，主要决定在根本才能的具备和运用，而非决定于某专业方面的知识有多少。②智力与工作绩效所谓能力是指人的认识能力和行为所到达的水平。亦可称为一般能力。智力与知识互为联系，但不是一回事，一个人的智力水平高，将有助于他尽快地接受和掌握知识；反过来知识的不断积累，又有利于+智力水平的提高。但是智力的提高与知识的积累并不成比例。关于智力与工作绩效的关系，目前尚有争议。但大多数人认为智力因素是选择人员的必要条件。不过也有研究说明，当智力均已到达中等水平以后，它与工作绩效的相关甚微，尤其是在执行类人员中，高智力很可能导致低绩效。即使是在指导类管理者中，智力也并非越高越好，因为过于聪明的人制定政策，往往容易脱离实际。所以有些国家在制定选人原那么上，对常识、智力采取封闭式标准。即规定录用的最低限和最高限。③能力倾向与工作绩效能力倾向的含义，尚有广义与狭义之分。广义地说，它包括人的身体条件、智能、性格、兴趣等是否适合于某个方面的职业领域。狭义地说，是指为了有效地进行某种特定活动所必需的特殊能力。值得指出的是，人的能力倾向是尚未接受教育训练的潜能，它同经过学习训练而获得的才能是有区别的。其次，能力倾向与智力之间无必然的相关。心理学的实践证明，人的特殊能力与智力的关系很小。一个人具有较强的智力水平，可能会有一些特殊的才能，但也可能缺乏某些如音乐的美术的特殊能力。而那些有美术、音乐才能的人，其聪明性，既可能在平均者之上，也可能在平均者之下。所以我们不能从一个人的能力倾向来推测他的智力，同样也不能从他智力水平来推测他的特殊能力。能力倾向与工作绩效的相关是比拟明显的，如果一个人的能力与他所从事的工作特点相匹配，那么就容易得到成功。我们提倡“用人所长〞就是这个道理。在二次世界大战以后，心理学的主要奉献就是在能力倾向测验的开展上，现在有很多研究迹象说明，智力测验越是趋于一般化，其价值越低。能力测验如果能突出特殊性就等于提高其价值。在我们现行的考试内容设计中，大家似乎已经注意到这个因素的重要性，但在考查手段上还是一个薄弱环节。④实践经验与工作绩效实践经验是指从亲身参加活动或者直接观察活动中得到的知识、技巧和行为方式。实践经验与工作绩效之间的相关性是显而易见的。尤其对于政府机关执行类的人才来讲，在某种意义上，经验比学历、知识更重要。当然三者又不可截然分开。值得指出的是，一个人被录用前的实践经验应当与他将要从事的工作性质是正相关时，他的实践经验才能继续获得用武之地，否那么将没有考察意义。2、非智能因素：主要包括政治素质、成就动机、社会适应性、身体条件。①政治素质与工作绩效政治素质主要是指一个人的政治立场、信仰和态度倾向，主要表达在思想觉悟、道德情操和价值水准上。政治素质将决定工作绩效的方向，是人才考核中不可无视的主要指标。②成就动机与工作绩效成就是指一个人在工作中达成组织或个人目标所设置的期望值。实践证明，工作绩效的大小，取决于一个人的能力与成就动机的强度。即强度较高的成就动机将有助于工作上的成功。但是成就动机也并非越高越好。有研究说明，成就动机处于中等强度时，工作绩效最正确。近年来，英、美国家又开展了一种新的笔试，要求个人撰写本人的未来“自传〞，设想个人今后五至十年的工作方案，以此测验应试者的成就动机和筹策能力，从而发现最适宜的管理人才。③社会适应性与工作绩效社会适应性是指人与社会相互作用时的心理承受水平以及自我调节能力。它包括人的气质、性格、应激能力等心理指标。

                    本文档为【评语大全之测量工作评语】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

评语大全之测量工作评语

你可能还喜欢