首页 基于项目反应理论的试题参数估计方法(精)

基于项目反应理论的试题参数估计方法(精)

举报
开通vip

基于项目反应理论的试题参数估计方法(精)第 5卷   第 1期 贵阳学院学报 (自然科学版   (季刊   Vol . 5  No . 1JOURNAL OF G U I Y ANG COLLEGE 2010年 3月 Natural Sciences (Quarterly Mar . 2010 基于项目反应理论的试题参数估计方法 薛宝山 (山东胜利职业学院 , 山东   东营   257097 摘   要 :探讨了几种常用的基于项目反应理论 (I RT 的试题参数估计方法 , 并分析了每一种估计方法的优 缺点及各自的适用领域 , 为构建基于 I RT...

基于项目反应理论的试题参数估计方法(精)
第 5卷   第 1期 贵阳学院学报 (自然科学版   (季刊   Vol . 5  No . 1JOURNAL OF G U I Y ANG COLLEGE 2010年 3月 Natural Sciences (Quarterly Mar . 2010 基于项目反应理论的试题参数估计方法 薛宝山 (山东胜利职业学院 , 山东   东营   257097 摘   要 :探讨了几种常用的基于项目反应理论 (I RT 的试题参数估计方法 , 并分析了每一种估计方法的优 缺点及各自的适用领域 , 为构建基于 I RT 的试题库系统提供理论参考 。 关键词 :项目反应理论 ; 试题库 ; 参数估计 ; 遗传算法 中图分类号 :TP3111131  文献标识码 :A   文章编号 :1673-6125(2010 01-03 I RT 2ba sed Param eter Eva on s (Shandong 257097, China Abstract:The p l ores several common I RT -based evaluati on methods of test questi ons and analyses ad 2vantages and of each method and its suitable app licati on range, which p r ovides the theoretical reference t o constructing I RT -based test questi on bank syste m. Key words:I RT; test questi on bank; para meter evaluati on; genetic algorith m; 1  引言 在互联网技术迅速发展的今天 , 基于网络技术 的考试系统得到了广泛的应用 , 网络考试系统拓展 了考试的灵活性 , 显著降低了教育成本 。 作为网络 考试系统中的重要环节 , 试题库及其理论的研究和 应用也越来越广泛 。 试题库是严格遵循教育测量理论 , 在计算机系 统中实现的某个学科题目的集合 , 是在精确的数学 模型基础上建立起来的教育测量工具 。试题库系 统是进行计算机辅助教学的一种有利工具 , 是计算 机科学 、 教育测量理论相结合的产物 , 是未来计算 机辅助教学系统的一个重要的发展方向 。 2  理论基础 211  项目反应理论 (I RT 项目反应理论是一种以试题参数为前提的理 论 , 它以被试个体潜能通过试题作答反应的可测 性 , 被试个体潜能与其试题上可见反应函数关系的 基本一致性 , 以及试题参数线性变换下的不变性为 理论假设 , 进而建立种种以被试个体在既定试题上 的作答反应参数来推断其潜在特性的数学模型 , 以 一定的数学模型来确定被试个体试题反应概率与 其潜在能力之间的函数关系 。 项目反应理论的质量指标即项目参数的估计 值与样本选择无关 , 对被试者能力水平的估计值与 测试试题无关 , 是一种建立于一套假定之上的能力 测量理论 。 考生的能力估计值除了测量误差外 , 不 会受所使用的测试种类的影响 , 它是试题独立 (I 2te m -independent 的能力估计值 , 其次 , 从不同群 体的考生估计得到的试题参数估计值 , 不受参与测 试的考生群体的影响 , 也就是说它是样本独立 — 87— 3收稿日期 :2009-12-30 作者简介 :薛宝山 (19  - , 男 , 山东胜利职业学院 , 讲师 , 本科 , 研究方向 :软件工程。 (Sa mp le -independent 的试题参数估计值 。项目 反应理论还提供其测量的估计 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 差 ((Standard err ors 和试题的信息函数 (Ite m inf or mati on func 2 ti on , 它可以用来作为评价能力估计值之精确度的 指标 , 优于经典测试理论中的 “ 信度 ” (Reliability 。 212  试题参数的估计 任何项目反应模型都可以统一描述成 P j (Q =F (Q, a, b, c 的形式 。公式中中包含两类参数 , 一类是被试者的能力参数 , 用 Q 来表示 , 只与被试 者有关 , 与题目参数无关 ; 另一类是项目的质量参 数 , 用 a 、 b 、 c 标识 , 分别称为区分度参数 、 难度参数 和猜测参数 , 这些参数值都不能由直接测量得到 , 而必须通过被试者的反应数据进行估计来求出 。 在项目反应理论模型的研究过程中 , 人们提出 了多种理论模型 , 可以分为两大类 :静态模型与动 态模型 。 静态模型描述被测试者某一时刻的素质 、 能力水平不随时间变化 ; 动态模型则用来描述被试 者的内在素质 、 能力水平随时间变化的情况 。 比较成熟的是静态模型 , , , 状分为正态卵型和逻辑斯蒂型等多种 。 213  逻辑斯蒂克模型 (Logistic Model 目前应用较广的是逻辑斯蒂克模型 (Logistic Model 。 在逻辑斯蒂克模型中 , 根据参数的不同 , 特 征函数可分为单参数、 双参数和三参数三种模式 : 单参数模式 :p (θ 1+e -D (θ-b 双参数模式 :p (θ 1+e -D a (θ-b 三参数模式 :p (θ =c +(1-c 1+e -D d (θ-b 其中 , D =11702为量表因子常数 ; θ为受测者 能力值 。 P (θ 表示能力为 θ的人答对此题目的概 率 ; a 为题目的区分度 , 即特征曲线的斜率 , 它的值 越大说明题目对受测者的区分程度越高 ; b 表示题 目的难度 , 即特征曲线在横坐标上的投影 ; c 表示 题目的猜测系数 , 即特征曲线的截距 , c 的值越大 , 说明不论受测者能力高低 , 都容易猜对本道题目 。 当 c =0为双参数模式 , 当 c =0且 a =1时为 单参数模式 。 通常 θ、 a 、 b 、 c 都是未知的 , 要根据被 试对项目的作答反应对 θ、 a 、 b 、 c 进行估计 , 一般采 用双参数 Logistic 的 0-1评分模型进行比较 。根 据具体问题 , 可出现几种情况 :第一是各项目参数 已知 , 估计被试能力 ; 第二是被试能力已知 , 估计项 目参数 ; 第三是同时估计被试能力和项目参数 。 3  试题参数的估计方法 311  极大似然估计法 在测试过程中 , 对测试样本进行如下统计 :假 设第 j 道试题的区分度为 a (j , 难度系数为 b (j , 猜测系数为 c (j , 应试者在该试题的反应函数 :U j ={1:答对情况 ; 0:答错情况 }。该应试者参与了 n 道测试后 , 其能力计算的极大似然方程为 : L (θ =L (U │ θ, a, b, c =Π n j =1 exp (u j 3 1n p j 3exp (1-u j 31n (1-p j 其中 θ为应试者的能力值 , Pj 为该应试者对第 j 道 题目的三参数 Logistic , Pj 为在该应试者能 L θ 两边求对数有 : =Π n j =1 (u j 3 1n p j +Πn j =1 (1-u j 31n (1 -p j 令 F (θ =ln L (θ , 则 : d θ 1n L (θ =F (θ =D 3Π n j =1 a j 3(u j -p j (p j -c j /p j 3(1-c j 通过解方程 F ′ (θ =0可求得能力参数 θ的 极大似然估计值 。 根据此模型计算可以得知 , 如果 受测者答错了 , 能力的估计值就会降低 ; 如果受测 者答对了 , 能力的估计值就会提高 。 为了避免出现能力测试失败 , 提高计算方法的 收敛速度 , 使能力估计值快速趋于稳定 , 可以通过 两种算法对此极大似然方程进行求解 。一种是常 用 Ne wt on -Raphs on 迭代法 , 又称切线法 , 切线法 存在如下不足 :(1 方程的可行解中不能出现导数 为零的点 (不收敛点 ; (2 方程的收敛速度较慢 , 特别是当 θ(t +1 值趋近于方程的解时 , 收敛明显 减慢 ; (3 方程的解法中当不存在解时 , 缺少对实 际能力值的调整 ; (4 当方程出现多解时 , 缺少相 应的处理 。 第二种方法是中值法 , 可以解决切线法中存在 的收敛问题 , 中值法满足条件的可能性相对切线法 来说是较为容易 , 采用中值计算法 , 收敛速度快 , 出 现特殊情况时进行简单的调整 , 这在一定程度上保 证了最终的能力估计值曲线的平衡性 。 — 9 7— 312  基于神经网络的参数估计方法 运用神经网络进行参数估计的方法 , 通过将所 有考生在项目上的反应作为网络输入 , 将项目的 I RT 参数值作为网络输出 , 进行网络建模 , 并通过 锚题测验 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 , 提供训练样本以及训练网络 ; 训练 好的网络就可以对小样本和连续记分的 I RT 参数 进行估计 , 该方法可以得到较好的估计精度 。 在基 于 I RT 的题库建设中 , 连续记分模型已经不再采 用 , 取而代之的是更为实用的基于二值记分的三参 数 Logistic 模型 (3P L M 。所谓二值记分 , 即指考 生在项目上的作答要么正确 , 基于神经网络项目参 数估计方法也适用于二值记分方式 。 GRNN 是由 Specht 提出的一种前馈式监督型 神经网络 。 该网络的结构设计比较简单 , 它具有一 个径向基隐层和一个线性输出层 , 只有一个网络参 数需要调节 , 具有学习速度快 、 拟合能力强等优点 , 常用于解决回归问题 , 尤其非常成功地应用在函数 拟合中 。 Matlab 网络设计函数为 ne wgrnn (P, T, SP , 样本 , T 为输出期望 , SP 度 。 其中 , 练样本数 , , 且该 层网络输入函数和传递函数分别为 Euclidean 距离 函数和 Gaussian 函数 。线性层权值为训练样本的 输出期望值 , 该层的网络输入函数和传递函数分别 规则化为点积函数和线性函数 。 在区分度和猜测系数上 , 神经网络方法比数理 统计方法的估计误差要小 , 但在难度上 , 神经网络 方法的误差较大 ; 在一些情况下 , 神经网络方法的 优势并不明显 , 但是当去掉对项目参数的先验概率 分布的限制后 , 基于神经网络的参数方法才体现出 一定的优势 。 特别是在小样本测验情况下 , 去掉对 项目参数的先验概率分布的限制后 , 神经网络方法 的优势更加明显 。 313  基于遗传算法的参数估计方法 遗传算法 (Genetic A lgorithm , G A 是近些年发 展起来的基于生物自然选择和自然遗传理论的随 机化全局优化算法 。与其它方法相比 , 遗传算法 具有其它算法所没有的自适应性 、 全局优化性和隐 含并行性 , 在解决问题时具有很强的稳健性 。 遗传算法通过“ 优胜劣汰 ” 选择个体 , 通过遗 传算子操作可产生新的优良结构的个体 , 采用与适 应值成比例的选择策略 , 可以使适应值高的个体具 有更多的生存机会 , 但也因此可能导致算法过早的 不成熟收敛等 。为了实现算法的自适应性与避免 早熟现象 , 可以用自适应的惩罚函数的方式调整适 应度函数 。 根据连续 k 代具有高适应度的个体满 足约束条件的情况调整惩罚因子 λ, 进而调整适应 函数为 : λ= λ3(1-δ λ3(1+ε λ 传统遗传算法采用的是二进制编码 , 现在应 用较多的是基于实数编码的遗传算法 (Real cod 2 ing Genetic A lgorithm , RG A 。这种遗传算法的过 程为 :在种群规模为 L 的父代种群基础上分别通 、 , 再 、 选择 、 杂交 , 如此反复 , 直到满足条件为止 。显然 , 改 进后的 RG A 实际搜索范围广 , 得到全局最优点的 机会也大 。 采用实数编码进行 I RT 的 3P LM 参数估计 , 是连续参数优化问题的自然描述 , 取消了编码 、 解码的过程 , 提高了算法的速度和精度 , 优点非 常明显 。 4  结束语 本文探讨了几种常用的基于项目反应理论的 试题参数估计方法 , 并分析了每一种估计方法的优 缺点 。 在建立试题库系统时 , 几种试题参数估计方 法可以结合使用 , 从而构建更加科学 、 高效 、 智能的 试题库系统 。 参考文献 : [1]戴海崎 . 国内项目反应理论 (I RT 应用研究述评 [J ].考试研究 , 200511. [2]李敏强 , 寇纪淞 , 林丹等 , 遗传算法的基本理论与应用 , 教育技术通讯应用开发 , 200417. [3]习胜丰 , 何志国 , 基于 W E B 的自适应考试系统的研究 与设计 , 计算技术与自动化 , 200813. — 0 8—
本文档为【基于项目反应理论的试题参数估计方法(精)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_633808
暂无简介~
格式:doc
大小:28KB
软件:Word
页数:10
分类:
上传时间:2019-06-05
浏览量:28