首页 SPSS软件中不同类型多选题的编码和分析方法

SPSS软件中不同类型多选题的编码和分析方法

举报
开通vip

SPSS软件中不同类型多选题的编码和分析方法 市场研究11 2010■ ■ 理论与方法 SPSS软件中不同类型 多选题的编码和分析方法 问卷调查法是社会科学领域常用的一种研究手段。 研究者将所要研究的问题编制成问题表格, 通过被访者 自行填答或对被访者的当面询问, 了解他们对某一现象 或问题的看法和意见。 问卷的设计要根据调查内容的特 点,选择使用不同的题型。 一方面可以提高被访者的答题 兴趣,缓解厌烦情绪;另一方面也可以从多个角度挖掘所 研究的问题, 方便对调查结果进行进一步量化分析和统 计处理。 在问卷设计中,常见的题型包括单选题、...

SPSS软件中不同类型多选题的编码和分析方法
市场研究11 2010■ ■ 理论与方法 SPSS软件中不同类型 多选题的编码和分析方法 问卷调查法是社会科学领域常用的一种研究手段。 研究者将所要研究的问题编制成问题表格, 通过被访者 自行填答或对被访者的当面询问, 了解他们对某一现象 或问题的看法和意见。 问卷的 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 要根据调查内容的特 点,选择使用不同的题型。 一方面可以提高被访者的答题 兴趣,缓解厌烦情绪;另一方面也可以从多个角度挖掘所 研究的问题, 方便对调查结果进行进一步量化分析和统 计处理。 在问卷设计中,常见的题型包括单选题、多选题和问 答题。 多选题(Multiple Choice)又称多重应答题(Multiple Response),指 答案 八年级地理上册填图题岩土工程勘察试题省略号的作用及举例应急救援安全知识车间5s试题及答案 不止一个,被访者可以同时选择多个选 项的题目。 多选题是社会科学领域中调查问卷的一种常 见问题形式,本质上属于分类数据,其优势是可以广泛的 搜集被访者的态度倾向,探索不同人群的态度组合,也可 以为进一步编制或修订量表提供依据。 同时,多选题相对 于单选题来说往往更加符合实际情况, 所获得的信息量 也更丰富,可以为决策提供更多有参考价值的信息。 目前已有研究者(余益兵,2005;陶维东等,2008)对 多选题的数据编码提出了改进方法, 提高了数据录入转 换的效率,王春枝等人(2010)尝试提出了对多选题数据 进行深度挖掘的方法。 在实际研究工作中,研究者也 总结 初级经济法重点总结下载党员个人总结TXt高中句型全总结.doc高中句型全总结.doc理论力学知识点总结pdf 了不同类型多选题的特点和处理方法, 为更好地开展工 作提供了许多支持。 本文将分别探讨不定项多选题、定项 多选题和定项排序多选题适用的录入编码方式和深度分 析方法。 1. 不定项多选题的编码 不定项多选题是最常见的多选题形式,指一道题目有 多个选项, 被访者可以任意选择其中的若干个选项。 例 如,对城市居民交通出行状况的研究问卷中有以下问题: 例 1:您上班通常采用以下哪些交通工具? A. 步行;B. 自 行车;C. 电动车;D. 公交车;E. 地铁;F. 自驾车;G. 班车。 对于这种题型通常采用二分变量编码法, 也就是将多选 题的每个选项都定义为一个子变量,采用“0~1”编码进行 处理,选中的赋值为“1”,未选中的赋值为“0”。 本例可设 定 a1_1,a1_2 到 a1_7 共 7 个变量,它们代表从 A 到 G 共 7 个备选选项。如果被访者的选择为 A 和 C,则在 a1_1 和 a1_3 中输入 1,其他变量输入 0。 另一种处理不定项多选题的录入方式是多重分类编 码法,仍然根据选项的个数确定子变量,设定 b1_1,b1_2 笪 陈 丽 不定项多选题的编码和分析 趥趽 市场研究 2010 11■■ 理论与方法 到 b1_7 共 7 个变量,但是与二分变量编码法对 7 个备选 答案的编码方式不同, 多重分类法从 A 到 G 分别编码为 1~7,如果被访者的选择为 A 和 C,则在 b1_1 和 b1_2 中 依次输入 1 和 3,其他变量空缺。 也可以通过空缺变量末 位补零的方式保持文件长度的一致,“0”当作系统缺失值 处理,不参与计数分析。 对两种编码方式的比较可以看出,如果多选题没有限 定选择数量, 且没有要求被访者对所选择的选项作顺序 排列时,采用二分变量编码法分析数据更方便。 这种方法 是多选题编码的通用方法, 其优点是各选项之间相互独 立,编码简单清楚,形成的数据文件格式统一,方便检查。 但是这种编码方式会明显增加录入工作量, 无论被访者 选择了几个答案, 录入人员都要对每个子变量进行数据 录入,一定程度上增加了出现录入错误的风险。 而多重分 类编码法具有输入简便、不容易出错的优点,但是这种方 式录入的数据有时不方便直接进行深入的分析计算,需 要进一步转换。 2. 不定项多选题的分析 在使用 SPSS 统计软件对不定项多选题进行分析时, 首先要对多选题进行定义, 即将数据库中设定的多个子 变量合并定义为一个多选题 。 选择 Analyze / Multiple Response 命令,选择 Define Sets 打开对话框。 首先将“复 选集定义”(Set Definition) 框内的多个子变量选入“变量 题集”(Variables in Set )。 如本例中 a1_1,a1_2 到 a1_7 共 7 个子变量要全部选入。 其次,在“变量编码”(Variables Are Codes As) 框内定义编码方式。 若采用二分变量编码 法则选择 “二分变量”(Dichotomies) 项, 并在 “计数值” (Counted Value) 框内填入需要计数的值 (如本例应填写 1,代表选中);若采用多重分类编码法则选 “分类变量 ” (Categories)项,并在“取值范围”(Range)框内填写变量取 值的起止数字(如本例应填写 1~7,0 不予计数分析)。 第 三,在“变量名”(Name)和“变量标签”(Label)框中定义相 应的内容。 最后将定义完成的多选题变量填加到 “多选 集”(Multiple Response sets)中,此时变量集名前自动添加 了集符号“$”(如: $a1),完成对多选题的定义。 对不定项多选题的常用分析方式是频数分析和列联 表分析。 在 SPSS 中定义多选题完成后,可选择 Analyze / Multiple Response / Frequencies 对多选题进行频数统计, 主要目的是了解被访者在各个选项上的分布情况。 如对 例 1 的频数分析结果如表 1,可以看到被访者选择各种交 通工具的人数和百分比情况。 此外,选择 Analyze / Multiple Response / Crosstabs 可 进行交叉列联表分析, 获得不同分类群体在各个选项上 的分布情况。 对例 1 可以比较不同性别被访者选用交通 工具的差异,得到的列联分析表如表 2,可以看到不同性 别的被访者选择各种交通工具的人数分布。 多选题的列联表分析无法进行卡方检验,不能比较不 同类别之间的差异是否达到统计学上的显著意义。 为此, 可以进行进一步的数据转化, 根据列联分析的结果形成 新的数据文件,再进行卡方检验。 以例 1 为例,介绍两种 常用的方法。 方法一是设置两个变量,分别为“性别”和“交通工具 类型”,性别中的 1 代表男,2 代表女,交通工具类型中代 码 1~7 分别代表 A~G 共 7 种交通工具, 将列联分析表转 化为新的数据文件如表 3。此后,可使用 SPSS 统计软件中 的 Descriptive Statistics 下的 Crosstabs 菜单, 进行列联表 和卡方检验。将“性别”选入 Column[s]框,“交通工具类型” 选入 Row[s]框,选择 Statistics 菜单下的“卡方检验”(Chi- square),可以得到统计结果 Pearson Chi-Square=5.04,sig= 0.54。可见不同性别被访者选择交通工具的类型不存在显 著差异。 表 1 多选题频数分析表 交通工具 1步行 2自行车 3电动车 4公交车 5地铁 6自驾车 7班车 频 数 4 5 2 9 5 8 3 百分比 26.7% 33.3% 13.3% 60.0% 33.3% 53.3% 20.0% 表 2 多选题列联分析表 交通工具 1步行 2自行车 3电动车 4公交车 5地铁 6自驾车 7班车 男 3 4 1 4 1 4 1 合计 4 5 2 9 5 8 3 女 1 1 1 5 4 4 2 趦趭 市场研究11 2010■ ■ 理论与方法 方法二是设置三个变量,分别为“性别”、“交通工具类 型”和“权重”,性别中的 1 代表男,2 代表女,交通工具类 型中代码 1~7 分别代表 A~G 共 7 种交通工具, 权重即为 列联表中不同性别被访者选择的交通工具的频数, 得到 数据文件如表 4。 此后,先选择 Data 下的 weight case 菜单 命令对数据进行加权,以“权重”变量为加权变量。 对加权 后的数据再采用 Descriptive Statistics 下的 Crosstabs 菜单 作列联表和卡方检验,得到相同的分析结果。 这两种方法的数据文件形式不同,但分析的结果是一 致的, 可以比较不同性别的被访者选择的交通工具类型 是否存在显著的差异。 研究者也可以比较被访者对每一 个选项的选择是否存在这种类别之间的差异。 首先要求 数据录入时采用二分变量编码法, 若采用多重分类编码 法录入的数据需要重新将编码转换为 0、1 编码的数据。 然后直接对多选题的各个子变量进行列联表分析和卡方 检验。 如例 1 中,要比较被访者对每种交通工具的选择是 否存在性别差异 , 可以利用 Descriptive Statistics 下的 Crosstabs 菜单,将“性别”选入 Column[s]框,将设定的子变 量 a1_1,a1_2 到 a1_7 选入 Row[s]框,选择 Statistics 菜单 下的“卡方检验”(Chi-square)进行分析。 与不定项多选题相比,定项多选题唯一区别是固定了 要选出的答案个数,也称限选题。 例如一个题目有 7 个备 选项,题目要求被访者限选 3 项。 例 2:您上班更愿意选用以下哪些交通工具? (选择最 主要的 3 项)A. 步行;B. 自行车;C. 电动车;D. 公交车;E. 地铁;F. 自驾车;G. 班车。 定项多选题中被访者可能提供的答案的数量是已知 的且一般会少于备选项的个数, 因此应采用多重分类法 来进行编码录入。 根据题目限选的答案个数设定相应个 数的子变量,如例 2 中可以设定 a2_1,a2_2 和 a2_3,他们 代表最终选出的 3 个答案。 7 个备选答案从 A 到 G 分别 编码为 1~7,如果被访者的选择为 ACD,这分别在 a2_1, a2_2 和 a2_3 三个变量中输入 1、3 和 4。 完成编码后对定项多选题的频数和列联表分析与不 定项多选题相同。 定项排序多选题结合了多选题和排序题的优点,先从 若干备选选项中提取出若干个最重要的选项, 然后再进 行排序。 与多选题相比,在答案中增加了顺序信息,因此 内容更丰富。 例 3: 您认为上班选用以下哪些交通工具最为便捷? (选择最便捷的 3 项,并依次排序)A. 步行;B. 自行车;C. 电动车;D. 公交车;E. 地铁;F. 自驾车;G. 班车。 对这种题型的编码方式主要有两种:第一,与定项多 表 3 多选题列联表转换数据文件 1 交通工具类型 1 1 1 2 2 2 2 3 4 4 4 4 5 6 6 6 6 7 性别 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 性别 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 交通工具类型 1 2 3 4 4 4 4 4 5 5 5 5 6 6 6 6 7 7 表 4 多选题列联表转换数据文件 2 交通工具类型 1 2 3 4 5 6 7 1 2 3 4 5 6 7 性 别 1 1 1 1 1 1 1 2 2 2 2 2 2 2 权 重 3 4 1 4 1 4 1 1 1 1 5 4 4 2 定项多选题的编码和分析 定项排序多选题的编码和分析 趦趮 市场研究 2010 11■■ 理论与方法 选题相同,按照多重分类法的方式定义变量,录入信息。 这种方法简便易行, 但没有完全反映被访者提供的顺序 信息,实际上没有体现排序的作用。 采用这种编码方式录 入的数据与定项多选题的分析方法相同, 可根据频数分 析确定各选项的重要性程度, 一定程度上反映被访者对 几个选项重要性的评价。 如例 3 进行频数分析后,按照频 数从高到低排序可以看出, 人们认为最便捷的交通工具 是自驾车,其次是电动车、自行车等(见表 5)。 第二种方式是定义与选项个数相同的若干个变量,每 个变量的取值做如下定义:0 为未选,1 为排第一位,2 为 排第二位,3 为排第三位。 如例 3 中, 分别定义 7 个变量 a3_1,a3_2 到 a3_7,如果被访者这一题答案的选择和排序 是 C、A、D,则对应在第三个变量中输入 1,第一个变量输 入 2,第四个变量输入 3,其他各变量输入 0。 这种方法是 排序题和多选题相结合的方法, 优势在于可以进一步深 入比较各选项的选择次序, 既可以得到各选项的选择频 数,也可以看出各变量的排序。 但是在录入时需要录入者 对答案编码进行一个转换, 容易出错, 可能影响录入效 率。 对这种数据的分析方法是, 首先确定选择次序的权 重,对数据进行重新编码。 例如,排序为 1、2、3 的权重依 次是 5、3、1, 选择 SPSS 中的 Transform 下的 Recode into Same Variables 命令, 将所有变量选入 Variables 对话框, 点击 Old and New Values 进行重新赋值。 将 1 填入旧数 值,将 5 填入新数值,然后单击 Add 进行转换。 接着再进 行“2 到 3”、“3 到 1”两组转换,得到重新编码的数据。 经 过二次编码后,选择 Date 下的 Transpose 命令,对全部数 据做行列转换 。 得到数据文件的如表 6 所示 。 再选择 Transform 下的 Compute Variables 命令,定义新变量 Sum= sum(V01 to V15),比较 Sum 的分数即得到各个备选选项 的重要性排序。 本文简要介绍了不同类型的多选题,适用的编码录入 及分析方法, 总的原则是最大限度提供研究所需要的信 息、最大限度减小数据的容量、最大可能提高录入的效率 和准确性,尽可能对数据进行深入的分析和挖掘,期望能 为社会调查领域的研究者提供参考。 笙 参考文献: [1] 王春枝,王娟. 多选题数据深度分析及其在 SPSS 中的实现[J]. 内蒙古财经学院学报,2010,8(2):75-78. [2]余益兵. 复选题的 SPSS 数据编码技巧分析[J]. 统计教育,2005,7:7-8. [3]曾祥明,任佳慧. 使用 SPSS 软件对多项选择题作卡方检验的方法[J]. 市场研究,2005,10:32-33. [4]陶维东,陶晓丽,谢超香等. 在 SPSS 中实现多选题数据录入 _ 转换的新方法[J]. 统计教育,2008,1:19-21. [5]王宣承,张利,张敏强. 关于多选题和排序题的 SPSS 处理[J]. 市场研究,2009,11:31-33. (作者单位:北京师范大学社会发展与公共政策学院) 表 5 定项排序多选题频数分析表 交通工具 6自驾车 3电动车 2自行车 4公交车 5地铁 7班车 1步行 频 数 10 8 6 6 6 5 4 百分比 66.70% 53.30% 40.00% 40.00% 40.00% 33.30% 26.70% 1步行 2自行车 3电动车 4公交车 5地铁 6自驾车 7班车 V01 0 0 0 5 3 1 0 V02 0 0 0 5 3 0 1 V03 0 5 3 0 0 0 1 V04 5 3 1 0 0 0 0 V05 0 0 5 0 0 3 1 V06 5 0 0 0 3 1 0 V07 0 5 3 0 0 1 0 V08 0 0 0 5 3 1 0 V12 0 0 5 0 0 3 1 V10 0 0 0 5 0 3 1 V09 0 3 1 4 0 0 0 V13 5 0 0 0 3 1 0 Sum 20 24 22 29 18 16 5 V11 5 3 1 0 0 0 0 V14 0 5 3 0 0 1 0 V15 0 0 0 5 3 1 0 趦趯
本文档为【SPSS软件中不同类型多选题的编码和分析方法】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_105124
暂无简介~
格式:pdf
大小:134KB
软件:PDF阅读器
页数:4
分类:企业经营
上传时间:2013-08-05
浏览量:180