首页 epidata教程

epidata教程

举报
开通vip

epidata教程nullnull 数据录入与统计分析 主讲:吴玲 海南医学院公共卫生学院卫生统计学教研室null一、数据录入和数据管理软件 (EpiData软件的应用)EpiData软件简介EpiData软件简介 EpiData软件是由丹麦非盈利性组织中的Jens M. Lauritsen和M ichael Bruus.设计的,主要用于录入数据和数据库管理,可在网上免费下载。 该软件简单易学而较易推广使用,软件间兼容性好,能转换为Excel,SAS,Access,States,SPSS数据库等,供不同软件进行统计...

epidata教程
nullnull 数据录入与统计分析 主讲:吴玲 海南医学院公共卫生学院卫生统计学教研室null一、数据录入和数据管理软件 (EpiData软件的应用)EpiData软件简介EpiData软件简介 EpiData软件是由丹麦非盈利性组织中的Jens M. Lauritsen和M ichael Bruus.设计的,主要用于录入数据和数据库管理,可在网上免费下载。 该软件简单易学而较易推广使用,软件间兼容性好,能转换为Excel,SAS,Access,States,SPSS数据库等,供不同软件进行统计分析。 软件免费下载网址 http://www.epidata.dk/download.php EpiData软件的用途EpiData软件的用途 主要用于数据录入、核对、管理和数据 报告 软件系统测试报告下载sgs报告如何下载关于路面塌陷情况报告535n,sgs报告怎么下载竣工报告下载 。 该软件的功能是建立数字化的调查表格,使收集的资料信息录入计算机更加方便。 优势:该软件不但可以在数据录入过程中对数据中的错误进行核对,而且可以在数据录入完成后对数据进行核对,如双录入的数据核查。 EpiData软件的特点EpiData软件的特点EpiData的安装、运行不会依赖系统文件夹中的任何文件,可以通过setup.exe在计算机中安装这个程序;也可以直接拷贝EpiData.exe文件到计算机中,同样可以运行。 该程序的最大特点是对录入的记录数没有限制。但在实际应用中,记录数一般不要超过200,000-300,000。整个录入界面不能超过999行。对数值或字符串编码进行解释的文字长度最多80个字符,编码长度最多为30个字符。EpiData软件的三种基本文件类型EpiData软件的三种基本文件类型① .qes 文件:数据库结构文件。决定数据库结构。 ② .rec 文件:数据文件。主要用于存放数据。 ③ .chk文件:核对文件。存放控制数据录入的核对规则,起质量控制作用。 EpiData由数据库结构文件(.qes),来决定数据库结构,然后根据该数据库结构文件生成数据文件(.rec)。null特别注意 每个文件夹中均包括相应的以.rec结尾的数据库文件 和以.chk结尾的数据核查文件,请勿删除缺失(特别是.chk核 查文件)。 所有数据录入应在相应文件夹中进行,请勿随意移动或删 除.chk核查文件,以免核查功能失效。待到全部数据录入完毕 以后,再将.rec数据库文件 进行复制上传;并请自行保 存所有原件,以便于复查与 核对。创建数据库的步骤:创建数据库的步骤:(一)、建立数据库文件(.qes文件) (二)、生成数据文件(.rec文件) (三)、录入核对规则(.chk文件) (四)、录入数据 (五)、核对数据(双录入) (六)、数据导出(一)、建立数据库文件(.qes文件)步骤(一)、建立数据库文件(.qes文件)步骤 1、打开EpiData程序(双击) 2、点击“建立调查表”——点击“建立新QES文件”,或者直接点击 ,则可以开始创建数据库结构 3、打开调查表(WORD版本) 4、复制调查表 内容 财务内部控制制度的内容财务内部控制制度的内容人员招聘与配置的内容项目成本控制的内容消防安全演练内容 ,粘贴到EpiData新生成的QES文件中 5、定义变量名 6、定义变量标签 7、定义变量类型 打开Epi Data 3.0打开Epi Data 3.0双击Epi Data 3.0程序文件——即红白两个倒三角形图案 的程序文件。 菜单栏 EpiData工作过程工具栏 EpiData常用的几个快捷工具按钮 (一)、建立数据库文件(一)、建立数据库文件步骤: 1、打开EpiData程序(双击) 2、点击“建立调查表”——点击“建立新QES文件”,或者直接点击 ,则可以开始创建数据库结构 3、打开调查表(WORD版本) 4、复制调查表内容,粘贴到EpiData新生成的QES文件中 null5. 定义变量名(Field Names)5. 定义变量名(Field Names) 输入的信息要保存在变量中因此需要定义变量名。一个数据库中录入变量的名称可以根据QES文件的内容自动创建。 EpiData中命名变量的方式有两种 1)将第一个单词作为变量名(First word in question is field name) 2)根据规则自动定义变量名(Automatic field names) 执行“文件→选项”命令打开“生成REC文件” (File(文件)→Options(选择项)→Create data file)选项卡。null(1)QES文件字体设置:变量名称的字体及其大小可以在QES文件显示(Show data form)中设置 。 (2)REC文件字体设置:更改REC文件变量名称的字体及其大小。 (3)首字符为汉字变量命名方法:系统不支持中文作为变量名,在如何生成字段名(How to generate field names)标签中选择定义变量名的方法。在选择“将第一个单词作为变量名”时,如第一列为汉字(如去除调查表中的A1,A2,A3等变量名),则系统自动生成变量名如Field1,field2和field3,同时REC表中中文文字也不再显示。因此,建议事先以字母形式定义变量名。 变量名的英文字母是大写(Upper-case)还是小写(Lower-case)或维持输入时的大小写状态(Leave as is)也可以在此修改。null(4)首字符为字母的变量命名,系统默认为将自动将变量编码左侧解释性文字中的第一个单词认作是变量名(First Word in Question is Field Name)。如果第一个单词的长度超过10个字符,程序只保留该单词的前10个字符作为变量名。例如: 1)如果输入:A1 Enter number #### 程序会创建一个变量名为“A1”的4位整数变量。 2)如果输入:Enter number #### 程序会创建一个变量名为“Enter”的4位整数变量。此时也可选择自动定义变量名(Automatic field names)的方式。 3)A1 编号 #### 则变量名为A1 ,注意A1与编号间要由一空格。 null4)当一个变量名已经使用过,再次出现时,程序会自动添加一个数字,以保证变量名的唯一性。 如有三个A1变量,则自动以A1,A2,A3命名,并以此类推,建议变量起名时具有唯一性,以免混淆。选择生成REC文件中的“更新问题为实际文件名”(Update question to actual field name),这样,即使创建调查表文件时有重复的变量名,在创建的数据库中,程序会自动将其更新为其实际的变量名。 在英文版本中。如果同时出现中文和英文,程序会自动选择第一个出现的英文单词作为变量名。 null(5)选中“使用{ }内的内容自动添加字段名(Automatic Field Names)根据变量编码前的解释性文字,自动生成变量名。 变量名第一个字符一定为字母(A-Z),之后可以包含字母(A-Z)和数字(0-9),最多10个字符。程序会遵循以下几个原则: 如希望定义的变量名不是第一个,则可将需要定义的变量名用大于号{}括起,如 Enter {Number} 则变量名为Number ,系统优先使用大括号中的文字作为变量名。如为 E{n}ter {age} ,则自动定义的变量名为nage。因此为了定义确切的变量名,尽量使用大括号来定义有意义的变量名。 一些常用词会被忽略(即,类似“what”、“the”、“of”、“and”等的词)。例如,“What are you doing?”,程序采用的变量名称将会是youdoing。nullnullnull(6)如果变量编码前没有任何解释性的文字,那么程序会延续上一个变量的名字,同时在末尾加上一个数字。例如,前一个变量的名称为A1,如果没有任何解释性文字的下一个变量A2。如果前面没有变量,则默认的变量名为FIELD1。(7)如果问题(提示符)以数字开头,程序会自动在数字前插入字母N。例如,“1、姓名”的变量名会是“N1 6.定义变量标签6.定义变量标签变量标签(Variable Labels) 变量标签是对一个变量所含数据内容的描述。 在EpiData中,程序会根据QES文件中,变量编码左侧的解释性文字自动生成变量标签。如果选择了“文件→选项”中的“将第一个词作为变量名”(First word in question is field name),则扣除作为变量名的第一个单词后,自左向右的文字会被作为变量标签。例如:“A1 Age of patient###”,变量名为“A1”,变量标签为“Age of patient”。 中文问题(提示符)虽然不能作为变量名,但是可以自动的作为变量标签。如果选择了“自动添加字段名”(Automatic field names),则变量名为“A1ageofp”,变量标签为“A1 Age of patient”。7.定义变量类型7.定义变量类型执行“编辑→字段编辑器”命令(Edit→Field Pick List), 或者按Ctrl+Q键, 或者在编辑器工具栏(Editor Toolbar)单击字段编辑器按钮,可以打开变量类型选择对话框,从中选择适当的变量类型单击“插入”按钮即可。(1)自动编码字段(1)自动编码字段 自动ID号变量(IDNUM)是一个数值型变量,其值由计算机自动生成。 其赋值原则是随着每一条记录的输入,变量值加1。在数据录入过程中它的值不能修改,只能自动增加。该变量的初始值默认为1,但是用户可以在“文件”菜单的“选项”中的“高级设置”中进行设置(File→Options→Advanced→ID number fields→First IDnumber in new data file:1)。此变量长度为5-18个字符。(2) 数值型字段(Numeric Fields)(2) 数值型字段(Numeric Fields) 数值型变量######.##中只能用来接受从0到9的数字,数值可以是整数也可以是小数。一个#号代表一位数,用户可以根据需要定义所需的数值位数,但包括小数点在内最大为14位。在数据录入过程中和.QES文件中你可以用圆点(.)或逗号(,)来表示小数点。一个变量中只允许输入一个小数点,这意味着,你不能用逗号作为千位的分隔符(例如:1,000,000)。字符“#”的数目表示变量的长度,小数点占一位字符。(3)文本(字符)型字段(Text Fields)(3)文本(字符)型字段(Text Fields) 下划线____________定义字符型变量的位数。字符型变量内可以输入任何字符。该类型变量的最大长度为80个字符。下划线字符的数目表示变量的长度。字符型变量允许输入所有字符。变量最长允许80个字符。如果输入中文,请注意,一个中文字需占用2个字符。(4)大写型字符字段(Upper-case Text)(4)大写型字符字段(Upper-case Text) 大写字母的字符型变量中可以录入任意字符,但程序会自动将录入的字母转换为大写。变量的长度即“<”和“>”间的字符数,其中包括大写字母“A”所占的1个字符。上面例子中,第一个变量的长度为1,第二个变量的长度为5。(5)日期型字段(Date Fields)(5)日期型字段(Date Fields)有三种类型的日期变量: 欧式日期(日/月/年)
、 美式日期(月/日/年) 习惯格式(年/月/日)。 日期变量的长度通常是10个字符。在数据录入过程中,允许录入的字符包括数字和斜线(/)。如果你可以把日期数字按完整的格式输入,中间可以不加“/”。日期型变量的长度总是10位。在数据录入过程中,能录入的字符为数字和斜线(/)。如果所有日月年数值都录入则不必录入斜线。比如2008年10月1日可以在数据录入时直接键入20081001。在光标移入下一个字段后,字段内的值自动变为标准的2008/10/01。 如果录入的两位数的年份在50到99之间的话,则被默认为20世纪,前面加“19”。如果年份值在00和49.之间的话则被默认为21世纪,前面加“20”。如果只录入0405,则计算机系统年份自动加入到字段中。(6)当天型日期字段(Today’s Date Fields)(6)当天型日期字段(Today’s Date Fields)当天型字段(自动插入日期字段)内自动的填入当前计算机的系统日期值。。该类型的字段不能编辑,光标也不能移入。 在数据录入时今天型子段为当前日期,如果下一次该纪录被修改时,则该今天型字段中则储存的日期值为修改的日期,因此可以用今天型日期子段来记录数据的最后一次修改日期。(7)声音提示(Soundex)型字段(7)声音提示(Soundex)型字段 声音提示Soundex型变量可以输入任何字符,但只有录入的最后一个词用来创建声音Soundex码。在需要匿名时需要使用Soundex型变量。比如参与调查人的姓名需要匿名,则要使用Soundex型变量。Soundex型变量编码总是用A-999格式,其中包括一个大写字母,一个连字符和一个3位数值。将录入的姓转换为一个字符和3个数字。用于保护被调查者的隐私。null以本问卷为例,继续操作第5-7步 5、定义变量名 6、定义变量标签 7、定义变量类型 本例,定义各调查问题后本例,定义各调查问题后变量设置变量设置6、点击“保存”,出现下列对话框,给出“文件名”, 生成.qes文件6、点击“保存”,出现下列对话框,给出“文件名”, 生成.qes文件(二)、生成数据文件(二)、生成数据文件1、可先进行数据文件的预览1、可先进行数据文件的预览null2、点击“生成数据文件(.rec文件)”3、出现下列对话框: 在第一行内输入调查表文件名,点击确定3、出现下列对话框: 在第一行内输入调查表文件名,点击确定4、出现对话框(数据文件标签),点击确定,出现“信息对话框”4、出现对话框(数据文件标签),点击确定,出现“信息对话框”(三)、录入核对规则(CHK文件)(三)、录入核对规则(CHK文件) 用我们上述介绍的方法已经足以完成一个临床观察表的数字化,并且可以顺利地将数据输出并进行统计计算。 但是Epidata的功能不仅于此,我们知道,Epidata有三种主要文件,上面的方法只涉及了.qes文件和.rec文件。 .chk文件有什么作用呢? null我们对于某些字段的数据并不满足于仅仅是长度或位数的设置,Epidata提供了对这些字段的进一步设置功能。 点击工作过程工具条中“添加核对命令”按钮,仍旧选择“2011儿童接种知识问答.rec”这个数据文件,同样会出现我们做好的电子表格,这时软件也会自动生成同名的.CHK文件,同时会有一个数据核对窗口(如图)。null可以看到这个数据核对窗口上半部是字段的名称、字段的内容及字段数据类型,下半部份就是我们需要设置的内容了。 3.1 Rang,Legal:是定义一个字段的数字范围及合理数。例如,我们对“编号”字段进行设置,输入“1001-9999”,表示这个字段只能输入1001-9999的数字,否则软件会弹出错误信息。null3.2 Jump:跳转命令。临床上有些问题只是需要部分人来回答,例如当前字段为性别sex (1=male(男性), 2=female) ,则可定义如果sex=1跳转至字段V23,而当sex=2跳转至V40,我们就可以在Jump后填入1>V23, 2>V40。 3.3 Must enter:如果当前字段必须输入数据,则需要使用这个规则,选择Yes。Epidata的默认选择为No。null3.4 Repeat:如果在编辑表中Repeat选择项中选择“Yes”则前一个记录中的该字段值将自动出现在下一个记录的该字段中,当然这个数值是可以改变的。 3.5 Value label:是将一组具有解释数值意义的文本与数值结合。例如,我们对“职业”这个字段进行设置,点击Value label后的“+”,在“数据编辑标签”中设置数字和其所代表的职业,数字和职业之间用空格分开,依次录入,最后选择“接受并关闭”null(四)、录入数据(四)、录入数据1、直接录入数据, 打开“儿童预防接种知识问答.rec”文件,开始录入数据:每题录入答案(必须为0-9的数字)后自动跳至下一题null2、一份问卷录入完毕,会跳出该提示 3、点击“是”或回车键,保存记录,并可看到记录数从“0”变为“1”,数据录入完毕后,可通过箭头查找某条记录。(五)、核对数据(五)、核对数据 为了保证数据录入的可靠性,我们可以让两个人分别输入同样的一组调查表数据,Epidata提供了对两个相同数据文件的检查功能。     操作步骤 操作步骤  1. 打开“EpiData 3.1”文件夹,双击EpiData 3.1程序文件   2. 这时你会看到EpiData 3.1的主界面。点击“文件”——“对两个数据文件进行有效性检查”。 null    操作步骤      3. 这时弹出的对话框中有“第一个数据文件名”和“第二个数据文件名”。分别点击后面的小黄图标,选择第一个人录入的数据的路径和文件名、第二个人录入的数据的路径和文件名,然后确定。 null4. 这时,弹出一个对话框。      1)对话框的左下方需要你选择关键字段。为了进行数据比较,必须至少指定一个关键字段。关键字段的作用是使两次录入的数据在比较时进行匹配。      2)对话框的右下方是几个选择项,你可以根据自己的实际需要进行选择,如:“不考虑已删除的记录”——在比较过程中计算机忽略已经有删除标记的记录;“不考虑字符型字段”——在比较过程中,字符型字段不进行比较。     3)选择确定。null5.   这时,系统会将所发现的具有差异的指标罗列出来。我们可以核查原调查表,对数据表进行修改。 六、输出数据六、输出数据点击“数据输出”,选择数据文件类型,可选Excel文件出现对话框,选择要输出数据的.rec文件,点击打开出现对话框,选择要输出数据的.rec文件,点击打开出现下列选择对话框,定义数据导出的位置,可选择要导出的记录、字段,点击“确定”出现下列选择对话框,定义数据导出的位置,可选择要导出的记录、字段,点击“确定”null 二、数据的统计分析 1、打开新生成的Excel文件1、打开新生成的Excel文件统计每题各选项的频数(主要用于定性资料)统计每题各选项的频数(主要用于定性资料) (1)用FREQUENCY函数计算 步骤:插入 函数 统计 FREQUENCY (2)用“直方图”计算 步骤:工具 加载宏 分析工具库 确定 工具 数据分析 直方图 确定 定义“输入区域” “接收区域” “输出区域” (3)用if函数 →→→→→→→→→→→→→定量资料的分析用“数据分析” 定量资料的分析用“数据分析” 步骤:工具 加载宏 分析工具库 确定 工具 数据分析 描述统计 →→→→→ 方法一:用FREQUENCY函数计算 1、在A1变量的空白处输入该变量的分类(1、2、3) 2、将鼠标单击“A19”(即选择输出区域) 3、再点击“插入”——选择“函数” 方法一:用FREQUENCY函数计算 1、在A1变量的空白处输入该变量的分类(1、2、3) 2、将鼠标单击“A19”(即选择输出区域) 3、再点击“插入”——选择“函数”在类别中选择:统计 在函数中选择:FREQUENCY在类别中选择:统计 在函数中选择:FREQUENCY出现下列对话框: 点击Data-array(数据引用区域行)的 : 出现下列对话框: 点击Data-array(数据引用区域行)的 : 出现“函数参数”对话框, 选择数据引用区域出现“函数参数”对话框, 选择数据引用区域数据区域已选好,接下来选择接受区间(即数据分类),点击bins-array行的数据区域已选好,接下来选择接受区间(即数据分类),点击bins-array行的选择接收区间选择接收区间显示结果{4;2;5;0}: 该结果表示在调查问卷中A1变量选项为“1”的有4份,选项为“2”的有2份,选项为“3”的有5份,其他选项没有。显示结果{4;2;5;0}: 该结果表示在调查问卷中A1变量选项为“1”的有4份,选项为“2”的有2份,选项为“3”的有5份,其他选项没有。 方法二:用“直方图”计算 步骤:点击“加载宏”—加载“数据分析” 方法二:用“直方图”计算 步骤:点击“加载宏”—加载“数据分析”加载“数据分析”——选择“分析工具库”——确定加载“数据分析”——选择“分析工具库”——确定选择“直方图”——确定选择“直方图”——确定选择数据区域选择数据区域选择接收区域选择接收区域选择输出区域选择输出区域选择:累积百分率、图标输出选择:累积百分率、图标输出结果输出:结果输出:方法三:用if函数处理方法三:用if函数处理nullnull
本文档为【epidata教程】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
最新资料
资料动态
专题动态
is_876273
暂无简介~
格式:ppt
大小:2MB
软件:PowerPoint
页数:0
分类:
上传时间:2013-07-18
浏览量:104