首页 试验数据的正态性检验、数据的转换及卡方检验

试验数据的正态性检验、数据的转换及卡方检验

举报
开通vip

试验数据的正态性检验、数据的转换及卡方检验试验数据的正态检验、数据的转换和卡方检验目录TOC\o"1-5"\h\z一、符合正态分布的例子1二、不符合正态分布的例子6HYPERLINK\l"bookmark50"三、不符合正态分布数据的转换及转换后数据的方差分析11四、次数分布资料的卡方检验14在对试验数据进行方差分析前,应对数据的三性(即同质性、独立性和正态性)进行检验。本文介绍对资料的正态性进行检验的方法,主要介绍3种检验方法:(1)频数检验——作频率分布图、看偏度系数和峰度系数,(2)作Q-Q图检验,(3)非参数检验——单个样本K-S检验。...

试验数据的正态性检验、数据的转换及卡方检验
试验数据的正态检验、数据的转换和卡方检验目录TOC\o"1-5"\h\z一、符合正态分布的例子1二、不符合正态分布的例子6HYPERLINK\l"bookmark50"三、不符合正态分布数据的转换及转换后数据的方差 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 11四、次数分布资料的卡方检验14在对试验数据进行方差分析前,应对数据的三性(即同质性、独立性和正态性)进行检验。本文介绍对资料的正态性进行检验的方法,主要介绍3种检验方法:(1)频数检验——作频率分布图、看偏度系数和峰度系数,(2)作Q-Q图检验,(3)非参数检验——单个样本K-S检验。下面以两个试验数据为例,例1为84头育肥猪的体重数据,通常符合正态分布。例2为生长育肥猪7个试验处理组的腹泻率(百分数资料)统计结果,这类资料往往不符合正态,而大多数人以为是符合正态分布,进行方差分析的,因而不能得出正确的结论,却可能得出错误结论。一、符合正态分布的例子【例1】84头生长育肥猪的“体重”数据如表1-1,检验该数据是否呈正态分布。表1-184头育肥猪的“体重”数据(排序后)No.体重No.体重No.体重No.体重No.体重No.体重No.体重No.体重No.体重155.31171.62178.33181.24184.65188.66192.07199.481107.4258.21272.12278.73282.24284.75288.86292.072100.782109.0360.21372.82378.83382.44384.75389.26392.273102.483112.8464.81473.62479.13482.84485.05489.96493.074103.084113.2565.81575.92579.33582.84585.35590.46594.275105.4666.71676.12679.73682.84685.75690.96695.376105.4767.91777.02780.23783.54786.45791.06797.077105.4868.41877.12880.63883.74886.85891.16897.878106.0970.11977.22981.13984.34987.35991.26998.479106.21070.82078.13081.14084.45087.46091.47098.580107.3检验方法一:频数检验一一作频率分布图、看偏度系数和峰度系数步骤1:数据录入SPSS中,如图1-1。NO林重1155.302258.203360.204464805565.BO6006.707767.90ae66^09970.101Gm70&0111171.60121272.10图1-1体重数据录入SPSS中步骤2:在SPSS里执行“分析一〉描述统计一〉频率”,然后弹出“频率”对话框(图1-2a),变量选择“体重”;再点右边的“统计量”按钮,弹出图“频率:统计量”对话框(图l-2b),选择“偏度”和“丰度”(图l-2b);再点右边的“图表”按钮,弹出图“频率:图表”对话框(图l-2c),选择“直方图”,并选中“在直方图显示正态曲线”图1-2a“频率”对话框.'■::::^rQ)割点期:";;:世迟)|津加愆|:..YrO)1宀10I更比型®频率;图表-團盍类型0Lft{|:D⑥宜冇回迟):Id三二並「止.:三我世)[刪际回Jn■'Ti■-:M-li^rJ图1-2b“频率:统计量”对话框;jit±(Dl云-3,7±ITT.--..31HI|均值的毎准氓目團表值®曲Jt-I--.©图1-2c“频率:图表”对话框设置完后点“确定”后,就会出来一系列结果,包括2个表格和一个图,我们先来看看“统计量”表,如下:步骤1:数据录入SPSS中,如图1-1。统计量体重N有效84缺失0偏度.040偏度的 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 误.263峰度-.202峰度的标准误.520偏度系数=0.040,峰度系数-0.202;两个系数都小于1,可认为近似于正态分布。再看直方图(图1-3),如下:图1-3中横坐标为“增重”,纵坐标为增重出现的“频数”。根据直方图及绘出的曲线,可以认为该数据近似正态分布。检验方法二:Q-Q图检验步骤1:数据录入SPSS中,如图1-1。步骤2:在SPSS里执行“描述统计一〉Q-Q图”,弹出“Q-Q图”对话框,变量选择“体重”,检验分布选择“正态”(见图1-4),其他选择默认,然后“确定”。Q-Q圏<^N0确左]粘站吃》、贡蛊国』團消」丨詔肋]与扪医期:图1-4Q-Q图”对话框最后可以得到Q-Q图检验结果,结果很多,我们只需要看最后一个图,见图1-5。所有数据几乎在一条直线上,表明近似正态分布。图1-584头生长育肥猪的正态Q-Q图检验方法三:非参数检验——单个样本K-S检验步骤2:在SPSS里执行“分析—>非参数检验—>旧对话框—>单个样本K-S检验”,弹出对话框,检验变量选择“期初平均分”,检验分布选择“常规”(即正态分布),然后点“确定”(图1-6)。单样本KoImogoro7-Smimov精确凶迭顶©-..图1-6单样本K-S检验对话框从以下结果可以看出,K-S检验中,Z值为0.563,渐近显著性(双侧)(即P值)=0.909〉0.05,因此数据呈近似正态分布。单样本^KolmsgsroviSmiinov■检验体重N84正态参数a,b均值85.9654标准差12.67824最极端差别绝对值.061正.061负-.056Kolmogorov-SmirnovZ.563渐近显著性(双侧).909检验分布为正态分布。根据数据计算得到。步骤1:数据录入SPSS中,如图2-1。步骤1:数据录入SPSS中,如图2-1。二、不符合正态分布的例子【例2】7个处理组,每个处理4个重复,每重复3头生长育肥猪全期(98天)的腹泻次数统计结果见表1-2。“腹泻率”统计结果,检验其是否符合正态分布?(腹泻指数为每天有1头猪发生腹泻,记为1头次)。表2-1生长育肥猪全期98天腹泻次数统计及腹泻率计算表分组重复(头数)饲养天数腹泻指数(腹泻头次)总指数(总头数)(=3*98)全期腹泻率%(=腹泻头次/总头次)139832941.021398112943.74139822940.68139852941.7022398102943.40239862942.04239862942.043398122944.08339872942.3833985529418.713398122944.084398232947.82439812940.34439822940.684398112943.7453987429425.1753984529415.3153988329428.23539842941.36639872942.386398142944.76639862942.046398222947.4873987329424.83739832941.02739842941.3673983629412.24检验方法一:频数检验一一作频率分布图、看偏度系数和峰度系数分组重垣饲养天数腹泻搭故总指数腹泻率自然对数转后的腹汚率1139832941.02213U0112943.741.323139S2294.6S-.39413&B52941.70.5352-23102943.4012223&B62942.04.718239862创2.04.7193396122&44.081.411033387294238.871133985525418.712.93图2-1腹泻率数据录入SPSS中步骤2:在SPSS里执行“分析一〉描述统计一〉频率”,然后弹出“频率”对话框(图2-2a),变量选择“腹泻率”;再点右边的“统计量”按钮,弹出图“频率:统计量”对话框(图2-2b),选择“偏度”和“丰度”(图2-2b);再点右边的“图表”按钮,弹出图“频率:图表”对话框(图2-2c),选择“直方图”,并选中“在直方图显示正态曲线”图2-2a“频率”对话框B频率:统计量[ai赣]职消|磐助®频率:图表罔禾年卑©无◎併副巴◎直三頁也>y:仕且月固二昱亍正:住曲热[①国牯自⑥频率近)冃百対Jj:C)图2-2b“频率:统计量”对话框图2-2c“频率:图表”对话框设置完后点“确定”,就后会出来一系列结果,包括2个表格和一个图,我们先来看看“统计量”表,如下:统计量腹泻率N有效27缺失1偏度1.623偏度的标准误.448峰度1.433峰度的标准误.872偏度系数=1.623,峰度系数1.433;两个系数都大于1,可认为不服从正态分布。再看直方图(图图2-3腹泻率的频数分布直方图图2-3中横坐标为“腹泻率”,纵坐标为增重出现的“频数”。根据直方图可以看出,分布显然是偏态的,与正态分布曲线相差甚远。检验方法二:Q-Q图检验步骤1:数据录入SPSS中,如图2-1。步骤2:在SPSS里执行“描述统计一〉Q-Q图”,弹出“Q-Q图”对话框,变量选择“腹泻率”,检验分布选择“正态”(见图2-4),其他选择默认,然后“确定”。护廿组#饲粽天数"膻泻指数帕“打山①分布裟数八心冷一|「1曰kzi-u匸氐1Q-Qd擠肿:=车捋頼自威对数H^{n)口引主它©口可迪:■季节性差分(5)c[1当创斤咽:T确定图2-4“Q-Q图”对话框最后可以得到Q-Q图检验结果,结果很多,我们只需要看最后一个图,见图2-5。腹泻率数据不在一条直线上,表明不符合正态分布。检验方法三:非参数检验——单个样本K-S检验步骤1:数据录入SPSS中,如图2-1。步骤2:在SPSS里执行“分析—>非参数检验—>旧对话框—>单个样本K-S检验”,弹出对话框检验变量选择“腹泻率”,检验分布选择“常规”(即正态分布),然后点“确定”(图2-6)。图2-6单样本K-S检验对话框检验结果为:从结果可以看出,-S检验中,Z值=1.544,渐近显著性(双侧)(即P值)=0.016〈0.05,因此数据分布不符合正态分布。单样本Kolmogorov-Smirnov检验腹泻率N27正态参数a,b均值6.7641标准差8.30213最极端差别绝对值.299正.299负-.220Kolmogorov-SmirnovZ1.554渐近显著性(双侧).016检验分布为正态分布。根据数据计算得到。后记:对于以上腹泻率百分数资料的正态性检验,结果表明不符合正态分布,因此不能用方差分析进行检验。可进行数据转换(对数转换等),然后再对转换后的数据进行正态性检验,或采用其他检验方法(如卡方检验)。数据的转换和卡方检验方法介绍如下三、不符合正态分布数据的转换及转换后数据的方差分析“自然对数转换”后的Q-Q图对于以上【例2】的腹泻率数据进行自然对数转换,可在Q-Q图检验时数转换”,步骤如下:在SPSS里执行“描述统计—>Q-Q图”,弹出“Q-Q图”对话框,变量选择“,选择“自然对腹泻率”,检验分然后“确定”。图3-1腹泻率自然对换转换后的“Q-Q图”对话框「,;;;•帀①()匚1r.=lz(ziig:BlomCRankitQTukey也V百ndsrWaerden#饲养天数戏总指数^VAR00015为结指定的軼色均值(M)©a(H)也低(L)匕强制打幵结冏.".如卩mm输出结果见图3-2。可见所有数据几乎在一条直线上,可认为近似正态分布。庖泻聿的正脊6Q閔期卑II:疵值■1-布选择“正态”,在转换中选择“自然对数转换”(见图3-1),其他选择默认,Siam图3-2腹泻率自然对换转换后的“Q-Q图”对自然对数转换后的数据作频率分布图、看偏度系数和峰度系数将以上【例2】的腹泻率数据时行自然对数转换,结果如下表。分组重复(头数)饲养天数腹泻指数(腹泻头次)总指数(总头数)全期腹泻率自然对数转换后的腹泻率139832941.020.021398112943.741.32139822940.68-0.39139852941.700.5322398102943.401.22239862942.040.71239862942.040.713398122944.081.41339872942.380.8733985529418.712.933398122944.081.414398232947.822.06439812940.34-1.08439822940.68-0.394398112943.741.3253987429425.173.2353984529415.312.7353988329428.233.34539842941.360.31639872940.024-3.7386398142940.048-3.045639862940.020-3.8926398222940.075-2.5937398732940.248-1.393739832940.010-4.585739842940.014-4.2977398362940.122-2.100自然对数转换后腹泻率的频率分布图(直方图)、偏度系数和峰度系数如下:图3-3自然对数转换后的腹泻率的直方图(近似正态分布)统计量自然对数转后的腹泻率N有效27缺失57偏度.212偏度的标准误.448峰度-・656峰度的标准误.872自然对数转换后的腹泻率的偏度系数=0.213,峰度系数=-0.656,均小于1.0,表明符合正态分布。数据转换前后的方差分析结果的比较腹泻率数据转换前与转换后的各组平均数如下:描述性统计量分组均值标准偏差N腹泻率11.78501.37058422.4933.78520337.31257.64048443.14503.471504517.517512.10036464.16502.51960479.862511.257014总计6.76418.3021327自然对数转后的腹泻率1.3700.7367042.8800.29445331.6550.8873044.47751.45973452.40251.42003461.2875.60665471.51131.585384总计1.23911.1991927SPSS—般线性模型方差分析结果如下:主体间效应的检验源因变量III型平方和df均方FSig.分组腹泻率735.4436122.5742.320.073自然对数转后的腹泻率12.14062.0231.603.198误差腹泻率1056.6152052.831自然对数转后的腹泻率25.250201.262总计腹泻率3027.38127自然对数转后的腹泻率78.84327方差分析结果显示:腹泻率数据转换前的P=0.073〉0.05,差异不显著;而转换后的腹泻率P=0.198〉0.05,仍然差异不显著。四、次数分布资料的卡方检验以上猪腹泻次数统计数据属于次数性资料,虽然换算成百分数后属于连续性资料,但经检验,不满足正态分布,因此不宜采用方差分析来检验各组腹泻率差异的显著性。而经自然对数转换后,腹泻率基本满足正态分布条件,可采用方差分析。但无论是转换前还转换后的腹泻率百分数资料,经以上方差分析显示,各组间腹泻率均差异不显著。因此,有必要寻求其他种检验方法——次数性资料的差异显著检验方法——卡方检验来试一试。表4-1生长育肥猪(98天)腹泻次数统计表分组头数饲养天数腹泻指数(腹泻头次)总指数(总头数)全期腹泻率112982111761.79%2998228822.49%312988611767.31%41298206117617.52%512984911764.17%6129811611769.86%712983711763.15%表4-2生长育肥猪(98天)腹泻次数资料一一卡方检验表腹泻次数一观察值分组腹泻头次(n)1正常头次(n)2合计头次(N)腹泻率121115511761.79%2228608822.49%386109011767.31%4206970117617.52%549112711764.17%6116106011769.86%737113911763.15%合计53774017938比例0.0680.9321腹泻次数一理论值计算结果分组腹泻头次(n)正常头次(n)合计头次(N)179.61096.41176.0259.7822.3882.0379.61096.41176.0479.61096.41176.0579.61096.41176.0679.61096.41176.0779.61096.41176.0合计537.07401.07938.0腹泻次数——卡方值计算结果分组腹泻头次(n)正常头次(n2)合计头次(N)143.103.1346.23223.781.7325.5030.520.040.564200.9714.58215.55511.740.8512.59616.701.2117.91722.761.6524.42合计319.5623.19342.75合计卡方值-342.75,查卡方分布表知其对应的P值-5.56E-71,差异极显著。该检验结果与前面方差分析结果大相径庭(见第三部分:不符合正态分布数据的转换及转换数据的方差分析)。后记:可见以上腹泻次数资料(腹泻率百分数资料)不宜采用方差分析,而应考虑采用卡方检验。
本文档为【试验数据的正态性检验、数据的转换及卡方检验】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
茉莉花开
暂无简介~
格式:doc
大小:283KB
软件:Word
页数:17
分类:
上传时间:2023-01-03
浏览量:1