卡方检验案例分析
在分类资料统计分析中我们常会遇到这样的资料,如两组大白鼠在不同致癌剂作用下的发癌率如下
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
,问两组发癌率有无差别,
处理 发癌数 未发癌数 合计 发癌率%
甲组 52 19 71 73.24
乙组 39 3 42 92.86
合计 91 22 113 80.33
52 19
39 3
是表中最基本的数据,因此上表资料又被称之为四格表资料。卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为71*(91/113)=57.18,故卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。
利用统计学软件分析结果如下:
data kafang;
input row column number @@;
cards;
1 1 52
1 2 19
2 1 39
2 2 3
;
run;
proc freq;
tables row*column/chisq;
weight number;
run;
统计量 自由度 值 概率
卡方 1 6.4777 0.0109(有统计学意义)
似然比卡方 1 7.3101 0.0069
连续校正卡方 1 5.2868 0.0215
Mantel-Haenszel 卡方 1 6.4203 0.0113
Phi 系数 -0.2394
列联系数 0.2328
Cramer 的 V -0.2394