最详细的中文sas软件教程第五卷(共五卷）无水印

最详细的中文sas软件教程第五卷(共五卷）无水印返回总目录返回总目录返回总目录返回总目录目目目目录录录录第 24 章 SAS 系统内七种变异数分析程序概述........................................................................ 4 24.1 七种变异数分析的程序............................................................................................... 4 24.2 平衡...

返回总目录返回总目录返回总目录返回总目录目目目目录录录录第 24 章 SAS 系统内七种变异数分析程序概述........................................................................ 4 24.1 七种变异数分析的程序............................................................................................... 4 24.2 平衡的实验MATCH_ word _1713299596703_2........................................................................................................... 4 24.3 一般线性模型............................................................................................................... 5 第 25 章比较两组平均数的 t 检定统计程序 PROCTTEST .............................................. 7 25.1 PROC TTEST 程序概述 ............................................................................................. 7 25.2 如何撰写 PROC TTEST 程序 ................................................................................... 7 25.3 输出文件概述............................................................................................................... 8 25.4 范例....................................................................................................................... 9 第 26 章平衡实验设计的变异数分析统计程序 PROCANOVA......................................... 11 26.1 PROC ANOVA 程序概述 ......................................................................................... 11 26.2 名词解释............................................................................................................... 11 26.3 各种统计模型............................................................................................................. 11 26.4 如何撰写 PROC ANOVA 程序 ............................................................................... 13 26.5 范例..................................................................................................................... 21 第 27 章变异数成份的分解统计程序 PROCVARCOMP ................................................... 27 27.1 PROC VARCOMP 程序概述 .................................................................................... 27 27.2 如何撰写 PROC VARCOMP 程序 ............................................................................ 28 27.3 范例..................................................................................................................... 29 第 28 章混合式模型的变异数分析统计程序 PROCMIXED ............................................. 33 28.1 PROC MIXED 程序概述 .......................................................................................... 33 28.2 名词解释............................................................................................................... 33 28.3 MIXED 程序基本功能的示范.................................................................................. 34 28.4 如何撰写 PROC MIXED 程序 ................................................................................ 38 28.5 范例..................................................................................................................... 51 28.6 注意事项............................................................................................................... 68 第 29 章变异数分析的实验设计统计程序 PROC PLAN.................................................. 70 29.1 PROC PLAN 程序的简介 ......................................................................................... 70 29.2 如何撰写 PROC PLAN 程序 .................................................................................... 71 29.3 范例..................................................................................................................... 75 29.4 注意事项............................................................................................................... 80 第 30 章无参数的一因子变异数分析统计程序 PROCNPAR1WAY ................................ 81 30.1 PROC NPAR1WAY 程序概述 .................................................................................. 81 30.2 如何撰写 PROC NPAR1WAY 程序 ........................................................................ 81 30.3 范例..................................................................................................................... 83 30.4 注意事项............................................................................................................... 91 第五部分变异数分析第 24 章 SAS 系统内七种变异数分析程序概述 24.1 七种变异数分析的程序本节提纲契领地介绍 SAS 所提供的七个变异数 analysis of variance 分析的程序及一些有关的统计观念这七个程序简介如下 TTEST 以 t 检定比较两组观察体的平均数 ANOVA 适用于平衡的实验设计 GLM 功能甚广可执行变异数分析回归分析共变量分析以及多变量变异数分析 (归入第六部分第 31 章) VARCOMP 推算各类型变异数的值 MIXED 适用于固定与随机效果的混合式模型分析 PLAN 为实验计划产生随机的排列组合 NPAR1WAY 适用于无参数分析中单因变量之变异数分析这七个程序中以 GLM 与 MIXED 两程序功能最广泛其他则只适用于特殊的情况读者必须依照实验设计选用合适的 SAS 程序变异数分析的用途在于解释我们观察所得的数据一般而言这些数据是在不同的实验情况下收集来的这些不同的情况会造成数据间的异同此称实验效果 (Treatment Effect) 但另有一部分的异同是与实验情况无关的此称随机误差 (Random Error) 所有变异数分析的精髓不外乎是选定合适的统计模型利用正确的 SAS 程序来推算出实验效果和随机误差的平均方 (Mean Square) 若以 MS(A) 表实验效果的平均方以 MS(E) 表随机误差的平均方则其比例会导出一个 F 分配 MS(E) MS(A)F = F 的自由度随不同的实验设计而定若 MS(A) 远超过 MS(E) (即 F 值远大于 1) 则我们说实验效果显著反之我们说实验效果不显著这个统计的理论是费契尔 (Fisher 1925) 所建立的有关这个理论最早的教科书是沙菲所著 (Scheffe 1959) 24.2 平衡的实验设计平衡的实验设计是指相等人数的实验也就是说每一组 (或每一细格) 里的观察体个数相同若研究者的实验设计是平衡的则你可以用较简单的 ANOVA 程序计算出变异数分析中所有必需的统计值而不必用到较费时费力的 GLM 程序若把 ANOVA 程序第 24 章 SAS 系统内七种变异数分析程序概述 5 用在不平衡的实验设计划则结果会有误差甚至可能导出负的平均方值 24.3 一般线性模型如果你的实验设计是不平衡的则你不可用 ANOVA 程序你极可能会用到 PROC GLM (一般线性模型程序) 或 PROC MIXED (混合式的线性模型) 在统计领域中的线性模型与解析几何中的线性函数或线性图有异同之处相同之处是它们都用线性这个名词来表示一个一次的或线性的函数关系相异之处是统计中所指的线性关系是指因变量与参数之间的线性关系而非因变量与自变量之间的线性关系若以 X 代表自变量 Y 代表因变量代表参数 E 代表随机误差则下列三式都称为线性模型 i2211i i221 2 1i i2211i EX)log(XY EXXY EXXY ++= ++= ++= 但下列三式则称为非线性模型 i X2X1 21 1 i i2211i i X2)X1( i E)e(eY 或;EXXY EeY 21 21 +− − = ++= += −− + 许多的非线性模型可被转换成线性模型否则它们无法用变异数分析法来处理线性假设线性假设是指参数间的线性组合而言下面列举几种常见的表示法 H: 1 = 2 = ... = 0 ; 或 H: L1 1 + L2 2 + L3 3 + ... +Lk k = 0 ; 或 H: L = 0 (此处 L 是行向量是列向量) 随机效果随机效果一般是由随机因子导出在农业经济研究上农作物的产地如畦田或耕地等) 通常被视为一个随机因子 (Random Factor) 在教育界一个班级或学校或一群学生则被看作是一个随机因子随机因子的效果称为随机效果关于这些随机因子的变异数分析 SAS 预备有 VARCOMP 与 NESTED 两程序另一程序 GLM 则只印出随机因子的平均方值但不推算各类型变异数的预计值平均数的比较如果数据中含多个平均数而且读者已决定要比较哪两个平均数时可用 GLM 程第五部分变异数分析6 序中的 CONTRAST 指令来检验这两个平均数之间是否有显著的差异请读者注意若你反复地使用 CONTRAST 指令来测许多对平均数则你的分析结果将失去真实性这是因为这种分析法可能让你犯了统计上所谓的第一类型错误详情请见第 31 章 PROC GLM 的平均数比较部分无参数的变异数分析无参数的变异数分析并不要求数据符合常态分配的假设因此数据不能以一般参数分析的统计方法处理在这种情况下可用 NPAR1WAY 程序将数据转换成名次排列 (如第一第二等等) 然后进行无参数的单因变量变异数分析二元或二元以上无参数的变异数分析与 NPAR1WAY 相似读者可先用 PROC RANK 把数据转换成名次然后再用一般的参数分析程序处理如 TEST ANOVA 或 NESTED 等第 25 章比较两组平均数的 t 检定统计程序 PROC TTEST 25.1 PROC TTEST 程序概述 TTEST 程序旨在对 SAS 文件中的两个平均数执行 t 检定这个 t 检定是单元变异数分析的特殊例子它的虚无假设是这两个平均数相等 t 检定有一个重要的假设即两组观察体所代表的母群其变异数必须相同这个假设由 F 检定来鉴别 (Steel and Terrie 1980) 若此假设成立则 SAS 可进一步算出 t 值与其统计的显著程度若此假设不成立则 SAS 会算出 t 的近似值与其近似的自由度自由度的近似值估计系采沙特斯威氏 (Satterthwaite 1946) 的方法同时读者可要求根据 Cochran 与 Cox 1957 计算 t 检定之近似值的显著度若读者有意进行一组平均数的 t 检定或配对组平均数比较的 t 检定则应用 PROC MEANS 来进行 (见本章例二的示范) TTEST 程序只适用于两组独立的样本 25.2 如何撰写 PROC TTEST 程序 PROC TTEST 含四道指令它们的格式如下 PROC TTEST 选项串 CLASS 变量名称 VAR 变量名称串 BY 变量名称串; 上述四道指令不能重复出现只有 PROC TTEST 与 CLASS 两指令是必须的不可省略 PROC TTEST 后的指令出现次序可以随意安排指令 #1 PROC TTEST 选项串下面这两个选项可出现在 PROC TTEST 指令中 (1) DATA=输入文件名称指明对那一个文件执行 t 检定若省略此选项则 SAS 会自动找出在此程序之前最后形成的 SAS 文件对它执行 t 检定 (2) COCHRAN 当两组数据的变异数据不相当时这个选项可以正确地计算出 t 检定之近似值的统计显著度其理论基础是 Cochran 与 Cox 1957 年的著作第五部分变异数分析8 指令 #2 CLASS 变量名称此变量旨在识别观察体所属的组别因此变量只可有两个不同的值 (如男女或 1 0 等) 如果此变量的值是英文字母如 MALE 或 FEMALE 则名字的长度不应超过十六个字母否则警告信息会出现指令 #3 VAR 变量名称串指明对那些因变量的平均数执行 t 检定若省略此指令则 SAS 会视输入文件内所有数值变量 (除 CLASS 指令里提到的变量外) 为因变量然后针对每一数值变量执行 t 检定指令 #4 BY 变量名称串 SAS 依据此指令所列举的变量将文件分成几个小的文件然后对每一个小的文件分别执行 t 检定当读者选用此指令时文件内的数据必须先按照 BY 变量串的值做由小到大的重新排列这个步骤可藉 PROC SORT 达成 25.3 输出文件概述针对每一个参与 t 检定的因变量 TTEST 程序会印出下列的统计值 1. 该因变量的名称 2. 组别名称 3. 有效观察体个数 (N) 4. 平均数 (MEAN) 5. 标准差 (STD DEV) 6. 标准误差 (STD ERROR) 7. 最小值 (MINIMUM) 8. 最大值 (MAXIMUM) 当等值变异数的假设不成立时印出以下的统计值 9. t 检定的近似值 (T) 10. 近似的自由度 (DF) 11. 双尾检定的显著程度 (PROB>T) 当等值变异数的假设成立时 SAS 改印 12. t 检定的正确值 (T) 13. 正确的自由度 (DF) 14. 双尾检定的显著程度 (PROB>T 与上述 (11) 同) 等值变异数假设的检验结果是以下列的统计值来表示 15. 鉴别等值变异数假设的 F' 值 (F') 16. F' 检定的自由度 (DF) 17. 大于现有 F' 值的单尾检定的显著程度 (PROB>F') 第 25 章比较两组平均数的 t 检定统计程序 PROC TTEST 9 25.4 范例例一以 PROC TTEST 比较两个独立样本的平均数本例采用一班学生的体育成绩来示范 PROC TTEST 这一班学生有男有女我们想知道到底男女学生在网球的球技上是否有显著的不同虚无假设则是男女球技相同程序 DATA SCORES; INPUT SEX $ SCORE @@; CARDS; F 75 F 76 F 80 F 77 F 80 F 77 F 73 M 82 M 80 M 85 M 85 M 78 M 87 M 82 ; PROC TTEST; CLASS SEX; VAR SCORE; TITLE 'GOLF SCORES'; RUN; 结果首先看 F' 对变异数等值的假设检定 F'=1.53 未达显著程度因此接下来我们可以接受 Variances=Equal 的 t 检定值 T=-3.8288 (自由度=12.0) 达 0.0024 的显著程度所以结论是男女在网球的球技上有高下之分报表 25.1 以 PROC TTEST 比较两个独立样本的平均数 GOLF SCORES TTEST PROCEDURE Variable: SCORE SEX N Mean Std Dev Std Error Minimum Maximum F 7 76.85714286 2.54483604 0.96185761 73.00000000 80.00000000 M 7 82.71428571 3.14718317 1.18952343 78.00000000 87.00000000 Varianc es T DF Prob>|T| Unequal -3.8288 11.5 0.0026 Equal -3.8288 12.0 0.0024 For H0:Variances are equal,F'=1.53 DF=(6,6) Prob>F'=0.6189 例二以 PROC MEANS 比较配对组的平均数当两组数据之间有相关时 (如夫妻文件的数据或同一班学生前后两次考试的成绩) 则读者应用 PROC MEANS (而非 PROC TTEST) 来比较这两组之间平均数的差异本例另创一个新变量 (DIFF) 来代表两次考试的平均数差 PROC MEANS 的两个选项 T 第五部分变异数分析10 与 PRT 引导 SAS 进行配对组的 t 检定而且计算其统计显著度程序 DATA A; INPUT ID PRETEST POSTTEST; DIFF=POSTTEST-PRETEST; CARD; 1 80 82 2 73 71 3 70 95 4 60 69 5 88 100 6 84 71 7 65 75 8 37 60 9 91 95 10 98 99 11 52 65 12 78 83 13 40 60 14 79 86 15 59 62 ; PROC MEANS MEAN STDERR T PRT; VAR DIFF; TITLE 'PAIRED-COMPARISONS T TEST'; RUN; 结果分析结果显示后测比前测平均高出 7.93 分这个差异经 t 检定检验后 (T=3.09) 证明达 0.0079 的显著度报表 25.2 以 PROC MEANS 比较配对组的平均数 PAIRED-COMPARISONS T TEST Analysis Variable : DIFF NObs Mean StdError T Prob>|T| 15 7.9333333 2.5643465 3.0937057 0.0079 第 26 章平衡实验设计的变异数分析统计程序 PROC ANOVA 26.1 PROC ANOVA 程序概述 ANOVA 程序主要是对平衡实验设计的数据执行变异数分析但也可以处理拉丁方格实验设计完全的镶嵌设计 (Completely Nested Design) 细格之间人数成比例的实验设计等所谓的平衡实验设计是指组间 (或细格间) 人数相等的实验设计不平衡的实验设计则不可用 ANOVA 程序来处理要用 GLM 程序 (见第 31 章) 26.2 名词解释自变量与因变量自变量又称独立变量定性变量 (Qualitative Variable) 分类变量 (Classification Variable) 或是类别变量 (Categorical Variable) 其数值多半是不连续的反之因变量又称反应变量 (Response Variable) 其数值则是连续的实验效果变异数分析的目的在于找出自变量与因变量之间的线性关系或说自变量对因变量产生的实验效果这种实验效果可粗分为三种即主效果交互效果与镶嵌效果主效果以自变量的英文字母代表如 A B 等交互效果以星号联接的自变量表示如 A*B 镶嵌效果以小括号表示如 A(B) 表示 A 效果是镶嵌在 B 效果内 26.3 各种统计模型上述的三种实验效果分别与变异数分析法中不同的统计模型相对应现将这三种统计的模型分述如下主效果的统计模型假设有一个平衡的实验设计含三个自变量 (分别以 A B C 表示) 其因变量以 Y 表示则此三因子主效果变异数分析可以下面的程序来执行 PROC ANOVA; CLASS A B C; MODEL Y = A B C; 第五部分变异数分析12 交互效果的统计模型这种模型适用于含两个或两个以上自变量的实验设计若以上述的三因子设计为例其对应的主效果及交互效果可用下列的程序来计算 PROC ANOVA; CLASS A B C; MODEL Y = A B C A*B B*C A*C A*B*C; 当实验设计含多个自变量时交互效果会变得繁杂此时可用竖号 | 来简化比方说上例的 MODEL 指令可利用竖号简化如下 MODEL Y = A|B|C; 等于 MODEL Y = A B C A*B B*C A*C A*B*C; 另外举几个使用竖号的例子如下 A|C(B) 等于 A C(B) A*C(B) A(B)|C(B) 等于 A(B) C(B) A*C(B) A(B)|B(D E) 等于 A(B) B(D E) A|B(A)|C 等于 A C B(A) A*C B*C(A) 其他有关竖号的使用规则请参考第 16 章 PROC CATMOD 第 16.3 节的内容此外 @ 的符号表交互作用的最高元次因此 A|B|C@2 等于 A B C A*B A*C B*C A|B(A)|C@2 等于 A B(A) C A*C A|B|C|D@2 等于 A B A*B C A*C B*C D A*D B*D C*D 镶嵌效果的统计模型以上述三因子变量的实验设计为例我们现在假设自变量 C 是镶嵌在另外两个自变量 A 与 B 内则可用下列的 SAS 程序来执行变异数分析 PROC ANOVA; CLASS A B C; MODEL Y = A B C(A B); 由上式可知 C 是写在 A 与 B 的小括号外面这种写法表示 C 效果是镶嵌在 A 与 B 的交互作用内其他注意事项假如有一个实验设计同时包含了交互与镶嵌效果则读者可同时使用 * 与 ( ) 来表示如 PROC ANOVA; CLASS A B C; MODEL Y = A B(A) C(A) B*C(A); B*C(A) 表示 B 与 C 的交互效果是镶嵌在 A 的主效果里第 26 章平均实验设计的变异数分析统计程序 PROC ANOVA 13 值得读者注意的是当 MODEL 指令中省略一些效果时这些被省略的效果会自动与细格内的误差即 Within-Cell Error) 协调根据这个原则下面两道指令所表示的统计模型是完全相同的 CLASS A B; MODEL Y = A B(A); 等于 CLASS A B; MODEL Y = A A*B; 上面两段指令皆省略了 B 的主效果所以它们的细格内的误差值均相等 (因都包含了 B 的主效果) 26.4 如何撰写 PROC ANOVA 程序 PROC ANOVA 含十道指令它们的格式如下 PROC ANOVA 选项串 CLASS 变量名称串 MODEL 因变量名称串=实验效果串 (@)/ 选项串 MEANS 实验效果串 / 选项串 ABSORB 变量名称串 FREQ 变量名称 TEST H= 效果名称 E= 效果名称 MANOVA H= 效果名称 E= 效果名称 M= 变量的转换式 PREFIX= 新变量的名称代号 MNAMES= 新变量的名称串 / 选项串 REPEATED 重复变量的名称组数据(组名) 变量的转换 / 选项串 BY 变量名称串 CLASS 指令必须出现在 MODEL 指令之前如果选用 TEST MANOVA 指令则它们必须出现在 MODEL 指令之后 MEANS TEST 及 MANOVA 等指令可重复使用其他指令则只能出现一次指令 #1 PROC ANOVA 选项串下面四个选项可放在 PROC ANOVA 指令之后 (1) A DATA= 输入文件名称指明对那一个 SAS 文件执行 ANOVA 分析若省略此选项则 SAS 会自动找出在此程序之前最后形成的 SAS 文件对它执行 ANOVA 分析第五部分变异数分析14 (2) MANOVA 要求 PROC ANOVA 将含一个或一个以上因变量遗漏数据的观察体剔除当读者以交互式 (Interactive Mode) 方式进行多变量的变异数分析时最好界定此选项 (3) MULTIPASS 要求 PROC ANOVA 在必要情况下重读输入文件内的数据由于这个选项会占用极多的记忆体同时耗时很多除非必要读者可以省略此选项 (4) OUTSTAT=(含分析结果的) 输出文件名称这个选项会界定一个含分析结果的输出文件此输出文件将含离差平方和 (SS) F 检定值以及各实验效果的显著程度若读者同时界定 MANOVA 指令中的 CANONICAL 选项但未界定 M= 的选项则典型相关分析的结果也会纳入此输出文件内指令 #2 CLASS 变量名称串此指令指明上述的文件中哪些变量是自变量自变量可以是数值的 (如 1 代表男 2 代表女) 或文字的 (如 MALE 代表男 FEMALE 代表女) 若是文字变量则其长度不可超过十六个字母指令 #3 MODEL 因变量名称串=实验效果串 (@) 选项串有关删除号 (/) 前因变量= 实验效果的部分读者必须自行决定适合的统计模型然后根据本章第 26.3 节所介绍的原则写出 @ 符号可以限制交互作用的最高元次例如 A|B|C|D@2 则表示只需计算两两自变量相乘的交互作用即可至于删除号 (/) 之后的选项有两个 (1) A NOUNI 抑制单变量变异数分析结果的印出这个选项适用于多变量的变异数分析或重复观察实验中有关重复变量的分析报表 (2) INTERCEPT (或 INT) 要求 SAS 把线性模型内的截距 (亦即数据的总平均数) 当成一个参数同时对这个截距作是否为零的假设统计检定指令 #4 MEANS 实验效果串选项串此指令的前半部 (删除号之前) 是用来要求 ANOVA 程序算出某些自变量 (和其交互作用或镶嵌作用) 中各组 (或细格) 的平均数比方说我们可用下列的 SAS 程序算出文件中男人女人黑人白人男黑人男白人女黑人及女白人在因变量年薪 (SALARY) 上的平均数 PROC ANOVA; CLASS SEX RACE; MODEL SALARY = SEX RACE; MEANS SEX RACE SEX*RACE; 第 26 章平均实验设计的变异数分析统计程序 PROC ANOVA 15 删除号 (/) 之后可用的选项有二十四个前十七个选项分别对 MEANS 指令中所列的主效果平均数执行不同的显著性检定以上例而言 MEANS 指令会比较男与女黑人与白人之间的年薪差异后七个选项则与统计检定的各项事宜有关 (1) A BON 执行显著性 t 检定其理论基础是班弗尼氏的不等律 (Bonferroni Inequality) (2) DUNCAN 执行唐肯氏多范围检定 (Duncan's Multiple-Range Test) (3) DUNNETT (控制组组别) 这个选项界定唐那氏的两组平均数之双尾检定唐那氏 (Dunnett) 的检定依据 t 分配而且必须是实验组与控制组平均数的比较因此括号内必须指明控制组的组别请看下面的程序 MEANS A/DUNNETT ('CONTROL'); 根据这个指令的语法 A 效果的第 CONTROL 组就是控制组若控制组的组别是以数字来表示的 (如 2) 则不必再加单引号如 MEANS A/ DUNNETT(2); 这个选项的控制组一般是设定在第一组 (内设值) 若控制组不只一组时读者可同时在括号内提及如 MEANS A B C/DUNNETT('FIRST' 'SECOND' 'THIRD'); 根据上述指令的语法 A 效果的控制组是第 FIRST 组 B 效果的控制组是第 SECOND 组 C 效果则是第 THIRD 组 (4) DUNNETTL (控制组组名) 这个选项界定唐那氏的两组平均数之单尾检定而且预期的差异必须是负值 (亦即实验组的平均数小于控制组的平均数) 因此临界值订在 t 分配的下端有关控制组的内设值以及撰写语法请参见上面 (3) DUNNETT 的说明 (5) A DUNNETTU (控制组组名) 这个选项界定唐那氏的两组平均数之单尾检定而且预期的差异必须是正值 (亦即实验组的平均数大于控制组的平均数) 因此临界值订在 t 分配的上端有关控制组的内设值以及撰写语法请参见上面 (3) DUNNETT 的说明 (6) GABRIEL 执行贵博氏的多重比较 (Gabriel's Multiple-Comparison Procedure) (7) REGWF 执行 Ryan-Einot-Gabriel-Welsch 的 F 检定 (8) REGWQ 执行 Ryan-Einot-Gabriel-Welsch 的 t 检定 (9) SCHEFFE 执行沙菲氏 (Scheffe) 的多重比较检定第五部分变异数分析16 (10) SIDAK 执行 Sidak 的两组平均数的 t 检定 (11) SMM [或 (12) GT2] 执行 Sidak 的独立样本 t 检定当两组人数不等时此法也就是哈氏 (Hochberg) 的 GT2 法 (13) SNK 执行纽曼-库尔 (Newman-Keuls) 的两组平均数差的 t 检定 (14) T [或 (15) LSD] 执行配对组 t 检定因为 ANOVA 所处理的是平衡的设计故其结果与费契尔的最小显著差 (LSD) 的检验结果相同 (16) TUKEY 执行土其氏 (Tukey) 的 HSD 检定 (17) WALLER 执行 Waller-Duncan K-ratio 的 t 检定 (18) ALPHA= P 界定统计检验的显著程度内设值是 .05 当上面选项与选项 (2) DUNCAN 并用时 ALPHA 的值必须是 .10 .05 或 .01 三者之一与上面其他检定选项并用时 ALPHA 可以是 0.0001 与 0.9999 间任何的值 (19) LINES 将读者选用的显著性检定的分析结果 (即各平均数) 作由大到小的排列若某一对平均数之间无显著的差异则 SAS 将它们印在同一行上并以虚线将它们与其它有显著差异的平均数分开当读者选用 DUNCAN REGWF REGWQ SNK 或 WALLER 等检定时此选项会自动被包括在内否则读者必须另外附加此选项最适用于平衡的实验设计以及组数少于 24 的平均数比较若细格内的人数不等则 ANOVA 程序计算各细格人数的调和平均数 (Harmonic Mean) 并用此数来比较主效果的平均数差异当细格间人数差异太大时则某些比较的结果会不够严谨此选项不可与 (3) DUNNETT (4) DUNNETTL 或 (5) DUNNETTU 联用 (20) CLDIFF 将 BON GABRIEL SCHEFFE SIDAK SMM GT2 T LSD 或 TUKEY 显著性检定的结果用信赖区间的方式表示当实验设计是一个不平衡的设计时 CLDIFF 选项会自动被包括在内当读者选用 DUNCAN REGWF REGWQ SNK 或 WALLER 时则须另外附加 (21) CLM 将 MEANS 指令中所提到的效果的各组平均数以信赖区间的方式表示此选项必须与 BON GABRIEL SCHEFFE SIDAK SMM T 以及 LSD 等联用 (22) NOSORT 与上述 CLDIFF 或 CLM 选项合用抑止平均数按大小重新作排列第 26 章平均实验设计的变异数分析统计程序 PROC ANOVA 17 (23) E=效果名称此选项界定上述各显著性检定的分母若省略此选项则实验设计的误差 (或余差) 的平均方 (MS Residual) 就自动成为分母 (24) KRATIO=正整数与 WALLER 选项联用这个比例 (第一类型错误 / 第二类型错误) 的值若订为 50 100 或 500 则大约与 ALPHA 值 .10 .05 .01 相对应这个选项的内设值是 100 指令 #5 ABSORB 变量名称串此指令的用途旨在节省计算时间与电脑的记忆储存量详情请见第 31 章 (PROC GLM) 的 31.8 节 (ABSORB 指令及其使用方法) 请读者注意当选用此指令时文件中的数据必须依 ABSORB 指令中的变量做由小到大的排列而且这些变量不可出现在 CLASS 或 MODEL 指令内否则会产生错误的平方总和指令 #6 FREQ 变量名称此变量的值就是文件中各观察体重复出现的次数指令 #7 TEST H 效果名称 E 效果名称一般而言 SAS 的变异数分析自动采用误差 (或余差) 的平均方 (MS Residual) 作为 F 检定的分母读者可藉此指令自订 F 检定的分子分母以进行不同的 F 检定其中 H= 分子而 E= 分母请看下例 PROC ANOVA; CLASS A B C; MODEL Y = A|B(A)|C; TEST H = A E= = B(A); [所以 F = A/B(A)] TEST H = C A*C E = B*C(A); [所以 F = C/B*C(A) F = A*C/B*C(A)] 指令 #8 MANOVA H 效果名称 E 效果名称 M 变量的转换式 PREFIX 新变量的名称代号 MNAMES 新变量的名称串选项串当 MODEL 指令中含一个以上的因变量时读者可利用 MANOVA 指令要求执行多变量变异数分析 (Multivariate Analysis of Variance) MANOVA 指令的写法示范如下 PROC ANOVA; CLASS A B; MODEL Y1-Y5 = A B(A); MANOVA H = A E = B(A) / PRINTH PRINTE; MANOVA H = B(A) / PRINTE; 第五部分变异数分析18 MANOVA H = A E = B(A) M = Y1-Y2 Y2-Y3 Y3-Y4 Y4-Y5 PREFIX =DIFF; 上列的程序里由于在 MODEL 指令中有五个因变量 (Y1 Y2 Y3 Y4 Y5) 故可利用 MANOVA 指令要求执行多变量变异数分析第一个 MANOVA 指令中 H= A 规定 F 检定的分子是主效果 A E=B(A) 规定 F 检定的分母是镶嵌效果 B(A) 删除号 (/) 后的两个选项要求 ANOVA 程序印出 H 矩阵 (导源于 F 检定的分子在本例中即是主效果 A) 以及 E 矩阵 [导源于 F 检定的分母在本例中是镶嵌效果 B(A)] 第二个 MANOVA 指令中 H=B(A) 规定 F 检定的分子是镶嵌效果 B(A) 由于指令中未指明分母故误差的平均方便自动成为此 F 检定的分母同时误差的矩阵也将被印出第三个 MANOVA 指令与第一个指令类似但它额外地要求四对平均数的比较 (即 M= Y1-Y2 Y2-Y3 Y3-Y4 Y4-Y5) PREFIX= DIFF 规定这四对比较的名称将分别是 DIFF1 DIFF2 DIFF3 与 DIFF4 此外让我们来讨论 M= 变量的转换式这一部分的写法 M= 转换变量 {± 转换变量} 在此转换变量可以是原因变量或是常数乘以原因变量 {} 中的部分可有可无若选项 M=中含一个以上的变量转换式则以逗号 ( ) 相隔选项 M= 之后也可直接以系数矩阵的横列来表示前例中的程序若改用这种方式则应该是 MANOVA H=A E=B(A) M=(1 -1 0 0 0 0 1 -1 0 0 0 0 1 -1 0 0 0 0 1 -1) PREFIX=DIFF; 在此必须注意的是每一横列所含的系数必须等于因变量的数目而且在每一横列后要加上逗号分隔有时你或许希望进行趋势分析 (Trend Analysis) 下面示范此类分析的 ANOVA 程序 PROC ANOVA; CLASS GROUP; MODEL D1-D4= GROUP; MANOVA H= GROUP M= 3*D1-D2+D3+3*D4 D1-D2-D3-D4 -D1+3D2-3D3+D4 MNAMES= LINEAR QUADRTIC CUBIC / PRINTE; 上例 MANOVA 指令中的选项 MNAMES= 表明此趋势分析包含三个检定即线性的 (一次方) 抛物线性的 (二次方) 以及 S 型的 (三次方) 其他的选项与前相同除了上述两个例子所示范删除号 (/) 前的 MANOVA 指令外下面五个选项可置于第 26 章平均实验设计的变异数分析统计程序 PROC ANOVA 19 删除号 (/)之后 (1) A PRINTH 要求印出被测效果 (即 F 检定中的分子) 的矩阵 (2) PRINTE 要求印出 F 检定中分母的矩阵 (3) ORTH 规定 M= 所构成的平均数比较是经过标准化正交 (Orthonormalization) 的转换 (4) CANONICAL 对 H 与 E 矩阵执行典型分析(此分析的结果会与另一统计程序 PROC CANDISC 类似) 并印出分析的结果 (5) SUMMARY 印出每一因变量的变异数分析摘要表如果与选项 M= 联用时此指令印出 M 矩阵中所转换的每一变量的变异数分析摘要表指令 #9 REPEATED 重复变量的名称组数组名变量的转换选项串假设有三种实验在四个不同的时间进行则每一位受试有十二个分数假如这十二个分数分别以 Y1-Y12 表示则下面的指令可代表这十二个分数的统计分析 REPEATED TRIAL 3 (A B C) TIME 4 (T1 T2 T3 T4); 这个指令言简意赅的说明了下列的

                    本文档为【最详细的中文sas软件教程第五卷(共五卷）无水印】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

最详细的中文sas软件教程第五卷(共五卷）无水印

你可能还喜欢