首页 最详细的中文sas软件教程第五卷(共五卷)无水印

最详细的中文sas软件教程第五卷(共五卷)无水印

举报
开通vip

最详细的中文sas软件教程第五卷(共五卷)无水印 返回总目录返回总目录返回总目录返回总目录 目目目目 录录录录 第 24 章 SAS 系统内七种变异数分析程序概述........................................................................ 4 24.1 七种变异数分析的程序............................................................................................... 4 24.2 平衡...

最详细的中文sas软件教程第五卷(共五卷)无水印
返回总目录返回总目录返回总目录返回总目录 目目目目 录录录录 第 24 章 SAS 系统内七种变异数分析程序概述........................................................................ 4 24.1 七种变异数分析的程序............................................................................................... 4 24.2 平衡的实验MATCH_ word word文档格式规范word作业纸小票打印word模板word简历模板免费word简历 _1713299596703_2........................................................................................................... 4 24.3 一般线性模型............................................................................................................... 5 第 25 章 比较两组平均数的 t 检定 统计程序 PROCTTEST .............................................. 7 25.1 PROC TTEST 程序概述 ............................................................................................. 7 25.2 如何撰写 PROC TTEST 程序 ................................................................................... 7 25.3 输出文件概述............................................................................................................... 8 25.4 范 例....................................................................................................................... 9 第 26 章 平衡实验设计的变异数分析 统计程序 PROCANOVA......................................... 11 26.1 PROC ANOVA 程序概述 ......................................................................................... 11 26.2 名 词 解 释............................................................................................................... 11 26.3 各种统计模型............................................................................................................. 11 26.4 如何撰写 PROC ANOVA 程序 ............................................................................... 13 26.5 范 例..................................................................................................................... 21 第 27 章 变异数成份的分解 统计程序 PROCVARCOMP ................................................... 27 27.1 PROC VARCOMP 程序概述 .................................................................................... 27 27.2 如何撰写 PROC VARCOMP 程序 ............................................................................ 28 27.3 范 例..................................................................................................................... 29 第 28 章 混合式模型的变异数分析 统计程序 PROCMIXED ............................................. 33 28.1 PROC MIXED 程序概述 .......................................................................................... 33 28.2 名 词 解 释............................................................................................................... 33 28.3 MIXED 程序基本功能的示范.................................................................................. 34 28.4 如何撰写 PROC MIXED 程序 ................................................................................ 38 28.5 范 例..................................................................................................................... 51 28.6 注 意 事 项............................................................................................................... 68 第 29 章 变异数分析的实验设计 统计程序 PROC PLAN.................................................. 70 29.1 PROC PLAN 程序的简介 ......................................................................................... 70 29.2 如何撰写 PROC PLAN 程序 .................................................................................... 71 29.3 范 例..................................................................................................................... 75 29.4 注 意 事 项............................................................................................................... 80 第 30 章 无参数的一因子变异数分析 统计程序 PROCNPAR1WAY ................................ 81 30.1 PROC NPAR1WAY 程序概述 .................................................................................. 81 30.2 如何撰写 PROC NPAR1WAY 程序 ........................................................................ 81 30.3 范 例..................................................................................................................... 83 30.4 注 意 事 项............................................................................................................... 91 第五部分 变 异 数 分 析 第 24 章 SAS 系统内七种变异数分析程序概述 24.1 七种变异数分析的程序 本节提纲契领地介绍 SAS 所提供的七个变异数 analysis of variance 分析的程序及 一些有关的统计观念 这七个程序简介如下 TTEST 以 t 检定比较两组观察体的平均数 ANOVA 适用于平衡的实验设计 GLM 功能甚广 可执行变异数分析 回归分析 共变量分析以及多变 量变异数分析 (归入第六部分第 31 章) VARCOMP 推算各类型变异数的值 MIXED 适用于固定与随机效果的混合式模型分析 PLAN 为实验 计划 项目进度计划表范例计划下载计划下载计划下载课程教学计划下载 产生随机的排列组合 NPAR1WAY 适用于无参数分析中单因变量之变异数分析 这七个程序中 以 GLM 与 MIXED 两程序功能最广泛 其他则只适用于特殊的情 况 读者必须依照实验设计选用合适的 SAS 程序 变异数分析的用途在于解释我们观察 所得的数据 一般而言 这些数据是在不同的实验情况下收集来的 这些不同的情况会造 成数据间的异同 此称实验效果 (Treatment Effect) 但另有一部分的异同是与实验情况无 关的 此称随机误差 (Random Error) 所有变异数分析的精髓不外乎是选定合适的统计模 型 利用正确的 SAS 程序来推算出实验效果和随机误差的平均方 (Mean Square) 若以 MS(A) 表实验效果的平均方 以 MS(E) 表随机误差的平均方 则其比例会导出一个 F 分 配 MS(E) MS(A)F = F 的自由度随不同的实验设计而定 若 MS(A) 远超过 MS(E) (即 F 值远大于 1) 则我们说实验效果显著 反之 我们 说实验效果不显著 这个统计的理论是费契尔 (Fisher 1925) 所建立的 有关这个理论 最早的教科书是沙菲所著 (Scheffe 1959) 24.2 平衡的实验设计 平衡的实验设计是指相等人数的实验 也就是说每一组 (或每一细格) 里的观察体个 数相同 若研究者的实验设计是平衡的 则你可以用较简单的 ANOVA 程序计算出变异 数分析中所有必需的统计值 而不必用到较费时费力的 GLM 程序 若把 ANOVA 程序 第 24 章 SAS 系统内七种变异数分析程序概述 5 用在不平衡的实验设计划 则结果会有误差 甚至可能导出负的平均方值 24.3 一般线性模型 如果你的实验设计是不平衡的 则你不可用 ANOVA 程序 你极可能会用到 PROC GLM (一般线性模型程序) 或 PROC MIXED (混合式的线性模型) 在统计领域中的线性模型与解析几何中的线性函数或线性图有异同之处 相同之处 是它们都用 线性 这个名词来表示一个 一次 的或线性的函数关系 相异之处是 统计中所指的线性关系是指因变量与参数之间的线性关系 而非因变量与自变量之间的线 性关系 若以 X 代表自变量 Y 代表因变量 代表参数 E 代表随机误差 则下列三式 都称为线性模型 i2211i i221 2 1i i2211i EX)log(XY EXXY EXXY ++= ++= ++= 但下列三式则称为非线性模型 i X2X1 21 1 i i2211i i X2)X1( i E)e(eY 或;EXXY EeY 21 21 +− − = ++= += −− + 许多的非线性模型可被转换成线性模型 否则它们无法用变异数分析法来处理 线性假设 线性假设是指参数间的线性组合而言 下面列举几种常见的表示法 H: 1 = 2 = ... = 0 ; 或 H: L1 1 + L2 2 + L3 3 + ... +Lk k = 0 ; 或 H: L = 0 (此处 L 是行向量 是列向量) 随机效果 随机效果一般是由随机因子导出 在农业经济研究上 农作物的产地 如 畦田或 耕地等) 通常被视为一个随机因子 (Random Factor) 在教育界 一个班级或学校或一群 学生则被看作是一个随机因子 随机因子的效果称为随机效果 关于这些随机因子的变异 数分析 SAS 预备有 VARCOMP 与 NESTED 两程序 另一程序 GLM 则只印出随机因 子的平均方值 但不推算各类型变异数的预计值 平均数的比较 如果数据中含多个平均数 而且读者已决定要比较哪两个平均数时 可用 GLM 程 第五部分 变异数分析6 序中的 CONTRAST 指令来检验这两个平均数之间是否有显著的差异 请读者注意 若 你反复地使用 CONTRAST 指令来测许多对平均数 则你的分析结果将失去真实性 这是 因为这种分析法可能让你犯了统计上所谓的第一类型错误 详情请见第 31 章 PROC GLM 的平均数比较部分 无参数的变异数分析 无参数的变异数分析并不要求数据符合常态分配的假设 因此数据不能以一般参数 分析的统计方法处理 在这种情况下 可用 NPAR1WAY 程序将数据转换成名次排列 (如 第一 第二等等) 然后进行无参数的单因变量变异数分析 二元或二元以上无参数 的变异数分析与 NPAR1WAY 相似 读者可先用 PROC RANK 把数据转换成名次 然后 再用一般的参数分析程序处理 如 TEST ANOVA 或 NESTED 等 第 25 章 比较两组平均数的 t 检定 统计程序 PROC TTEST 25.1 PROC TTEST 程序概述 TTEST 程序旨在对 SAS 文件中的两个平均数执行 t 检定 这个 t 检定是单元变异 数分析的特殊例子 它的虚无假设是这两个平均数相等 t 检定有一个重要的假设 即 两组观察体所代表的母群 其变异数必须相同 这个 假设由 F 检定来鉴别 (Steel and Terrie 1980) 若此假设成立 则 SAS 可进一步算出 t 值 与其统计的显著程度 若此假设不成立 则 SAS 会算出 t 的近似值与其近似的自由度 自由度的近似值估计系采沙特斯威氏 (Satterthwaite 1946) 的方法 同时读者可要求根据 Cochran 与 Cox 1957 计算 t 检定之近似值的显著度 若读者有意进行一组平均数的 t 检定或配对组平均数比较的 t 检定 则应用 PROC MEANS 来进行 (见本章例二的示范) TTEST 程序只适用于两组独立的样本 25.2 如何撰写 PROC TTEST 程序 PROC TTEST 含四道指令 它们的格式如下 PROC TTEST 选项串 CLASS 变量名称 VAR 变量名称串 BY 变量名称串; 上述四道指令不能重复出现 只有 PROC TTEST 与 CLASS 两指令是必须的 不可 省略 PROC TTEST 后的指令出现次序可以随意安排 指令 #1 PROC TTEST 选项串 下面这两个选项可出现在 PROC TTEST 指令中 (1) DATA=输入文件名称 指明对那一个文件执行 t 检定 若省略此选项 则 SAS 会自动找出在此程序之 前最后形成的 SAS 文件 对它执行 t 检定 (2) COCHRAN 当两组数据的变异数据不相当时 这个选项可以正确地计算出 t 检定之近似值的 统计显著度 其理论基础是 Cochran 与 Cox 1957 年的著作 第五部分 变异数分析8 指令 #2 CLASS 变量名称 此变量旨在识别观察体所属的组别 因此变量只可有两个不同的值 (如 男 女或 1 0 等) 如果此变量的值是英文字母 如 MALE 或 FEMALE 则名字的长度不应超过 十六个字母 否则警告信息会出现 指令 #3 VAR 变量名称串 指明对那些因变量的平均数执行 t 检定 若省略此指令 则 SAS 会视输入文件内 所有数值变量 (除 CLASS 指令里提到的变量外) 为因变量 然后针对每一数值变量执行 t 检定 指令 #4 BY 变量名称串 SAS 依据此指令所列举的变量将文件分成几个小的文件 然后对每一个小的文件分 别执行 t 检定 当读者选用此指令时 文件内的数据必须先按照 BY 变量串的值做由小 到大的重新排列 这个步骤可藉 PROC SORT 达成 25.3 输出文件概述 针对每一个参与 t 检定的因变量 TTEST 程序会印出下列的统计值 1. 该因变量的名称 2. 组别名称 3. 有效观察体个数 (N) 4. 平均数 (MEAN) 5. 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 差 (STD DEV) 6. 标准误差 (STD ERROR) 7. 最小值 (MINIMUM) 8. 最大值 (MAXIMUM) 当等值变异数的假设不成立时 印出以下的统计值 9. t 检定的近似值 (T) 10. 近似的自由度 (DF) 11. 双尾检定的显著程度 (PROB>T) 当等值变异数的假设成立时 SAS 改印 12. t 检定的正确值 (T) 13. 正确的自由度 (DF) 14. 双尾检定的显著程度 (PROB>T 与上述 (11) 同) 等值变异数假设的检验结果是以下列的统计值来表示 15. 鉴别等值变异数假设的 F' 值 (F') 16. F' 检定的自由度 (DF) 17. 大于现有 F' 值的单尾检定的显著程度 (PROB>F') 第 25 章 比较两组平均数的 t 检定 统计程序 PROC TTEST 9 25.4 范 例 例一 以 PROC TTEST 比较两个独立样本的平均数 本例采用一班学生的体育成绩来示范 PROC TTEST 这一班学生有男有女 我们想 知道到底男女学生在网球的球技上是否有显著的不同 虚无假设则是男女球技相同 程 序 DATA SCORES; INPUT SEX $ SCORE @@; CARDS; F 75 F 76 F 80 F 77 F 80 F 77 F 73 M 82 M 80 M 85 M 85 M 78 M 87 M 82 ; PROC TTEST; CLASS SEX; VAR SCORE; TITLE 'GOLF SCORES'; RUN; 结 果 首先 看 F' 对变异数等值的假设检定 F'=1.53 未达显著程度 因此 接下来我们 可以接受 Variances=Equal 的 t 检定值 T=-3.8288 (自由度=12.0) 达 0.0024 的显著程 度 所以 结论是男女在网球的球技上有高下之分 报表 25.1 以 PROC TTEST 比较两个独立样本的平均数 GOLF SCORES TTEST PROCEDURE Variable: SCORE SEX N Mean Std Dev Std Error Minimum Maximum F 7 76.85714286 2.54483604 0.96185761 73.00000000 80.00000000 M 7 82.71428571 3.14718317 1.18952343 78.00000000 87.00000000 Varianc es T DF Prob>|T| Unequal -3.8288 11.5 0.0026 Equal -3.8288 12.0 0.0024 For H0:Variances are equal,F'=1.53 DF=(6,6) Prob>F'=0.6189 例二 以 PROC MEANS 比较配对组的平均数 当两组数据之间有相关时 (如 夫妻文件的数据 或同一班学生前后两次考试的成 绩) 则读者应用 PROC MEANS (而非 PROC TTEST) 来比较这两组之间平均数的差异 本例另创一个新变量 (DIFF) 来代表两次考试的平均数差 PROC MEANS 的两个选项 T 第五部分 变异数分析10 与 PRT 引导 SAS 进行配对组的 t 检定而且计算其统计显著度 程 序 DATA A; INPUT ID PRETEST POSTTEST; DIFF=POSTTEST-PRETEST; CARD; 1 80 82 2 73 71 3 70 95 4 60 69 5 88 100 6 84 71 7 65 75 8 37 60 9 91 95 10 98 99 11 52 65 12 78 83 13 40 60 14 79 86 15 59 62 ; PROC MEANS MEAN STDERR T PRT; VAR DIFF; TITLE 'PAIRED-COMPARISONS T TEST'; RUN; 结 果 分析结果显示后测比前测平均高出 7.93 分 这个差异经 t 检定检验后 (T=3.09) 证明达 0.0079 的显著度 报表 25.2 以 PROC MEANS 比较配对组的平均数 PAIRED-COMPARISONS T TEST Analysis Variable : DIFF NObs Mean StdError T Prob>|T| 15 7.9333333 2.5643465 3.0937057 0.0079 第 26 章 平衡实验设计的变异数分析 统计程序 PROC ANOVA 26.1 PROC ANOVA 程序概述 ANOVA 程序主要是对平衡实验设计的数据执行变异数分析 但也可以处理拉丁方格 实验设计 完全的镶嵌设计 (Completely Nested Design) 细格之间人数成比例的实验设计 等 所谓的平衡实验设计是指组间 (或细格间) 人数相等的实验设计 不平衡的实验设计 则不可用 ANOVA 程序来处理 要用 GLM 程序 (见第 31 章) 26.2 名 词 解 释 自变量与因变量 自变量又称独立变量 定性变量 (Qualitative Variable) 分类变量 (Classification Variable) 或是类别变量 (Categorical Variable) 其数值多半是不连续的 反之 因变量 又称反应变量 (Response Variable) 其数值则是连续的 实验效果 变异数分析的目的在于找出自变量与因变量之间的线性关系 或说自变量对因变量 产生的实验效果 这种实验效果可粗分为三种 即 主效果 交互效果 与镶嵌效果 主 效果以自变量的英文字母代表 如 A B 等 交互效果以星号联接的自变量表示 如 A*B 镶嵌效果以小括号表示 如 A(B) 表示 A 效果是镶嵌在 B 效果内 26.3 各种统计模型 上述的三种实验效果分别与变异数分析法中不同的统计模型相对应 现将这三种统 计的模型分述如下 主效果的统计模型 假设有一个平衡的实验设计 含三个自变量 (分别以 A B C 表示) 其因变量以 Y 表示 则此三因子主效果变异数分析可以下面的程序来执行 PROC ANOVA; CLASS A B C; MODEL Y = A B C; 第五部分 变异数分析12 交互效果的统计模型 这种模型适用于含两个或两个以上自变量的实验设计 若以上述的三因子设计为例 其对应的主效果及交互效果可用下列的程序来计算 PROC ANOVA; CLASS A B C; MODEL Y = A B C A*B B*C A*C A*B*C; 当实验设计含多个自变量时 交互效果会变得繁杂 此时可用竖号 | 来简化 比方 说 上例的 MODEL 指令可利用竖号简化如下 MODEL Y = A|B|C; 等于 MODEL Y = A B C A*B B*C A*C A*B*C; 另外举几个使用竖号的例子如下 A|C(B) 等于 A C(B) A*C(B) A(B)|C(B) 等于 A(B) C(B) A*C(B) A(B)|B(D E) 等于 A(B) B(D E) A|B(A)|C 等于 A C B(A) A*C B*C(A) 其他有关竖号的使用规则 请参考第 16 章 PROC CATMOD 第 16.3 节的内容 此外 @ 的符号表交互作用的最高元次 因此 A|B|C@2 等于 A B C A*B A*C B*C A|B(A)|C@2 等于 A B(A) C A*C A|B|C|D@2 等于 A B A*B C A*C B*C D A*D B*D C*D 镶嵌效果的统计模型 以上述三因子变量的实验设计为例 我们现在假设自变量 C 是镶嵌在另外两个自变 量 A 与 B 内 则可用下列的 SAS 程序来执行变异数分析 PROC ANOVA; CLASS A B C; MODEL Y = A B C(A B); 由上式可知 C 是写在 A 与 B 的小括号外面 这种写法表示 C 效果是镶嵌在 A 与 B 的交互作用内 其他注意事项 假如有一个实验设计同时包含了交互与镶嵌效果 则读者可同时使用 * 与 ( ) 来表 示 如 PROC ANOVA; CLASS A B C; MODEL Y = A B(A) C(A) B*C(A); B*C(A) 表示 B 与 C 的交互效果是镶嵌在 A 的主效果里 第 26 章 平均实验设计的变异数分析 统计程序 PROC ANOVA 13 值得读者注意的是 当 MODEL 指令中省略一些效果时 这些被省略的效果会自动 与细格内的误差 即 Within-Cell Error) 协调 根据这个原则 下面两道指令所表示的统 计模型是完全相同的 CLASS A B; MODEL Y = A B(A); 等于 CLASS A B; MODEL Y = A A*B; 上面两段指令皆省略了 B 的主效果 所以它们的细格内的误差值均相等 (因都包含 了 B 的主效果) 26.4 如何撰写 PROC ANOVA 程序 PROC ANOVA 含十道指令 它们的格式如下 PROC ANOVA 选项串 CLASS 变量名称串 MODEL 因变量名称串=实验效果串 (@)/ 选项串 MEANS 实验效果串 / 选项串 ABSORB 变量名称串 FREQ 变量名称 TEST H= 效果名称 E= 效果名称 MANOVA H= 效果名称 E= 效果名称 M= 变量的转换式 PREFIX= 新变量的名称代号 MNAMES= 新变量的名称串 / 选项串 REPEATED 重复变量的名称 组数据(组名) 变量的转换 / 选项串 BY 变量名称串 CLASS 指令必须出现在 MODEL 指令之前 如果选用 TEST MANOVA 指令 则 它们必须出现在 MODEL 指令之后 MEANS TEST 及 MANOVA 等指令可重复使用 其他指令则只能出现一次 指令 #1 PROC ANOVA 选项串 下面四个选项可放在 PROC ANOVA 指令之后 (1) A DATA= 输入文件名称 指明对那一个 SAS 文件执行 ANOVA 分析 若省略此选项 则 SAS 会自动找 出在此程序之前最后形成的 SAS 文件 对它执行 ANOVA 分析 第五部分 变异数分析14 (2) MANOVA 要求 PROC ANOVA 将含一个或一个以上因变量遗漏数据的观察体剔除 当读者 以交互式 (Interactive Mode) 方式进行多变量的变异数分析时 最好界定此选项 (3) MULTIPASS 要求 PROC ANOVA 在必要情况下重读输入文件内的数据 由于这个选项会占用 极多的记忆体 同时耗时很多 除非必要 读者可以省略此选项 (4) OUTSTAT=(含分析结果的) 输出文件名称 这个选项会界定一个含分析结果的输出文件 此输出文件将含离差平方和 (SS) F 检定值 以及各实验效果的显著程度 若读者同时界定 MANOVA 指令中的 CANONICAL 选项但未界定 M= 的选项 则典型相关分析的结果也会纳入此输 出文件内 指令 #2 CLASS 变量名称串 此指令指明上述的文件中哪些变量是自变量 自变量可以是数值的 (如 1 代表男 2 代表女) 或文字的 (如 MALE 代表男 FEMALE 代表女) 若是文字变量 则其长度 不可超过十六个字母 指令 #3 MODEL 因变量名称串=实验效果串 (@) 选项串 有关删除号 (/) 前 因变量= 实验效果 的部分 读者必须自行决定适合的统计模型 然后根据本章第 26.3 节所介绍的原则写出 @ 符号可以限制交互作用的最高元次 例 如 A|B|C|D@2 则表示只需计算两两自变量相乘的交互作用即可 至于删除号 (/) 之后的 选项有两个 (1) A NOUNI 抑制单变量变异数分析结果的印出 这个选项适用于多变量的变异数分析或重复 观察实验中有关重复变量的分析报表 (2) INTERCEPT (或 INT) 要求 SAS 把线性模型内的截距 (亦即数据的总平均数) 当成一个参数 同时对这 个截距作是否为零的假设统计检定 指令 #4 MEANS 实验效果串 选项串 此指令的前半部 (删除号之前) 是用来要求 ANOVA 程序算出某些自变量 (和其交互 作用或镶嵌作用) 中各组 (或细格) 的平均数 比方说我们可用下列的 SAS 程序算出文 件中男人 女人 黑人 白人 男黑人 男白人 女黑人及女白人在因变量年薪 (SALARY) 上的平均数 PROC ANOVA; CLASS SEX RACE; MODEL SALARY = SEX RACE; MEANS SEX RACE SEX*RACE; 第 26 章 平均实验设计的变异数分析 统计程序 PROC ANOVA 15 删除号 (/) 之后可用的选项有二十四个 前十七个选项分别对 MEANS 指令中所列 的主效果平均数执行不同的显著性检定 以上例而言 MEANS 指令会比较男与女 黑人 与白人之间的年薪差异 后七个选项则与统计检定的各项事宜有关 (1) A BON 执行显著性 t 检定 其理论基础是班弗尼氏的不等律 (Bonferroni Inequality) (2) DUNCAN 执行唐肯氏多范围检定 (Duncan's Multiple-Range Test) (3) DUNNETT (控制组组别) 这个选项界定唐那氏的两组平均数之双尾检定 唐那氏 (Dunnett) 的检定依据 t 分配而且必须是实验组与控制组平均数的比较 因此 括号内必须指明控制组的 组别 请看下面的程序 MEANS A/DUNNETT ('CONTROL'); 根据这个指令的语法 A 效果的第 CONTROL 组就是控制组 若控制组的组别 是以数字来表示的 (如 2) 则不必再加单引号 如 MEANS A/ DUNNETT(2); 这个选项的控制组一般是设定在第一组 (内设值) 若控制组不只一组时 读者可 同时在括号内提及 如 MEANS A B C/DUNNETT('FIRST' 'SECOND' 'THIRD'); 根据上述指令的语法 A 效果的控制组是第 FIRST 组 B 效果的控制组是第 SECOND 组 C 效果则是第 THIRD 组 (4) DUNNETTL (控制组组名) 这个选项界定唐那氏的两组平均数之单尾检定 而且预期的差异必须是负值 (亦 即实验组的平均数小于控制组的平均数) 因此临界值订在 t 分配的下端 有关控制组的内设值以及撰写语法 请参见上面 (3) DUNNETT 的说明 (5) A DUNNETTU (控制组组名) 这个选项界定唐那氏的两组平均数之单尾检定 而且预期的差异必须是正值 (亦 即实验组的平均数大于控制组的平均数) 因此临界值订在 t 分配的上端 有关控制组的内设值以及撰写语法 请参见上面 (3) DUNNETT 的说明 (6) GABRIEL 执行贵博氏的多重比较 (Gabriel's Multiple-Comparison Procedure) (7) REGWF 执行 Ryan-Einot-Gabriel-Welsch 的 F 检定 (8) REGWQ 执行 Ryan-Einot-Gabriel-Welsch 的 t 检定 (9) SCHEFFE 执行沙菲氏 (Scheffe) 的多重比较检定 第五部分 变异数分析16 (10) SIDAK 执行 Sidak 的两组平均数的 t 检定 (11) SMM [或 (12) GT2] 执行 Sidak 的独立样本 t 检定 当两组人数不等时 此法也就是哈氏 (Hochberg) 的 GT2 法 (13) SNK 执行纽曼-库尔 (Newman-Keuls) 的两组平均数差的 t 检定 (14) T [或 (15) LSD] 执行配对组 t 检定 因为 ANOVA 所处理的是平衡的设计 故其结果与费契尔 的最小显著差 (LSD) 的检验结果相同 (16) TUKEY 执行土其氏 (Tukey) 的 HSD 检定 (17) WALLER 执行 Waller-Duncan K-ratio 的 t 检定 (18) ALPHA= P 界定统计检验的显著程度 内设值是 .05 当上面选项与选项 (2) DUNCAN 并 用时 ALPHA 的值必须是 .10 .05 或 .01 三者之一 与上面其他检定选项并 用时 ALPHA 可以是 0.0001 与 0.9999 间任何的值 (19) LINES 将读者选用的显著性检定的分析结果 (即各平均数) 作由大到小的排列 若某一 对平均数之间无显著的差异 则 SAS 将它们印在同一行上 并以虚线将它们与 其它有显著差异的平均数分开 当读者选用 DUNCAN REGWF REGWQ SNK 或 WALLER 等检定时 此选项会自动被包括在内 否则读者必须另外附加 此选项最适用于平衡的实验设计以及组数少于 24 的平均数比较 若细格内的人 数不等 则 ANOVA 程序计算各细格人数的调和平均数 (Harmonic Mean) 并 用此数来比较主效果的平均数差异 当细格间人数差异太大时 则某些比较的结 果会不够严谨 此选项不可与 (3) DUNNETT (4) DUNNETTL 或 (5) DUNNETTU 联用 (20) CLDIFF 将 BON GABRIEL SCHEFFE SIDAK SMM GT2 T LSD 或 TUKEY 显 著性检定的结果用信赖区间的方式表示 当实验设计是一个不平衡的设计时 CLDIFF 选项会自动被包括在内 当读者选用 DUNCAN REGWF REGWQ SNK 或 WALLER 时 则须另外附加 (21) CLM 将 MEANS 指令中所提到的效果的各组平均数以信赖区间的方式表示 此选项 必须与 BON GABRIEL SCHEFFE SIDAK SMM T 以及 LSD 等联用 (22) NOSORT 与上述 CLDIFF 或 CLM 选项合用 抑止平均数按大小重新作排列 第 26 章 平均实验设计的变异数分析 统计程序 PROC ANOVA 17 (23) E=效果名称 此选项界定上述各显著性检定的分母 若省略此选项 则实验设计的误差 (或余 差) 的平均方 (MS Residual) 就自动成为分母 (24) KRATIO=正整数 与 WALLER 选项联用 这个比例 (第一类型错误 / 第二类型错误) 的值若订为 50 100 或 500 则大约与 ALPHA 值 .10 .05 .01 相对应 这个选项的内设 值是 100 指令 #5 ABSORB 变量名称串 此指令的用途旨在节省计算时间与电脑的记忆储存量 详情请见第 31 章 (PROC GLM) 的 31.8 节 (ABSORB 指令及其使用方法) 请读者注意 当选用此指令时 文件中的数据必须依 ABSORB 指令中的变量做由 小到大的排列 而且这些变量不可出现在 CLASS 或 MODEL 指令内 否则会产生错误 的平方总和 指令 #6 FREQ 变量名称 此变量的值就是文件中各观察体重复出现的次数 指令 #7 TEST H 效果名称 E 效果名称 一般而言 SAS 的变异数分析自动采用误差 (或余差) 的平均方 (MS Residual) 作为 F 检定的分母 读者可藉此指令自订 F 检定的分子 分母以进行不同的 F 检定 其中 H= 分子 而 E= 分母 请看下例 PROC ANOVA; CLASS A B C; MODEL Y = A|B(A)|C; TEST H = A E= = B(A); [所以 F = A/B(A)] TEST H = C A*C E = B*C(A); [所以 F = C/B*C(A) F = A*C/B*C(A)] 指令 #8 MANOVA H 效果名称 E 效果名称 M 变量的转换式 PREFIX 新变量的名称代号 MNAMES 新变量的名称串 选项串 当 MODEL 指令中含一个以上的因变量时 读者可利用 MANOVA 指令 要求执行 多变量变异数分析 (Multivariate Analysis of Variance) MANOVA 指令的写法示范如下 PROC ANOVA; CLASS A B; MODEL Y1-Y5 = A B(A); MANOVA H = A E = B(A) / PRINTH PRINTE; MANOVA H = B(A) / PRINTE; 第五部分 变异数分析18 MANOVA H = A E = B(A) M = Y1-Y2 Y2-Y3 Y3-Y4 Y4-Y5 PREFIX =DIFF; 上列的程序里 由于在 MODEL 指令中有五个因变量 (Y1 Y2 Y3 Y4 Y5) 故 可利用 MANOVA 指令要求执行多变量变异数分析 第一个 MANOVA 指令中 H= A 规定 F 检定的分子是主效果 A E=B(A) 规定 F 检定的分母是镶嵌效果 B(A) 删除号 (/) 后的两个选项要求 ANOVA 程序印出 H 矩阵 (导源于 F 检定的分子 在本例中即是主效果 A) 以及 E 矩阵 [导源于 F 检定的分母 在本例中是镶嵌效果 B(A)] 第二个 MANOVA 指令中 H=B(A) 规定 F 检定的分子是镶嵌效果 B(A) 由于指 令中未指明分母 故误差的平均方便自动成为此 F 检定的分母 同时 误差的矩阵也将 被印出 第三个 MANOVA 指令与第一个指令类似 但它额外地要求四对平均数的比较 (即 M= Y1-Y2 Y2-Y3 Y3-Y4 Y4-Y5) PREFIX= DIFF 规定这四对比较的名称将分别是 DIFF1 DIFF2 DIFF3 与 DIFF4 此外 让我们来讨论 M= 变量的转换式 这一部分的写法 M= 转换变量 {± 转换变量} 在此 转换变量 可以是原因变量或是常数乘以原因变量 {} 中的部分可有可无 若选项 M=中含一个以上的变量转换式 则以逗号 ( ) 相隔 选项 M= 之后也可直接以系数矩阵的横列来表示 前例中的程序若改用这种方式 则应该是 MANOVA H=A E=B(A) M=(1 -1 0 0 0 0 1 -1 0 0 0 0 1 -1 0 0 0 0 1 -1) PREFIX=DIFF; 在此必须注意的是 每一横列所含的系数必须等于因变量的数目 而且在每一横列 后要加上逗号分隔 有时 你或许希望进行趋势分析 (Trend Analysis) 下面示范此类分析的 ANOVA 程 序 PROC ANOVA; CLASS GROUP; MODEL D1-D4= GROUP; MANOVA H= GROUP M= 3*D1-D2+D3+3*D4 D1-D2-D3-D4 -D1+3D2-3D3+D4 MNAMES= LINEAR QUADRTIC CUBIC / PRINTE; 上例 MANOVA 指令中的选项 MNAMES= 表明此趋势分析包含三个检定 即线性 的 (一次方) 抛物线性的 (二次方) 以及 S 型的 (三次方) 其他的选项与前相同 除了上述两个例子所示范删除号 (/) 前的 MANOVA 指令外 下面五个选项可置于 第 26 章 平均实验设计的变异数分析 统计程序 PROC ANOVA 19 删除号 (/)之后 (1) A PRINTH 要求印出被测效果 (即 F 检定中的分子) 的矩阵 (2) PRINTE 要求印出 F 检定中分母的矩阵 (3) ORTH 规定 M= 所构成的平均数比较是经过标准化正交 (Orthonormalization) 的转换 (4) CANONICAL 对 H 与 E 矩阵执行典型分析(此分析的结果会与另一统计程序 PROC CANDISC 类似) 并印出分析的结果 (5) SUMMARY 印出每一因变量的变异数分析摘要表 如果与选项 M= 联用时 此指令印出 M 矩阵中所转换的每一变量的变异数分析摘要表 指令 #9 REPEATED 重复变量的名称 组数 组名 变量的转换 选项串 假设有三种实验在四个不同的时间进行 则每一位受试有十二个分数 假如这十二 个分数分别以 Y1-Y12 表示 则下面的指令可代表这十二个分数的统计分析 REPEATED TRIAL 3 (A B C) TIME 4 (T1 T2 T3 T4); 这个指令言简意赅的说明了下列的
本文档为【最详细的中文sas软件教程第五卷(共五卷)无水印】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_904375
暂无简介~
格式:pdf
大小:729KB
软件:PDF阅读器
页数:45
分类:金融/投资/证券
上传时间:2012-12-17
浏览量:18