null3 SAS过程步
及简单统计分析3 SAS过程步
及简单统计分析3.1 SAS过程步简介3.1 SAS过程步简介SAS过程步的一般形式为:
PROC 过程名 [ DATA=输入数据集] [选项];
过程语句1 [/ 选项 ];
过程语句2 [/ 选项 ];
……
RUN;
Data选项
用于指明所需处理的数据集名,在这里它是一个可选项参数。
常用过程步的名称及功能常用过程步的名称及功能null1.VAR语句
语法
格式
pdf格式笔记格式下载页码格式下载公文格式下载简报格式下载
为:
VAR 变量名1 变量名2 … 变量名n;
变量名列表可以使用省略的形式,如x1-x3 等。
功能:用于指定分析变量。
应用实例: var math chinese;
2.MODEL语句
语法格式为:
MODEL 因变量 = 自变量列表 / 选项;
功能:统计建模过程中用来指定模型的形式。
应用实例:model y=x1 x2 x3 ;
null3.BY语句
语句格式:
BY
变量 …
功能:在过程步中用来指定一个或几个分组变量,根据这些分组变量值可以把观测记录分组,然后对每一组观测分别进行指定的分析。BY语句总是与SORT过程一起使用,以便定义数据排列次序。
例如:假设我们已经把class1数据集按性别排序,则下面PRINT 过程可以把男、女生分别列出:
proc print data=class1 ;
by sex;
run;null4.OUTPUT语句
语法格式为:
OUTPUT OUT=输出数据集名 关键字=变量名 关键字=变量名 …;
功能:将过程指定结果输出到一个新的SAS数据集,以便作为下步处理的输入。不同过程中把输出结果存入数据集的方法各有不同,OUTPUT语句是使用频繁的语句之一。OUT=给出了存放结果数据集的名字,关键字用于定义输出变量名,用“关键字=变量名”的方式指定了系统自动输出变量与存储变量之间的对应关系。等号后面的变量名指定了输出数据集中的存储变量名称。(程序示例)null5.FREQ语句
语法格式为:
FREQ 变量;
功能:规定一个数值变量,表示数据集中观测出现的频数。
6.WEIGHT语句
语法格式
WEIGHT 变量;
功能:规定一个权重变量,反映该变量在总体中的相对重要性
null7.ID语句
语法格式为:
ID 变量表;
功能:用来规定一个变量,以便在输出或由该过程产生的SAS数据集中,不再使用Obs,而用这些变量来识别观测。
8.CLASS语句
语法格式
CLASS 变量表;
功能:定义分类变量。
null9.WHERE语句
语法格式为:
where 逻辑表达式;
功能:用来选择输入数据集的子集进行分析。
示例:
Where math>=90 chinese>=60;
10.LABEL语句
语法格式
Label 变量=‘新标签 ’ …;
功能:为变量指定一个标签。(示例)
null11 FORMAT语句
语法格式:
Format 变量名 格式描述符 …;
示例:
Format inday MMDDYY8. math 5.1;3.2 PRINT过程
3.2 PRINT过程
3.2.1 PRINT过程简介
在SAS Windows版以前,PRINT过程是最常用的SAS过程之一。PRINT过程步列出数据集的内容,以检查变量对应输入的数据值是否正确。现在我们可能通过Viewtable表打开生成的数据集查看数据。为了输出显示一个指定的数据集,在PROC PRINT语句中使用DATA=指定数据集,语法结构如下:
PROC PRINT