常用统计软件实习报告
姓名: 学号:
班级
班级管理量化考核细则初中班级管理量化细则班级心理健康教育计划班级建设班级德育计划
练习1:
(1)①分析步骤:
a.单击菜单Analyze→Reports→OLAP Cubes,打开OLAP Cubes对话框,从左侧的变量列
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
框中选择“销售额”移入Summary Variables方框中;选择“部门”,“职务”移入Grouping Variable方框中。
b.单击Statistics按钮,弹出OLAP Cubes:Statistics对话框中,从Cell Statistics统计量列表中,移出系统默认的Sum、 Percent of Total Sum和Percent of Total N这三个默认的统计量,从Statistics框中,选择Median移入Cell Statistics列表框中。
c.单击Continue按钮,回到OLAP Cubes:Statistics对话框中,单击Title按钮,弹出OLAP Cubes:Title对话框,在Title下方输入“某公司销售额变化情况分析”,在Caption下方输入“根据部门、职务分组”。单击Continue按钮,回到主对话框,单击OK按钮,输出在线分析结果。
d.为了在表中对比不同销售部门和不同职务在销售额方面存在的差异,对输出的
表格
关于规范使用各类表格的通知入职表格免费下载关于主播时间做一个表格详细英语字母大小写表格下载简历表格模板下载
进行转置,双击刚生成的表格,将它激活;在弹出的PivotingTrays对话框,将分组变量“部门”、“职务”从Layer托盘拖动到下方的Row托盘上, 单击PivotingTrays对话框中的关闭按钮。
②输出表格:
③分析:职务不同,销售额不同。不分部门,从总体来看平均销售额从高到低依次为低级管理人员、公司老总、普通雇员、部门经理、高级管理人员;从标准差来看:低级管理人员销售额最不稳定,高级管理人员销售额最稳定;从中位数看,普通雇员最高,高级管理人员最低。部门不同,销售额也不同。不分职务,从总体来看平均销售额从高到低依次为财务部门、电脑服务部门、研发部门、其他部门 ;从标准差来看:电脑服务部门最不稳定,其他部门最稳定;从中位数看,财务部门最高,其他部门最低。
(2)①分析步骤:
a.单击Analyze→Reports→Case Summaries,打开个案综述分析对话框。从左侧的变量名列表框中选择“销售额”,移入Variables方框中;选择“部门”、“职务”,移入Grouping Variable方框中。由于输出的分组综述表,并不需要显示个案列表,因此不要选择左下角的Display cases复选框。
b.单击Statstics按钮。在统计量对话框中,从左侧的统计量列表框中选择Mean、Median和Standard Deviation移入右侧的Cell Statistics方框中,其中Number of Cases是默认的统计量。单击Continue按钮,回到个案综述对话框。
c.单击Options按钮,打开报表选项对话框。在Title下方输入“某公司销售额变化个案综述表”,在Caption下方输入“根据部门、职务分组”。单击Continue按钮,回到主对话框,单击OK按钮,输出个案综述分析结果。
②输出表格:
③分析:个案综述分析输出的报表和OLAP输出的报表在格式上没有明显差别,因此分析与上一题相同。
(3)①分析步骤:
a.单击Analyze→Compare Means→Means,打开Means(均值分析)对话框。把变量“销售额”移入Dependent List (因变量列表框)中,将“部门”移入Independent List(自变量列表框)中。
b. 单击Next按钮, Independent List方框上方显示Layer2 of 2,再将变量“公司规模”移入Independent List方框中,单击OK按钮,输出分析结果。
②输出表格:
③分析:在输出的report中,变量“公司规模”是以列的方式嵌套在表格中,从中可以发现四种部门中,随着公司规模的不同,工人的平均销售额呈现出不同的变化趋势。四种部门的工人平均销售额均随着公司规模的增大而逐渐增加。
练习2:
(1)①分析步骤:
a.单击Analyze→Descriptive Statistics→Frequencies,弹出Frequencies对话框,将变量“部门”移入Variable方框中。
b. 变量“部门”是数值变量,在进行频数分析时需要选择统计量。单击Statisitcs按钮,弹出Statisitcs对话框。勾选Central Tendency栏中的Mean、Median、Mode这三个集中趋势统计量;勾选Dispersion栏中的Std Deviation、Range这两个离散趋势统计量;勾选Distribution栏中的Skewness和Kurtosis。单击Continue按钮,返回到频数分析对话框。
c. 单击Charts按钮,在Chart对话框中,单击Chart type中的Bar charts (柱形图),单击Continue按钮,返回到频数分析对话框。单击OK按钮,输出分析结果。
②输出表格:
③分析:输出结果中的统计量表显示变量“部门”的样本容量n,其中有效数据62个,缺失数据8个(missing=8)。均值mean为2.05,中位数median为2.00,众数mode为2,标准差std deviation为0.818。
偏度skewness为0.466,峰度kurtosis为-0.189,虽然偏度为正值,有点右偏趋势,峰度为负值,峰值稍低于正态分布的峰值,但是这两个分布形态趋势统计量都趋近于0,而且没有大于它们对应标准差的2倍,说明变量“部门”可能还是接近正态分布的。
从频数分析表和柱形图可知:销售人员经常联系客户在电脑服务部门的人最多,接下去依次为研发部门、财务部门、其他部门,缺失的在未知部门。
(2)①分析步骤:
a. 单击Analyze→Descriptive Statistics→Frequencies,弹出Frequencies对话框,将变量“职务”移入Variable方框中。
b. 变量“职务”是数值变量,在进行频数分析时需要选择统计量。单击Statisitcs按钮,弹出Statisitcs对话框。勾选Central Tendency栏中的Mean、Median、Mode这三个集中趋势统计量;勾选Dispersion栏中的Std Deviation、Range这两个离散趋势统计量;勾选Distribution栏中的Skewness和Kurtosis。单击Continue按钮,返回到频数分析对话框。
c. 单击Charts按钮,在Chart对话框中,单击Chart type中的Pie charts (饼状图),单击Continue按钮,返回到频数分析对话框。单击OK按钮,输出分析结果。
②输出表格:
③分析:输出结果中的统计量表显示变量“职务”的样本容量n,其中有效数据59个,缺失数据11个(missing=11)。均值mean为2.86,中位数median为3.00,众数mode为3,标准差std deviation为1.252。
偏度skewness为-0.008,峰度kurtosis为-0.940,虽然偏度为负值,有点左偏趋势,峰度为负值,峰值稍低于正态分布的峰值。
从频数分析表和饼状图可知:销售人员经常联系的客户的职位大部分为高级管理人员,接下去是部门经理,低级管理人员和普通雇员并列,最后是公司老总。
(3)①分析步骤:
a. 单击Analyze→Descriptive Statistics→ Descriptives,弹出Descriptives对话框。从左侧的变量列表框中选择“销售额”,移入Variable方框中。
b. 单击Options按钮,取消离散趋势统计量中默认的Minimum和Maximum,只保留 Std Deviation,单击Continue按钮,返回到描述性分析对话框。
c. 在描述性分析对话框中没有提供图表输出的选项,单击OK按钮,输出分析结果。
②输出表格:
③分析:销售额偏度为正值,所以呈右偏分布;峰度也为正值,所以呈尖峰分布。
练习3:
(1)①分析步骤:
a.单击Analyze→Descriptive Statistics→Explore,弹出探索性分析对话框。从左侧变量列表框中选择“月消费金额”,移入到Dependent List方框中。
b.单击Plots按钮,在图形对话框中,勾选Descriptive栏中的Histogram;勾选Normality plots with test,输出正态检验统计量及其相应的图形。单击Continue按钮,返回到探索性分析对话框,单击OK按钮,输出分析结果。
②输出表格:
③分析:正态概率Q-Q图和剔除趋势的正态概率Q-Q图也是判断变量是否服从正态分布的图形。正态概率Q-Q图的斜线是过原点的正态分布标准线,如果散点分布在这条斜线附近没有明显偏离它,那么变量大体应该服从正态分布。剔除趋势的正态概率Q-Q图中,如果散点在横坐标x=0附近随机分布,没有明显的变化趋势,那么变量也应该大体服从正态分布。
变量“月消费金额”的正态概率Q-Q图中,散点明显偏离斜线,剔除趋势的正态概率Q-Q图中,散点在横坐标x=0附近的分布也呈现明显的变化趋势,因此它不服从正态分布。它服从于右偏分布。
(2)①分析步骤:单击常用工具栏中的Dialog Recall按钮,在弹出的对话框中选择Explore,回到探索性分析对话框中,从左侧变量列表框中选择“性别”,将它移入Factor List方框中,单击OK按钮。
②输出表格:
③分析:根据输出结果判断两种不同类型客户的“月消费金额”均不服从正态分布,且都为右偏分布。
练习4:①分析步骤:
a. 单击Analyze→Compare Means→Independent Samples t test,弹出独立样本均值检验对话框。将变量“两法的激励效果”移入到test variable方框中。
b. 将变量“激励方法”移入Grouping variable方框中,单击Define Group按钮,弹出定义组对话框,在Group1和Group 2后的文本框中分别输入0和1。单击continue按钮,返回独立样本均值检验对话框,点击OK。
c. 双击检验表,在SPSS Viewer窗口中,单击Pivot→Pivoting Trays,弹出Pivoting Trays对话框。将下方Rows托盘中的Assumptions图标拖动到Layer托盘中,关闭Pivoting Trays对话框。从Layer右侧的下拉列表框中选择Equal Variance assumed,得到方差齐次条件下的两个独立样本均值检验结果。
②输出表格:
③分析:分组统计量表显示两组变量的样本容量、均值、标准差和抽样平均误差,A法的平均激励效果为17.0143,高于B法的平均激励效果。A法的标准差相差大于B法的标准差,说明B法的激励效果较稳定。
接下来可以观察到t检验统计量为1.637,自由度为12,t统计量对应的显著性水平Sig=0.128,大于常用的显著性水平0.0A,接受两组样本均值相等的假定,也就是说两种方法的激励效果不存在显著差别。
表中的Mean Difference是两组样本数据均值之差(0.50000=17.0143-16.5143)。95% Confidence Interval of the Difference显示两组样本均值之差95%的置信区间,这个置信区间包含0,因此接受两组样本均值之差为0的原假设。
练习5:
(1)①分析步骤:
a. 单击Graph →Legacy Dialogs →Scatter,弹出Scatter/Dot对话框,单击Simple Scatter按钮,选择简单散点图,再单击Define按钮,弹出Simple Scatterplot对话框。
b. 在Simple Scatterplot对话框中,选择“进出口总额”作为因变量,移入Y Axis(纵坐标)方框下;选择“地区生产总值”作为自变量,移入X Axis(横坐标)方框下,单击OK按钮,生成简单散点图。
②输出表格:
③分析:这两个变量之间存在明显的线性趋势。
(2)①分析步骤:单击Analyze→Correlate→Bivariate,弹出双变量相关系数对话框,将两个变量移入Variable方框中,单击OK按钮,输出相关系数矩阵。
②输出表格:
③分析:相关系数表显示两个变量的相关系数(教材中的相关系数又称皮尔逊相关系数)为0.947,其对应的显著性水平Sig为0.000,小于显著性水平0.05,拒绝两个变量相关系数r=0的假设,变量“进出口总额”和“地区生产总值”线性相关显著。
(3)①分析步骤:
a. 单击Transform→Compute Variable,弹出Compute Variable(计算变量)对话框,在Target variable(目标变量)下方文本框中输入目标变量,也就是新变量名称lnx。
b. 单击右侧Function group(
函
关于工期滞后的函关于工程严重滞后的函关于工程进度滞后的回复函关于征求同志党风廉政意见的函关于征求廉洁自律情况的复函
数组)列表框中的Arithmetic(算术),下方的Function and special variable列表框中显示SPSS内置的数学函数,单击自然对数函数ln,再单击向上的箭头(或者双击ln),将函数表达式移入Numeric Expression方框中,此时函数表达式中还没有参数,会显示?。
c. 单击Type&Label下面变量列表框的变量x,再单击向右的箭头,将变量x移入函数表达式中作为参数(双击变量y也能将它移入函数表达式中) ,单击OK按钮,data view中会显示新变量lnx,lny同理可得。
d.简单散点图绘制方式同(1)
②输出表格:
③分析:两个变量之间的关系比x与y之间的关系更为显著。
(4)①分析步骤:
a. 单击Analyze→Regression→Linear,弹出线性回归对话框。变量lny是因变量,将它移入Dependent方框中,变量lnx是自变量,将它移入Independent方框中。
b. 单击Plots按钮,在Line Regression:Plots对话框中,从左侧的变量列表框中,选择ZRESID(标准化残差)为纵坐标变量,移入Y方框中,选择Dependent(因变量)为横坐标变量,移入X方框中,在Standardized Residual Plots(标准化残差图)栏中,选择Histogram和Normal probability plot,单击Continue按钮,回到线性回归对话框。
c. 单击Save按钮,弹出Linear Regression:save(保存变量)对话框,分别勾选Predicted Values栏和Residual栏中的Unstandardized复选框,因变量的未标准化预测值和残差将作为新变量保存到原文件中。单击Continue按钮,回到线性回归对话框。单击OK按钮,输出线性回归结果。
②输出表格:
③分析:进出口总额对地区生产总值的的一元线性回归模型表达式为:
练习6:谈谈你在使用SPSS软件在绘制图形、创建报表、数据整理和数据分析方面的一些体会。
(1)使用spss软件在绘制图形方面的体会:
通过一周的练习,我了解到与其他软件相比,spss制图功能强大,图形美观,操作简便易行,能够满足大多数情况下的要求,在各种统计软件中,以spss制作的统计图应用最为广泛;除了生存分析所用的生存曲线图被整合到Analyze菜单中外,其他的统计绘图功能均在Graph菜单中。spss中使用的一种高度可视化的构造图表交互界面----图形构建器能够将复杂的信息清晰地表现出来,而PDF格式的输出功能能让用户更好地同其他人员进行信息共享。
(2)使用spss软件在创建报表方面的体会:
spss的Analyze菜单的Reports中包含了OLAP(在线分层分析)、Case Summaries(个案汇总分析)、Reports Summaries in Rows(行报告汇总分析)和Reports Summaries in Columns(列报告汇总分析),后面两个过程的功能比较相似,分别按行和列的形式输出报表,可以生成比较复杂的统计报表。通过spss提供的Pvioting Tray功能,在OLAP Cube 中可以很方便地实现层字段、列字段和页字段的转化,这一功能非常类似于Excel中的数据透视表。我们还可以在描述性统计量表中设置表格的标题和脚注。在输出的OLAP Cube报表中,可以通过spss提供的Pivoying Trays功能实现表格中层字段、行字段和列字段的相互转换。
(3)使用spss软件在数据整理和数据分析方面的体会:
与其他统计软件相比(如SAS软件),spss软件在数据整理与分析时不用基于一些较为繁琐、枯燥的语句和命令,只要用户具备一般的计算机和统计原理知识,就能用鼠标进行操作,得到所需要的统计分析结果。
spss数据整理包括变量计算、变量值计数、变量值重新编码及其自动编码、观测量求秩、缺失值替代处理、观测量排序与数据文件的转置、数据文件的合并与拆分、数据的分类汇总、观测量选择与加权,这些功能主要依靠compute和record命令执行。
spss数据分析主要包括描述统计、假设检验、方差分析、非参数检验、相关分析、回归分析、时间序列分析、聚类分析与判别分析、主成分分析与因子分析。通过实习训练,我发现spss数据分析操作简便,结果详细完善,大大减轻了我们的负担。
_1234567890.unknown