第一章 绪论
第一节 统计学的性质及分类
一、统计学的性质
统计学的概念:以搜集、整理、
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
或推断数据,并以此为依据对所研究对象做出判断或决策的方法科学论。
二、统计学的分类
理论统计学研究如何对客观现象的数量进行计量、观测、概括和
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
述,是统计学的基础和统计研究工作的第一步,内容包括统计指标及其
设计
领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计
、统计调查、统计整理、统计图表、集中趋势测度、离散程度测试、统计指数和时间序列常规分析等理论方法。
推断统计学是现代统计学的核心内容,它以概率论为理论依据,利用部分数据对总体数据的某些性质或数量特征进推断和检验。
理论统计学和应用统计学的关系:理论统计学所提出的科学的数量方法为应用统计学研究提供了理论依据和条件,而应用统计学的发展又可进一步改进、完善和发展理论统计学所提出的数量方法。
第二节 统计学的基本概念
一、总体和个体
总体:构成统计活动研究对象的全部事物的整体为总体(有限总体、无限总体)
个体:总体中每个个体事物。
总体容量:总体中全部个体事物的数量称为总体的容量。
统计总体根据统计研究的目的来确定。
二、样本
样本是指从总体中随机抽取出来,并作为其代表的那一部分个全所组成的子集。
样本的特点:每个个体必须取自于总体的内部,从一个总体可以抽取许多个不同的样本,样本是总体的代表,样本的随机性。
三、变量
变量:客观现象的特征取值或类别在一个以上者均为变量
四、指标及其测度
用来测度研究对象某种特征数量的概念称为统计指标,简称指标。
第三节 统计指标体系及其设计
一、统计指标体系的概念
反映总体及其所含个体的各个方面特征数量的一系列相互联系、相互补充的统计指标所形成的体系,称为统计指标体系。
二、统计指标体系中指标的分类
三、统计指标体系设计的内容:
1、 设置框架
2、 确定内涵和外延
3、 确定计量单位
4、 确定计算方法
四、统计指标体系设计的原则
统计指标体系设计的原则:目的性、科学性、可行性、联系性
第二章 数据的调查与整理
第一节 数据调查的方式与程序
一、数据调查的方式
数据调查的概念:根据研究目的要求,对总体中个体的相应特征进行观测取得数据的工作过程。数据资料具有代表性和真实性是对统计资料调查的基本要求。
调查方式:现场调查、实验调查。
二、数据调查的一般程序
数据调查的环节:制定
方案
气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载
、登记数据、数据整理与显示。确定调查目的是首要问题
第二节 现场调查
一、调查的抽样方式
现场调查:随机抽样和非随机抽样
调查的抽样方式:普查、抽样调查
抽样调查:从总体中抽取部份个体进行观测,取得样本数据,然后依据样本数据推算总体数据。
随机抽样又称为概率抽样调查,被调查总体中的每个个体被抽中或不被抽中的概率相同
非随机抽样:又称非概率抽样调查,凭调查人员主观判断进行选取,便利而随意选取。
二、调查的观测方式
三、问卷调查的设计
问卷设计技术主要包括:提问方式和提问次序
调查问卷提问方式:封闭型提问、开放性提问。
提问次序:先一般后特殊,所谓漏斗式。
第三节 试验观测
第四节 数据整理与显示
一、分类遵循两个原则:互斥性、完备性
观测个体分类:单值分类、组距分类
统计表概念:显示数据资料表格
统计表的结构:总标题、横栏标题、纵栏标题、数据资料、表示附注。
第三章 次数分布
第一节 次数分布的编制与显示
一、次数分布的概念
次数分布的概念:各个不同数值及每个不同数值出现的次数顺序排列
二、次数分布表及其编制
次数分布表概念:表示观测变量的次数分布的统计表
单值分组次数分布表:每一个不同的取值代表一个组的变量值,并计算各组出现的个数或次数。
累计频数和累计频率
累计频数(或频率)分布数列:可采用向上累计或向下累计。
向上累计:由变量值低的组向变量值高的组累计频数。
向下累计:由变量值高的组向变量值低的组累计频数。
重点掌握:直方图和柱状图
第二节 次数分布的理论模型
一、次数分布理论模型的概念和意义
随机变量的概率分布的表示方法主要有三种:概率分布表、概率分布图、概率分布函数。
二、离散型随机变量的概率分布
泊松分布:对于描述在一个特定时间或空间范围内某一事件发生的次数有用。
一、间隔期内发生次数概率相等
二、某一间隔内发生与否相互独立。
三、连续型随机变量的概率分布
第四章 分布特征的测度
第一节 分布中心的测度
一、分布中心的概念及意义
分布中心的定义:距离一个变量的所有取值最近的数值
变量分中意义:1、变量取值的一个代表,反映取值一般水平。
2、可以揭示取值的次数分布在直角坐标系上的集中位置。
二、分布中心的测度指标及其计算方法
1、算术平均数(简单算数平均数、加权算术平均数)、中位数、众数(重点计算)
算术平均数又称均值,它是一组变量值的总和与其变量值的个数总和的比值,是测量分布中心最常用指标。
2、组距数列算术平均数
首先计算出每组的组中值,组中值就是各组变量的代表值
组中值=(上限+下限)/2
缺下限的组中值=上限-邻组组距/2
缺上限的组中值=下限+邻组组距/2
3、应用算术平均数应注意的问题
㈠容易受极端变量值的影响,极大值或极小值应剔除
㈡权数不取绝于它的绝对值大小,而取决于它的比重
㈢组中值作为各组变量值的代表
4、算术平均数的数学性质
㈠变量值与平均数离差总和等于零
㈡变量值与平均数离方平均和为最小
二、中位数
中位数概念:将某一变量的变量值按照从小到大的顺序排成一列,位于这列数中心位置上的那个变量值。
中位数的确定:
(1)未分组资料中位数的确定:变量值由小到大排列(n+1)/2确定中位数所处的位置,最后寻找位置的变量值为中位数,若变量值n为偶数,则以排在数列中n/2项 n+1/2项变量值的简单算术平均数作为中位数。
(2)单项数列中位数的确定:计算向上或向下累计次数,由公式计算结果与累计次数的结果确定中位数在单项数列中所处组的位置,则该组上的变量值就是中位数。
(3)组距数列中位数的确定(例题公式重点)p88
三、众数
众数概念:变量取值出现次数最多的那个变量值
众数的确定:未分组的变量值,统计出现次数最多的那个变量值,若是单项数列则频数(或频率)最大的变量值就是众数。
众数组距数列:依距各组变量值出现次数的多少确定众数所在的组,然后采用上限公式或下限公式确定众数即可。(公式、例题)p90
算术平均数、中位数和众数三者之间的关系:在正态分布的情况下,三者在数量上完全相等。
第二节 离散程度的测试
一、离散程度通过对变量取值之间离散程度的测定,反映各个变量值之间的差异大小,可以反映中心指标变量值代表性的高低。
第五章 抽样估计
第一节 抽样估计的理论基础
抽样估计的基本内容根据总体的部份数据信息去估计未知总体指标的理论和方法。
1、大数定律
大量的独立重复测量值的算术平均值具有稳定性,对于这种稳定性构成大数定律的基本内容。
两个重要的大数定律:贝努里大数定律、辛钦大数定律
第二节 抽样方法与抽样分布
重复抽样和不重复抽样(掌握概念)
抽样分布:对于给定的总体和抽样方式以及样本容量,样本指标取值的概念分布就称为抽样分布
第三节 点估计
一、总体参数与其估计量
总体参数:根据样本数据来推断总体指标数值,总体指标又称为参数
根据样本来推断总体指标数值称为抽样估计
估计量:估计总体指标数值的统计量
估计值:估计量的数值为该总体指标的估计值
二、构造估计量的方法-矩法估计
构造估计量的方法:矩法估计,用样本矩作为总体同一矩的估计量或者用样本矩的函数作为总体相应矩的函数的估计量,最直观、最简单也是较为常用的方法就是矩法估计。
三、判断估计量优劣的
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
常用的标准主要有:一致性(基本要求)、无偏性(不应存在偏大或偏小偏差)、有效性、充分性、稳健性。
估计量的标准误:样本估计值与总体指标真值之间存在着误差,误差越大,抽样估计的精确程度就越低。
标准误的概念:样本估计量的标准差通常称为该估计量的标准误差。
标准误的计算:(例题、公式)
样本均值的标准误:(例题、公式)
(三)影响标准误的因素
(1)总体中各个个体之间的差异程度
(2)样本容量的大小,样本容量越大,标准误差越小,抽样估计误差也就越小
(3)抽样的方式与方法
第四节 区间估计
区间估计的概念:事先给定的概率保证程度下,根据样本估计量的概率分布确定可能包含未知总体参数的某个区间,作为对未知总数的估计。
第六章 相关与回归分析
第一节 相关分析
一、相关关系
当一个变量的变化完全决定另一个变量的变化或两个变量之间是一种严格的确定的关系时我们称之为函数。
相关关系的概念:存在着一定的联系但又不是严格的,确定的关系。
相关分析的主要内容:1、确定现象之间有无相关关系。
2、确定相关关系的表现形式。
3、测定相关关系的密切程度。
二、相关关系的描述-散点图
如两变量之间的变化方向是一致的,即存在着正相关。
如两变量之间的变化方向是相反的,即为负相关。
1、相关的形态:若变量Y与变量X的相关关系表现为线性组合或绘制的散点图近似的表现为一条直线,则称为线性相关,绘制的散点图近似地表现为一条曲线,则称为非线性相关或曲线相关。
2、相关的方向:正相关、负相关
三、相关程度的测定-相关系数的计算(公式、例题)
相关系数的性质与具体含义:
1、r 的取值在-1~1之间,即-1≤r≤1
r >0表明正线性相关关系
r <0表明负线性相关关系
当r=1时,表明完全相关
当r=0时,表明为无线性相关
当0<r<1时,表明为无完全相关
2、r具有对称性
3、r的数值大小与X和Y的计量尺度无关
4、r是两个变量之间线性关系的变量指标