null第四章 概率与概率分布第四章 概率与概率分布本章内容
4.1 概率分布及其特征
4.2 二项分布
4.3 正态分布
下一页返回目录4.1 概率分布及其特征4.1 概率分布及其特征4.1.1 概率分布及其数量特征
4.1.2 概率分布的数量特征
4.1.3 利用随机数发生器创建概率分布上一页下一页返回本章首页4.1.1 概率分布及其特征4.1.1 概率分布及其特征具有多种可能结果的现象称为随机现象,随机现象的每一可能结果即是一个随机事件,换句话说,随机变量的每一可能取值都是一个随机事件。
概率是度量随机事件出现或发生的可能性大小的一种尺度。
概率分布由随机变量的取值(x)及其相应的P(x)概率构成。
上一页下一页返回本节首页null按随机变量取值的特点,概率分布可分为离散型随机变量的概率分布和连续型随机变量的概率分布。
对于离散型随机变量x,其均值就是随机变量的各个取值与其相应的概率的乘积之和,即:
离散型随机变量的方差是随机变量的各个取值与均值E(x)之间离差平方的均值,即:
连续性随机变量的均值及方差的计算公式为: 上一页下一页返回本节首页4.1.2 概率分布的数量特征4.1.2 概率分布的数量特征频率与概率都是一个居于0和1之间的数。
频率是相对于样本而言,而概率则是相对于总体而言。因此可以说概率是频率的理论值,频率是概率的试验值或估计值。
频率分布是一种观察分布,而概率分布则是一种理论分布。上一页下一页返回本节首页例 在市场调查中,通常用5分来
评价
LEC评价法下载LEC评价法下载评价量规免费下载学院评价表文档下载学院评价表文档下载
消费者对某一品牌的满意程度。现某项目经理想要得到电视机消费者对其品牌的评价程度,当然这需要通过市场调查来完成。假如执行董事知道消费者对其品牌得分的概率分布如表所示,那么,他便可以根据概率分布来确认消费者对其品牌的评价。例 在市场调查中,通常用5分来评价消费者对某一品牌的满意程度。现某项目经理想要得到电视机消费者对其品牌的评价程度,当然这需要通过市场调查来完成。假如执行董事知道消费者对其品牌得分的概率分布如表所示,那么,他便可以根据概率分布来确认消费者对其品牌的评价。
上一页下一页返回本节首页null操作步骤如下:
①打开“第4章 概率与概率分布.XLS”工作簿,选择“概率分布”工作表。
上一页下一页返回本节首页null②在单元格C9中输入“均值”,在C10单元格中输入“方差”。
③选择单元格E2,键入公式“=C2*D2”,用来计算均值,注意这是一个相对引用,按回车键,单元格E2中将出现0.4。
④将单元格E2的公式复制到单元格E3:E6中。
⑤选定单元格E7,单击自动求和键Σ,Excel自动将E2:E6区域中的数值相加,按回车键,便得到品牌得分概率分布的均值1.95。
⑥选择单元格F2,输入公式“=(C2-$E$7)2*D2”,单元格C2提供随机变量X值,单元格E7提供概率分布的均值,按F4使E7绝对引用。按回车键便会得到0.42025。
上一页下一页返回本节首页null⑦把单元格F2的公式复制到F3:F6区域中。
⑧选定单元格F7,双击自动求和按钮,对F2:F6区域中的值求和,得到概率分布的方差。
⑨在单元格D9中输入“=E7”,在单元格D10中输入“=F7”,以便观察与比较均值与方差。
如果每个步骤操作正确,工作表将显示计算结果如图4.1所示。
这样,这个品牌得分的概率分布均值是1.95,方差是1.2475。均值1.95说明全部消费者对该品牌电视机的满意程度为一般。
上一页下一页返回本节首页4.1.3 利用随机数发生器
创建概率分布 4.1.3 利用随机数发生器
创建概率分布 在大多数情况下,概率分布是未知的,需要通过调查进行推断。
如果从全部调查对象中随机选取一名被访者,无法根据其评分来描述品牌得分的概率分布。
如果选取多名被访者,那么品牌得分的频率分布便会与概率分布相似。
这一点可以通过利用Excel的“随机数发生器”分析工具产生概率分布来证明。上一页下一页返回本节首页null 1.“随机数发生器”分析工具
“随机数发生器”分析工具可以按照用户选定的分布类型,在工作表的特定区域中生成一系列独立随机数字,通过概率分布来表示其总体特征。其对话框及其内容如图所示:
上一页下一页返回本节首页null 对话框中的主要内容包括:
变量个数:在此指定输出表中数值列的数目。如不输入数字,Excel出现提示信息:“随机数发生器—输入区域丢失,请输入”。
随机数个数:在此输入每一列中数据点的数目。如不输入数字,Excel出现提示信息:“随机数发生器—输入区域丢失,请输入”。
分布:可单击右侧的箭头,打开分布列表,选择用于创建随机数的分布类型。其中有均匀分布,正态分布,贝努里分布,泊松分布等。
参数:在此输入数值,或用来定义当前选定的分布类型的数值,不同的分布具有不同的参数。
上一页下一页返回本节首页null随机数基数:在此输入用来构造随机数的可选数值。
输出区域:在此输出计算结果。如果输出表将覆盖已有的数据,Excel 会自动确定输出区域的大小并显示信息。
新工作表:单击此选项,可在当前工作簿中插入新工作表,并由新工作表的 A1 单元格开始粘贴计算结果。如果需要给新工作表命名,请在右侧的编辑框中键入名称。
新工作簿:单击此选项,可创建新工作簿,并在新工作簿的新工作表中粘贴计算结果。上一页下一页返回本节首页null2.利用随机数发生器创建品牌得分概率分布
①打开“第4章 概率与概率分布.XLS”工作簿,选择“概率分布”工作表。
②在“工具”菜单中选择“数据分析”选项,弹出数据分析对话框。上一页下一页返回本节首页null③从“数据分析”对话框的列表中双击“随机数发生器”选项,则打开“随机数发生器”分析工具对话框如图所示。上一页下一页返回本节首页null变量个数决定Excel要使用多少列放置随机数据;随机数个数将决定Excel在工作表中使用多少行。
④此处只有一个变量“品牌得分”,所以在“变量个数”中输入“1”。要生成1000个随机数据,因而在“随机数个数”中键入1000。
⑤单击在“分布”选项旁边的下指箭头,选择“离散”分布选项。
⑥用鼠标或键盘在“数值与概率输入区域”中输入概率分布地址C2:D6单元格。
⑦单击“输出区域”选项,输入“A1”,它表明输出结果的起点。
⑧单击“确定”按钮,对话框消失,Excel会产生1000个不同的随机数据,并把它们放在A列中(A1:A1000)。上一页下一页返回本节首页null 3.建造频数分布
以4、3、2、1和0为随机变量,计算频数、频率、均值和方差,并且与概率分布进行比较。
将A1:A1000区域中的数据分成三类样本。第一个样本为A1:A10区域中的10个数据;第二个样本为A1:A100中区域中的100个数据;第三个样本为A1:A1000区域中的1000个随机数据。
(1)构建第一个样本的频数分布
上一页下一页返回本节首页①在单元格G1,H1和I1中分别输入“n=10”、“n=100”
和“n=1000”。①在单元格G1,H1和I1中分别输入“n=10”、“n=100”
和“n=1000”。 ②选择单元格G2,打开Excel的“插入”菜单,选择
“函数”选项,Excel会弹出“粘贴函数”对话框 。
上一页下一页返回本节首页null③在“函数分类”列表中选择“统计”,在“函数名”列表中选择条件计数函数(COUNTIF),单击“确定”按钮,打开COUNTIF函数对话框。
④在计数范围(Range)内输入“$A$1:$A$10”,采用绝对引用,便于向下复制。
⑤在计数条件(Criteria)输入单元格“$C2”,表明计数条件是随机变量为4,注意这里是列绝对引用,行相对引用。
⑥按“确定”按钮,然后确认单元格G2中的值是A1:A10区域中4的次数。
上一页下一页返回本节首页null⑦将单元格G2的内容复制到单元格G3:G6中,选择单元格G6确认其公式是“=COUNTIF($A$1:$A$10,$C6)”。
⑧在单元格G7中双击自动求和按钮计算G2:G6区域中数值之和,其和是10。
(2)构建第二个样本和第三个样本的频数分布
单元格H2:H6中的公式与单元格G2:G6中的公式相同,只是将单元格“$A$1:$A$10”变成单元格“$A$1:$A$100”。
上一页下一页返回本节首页null①将单元格G2中的公式复制到H2中。
②选择单元格H2,把公式中的“$A$1:$A$10”改成“$A$1:$A$100”。
③将单元格H2的内容复制到H3:H6中。
④在H7中单击自动求和按钮对H2:H6中的值的求和,如果操作正确,结果是100。
⑤将单元格G2中的公式复制到I2中,把公式中的“$A$1:$A$10”改成“$A$1:$A$1000”。
⑥将把单元格I2的内容复制到I3:I6中。
⑦在I7中双击自动求和按钮对I2:I6中的值的求和,如果操作正确,结果是1000。
上一页下一页返回本节首页null4. 构建频率分布
为了把这些频数分布同概率分布相比较,需要先
把这些频数转换成频率,方法如下:
①把单元格C1:C10中的内容复制到C13:C22。
②把单元格G1:I1的内容复制到D13:F13中,作为频率表的横行标题。
③在G13单元格中输入“概率”。
④把单元格D2:D6的内容复制到G14:G18。上一页下一页返回本节首页null接着要在单元格D14:F18中创建公式,以计算每个样本中各个随机变量所出现的频率。它的计算方法是用每一个样本的随机变量发生次数除以其次数总和。
可以采用列相对引用,行绝对引用的方法来计
算,方法如下:
①选择单元格D14,输入“=G2/G$7”,公式中
的G7采用列相对引用,行绝对引用格式。
②按回车键,D14单元格中显示的是第一个样
本中出现随机变量“4”的相对次数,即频率。
③将D14中的公式复制到D15:F18区域中。上一页下一页返回本节首页null单元格D14:F18中所显示的是0到4之间的随机变
量在各个样本中所出现的相对次数,每列中的
五个相对次数之和为1.0。
最后计算每一个样本的均值和方差。方法如下:
①在单元格D21中输入公式“=AVERAGE(A1:A10)计算第一个样本的均值;在单元格E21中输入公式“=AVERAGE(A1:A100)”计算第二个样本的均值;在单元格F21输入公式“=AVERAGE(A1:A1000)”中计算第三个样本的均值。上一页下一页返回本节首页null②在单元格D22,E22,F22中,分别输入公式“=VAR(A1:A10)”,“=VAR(A1:A100)”和“=VAR(A1:A1000)”以计算三个样本的方差。
③最后,在单元格E12中输入“频率分布”。
④选择单元格E12:F12,单击工具栏中的“跨列居中”按钮。
概率分布与频率分布的计算结果如下图所示。
上一页下一页返回本节首页null从以上计算与分析可以看出,当随机样本单位个数增加时,样本的频率分布便会越接近于概率分布;同样,其均值和方差也更接近于概率分布的均值和方差。在上面的例中,当样本单位为1000时,它均值和方差将非常接近概率均值和方差,它的频率分布也更加接近于概率分布。上一页下一页返回本节首页4.2 二项分布4.2 二项分布4.2.1 二项分布的基本内容
4.2.2 二项分布函数及其应用
上一页下一页返回本章首页4.2.1 二项分布的基本内容4.2.1 二项分布的基本内容二项分布用于计算在n次相同条件的试验中,出现k次“成功”(或“失败”)的概率P(x=k),其计算公式是:
P(x=k)=C P (1-P) (k=0,1,2,…,n)
将x值和相应的概率P(x=k)依序排列,即是二项分布数列。
依x值由小到大排列,并将相应的P(x=k)值依序累计,即得累计二项概率分布。上一页下一页返回本节首页null
根据累计概率分布,可以计算在n次试验中,出现“成功”的试验结果的次数大于和等于a次且小于等于b次的概率。
二项分布的均值及
标准
excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载
差的计算公式为:
均值: μ=np
标准差: σ=
上一页下一页返回本节首页4.2.2 二项分布函数
及其应用4.2.2 二项分布函数
及其应用 在 Excel中,常用的二项分布函数有三个,即:
二项分布函数 BINOMDIST,用于计算二项分布的概率值;
CRITBINOM函数,用于计算大于等于临界值的累积二项分布最小值;
NEGBINOMDIST负二项分布函数,用于返回负二项分布的概率。上一页下一页返回本节首页null 例 假定某一足球队员在12码线罚球的命中率为75%(即P=0.75)求罚球4次命中2次的概率。
操作步骤如下:
①打开Excel的“插入”菜单,选择“函数”选
项,打开“粘贴函数”对话框。
②在“函数分类”列表中选择“统计”,在“函
数名”列表中选择二项分布函数BINOMDIST。
单击“确定”按钮,打开二项分布函数对话框
如下图所示。
上一页下一页返回本节首页null③根据题意得知,成功次数为2,试验次数为4,成功概率为0.75,使用概率分布函数(False),将这些已知资料填入对话框中,单击“确定”按钮,得知罚球4次命中2次的概率为 0.21。
上一页下一页返回本节首页null例 同上题,问至多命中2次的概率。
①与上面的计算相同,只是采用累积分布函数,输入各选项资料如下图所示。
②单击“确定”按钮,得知至多命中2次的概率为 0.2617。 上一页下一页返回本节首页4.3 正态分布4.3 正态分布4.3.1 正态分布的基本内容
4.3.2 正态分布函数
4.3.3 用Excel绘制正态分布密度函数图
4.3.4 正态分布与二项分布的渐近关系
上一页下一页返回本章首页4.3.1 正态分布的基本内容4.3.1 正态分布的基本内容正态分布是统计推断中最重要的一种连续型分布,如果随机变量x的概率密度函数是:
则称x服从正态分布,记作x~N(μ,σ2),其中μ为随机变量x的均值,σ为随机变量x的标准差,它们是正态分布的两个参数。上一页下一页返回本节首页null当已知μ和σ后,将不同的x值代入,即可求出对应于的概率密度f(x)。以x为横轴,以f(x)为纵轴,依次在座标系上绘出和f(x)所构成的座标点,可见f(x)是一条对称的钟型曲线,它称为正态概率密度曲线。
正态概率分布有以下重要特征:
正态分布是个对称分布,对称轴是x=μ。
当x=μ时,正态概率密度的最大。
正态分布的图型由μ和σ决定。
当σ为定值时,μ的变化引起正态概率密度曲线在横轴平行移动。
当μ为定值时,σ的变化将引起正态概率密度曲线的形状变得尖峭或偏平。
上一页下一页返回本节首页null不同现象的正态随机变量有不同的μ和σ,它们的计量单位也不同,因此就有各种不同的正
态分布。可用 将各种不同的正态分布,
转变为计量单位相同且μ=0和σ=1的标准正态分布。
正态分布与二项分布的主要区别是正态分布是连续的而二项分布是离散的。象所有连续随机变量一样,正态随机变量任意一个确定值的概率为0,非0概率只有在确定区间内才能得到。
上一页下一页返回本节首页4.3.2 正态分布函数 4.3.2 正态分布函数 1.正态分布函数NORMDIST
正态分布函数NORMDIST用于计算给定均值和标准差的正态分布的累积函数。其语法结构为:NORMDIST(x,mean,standard_dev,cumulative)。
其中:X为需要计算其分布的数值;Mean为分布的均值;Standard_dev 为分布的标准差;Cumulative 为一逻辑值,指明函数的形式。
如果 cumulative 为 TRUE,函数 NORMDIST 返回累积分布函数;如果为 FALSE,返回概率密度函数。上一页下一页返回本节首页null 2.标准正态分布函数 NORMSDIST
标准正态分布函数 NORMSDIST用于计算标准正态分布的累积函数,该分布的均值为 0,标准偏差为 1。其语法结构为:NORMSDIST(z)。
其中:Z为需要计算其分布的数值。
3.正态分布函数的反函数NORMINV
正态分布函数的反函数NORMINV能够根据已
知概率等参数确定正态分布随机变量值。
其语法结构为:
NORMINV(probability,mean,standard_dev)上一页下一页返回本节首页null其中:Probability为正态分布的概率值;Mean为正态分布的均值;Standard_dev为正态分布的标准差。
4.标准正态分布函数的反函数NORMSINV
标准正态分布函数的反函数NORMSINV能够根据概率确定标准正态分布随机变量的取值。
其语法结构为:NORMSINV(probability)
其中:Probability为正态分布的概率值。
上一页下一页返回本节首页4.3.3 用Excel绘制正态分布
密度函数图4.3.3 用Excel绘制正态分布
密度函数图1.计算一般正态分布概率密度
了解如何使用Excel绘制正态分布之前,需要检查一下正态分布密度函数的图形,以及均值μ和标准差σ在分布中的作用。
有两个正态分布密度函数的图
一个是均值为“0”,标准差为1的标准正态分布
一个是均值与标准差可以变化的一般正态分布
上一页下一页返回本节首页null①打开“第4章 概率与概率分布.xls”工作簿,选择“密度函数”工作。上一页下一页返回本节首页null②选择B2单元格,打开Excel “插入”菜单,单击“函数”选项,Excel弹出“粘贴函数”对话框。
③在“函数分类”列表中选择“统计”,在“函数名”列表中选择正态分布函数“NORMDIST”,单击“确定”按钮,打开正态分布函数的对话框。
上一页下一页返回本节首页null④在X中输入A2单元格。
⑤在Mean中按绝对地址输入E1单元格,以便复制公式时能使其保持不变。
⑥在Standard_dev中按绝对地址输入E2单元格,以使公式不变。
⑦在Cumulative中输入“false”,说明函数只提供概率密度;如果输入“true”,函数所提供的便是累积概率了。
⑧单击“确定”按钮,在B2单元格出现的值是1.49E-0.6,也可写作0.00000149。
上一页下一页返回本节首页null2.计算标准正态分布概率密度
①打开“第4章 概率与概率分布.xls”工作簿,选择“密度函数”工作表。
②选定C2单元格,打开Excel “插入”菜单,单击“函数”选项,Excel 弹出“粘贴函数”对话框。
③在“函数分类”列表中选择“统计”,在“函数名”列表中选择正态分布函数“NORMDIST”,单击“确定”按钮,打开正态分布函数的对话框。
上一页下一页返回本节首页null④在X中输入A2单元格
⑤在Mean中输入“0”。
⑥在Standard_dev中输入“1”。
⑦在Cumulative中输入“false”。
⑧选择单元格B2:C2,将其公式复制到B3:C102区域中。这样便得到了标准正态分布的概率值。
上一页下一页返回本节首页null3.绘制图表
①打开Excel “插入”菜单中的“图表”选项,Excel则弹出“图表向导”对话框。
②在步骤1中,在“图表类型”列表中选择XY散点图,在“子图表类型”列表选择“平滑线散点图”,然后单击“下一步”按钮。
③在步骤2中,在数据区域中输入“A1:C102”,便会看到一个图形预览,如果觉得满意,可以单击“下一步”按钮。
上一页下一页返回本节首页null④由于不想加任何标题,在步骤3中便可单击“完成”按钮,得到下图:
上一页下一页返回本节首页null屏幕上的图形是一般正态分布与标准正态分布的图形重叠。
正态分布密度曲线表明:中心两边沿X轴宽度相同对称,表示随机变量的两个相同大小的区间,中间数值所出现的概率比两边的大,密度曲线离均值愈远,出现的可能性越小,反之,离均值越近,出现的可能性越大。
上一页下一页返回本节首页null4.标准差变化对正态分布形态的影响
①选择单元格E2(标准差σ),将标准差值变为1.1,两条密度曲线均清晰出现在屏幕上,从中可以确定哪个是一般正态分布密度曲线, 哪个是标准正态分布密度曲线。
上一页下一页返回本节首页null②从1.1开始,依次每步增加0.1,使E2值最后增到2。
可以看到,均值的变化引起曲线向左向右平移,
不论均值如何变化,峰值总是落在均值上,所
以均值是正态分布值中出现可能最大的值。 上一页下一页返回本节首页4.3.4 正态分布与二项分布的
渐近关系4.3.4 正态分布与二项分布的
渐近关系二项分布与正态分布存在渐近关系。
可以利用Excel图形来比较二项分布的概率函数与正态分布的相似性。
二项分布的参数是n和p(或π)。它们分别表示试验的次数和在一次试验中“成功”的概率。我们可以利用二项分布的均值和标准差公式将其转换成正态分布的均值μ和标准差σ如下:
上一页下一页返回本节首页null1.基础数据
①打开“第4章 概率与概率分布。
②在单元格E1中输入1000,在单元格E2中输入0.2。
③选定单元格E3输入公式“=E1*E2”,计算二项分布均值。
④选定单元格E4,输入公式“=SQRT(E3*(1-E2)”,计算二项分布标准差。
上一页下一页返回本节首页null⑤在单元格A2中输入“0”。
⑥选定单元格A2:A1002区域。
⑦选择“编辑”菜单中的“填充”选项,再选“序列”选项,打开“序列”对话框。
上一页下一页返回本节首页null⑧在“序列产生在”框中选择“列”选项。在“步长值”框中输入1,在“终止值”框中输入1000,单击“确定”按钮,单元格A2:A1002区域中分别显示0、1、2、等。
2.计算二项分布概率
①选择B2单元格,打开Excel “插入”菜单,单击“函数”选项,Excel弹出“粘贴函数”对话框。
②在“函数分类”列表中选择“统计”,在“函数名”列表中选择二项概率密度函数“BINOMDIST”,单击“确定”按钮,打开二项概率密度函数对话框,如下图所示。
上一页下一页返回本节首页null
③在“Numbers”中选择单元格A2,使用相对引用。
④在 “Trials”中选择单元格E1,使用绝对引用。
⑤在“Probability_s”选择单元格E2,使用绝对引用。上一页下一页返回本节首页null⑥在“Cumulative”中输入“FALSE”,这样,Excel便提供一个二项分布随机变量的X值的概率。
⑦单击”确定”按钮。在B2单元格中显示1.23E-97。
⑧将B2单元格中的公式复制到B3:B1002区域中,便得到二项分布的概率。
3.计算正态分布概率
①选定单元格C2,单击工具栏中的“函数”快捷按钮,打开“粘贴函数”对话框。上一页下一页返回本节首页null②在“函数类型”列表中选择“统计”选项,在“函数名”列表中选择正态分布函数NORMDIST(而不是NORMSDIST),打开正态分布函数对话框。
上一页下一页返回本节首页null③在X中输入单元格A2,为相对引用。
④在Mean 中输入单元格E3,按F4为绝对引用。
⑤在Standard_dev中输入单元格E4,按F4为绝对引用。
⑥在Cumulative中输入“TRUE”。单击“确定”按钮。则在单元格C2中显示值为0。
⑦重新选定单元格C2,其公式显示在编辑栏中。将光标放在编辑栏中的函数后面,输入一个减号,然后单击“函数”快捷按钮,打开“粘贴函数”对话框。
上一页下一页返回本节首页null⑧在“函数类型”列表中选择“统计”选项,在“函数名”列表中选择正态分布函数NORMDIST,打开正态分布函数对话框
⑨在X中输入单元格A2-1,为相对引用,注意不是A2。
⑩对话框中的其他内容与前相同,单击“确定”按钮,显示值为0。
单元格C2中的公式为:
=NORMDIST(A2,$E$3,$E$4,TURE)- NORMDIST(A2
-1,$E$3,$E$4,TURE)
最后将单元格C2复制到C3:C1002区域中便得到了正态分布概率值。
上一页下一页返回本节首页null4.绘图比较
①打开Excel “插入”菜单中的“图表”选项,Excel则弹出“图表向导”对话框。
②在步骤1中,在“图表类型”列表中选择折线图,在“子图表类型”列表中选择“数据点折线图”,然后单击“下一步”按钮。
③在步骤2中,于数据区域中输入“A1:C1002”。单击“系列”页面,在预览图形下面的“系列”框中删除X系列,只保留二项分布与正态分布(如下图所示)。Excel默认以自然序号0,1,2等为X轴,单击“下一步”按钮。
上一页下一页返回本节首页null上一页下一页返回本节首页null④在步骤3中,单击“图例”页面,将图便放在底部,如果认为图形满意,可单击“完成”按钮,则可得二项分布的折线图和正态折线图。
⑤经过修饰,得到下图。
上一页下一页返回本节首页Thank you very much!Thank you very much!上一页退出返回本章首页