附录1 统计学、矩阵代数知识简介

附录1 统计学、矩阵代数知识简介附录2 统计学、矩阵代数知识简介求和算子定义：对于T个观测值，x1, x2, …, xT，求和可以简化地表示为其中称作求和算子。求和算子的运算规则如下： (1) 变量观测值倍数的和等于变量观测值和的倍数。 (2) 两个变量观测值和的总和等于它们分别求总和后再求和。 (3) T个常数求和等于该常数的T倍。其中k是常数。利用求和算子定义，样本平均数可表示为 (4) 变量观测值对于其平均数的离差和等于零。利用规则(2)，(3)和样本平均数定义即可推导出上述结果。 (5) 随机变量的方差等...

附录2 统计学、矩阵代数知识简介求和算子定义：对于T个观测值，x1, x2, …, xT，求和可以简化地表示为其中称作求和算子。求和算子的运算规则如下： (1) 变量观测值倍数的和等于变量观测值和的倍数。 (2) 两个变量观测值和的总和等于它们分别求总和后再求和。 (3) T个常数求和等于该常数的T倍。其中k是常数。利用求和算子定义，样本平均数可表示为 (4) 变量观测值对于其平均数的离差和等于零。利用规则(2)，(3)和样本平均数定义即可推导出上述结果。 (5) 随机变量的方差等于其平方的均值减去其均值的平方证明： (6) 两个随机变量的协方差等于它们乘积的均值减去它们均值的乘积。与规则(5)的证明类似，即可证明上述结果。定义双重求和为 (7) 两个变量和的双重求和等于它们各自双重求和的和。 (8) 两个不同单下标变量积的双重求和等于它们各自求和的乘积。 2.2.1 随机变量的数学期望随机变量定义：按一定的概率取不同实数值的变量称为随机变量，用x, y等表示。若随机变量x可能取的值为有限个或可列个，则称x为离散型随机变量。离散型随机变量的一切可能取值及其取值的相应概率称作离散型随机变量的概率分布。若随机变量x可能取的值是整个数轴，或数轴上的某个区间，则称x为连续型随机变量。连续型随机变量的概率分布是通过随机变量在一切可能区域内取值的概率定义的。最常用和最简便的形式是通过概率密度函数表示。对于随机变量x，若存在非负可积函数f (x)，（- < x < ），使对任意实数a, b, (a < b)有则称x为连续型随机变量。f (x)为x的概率密度函数（简称概率密度或密度）。由上式知f (x)在[a, b]区间上的积分等于随机变量x在[a, b]区间取值的概率。对于离散型随机变量x，若有概率分布 P{x = xi} = p, (i = 1, 2, …, )，则称为x的数学期望，简称为期望或均值。记作E(x)。对于连续型随机变量x，若密度函数为f (x)，则称为x的数学期望。记作E(x)。期望属于位置特征。用来描述随机变量取值的集中位置。体现了随机变量取值的平均大小。期望就是随机变量取一切可能值的加权平均。其中的权数就是概率值。数学期望的性质如下： (1) 常量的期望就是这个常量本身。 E(k) = k (2) 常量与随机变量和的期望等于这个随机变量的期望与这个常量的和。 E(x + k) = E(x) + k (3) 常量与随机变量乘积的期望等于这个常量与随机变量期望的乘积。 E(k x) = k E(x) (4) 随机变量的线性函数的期望等于这个随机变量期望的同一线性函数。 E(k x + k) = k E(x) + k (5) 两个随机变量和（或差）的期望等于这两个随机变量期望的和（或差）。 E(x ± y) = E(x) ± E(y) (6) 两个相互独立随机变量乘积的期望等于这两个随机变量期望的乘积。 E(x y) = E(x) E(y) 2.2.2 随机变量的方差、标准差随机变量x对其均值的离差平方的数学期望， E[x - E(x) ]2 称作随机变量x的方差。记作Var(x)。则称作x的标准差。方差和标准差用来描述随机变量的离散特征。它们反映了随机变量取值离散程度的大小。对于离散型随机变量x，方差的定义是其中pi表示x取xi值时的概率。对于连续型随机变量x，方差的定义是其中f (x) 是x的概率密度函数。注意：（1）Var(x)的量纲是x的量纲的平方。（2）的量纲与x的量纲相同。随机变量方差的性质： (1) 常量的方差为零。 Var(k) = 0 (2) 随机变量与常量之和的方差等于这个随机变量的方差。 Var(x + k) = Var(x) 其中x为随机变量，k为常量。 (3) 常量与随机变量乘积的方差等于这个常量的平方与随机变量方差的乘积。 Var(k x) = k2 Var(x)（其中K为常量）证明 (4) 两个相互独立随机变量之和（或差）的方差等于这两个随机变量方差的和。 Var (x ± y) = Var (x) + Var (y) 下面证明随机变量之差情形。 (5) 随机变量的方差等于这个随机变量平方的期望减其期望的平方（证明）。 Var (x) = E(x2) – [E(x)]2 2.2.3 随机变量的协方差协方差定义：随机变量x, y分别对其均值的离差乘积的数学期望 E [x - E(x) ][y - E(y)] 称作随机变量x, y的协方差，记作Cov(x, y)。其中E(x), E(x)分别表示x, y的期望。协方差用来描述两个随机变量关系的紧密程度。对于离散型随机变量x, y，协方差定义为其中p(xi, yj ) = P(x = xi, y = yj ) 表示x = xi, y = yj 条件下的概率。上式是协偏差[ xi - E(x) ][yj - E(y)]的加权平均。对于连续型随机变量x, y，协方差定义为其中p(x, y )是x, y的概率密度函数。当x, y相互独立时，Cov(x, y) = 0。协方差的大小与x, y的量纲有关。一般来说，改变x, y的量纲，则x, y协方差的值也要改变。因此协方差所提供的主要信息是正值、负值还是零。 2.3.1 正态分布与标准正态分布正态分布定义：若连续型随机变量x的概率密度函数为其中, 为常量， > 0，则称x服从正态分布。记作x N(, 2 )。, 分别是x的数学期望和标准差。可以证明三种不同参数的正态分布曲线见图1。概率密度函数f (x)呈钟形。最大值点在x = 处。曲线以x = 对称。在x = 处密度函数曲线有拐点。当x 时，f (x) 以x轴为渐近线。当较大时，f (x) 曲线较平缓；当较小时，f (x) 曲线较陡峭。已知和的值，就可以完全确定正态分布密度函数。标准正态分布定义：对于正态分布密度函数f (x)，当 = 0， = 1时，即称连续型随机变量x服从标准正态分布。记作x N(0, 1 )。对于标准正态分布E(x) = 0，Var 。标准正态分布曲线见图2。标准正态分布密度函数f0 (x)有如下性质：（1） f0 (x) 以纵轴对称；（2）x = 0 时，f0 (x) 的极大值是（3）f0 (x) 在x = 1处有两个拐点；（4）。图2 标准正态分布曲线正态分布随机变量的标准化。若x N(, 2 )，a, b为任意实数，且a < b，则设u = (x -) / ，则（参见微积分中换元积分法）显然u是一个服从标准正态分布的随机变量。当x N(, 2 )时，令u = (x -) / ，则可见对一般正态分布随机变量x做变换u = (x -) / ，则可以把x转化为服从标准正态分布的随机变量u。 2.3.2 t分布 t分布是连续型的概率分布，并具有一个参数n。n称作自由度。n可以取所有正整数，构成一个t分布族。服从自由度为n的t分布的随机变量用t(n) 表示。t(n) 的取值范围是（- , ）。 t分布密度曲线见图3。t分布以纵轴对称，也呈钟形。当n为有限值时，t分布的峰值小于正态分布的峰值，而尾部要比正态分布的厚，即t分布呈低峰厚尾特征。当t ，t分布趋近于标准正态分布。实际中，当n > 30，t分布就很近似于标准正态分布。图3 自由度为3的t分布曲线 t分布的均值和方差分别为 E(t(n) ) = 0 Var(t(n) ) = n / (n -2), n > 2 注意：（1）当n 2时，方差无定义。（2）当n 时，Var(t(n) ) = 1，与标准正态分布的方差相同。t分布的百分位数可以通过t分布表（附录2）查到。 2.3.3 2分布 2（读作“开方”，是希腊字母）分布是连续型的概率分布，并具有一个参数n。n是2分布的自由度。n可以取所有正整数，从而构成一个2分布族。n的不同值对应着2分布族中不同的具体的2分布曲线。服从自由度为n的2分布的随机变量用2 (n) 表示。2 (n) 的取值范围是（0, ）。 2 (2) , 2 (4) , 2 (6) 的分布密度曲线见图4。2分布密度曲线是单峰的，右偏倚的。随着自由度n的加大，偏倚程度变小。当n 增大时，2分布的形状趋近于正态分布。图4 χ2分布密度曲线可以证明（略），2分布的均值和方差分别为 E(2 (n) ) = n Var(2 (n) ) = 2 n, n > 2 由上两式知，当n 增大时，2分布的均值和方差也分别增大。注意：2分布的百分位数可以在2分布表（附表3）中查到。 2.3.4 F分布 F分布是连续型的概率分布，并具有两个参数n1和n2 。n1和n2是F分布的两个自由度。n1称作第1自由度（或分子自由度），n2称作第2自由度（或分母自由度）。n1和n2可以取所有正整数，从而构成一个2分布族。每个（n1, n2）对应着F分布族中一个不同的具体的分布曲线。服从自由度为n1和n2的F分布的随机变量用F(n1, n2) 表示。F(n1, n2) 的取值范围是（0, ）。服从F分布的密度曲线见图5。F分布密度曲线是单峰的，右偏倚的。随着自由度n1和n2的加大，F分布的众数趋近于1。图5 F分布密度曲线 F分布的均值为 E(F(n1, n2)) = n2 / (n2 - 2) , n2 > 2 注意：（1）当n2 2时，均值无定义。（2）当n2变大时，E(F(n1, n2)) 趋近于1。 F分布的方差为注意：（1）当n2 4时，方差无定义。（2）当n1, n2变大时，Var(F(n1, n2)) 趋近于零。因为F分布有两个自由度，所以F分布是以不同的百分位数分别编表的。附表4和5分别给出F分布第95，99百分位数表（相对于 = 0.05 和 = 0.01）。已知F分布第95，99百分位数，可利用下式求其第5，1百分位数。 F (n1, n2) = 1 / (F1- (n2, n1)) 注意：在上式的分母中n1, n2对调了位置。 2.4.1.点估计通常我们知道某个随机变量服从某种特定的概率分布或者愿意假定某个随机变量服从某种特定的概率分布，但是却不知道分布的参数。比如，知道某个随机变量服从正态分布，但不知道参数和2。这时常常需要根据样本对总体的某种特征做出推断。这就是参数估计问题。参数估计可分为两大类。（1）点估计，（2）区间估计。点估计定义：用样本的某一函数估计总体参数就是对总体参数的点估计。用表示总体未知参数。在点估计中，也称为被估计量。常用来表示估计量。是样本（x1, x2, …, xT）的函数，也称作统计量。估计量也是随机变量。当估计量取一具体值时，称其为估计值。 2.4.2 评价估计量优劣的标准 (1) 无偏性：若未知参数的估计量满足 E( ) = 则称估计量是未知参数的无偏估计量。具有无偏性。与的差称作偏差。一次抽样条件下，通常与的偏差不会等于零。无偏性的实际意义是，当反复抽样时的值在周围摆动，且不存在系统偏差。 (2) 有效性：设 1和 2都是的无偏估计量。若对任意的样本容量总有 Var( 1) < Var( 2) 成立，则称 1是比 2更有效的估计量。 1具有有效性。若在的一切无偏估计量中，Var( 1)最小，则称 1为最小方差、无偏估计量。 1具有最小方差性。 (3) 渐近无偏性：若估计量满足则称作渐近无偏估计量，具有渐近无偏性。 (4) 一致性：若一个估计量与其真值的差的绝对值小于任意给定的小的正数的概率随着样本容量的加大趋近于1，即其中P{}表示概率，lim 表示求极限，则称估计量是其真值的一致估计量。具有一致性。根据一致性定义，估计量是否具有一致性的充分条件是（1）具有渐近无偏性， E( ) = ；（2）的渐近方差为零， Var ( ) = 0。 (5) 渐近有效性：在具有一致性的估计量中，具有较小渐近方差的估计量具有渐近有效性。渐近无偏性、一致性和渐近有效性属于大样本特性。 2.4.3 总体均值、总体方差和总体协方差的点估计 (1) 总体均值的点估计。通常用样本平均数估计总体均值。用（x1, x2, …, xT）表示一个随机样本，则样本平均数的定义是用表示总体的均值。因为所以具有无偏性。用2表示总体的方差。因为所以具有一致性。 (2) 总体方差的点估计。通常用样本方差作为总体方差的点估计。样本方差s2的定义是其中是样本平均数。因为所以s2是 2的无偏估计量。 (3) 总体协方差的点估计。通常用样本协方差估计总体协方差。样本协方差的定义是 2.4.4 区间估计在得到点估计值的同时，自然希望知道估计值与被估计值究竟相差多少。希望以某种可靠程度对总体参数的真值估计出一个范围。这就是区间估计问题。具体做法是计算由样本确定的两个统计量 1和 2使满足 P{ 1 2} = 1 - 其中[ 1, 2]称作置信区间； 1, 2称作置信限；1 - 称作置信度；是估计不准的概率。通常取 = 0.05, = 0.01。要想利用上式求被估参数的置信区间，必须找到一个含有被估参数的合适的统计量，并知其概率分布。下面以t统计量为例估计一元回归模型yt = 0 + 1 xt + ut中1的置信区间。构造统计量其中是对1的最小二乘估计，s( )是1的样本标准差。所以有t t(T-2)。与P{ 1 2} = 1 - 相仿，得其中t (T-2) 表示临界值。由上式可求出1的置信区间如下：为简单，一致估计量的定义式也可表示为其中plim表示概率极限。概率极限运算规则如下： (1) 若估计量是其真值的一致估计量，f ( )是的任意连续函数，则举例来说，若估计量是其真值的一致估计量，则1/ 是其真值1/ 的一致估计量。log( )也是log( )的一致估计量。注意，这个性质不适用于期望算子。比如有E( ) = ，但是E(1/ ) 1/ E( )。 (2) 常数的概率极限仍是该常数。 (3) 两个一致估计量 1和 2的和的概率极限等于 1和 2的概率极限的和。 (4) 两个一致估计量 1和 2的积的概率极限等于 1和 2的概率极限的积。 (5) 两个一致估计量 1和 2的商的概率极限等于 1和 2的概率极限的商。注意，规则（4）和（5）一般不适用于期望算子。比如E( 1 / 2) E( 1) / E( 2)，E( 1 2) E( 1) E( 2)。但是当具有相互独立的分布时，则E( 1 2) = E( 1) E( 2)。假设检验定义：假设检验是指根据样本信息判断假设是否成立的全过程。假设检验遵循的是反证法思想，即先假定假设成立，然后依据某种准则分析所得结果，若是一个合理结果，则认为假设成立，若是一个不合理结果，则认为假设不成立。这种推理过程依赖于两个条件，（1）选用适当的统计量并知其概率分布；（2）遵从小概率原则。所谓“小概率原则”就是认为概率很小的事件在一次试验中几乎不可能发生。事件发生的概率小到什么程度才被认为是小概率事件呢？通常取此概率为0.05或0.01。假设检验中称此为检验水平（或显著性水平），用表示。1- 称为置信度或置信水平。 “假设”通常用H表示。假设分为两类。一类称作原假设或零假设，用H0表示；一类称作备择假设或对立假设，用H1表示。原假设与备择假设应该是互补的，即非此即彼，二者必取其一。在处理实际问题时，通常把着重考察或便于处理的假设定为原假设。假设检验一般分成五步：（1）建立假设。提出原假设与备择假设。假设检验始终在假定原假设成立条件下进行。（2）选取合适的统计量并知其概率分布。要依据不同的假设选择不同的统计量。（3）确定临界值。根据给定的检验水平和所选定的统计量，查相应的概率分布临界值表，从而确定临界值。（4）制定判别规则。根据临界值确定原假设H0的接受域和拒绝域。（5）利用样本信息做出判断。利用样本计算统计量的值，若该值落入原假设H0的接受域，则接受该原假设；若落入原假设H0的拒绝域，则拒绝该原假设。注意：（1）从接受域和拒绝域的位置看，假设检验可分为双端（双侧）检验和单端（单侧）检验。单端检验又可分为左单端检验和右单端检验。（2）计量经济分析中常用的有t检验、F检验和2检验等。（3）既然假设检验是依靠样本作判断，用部分推断全体，并遵循小概率原则，所以做出的结论就不可能绝对正确。就不可能有100%的把握。有时是有可能犯错误的。所犯错误分成两类。一类是弃真错误（或称第一类错误），即原假设本来是真实的，而检验结果却拒绝了原假设。 P{弃真错误} = P{拒绝H0 H0真实} = 一类是取伪错误（或称第二类错误），即原假设本来是不真实的，而检验结果却接受了原假设。 P{取伪错误} = P{接受H0 H0不真实} 图 2-6 两类错误在样本容量一定条件下，不可能同时减小犯弃真错误和取伪错误的概率。通常的做法是先固定犯弃真错误的概率，然后用扩大样本容量的方法减小犯取伪错误的概率。下面以F统计量为例对一元回归模型yt = 0 + 1 xt + ut中1是否为零进行假设检验。建立零假设和备择假设，H0：1 = 0；H1：1 0 临界值为F (1, T-2)。因为这里F检验为右单端检验，所以判别规则是若用样本计算的统计量 F F (1, T-2)，则接受H0；F > F (1, T-2)，则拒绝H0 2.7.1 矩阵概念矩阵：由mn个元素排列起来的长方形阵列称为矩阵。记作 aij是第i行和第j列的元素，其中i = 1, 2, …, m；j = 1, 2, …, n。A表示的是mn阶矩阵。它包括m行n列，共有mn个元素。方阵：若矩阵的行数等于其列数，即m = n, 则称此矩阵为方阵。当A为方阵时，i = j的元素，即a11, a22, …, ann，称作主对角线元素。当m = n = 1时，A减化为一个标量。行向量：仅有一行的矩阵称作行向量。列向量：仅有一列的矩阵称作列向量。单位矩阵：一个方阵，若其主对角线元素都为1，其余元素都为零，则称此矩阵为单位矩阵，记为I。对角矩阵：若n阶方阵中的元素满足条件当i j时，aij = 0，（i, j = 1, 2, …, n），则称为对角矩阵。由此可知，单位矩阵是对角矩阵的一个特例。零矩阵：元素全为零的矩阵称作零矩阵，记为0。对称矩阵：若n阶方阵A中的元素满足条件aij = aji，(i j，i, j = 1, 2, …, n), 则称A为n阶对称矩阵。 2.7.2 矩阵运算矩阵相等：如果两个矩阵A = (aij)mn和B = (bij)mn同阶且所有对应元素相等，即aij = bij，(i = 1, 2, …, m；j = 1, 2, …, n), 则称矩阵A与B相等，记为A = B。矩阵加法与减法：两个同阶矩阵A = (aij)mn和B = (bij)mn对应元素相加（减）得到的矩阵称作A与B的和（差）。记为A + B（或A - B）。矩阵加法的性质：若A、B、C、0都是mn阶矩阵，则 (1) A + B = B + A （交换律） (2) A +（B + C）=（A + B）+ C （结合律） (3) A - A = 0 或A + 0 = A 标量与矩阵相乘：标量k与矩阵A相乘是k与A的所有元素相乘，记为k A，即 k A = k (aij)mn = (kaij)mn 标量与矩阵相乘的性质（k, l是自然数）： (1) k A = A k (2) k (A + B) = k A + k B (3) k l A = k (l A) (4) (-1) A = - A 矩阵的乘法：设矩阵A = (aij)mr，B = (bij)rn，则规定A和B的乘积是 A B = C = (cij)mn，其中即两个矩阵的乘法要求左边矩阵的列数等于右边矩阵的行数，积的元素是由左边矩阵的行元素乘以右边矩阵的相应列元素，并将所有积相加得到。

                    本文档为【附录1  统计学、矩阵代数知识简介】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

附录1 统计学、矩阵代数知识简介

你可能还喜欢