首页 R语言实验6

R语言实验6

举报
开通vip

R语言实验6实验6参数估计一、实验目的:1.掌握矩法估计与极大似然估计的求法;2.学会利用R软件完成一个和两个正态总体的区间估计;3.学会利用R软件完成非正态总体的区间估计;4.学会利用R软件进行单侧置信区间估计。二、实验内容:练习:要求:①完成练习并粘贴运行截图到文档相应位置(截图方法见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。④修改本文档名为“本人完整学号姓名1”,其中1表示第1次实验,以后更改为2,3,...。如文件名为“09张立1”,表示学号为09的张立同学...

R语言实验6
实验6参数估计一、实验目的:1.掌握矩法估计与极大似然估计的求法;2.学会利用R软件完成一个和两个正态总体的区间估计;3.学会利用R软件完成非正态总体的区间估计;4.学会利用R软件进行单侧置信区间估计。二、实验内容:练习:要求:①完成练习并粘贴运行截图到文档相应位置(截图 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 见下),并将所有自己输入文字的字体颜色设为红色(包括后面的思考及小结),②回答思考题,③简要书写实验小结。④修改本文档名为“本人完整学号姓名1”,其中1 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示第1次实验,以后更改为2,3,...。如文件名为“09张立1”,表示学号为09的张立同学的第1次实验,注意文件名中没有空格及任何其它字符。最后连同数据文件、源程序文件等(如果有的话,本次实验没有),一起压缩打包发给课代表,压缩包的文件名同上。截图方法:法1:调整需要截图的窗口至合适的大小,并使该窗口为当前激活窗口(即该窗口在屏幕最前方),按住键盘Alt键(空格键两侧各有一个)不放,再按键盘右上角的截图键(通常印有“印屏幕”或“PrScrn”等字符),即完成截图。再粘贴到word文档的相应位置即可。法2:利用QQ输入法的截屏工具。点击QQ输入法工具条最右边的“扳手”图标,选择其中的“截屏”工具。)1.自行完成教材P163页开始的节中的例题。2.(习题)设总体的分布密度函数为(1)x0x1,f(x;)0其他,X,X,…,X为其样本,求参数的矩估计量ˆ和极大似然估计量ˆ。现测得12n12样本观测值为,,,,,求参数的估计值。解:先求参数的矩估计量ˆ。由于只有一个参数,因此只需要考虑E(X)=X。1而由E(X)的定义有:111E(X)=xf(x)dxx(1)xdxx2|12020111因此X,解得ˆ2。211X以下请根据上式完成R程序,计算出参数的矩估计量ˆ的值。1源代码及运行结果:(复制到此处,不需要截图)x<-c,,,,,>(2*mean(x)-1)/(1-mean(x))[1]下面再求参数的极大似然估计量ˆ。只需要考虑x(0,1)部分。依题意,2nn此分布的似然函数为L(;x)=f(x;)(1)n(x)iii1i1n相应的对数似然函数为lnL(;x)=nln(+1)+lnxii1lnL(;x)nn令lnx=01ii1nn解此似然方程得到1,或写为1。nnlnxlnxiii1i12lnL容易验证0,从而使得L达到极大,即参数的极大似然估计量2nunˆ1。2nlnXii1以下请根据上式完成R程序,计算出参数的极大似然估计量ˆ的值。2源代码及运行结果:(复制到此处,不需要截图)>f<-function(a)6/(a+1)+sum(log(x))>uniroot(f,c(0,1))$root[1]$[1]$iter[1]5$[1]NA2$[1]3.(习题)设元件无故障工作时间X具有指数分布,取1000个元件工作时间的记录数据,经分组后得到它的频数分布为组中5123456值x555555i频数3211742v65455000055i如果各组中数据都取为组中值,试用极大似然函数估计求的点估计。提示:n①根据教材P168例知,指数分布中参数的极大似然估计是n/X。ii1②利用rep()函数。解:源代码及运行结果:(复制到此处,不需要截图)x<-c(rep(5,365),rep(15,245),rep(25,150),rep(35,100),rep(45,70),rep(55,45),rep(65,25))>1000/sum(x)[1]4.(习题)为检验某自来水消毒设备的效果,现从消毒后的水中随机抽取50升,化验每升水中大肠杆菌的个数(假设一升水中大肠杆菌个数服从Poisson分布),其化验结果如下:大肠杆菌0123456数/升水的升数1212100700试问平均每升水中大肠杆菌个数为多少时,才能使上述情况的概率为最大解:此题实际就是求泊松分布中参数的极大似然估计。ke泊松分布的分布律为P{X=k}=,k=0,1,2,…,>0k!设x,x,…,x为其样本X,X,…,X的一组观测值。12n12n于是此分布的似然函数为L(;x)=L(;x,…,1nxxiniei1x)=ennx!x!x!i1i1nnn相应的对数似然函数为lnL(;x)=-n+xln-ln(x!)iii1i13lnL(;x)1n令nx=0ii1解此似然方程得到x2lnL容易验证0,从而使得L达到极大,即参数的极大似然估计量2ˆX。以下请据此完成R程序,计算出参数的极大似然估计量ˆ的值。同上题,也需要利用rep()函数。源代码及运行结果:(复制到此处,不需要截图)x<-c(rep(0,17),rep(1,20),rep(2,10),rep(3,2),rep(4,1),rep(5,0),rep(6,0))>mean(x)[1]15.(习题)利用R软件中的nlm()函数求解无约束优化问题minf(x)=(-13+x+((5-x)x-2)x)2+(-29+x+((x+1)x-14)x)2,12221222取初始点x(0)=,-2)T。提示:参考教材P173 公式 小学单位换算公式大全免费下载公式下载行测公式大全下载excel公式下载逻辑回归公式下载 ()对应的例题。解:源代码及运行结果:(复制到此处,不需要截图)obj<-function(x){f<-c(-13+x[1]+((5-x[2])*x[2]-2)*x[2],-29+x[1]+((x[2]+1)*x[2]-14)*x[2])sum(f^2)}>source("")>x0<-c,-2)>nlm(obj,x0)$minimum[1]$estimate[1]$gradient[1]$code[1]1$iterations[1]16结论:$minimum是函数的最目标值,即f*=,$estimate是最优点的估计值,即x*=(,T;$gradient是在最优点处(估计值)目标函数梯度值,即f*,T;$code是指标,这里是1,表示迭代成功;$iterations4是迭代次数,这里是16,表示迭代了16次迭代。6.(习题)正常人的脉搏平均每分钟72次,某医生测得10例四乙基铅中毒患者的脉搏数(次/min)如下:54676878706667706569已知人的脉搏次数服从正态分布,试计算这10名患者平均脉搏次数的点估计和95%的区间估计。并作单侧区间估计,试分析这10患者的平均脉搏次数是否低于正常人的平均脉搏次数。提示:此题是一个正态总体的估计问题,且由于总体方差未知,因此可以直接使用R语言中()函数进行分析。解:源代码及运行结果:(复制到此处,不需要截图)x<-c(54,67,68,78,70,66,67,70,65,69)>(x)#()做单样本正态分布区间估计OneSamplet-testdata:xt=,df=9,p-value=alternativehypothesis:truemeanisnotequalto095percentconfidenceinterval:sampleestimates:meanofx>(x,alternative="less",mu=72)#()做单样本正态分布单侧间估计OneSamplet-testdata:xt=,df=9,p-value=alternativehypothesis:truemeanislessthan7295percentconfidenceinterval:-Infsampleestimates:meanofx结论:双侧区间估计:平均脉搏点估计为,95%区间估计为;单侧区间估计:p=<,拒绝原假设,平均脉搏低于正常人。7.(习题)甲、乙两种稻种分别播种在10块试验田中,每块试验田甲、乙稻种各种一半。假设两稻种产量X,Y均服从正态分布,且方差相等。收获后10块试验田的产量如下所示(单位:千克)。5甲1111111111种40373640454840354441乙1111111111种35181540283130153125求出两稻种产量的期望差-的置信区间(=)。12提示:此题是两个正态总体的区间估计问题,且由于两总体方差未知,因此可以直接使用R语言中()函数进行分析。()可做两正态样本均值差的估计。注意此例中两样本方差相等。参考教材P185倒数第四行开始至P186。解:源代码及运行结果:(复制到此处,不需要截图)>x<-c(140,137,136,140,145,148,140,135,144,141)>y<-c(135,118,115,140,128,131,130,115,131,125)>(x,y,=TRUE)TwoSamplet-testdata:xandyt=,df=18,p-value=alternativehypothesis:truedifferenceinmeansisnotequalto095percentconfidenceinterval:sampleestimates:meanofxmeanofy结论:期望差的95%置信区间为8.(习题)甲、乙两组生产同种导线,现从甲组生产的导线中随机抽取4根,从乙组生产的导线中随机抽取5根,它们的电阻值(单位:)分别为甲组已组假设两组电阻值分别服从正态分布N(,2)和N(,2),2未知。试求11-的置信区间系数为的区间估计。12提示:此题是两个正态总体的估计问题,且由于两总体方差未知,因此可以直接使用R语言中()函数进行分析。()可做两正态样本均值差的估计。注意此例中两样本方差相等。参考教材P185倒数第四行开始至P186。解:源代码及运行结果:(复制到此处,不需要截图)>x<-c,,,>y<-c,,,,>(x,y,=TRUE)6TwoSamplet-testdata:xandyt=,df=7,p-value=alternativehypothesis:truedifferenceinmeansisnotequalto095percentconfidenceinterval:sampleestimates:meanofxmeanofy结论:期望差的95%区间估计为9.(习题)对习题中甲乙两种稻种的数据作方差比的区间估计,并用其估计值来判定两数据是否等方差。若两数据方差不相等,试重新计算两稻种产量的期望差-的置信区间(=)。12提示:在R软件中,()函数能够提供两个样本方差比的区间估计。参考教材P189倒数第6行开始的内容。此结果可认为方差不等。因此重新计算期望差时应该采取方差不等的参数。解:源代码及运行结果:(复制到此处,不需要截图)>x<-c(140,137,136,140,145,148,140,135,144,141)>y<-c(135,118,115,140,128,131,130,115,131,125)>(x,y)Ftesttocomparetwovariancesdata:xandyF=,numdf=9,denomdf=9,p-value=alternativehypothesis:trueratioofvariancesisnotequalto195percentconfidenceinterval:0.sampleestimates:ratioofvariances>(x,y,)WelchTwoSamplet-testdata:xandyt=,df=,p-value=alternativehypothesis:truedifferenceinmeansisnotequalto095percentconfidenceinterval:7sampleestimates:meanofxmeanofy结论:期望差的95%置信区间为10.(习题)设电话总机在某段时间内接到的呼唤的次数服从参数未知的Poisson分布P(),现收集了42个数据接到呼唤0123456次数出现的频7118320数02试求出平均呼唤次数的估计值和它的置信系数为的置信区间。此题给出完整答案,供参考。解:从习题已经知道,平均呼唤次数的估计值就是X。此题是非正态总体的区间估计问题。但由中心极限定理可知,此类问题其置信区间与方差2未知时一个正SS态总体的均值的置信区间完全一样,即为[X-Z,X+Z]。参考教材P190n/2n/2公式()及其后的程序。源代码及运行结果:>x<-c(rep(0,7),rep(1,10),rep(2,12),rep(3,8),rep(4,3),rep(5,2))>n<-length(x)>tmp<-sd(x)/sqrt(n)*qnorm2)>mean(x)[1]>mean(x)-tmp;mean(x)+tmp#置信区间的下限和上限[1][1]结论:平均呼唤次数为的置信区间为[,]。11.(习题)已知某种灯泡寿命服从正态分布,在某星期所生产的该灯泡中随机抽取10只,测得其寿命(单位:小时)为1067919119678511269369181156920948求灯泡寿命平均值的置信度为的单侧置信下限。提示:此题是一个正态总体的区间估计问题,且由于总体方差未知,因此可以直接使用R语言中()函数进行分析。根据教材P191定义知,单侧置信下限,()函数中的参数alternative="greater"。参考教材P193-194的例及其后面一段文字。解:源代码及运行结果:(复制到此处,不需要截图)8x<-c(1067,919,1196,785,1126,936,918,1156,920,948)>(x,alternative="greater")OneSamplet-testdata:xt=,df=9,p-value=alternativehypothesis:truemeanisgreaterthan095percentconfidenceinterval:Infsampleestimates:meanofx结论:灯泡平均寿命置信度95%的单侧置信度下限为思考:1.常用的点估计的方法有哪些距法,极大似然法,最小二乘法等。2.估计量的优良性准则有哪些无偏性,有效性和相合性(一致性)3.在R语言中,求矩法估计时,如果令总体的k阶原点矩等于它样本的k阶原点矩得到的k个方程无法求出解析解,此时需要调用教材P103的节作者编写的Newton法程序求此方程组的解。在求极大似然估计时需要求解(对数)似然函数的极大值,如果无法求出其相应似然方程的解析解,若此(对数)似然函数是一维变量,可以用R中的_optimeize()(或optimise())_____函数变相求解此(对数)似然函数的相反数的极小值若此(对数)似然函数是多维变量,可以用R中的__nlm()__函数变相求解min–L(;x)或min–lnL(;x)三、实验小结(必写,但字数不限)这次实验主要学会掌握矩法估计与极大似然估计的求法,会利用R软件完成一个和两个正态总体的区间估计,非正态总体的区间估计和单侧置信区间估计,还要会分析结果,得出结论。懂得什么样的题,用什么样的方法和函数。通过这次实验,已经掌握了一些基本参数估计知识,要多看书本,多加练习。9
本文档为【R语言实验6】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
白学芝
热爱爱问
格式:pdf
大小:494KB
软件:PDF阅读器
页数:9
分类:
上传时间:2023-03-18
浏览量:2