关闭

关闭

封号提示

内容

首页 MATLAB统计功能与SPlus对比.pdf

MATLAB统计功能与SPlus对比.pdf

MATLAB统计功能与SPlus对比.pdf

上传者: 大夫王 2010-10-26 评分 5 0 127 17 578 暂无简介 简介 举报

简介:本文档为《MATLAB统计功能与SPlus对比pdf》,可适用于IT/计算机领域,主题内容包含Matlab统计功能简介兼与SPLUS比较主要内容Matlab统计功能介绍SPLUS对应功能参考资料™statisticstoolbox™Compu符等。

Matlab统计功能简介兼与SPLUS比较主要内容Matlab统计功能介绍SPLUS对应功能参考资料™statisticstoolbox™ComputationalStatisticsHandbookwithMATLAB™SPLUSforWindowsGuidetoStatisticsMatlab统计功能™概率分布™描述性统计™统计作图™假设检验™线性和非线性模型™多变量统计™等等概率分布™MATLAB中函数*pdf,*cdf,*inv(cdf),*rnd™SPLUS中函数d*,p*,q*,r*连续型™Beta(beta*)(*beta)™指数分布(Exponential)(exp*)(*exp)™Gamma(gam*)(*gamma)™对数正态分布(Lognormal)(logn*)(*lnorm)™正态分布(Normal)(norm*)(*norm)™均匀分布(Uniform)(unif*)(*unif)™Weibull(wbl*)(*weibull)函数MATLABSPLUS连续型统计分布™卡方分布(Chisquare)(chi*)(*chisq)™非中心卡方分布(NoncentralChisquare)(ncx*)(pchisq(,,ncp=),ncxcdp(,,))™F(f*)(*f)™NoncentralF(ncf*)(ncfcdf(,,,),pf(,,,ncp=))™t(t*)(*t)™Noncentralt(nct*)离散型™二项分布(Binomial)(bino*)(*binom)™几何分布(Geometric)(geo*)(*geom)™超几何分布(Hypergeometric)(hyge*)(*hyper)™负二项分布(Negativebinomial)(nbin*)(*nbinom)™泊松分布(Poisson)(poiss*)(*pois)计算标准正态分布概率密度函数x=时的值>>normpdf()ans=>dnorm()#SPLUS>>normcdf(,,)ans=(>pnorm(,,)#SPLUS)计算P(<X<),则有>>normcdf(,,)normcdf(,,)ans=>pnorm(,,)pnorm(,,)#SPLUS(),XN设计算()PX>>norminv(,,)ans=>qnorm(,,)#SPLUS描述性统计™均值™中位数™方差™标准差™等应用举例>>loadszdata>>p=sz(:,)>>p=sz(:,)>>mean(p)均值>>var(p)方差>>std(p)标准差>>prctile(p,)分位值>>prctile(p,)应用举例>>skewness(p)偏度>>kurtosis(p)峰度>>min(p)>>max(p)>>range(p)范围>>median(p)中位数SPLUS>szimportData("……sztxt",type="ASCII")>psz,>psz,>stdev(p)标准差>quantile(p,c(,,))分位数作图™盒形图™分布图™散点图™等盒形图(boxplot)>>x=normrnd(,,,)normrnd(,,,)均值标准差x矩阵>>boxplot(x)>xappend(rnorm(,,),rnorm(,,))>boxplot(x)直方图(hist)Matlab>>hist(x)>>hist(x,)>setseed()>xappend(rnorm(,,),rnorm(,,))>hist(x)x散点图Matlab>>y=,,,,,,,,,,,,,,,>>x=:>>plot(x,y,'')>>plot(x,y,‘')SPLUS>y=c(,,,,,,,,,,,,,,,)>x:>plot(x,y,pch=‘’)xy线形图>>plot(x,y)xy>plot(x,y,type=‘l’)分布图卡方分布f分布标准正态分布x=::y=normpdf(x,,)plot(x,y)t分布和标准正态分布>>x=::>>y=tpdf(x,)>>z=normpdf(x)>>plot(x,y,'',x,z,'')SPLUS标准正态分布#标准正态分布x=seq(,,)plot(x,dnorm(x),type='l',xlab='',ylab='',col=,main='标准正态分布')t分布自由度为的t分布自由度为的t分布x=seq(,,)plot(x,dt(x,),type='n',xlab='',ylab='',main='t分布')lines(x,dt(x,),lwd=,col=)lines(x,dt(x,),lty=,lwd=,col=)legend(,,c('自由度为的t分布','自由度为的t分布'),lty=c(,),col=c(,))卡方分布自由度为的卡方分布自由度为的卡方分布x=seq(,,)plot(x,dchisq(x,),xlab='',ylab='',type='n',main='卡方分布')lines(x,dchisq(x,),lwd=,col=)lines(x,dchisq(x,),lty=,lwd=,col=)legend(,,c('自由度为的卡方分布','自由度为的卡方分布'),lty=c(,),lwd=,col=c(,))™x=seq(,,)™plot(x,df(x,,),xlab='',ylab='',type='n',main='f分布')™lines(x,df(x,,),lwd=,col=)™lines(x,df(x,,),lty=,lwd=,col=)™legend(,,c('自由度为(,)的f分布','自由度为(,)的f分布'),lty=c(,),lwd=,col=c(,))f分布自由度为(,)的f分布自由度为(,)的f分布假设检验™零假设(hypothesis)™备择假设(Alternativehypotheses)™置信水平(Significancelevel)™P值(pvalue)™置信区间(Confidenceintervals)假设检验(SPLUS)xc(,,,,,,,,,,,,,,,,,,,)ttest(x,mu=)OnesampletTestdata:xt=,df=,pvalue=alternativehypothesis:meanisnotequaltopercentconfidenceinterval:sampleestimates:meanofx单样本t检验Matlabx=,,,,,,,,,,,,,,,,,,,>>h,pvalue,ci=ttest(x,)h=pvalue=ci=™ttest(x,conflevel=,mu=)#S™OnesampletTest™data:x™t=,df=,pvalue=™alternativehypothesis:meanisnotequalto™percentconfidenceinterval:™™sampleestimates:™meanofx™置信水平>>h,pvalue,ci=ttest(x,,)#Mh=pvalue=ci=显著性水平™>vartest(x,y)™Ftestforvarianceequality™data:xandy™F=,numdf=,denomdf=,pvalue=™alternativehypothesis:ratioofvariancesisnotequalto™percentconfidenceinterval:™™sampleestimates:™varianceofxvarianceofy™检验方差是否相等结果表明方差相等不容拒绝。>xc(,,,,,,,,,,,)>yc(,,,,,,)>ttest(x,y)StandardTwoSampletTestdata:xandyt=,df=,pvalue=alternativehypothesis:differenceinmeansisnotequaltopercentconfidenceinterval:sampleestimates:meanofxmeanofy双样本t检验>>h,pvalue,ci=ttest(x,y)h=pvalue=ci=线性和非线性模型™多元线性回归™非线性回归™逐步回归™广义线性模型™稳健性和非参数方法回归分析.多元线性回归在Matlab统计工具箱中使用命令regress()实现多元线性回归调用格式为b=regress(yx)或bbintrrintstats=regess(yxalpha)其中因变量数据向量y和自变量数据矩阵x按以下排列方式输入kknknxxxxxx=X""###"nyyy=Y#R对一元线性回归取k=即可。alpha为显著性水平(缺省时设定为)输出向量bbint为回归系数估计值和它们的置信区间rrint为残差及其置信区间stats是用于检验回归模型的统计量有三个数值第一个是其中R是相关系数第二个是F统计量值第三个是与统计量F对应的概率P当P<α时拒绝回归模型成立。H【【例例】】一家百货公司在一家百货公司在个地区设有经销分公司。公司认为商品个地区设有经销分公司。公司认为商品销售额与该地区的人口数和年人均收入有关并希望建立它们之销售额与该地区的人口数和年人均收入有关并希望建立它们之间的数量关系式以预测销售额。有关数据如下表。试确定销售间的数量关系式以预测销售额。有关数据如下表。试确定销售额对人口数和年人均收入的线性回归方程并分析回归方程的拟额对人口数和年人均收入的线性回归方程并分析回归方程的拟合程度对线性关系和回归系数进行显著性检验合程度对线性关系和回归系数进行显著性检验((αα=)=)。。年人均收入(元)X人口数(万人)X销售额(万元)Y地区编号销售额、人口数和年人均收入数据()输入数据y=,,,,,,,,,x=,,,,,,,,,x=,,,,,,,,,()保存数据(以数据文件mat形式保存便于以后调用)savedataxxyloaddatamat(取出数据)()执行回归命令x=ones(,)x'x'y=y'b,bint,r,rint,stats=regress(y,x)得结果:b=(,,)‘stats=()即=xx=F=P=yˆRb,stats画出残差及其置信区间用命令rcoplot(r,rint)预测>>z=,,'>>yhat=b'*zyhat=SPLUS命令yc(,,,,,,,,,)xc(,,,,,,,,,)xc(,,,,,,,,,)lmfitlm(y~xx)summary(lmfit)datadataframe(,)dimnames(data)list(,c('x','x'))predict(lmfit,newdata=data,se=T,cifit=T,pifit=T)#预测.非线性回归非线性回归可由命令nlinfit来实现调用格式为beta,r,j=nlinfit(x,y,'model’,beta)其中输人数据xy分别为nm矩阵和n维列向量对一元非线性回归x为n维列向量model是事先用m文件定义的非线性函数beta是回归系数的初值beta是估计出的回归系数r是残差j是Jacobian矩阵它们是估计预测误差需要的数据。预测和预测误差估计用命令y,delta=nlpredci(’model’,x,beta,r,j)【【例例】】以下是奥林匹克男子米获胜者所需时间数据和建议拟合下列模型:其中θθθ最终极限时间第一纪录超过最终极限时间值记录序列向最终极限时间下降的固定比率loadOlympicmYear=Olympic(:,)Time=Olympic(:,)plot(Year,Timeplot(Year,Time,'*'),'*')beta=,,'beta,r,j=nlinfit(Year,Time,'model',beta)>>betabeta=因此得到:()*YearTimee=Time,delta=nlpredci('model',Year,beta,r,j)plot(Year,Time,'k',Year,Time,'r')利用SPLUS中函数nls来进行模型参数的估计source(“……olympicdat")Olympicfit<nls(Time~thetatheta*exp(theta*(Year)),Olympic,start=list(theta=,theta=,theta=))Olympicfit$parametersthetathetatheta()*YearTimee=因此得到:attach(Olympic)plot(Year,Time)lines(Year,predict(Olympicfit))YearTime【【例例】】已知某公司某商品的销售资料试预测该公司已知某公司某商品的销售资料试预测该公司第第期的销售量。期的销售量。数据:数据:y=,,,,,,,,,y=,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,t=:t=:y=y'y=y't=t't=t'beta=,,'beta,r,j=nlinfit(t',y','model',beta)得到:beta=(,,)’ˆttye=预测及作图yy,delta=nlpredci('model',t',beta,r,j)plot(t,y,'k',t,yy,'r')nlpredci('model',,beta,r,j)ˆy=SPLUSy=c(,,,,,,,,,,,,,,,,,,,,)t=:nlsfitnls(y~SSlogis(t,A,B,C))summary(nlsfit)predict(nlsfit,t=)#预测Formula:y~SSlogis(t,A,B,C)Parameters:ValueStdErrortvalueABCResidualstandarderror:ondegreesoffreedomttBCAye=ˆtttyee==ˆy=或y=c(,,,,,,,,,,,,,,,,,,,,)t=:lixin=cbind(y,t)lixin=dataframe(lixin)#nlsfitnls(y~A(exp((tB)C)),data=lixin,start=list(A=,B=,C=))#等同于SSlogis效果#nls(y~A(B*exp(C*t)),data=lixin,start=list(A=,B=,C=))逐步回归【【例例】】水泥凝固时放出的热量y与水泥中种化学成分x、x、x、x有关今测得一组数据如下试用逐步回归法确定一个线性模型序号xxxxy、数据输入:x='x='x='x='y='x=xxxx、逐步回归:()先在初始模型中取全部自变量:stepwise(x,y)得图StepwisePlot和表StepwiseTable图StepwisePlot中四条直线都是虚线说明模型的显著性不好从表StepwiseTable中看出变量x和x的显著性最差()在图StepwisePlot中点击直线和直线移去变量x和x移去变量x和x后模型具有显著性虽然剩余标准差(RMSE)没有太大的变化但是统计量F的值明显增大因此新的回归模型更好()对变量y和x、x作线性回归:X=ones(,)xxb=regress(y,X)得结果:b=故最终模型为:y=xxSPLUSx=c(,,,,,,,,,,,,)x=c(,,,,,,,,,,,,)x=c(,,,,,,,,,,,,)x=c(,,,,,,,,,,,,)y=c(,,,,,,,,,,,,)xcbind(x,x,x,x)lmfitlm(y~xxxx)>step(lmfit,trace=F)Call:lm(formula=y~xx)Coefficients:(Intercept)xxDegreesoffreedom:totalresidualResidualstandarderror(onweightedscale):多变量统计™主成分分析Principalcomponentsanalysis™因子分析Factoranalysis™方差分析MANOVA™聚类分析Clusteranalysis主成份分析主成份分析主要求解特征值和特征向量使用命令eig()调用格式为VD=eig(R)其中R为X的相关系数矩阵D为R的特征值矩阵V为特征向量矩阵【【例例】】已知某湖八年来湖水中COD浓度实测值(y)与影响因素湖区工业产值(x)、总人口数(x)、捕鱼量(x)、降水量(x)资料建立污染物y的水质分析模型。数据x=,,,,,,,x=,,,,,,,x=,,,,,,,x=,,,,,,,y=,,,,,,,x=x'x'x'x'计算相关系数矩阵R=corrcoef(x)R=求特征根、特征向量V,D=eig(R)结果:R*V=V*DV=D=按特征根由大到小写出各主成份第一主成份f=xxxx方差贡献率为=%第二主成份f=xxxx方差贡献率为=%第三主成份f=xxxx方差贡献率为=注:这里xi表示标准化向量iiixxσcoefs,scores,variances,t=princomp(x)coefs=variances=或:VD=eig(cov(x))>>variances()sum(variances)ans=>>variancessum(variances)ans=x=c(,,,,,,,)x=c(,,,,,,,)x=c(,,,,,,,)x=c(,,,,,,,)y=c(,,,,,,,)xcbind(x,x,x,x)Rcor(x)eigeigen(R)>eig$values>eig$vectors,,,,,,,,>xprcprincomp(x)>summary(xprc,loadings=T)Importanceofcomponents:CompCompCompStandarddeviationProportionofVarianceCumulativeProportionCompStandarddeviationProportionofVarianceCumulativeProportionLoadings:CompCompCompCompxxxx>xprcprincomp(x,cor=T)>summary(xprc,loadings=T)Importanceofcomponents:CompCompCompStandarddeviationProportionofVarianceCumulativeProportionCompStandarddeviationProportionofVarianceCumulativeProportionLoadings:CompCompCompCompxxxxCompCompCompCompxVariancesCompCompCompCompxVariances

精彩专题

职业精品

上传我的资料

热门资料

资料评价:

/ 87
所需积分:0 立即下载

意见
反馈

返回
顶部

Q