我国妇幼死亡率GM(1,1)与线性回归预测模型研究
我国妇幼死亡率GM(1,1)与线性回归预测
模型研究
?
366?
?
应用研究?
中国卫生统计2010年8月第27卷第4期
我国妇幼死亡率GM(1,1)与线性回归预测模型研究
李望晨张利平孔雨佳王春平.
【提要】目的提出妇幼死亡率预测的GM(1,I)与线性回归模型,探讨资料处理,模型检验方法,以及适用性.
方法论证后建立婴幼儿死亡率GM(1,1)模型和孕产妇死亡率线性回归模型.结果婴幼儿死亡率GM(I,1)模型预
测效果好;孕产妇死亡率线性回归模型预测更优.结论GM(I,1)适于离散,灰序列建模;事物呈时序线性变化时线性回
归模型预测更优.
【关键词】妇幼死亡率GM(1,1)线性回归预测
灰色系统是信息欠缺又存在内在规律的复杂系
统,采用连续动态思想处理离散,随机性数据,减小灰
度而增加白度,建模
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
以揭示系统关联性特征与规
律,应用于经济,管理及医疗卫生等系统工程领域,如
传染病发展预测?].系统数据呈线性分布或变化特
点时,可参考线性回归模型,建模简单,易操作.合理
有效的预测模型取决于实际资料分析与模型方法检验
的充分论证.
模型方法简析
GM(1,1)是对随机扰动原始数据累加为规律性
较强的生成数据,用离散序列近似建立微分方程,拟合
系统规律并外推应用的单变量一阶灰色指数函数模
型.步骤如下:
设’.)={‘.(1),’.(2),…,X’.(n)}为原始数
据数列,’)={((1),’’(2),…,’(n)}为其一
次累加后生成数列,其中’(1)=x’.’(1),’(k)=
‘‘(k一1)+’.(k).
求均值序列Z’’={Z’(2),Z’(3),…,
z’’(n)},其中Z’(k)--0.5x’(k)+0.5x’’(k一1).
分别取X’.’(2),…,X’.(,z),代人灰微分方程X(k)
+az?’(七)=b,并表示为矩阵形式:
?
P=
一
Z’’(2)
一
Z’(3)
:
?
一
z’(n)
x’.’(2)
‘.’(3)
:
?
X’.(n)
=),,
得P:f:1:(BrB)一Bry.
则模型参数=,=,其
中c=?z’”(J《:),D=??’(),E=?zu(七)
1.潍坊医学院
数学
数学高考答题卡模板高考数学答题卡模板三年级数学混合运算测试卷数学作业设计案例新人教版八年级上数学教学计划
教研室(261053)
2.潍坊医学院预防医学系
?’(k),F=?(Z.(k)).由差分近似白化方程
+甜(1)=易
,
再根据解((f)=(xC.’(1)一b/a)
e’+b/a
,
确立预测模型’’(k+1)=(‘.(I)一
b/a)e+b/a,最后累减还原为模型预测值i’.’(k+
1)=主’(k+1)一’’(k).
模型要经过可行性检验,残差检验和后验差检验
以确定适用性:
级比?(e-2/(n+1)~eZ/(n+1))
且a?(一2,2),则建模可行;
设平均残差;=
6--9
J
X
I’其—
l一f)
中羔?’(2),…,’.(n)为模型预测值,平均精度P’=
(1一)X100%,则P越大越好,一般(k)<10%,
P’>90%;设后验差比C=/S,其中
———————————一
S?音(()?),———————一
?音(?(七)一),?(七)为残差序歹IJ,
小误差概率P=P{IA(k)一I<0.6745S}.一般结
论为C<0.35,P>0.9时模型精度优.
系统中目标变量Y与自变量t近似线性依存关系
时可参考回归模型Y=a+来拟合.
为验证模型适合程度要进行相关分析,计算相关
系数:_坚,其中(,)为观测??(t—f)?(Yt—x)
序列,i和为均值,k=1,…,Ft为数据个数.
预测
案例
全员育人导师制案例信息技术应用案例心得信息技术教学案例综合实践活动案例我余额宝案例
实证
婴幼儿及孕产妇各死亡率指标是反映社会进步和
医疗卫生水平的重要指标,对其动态监测及预测以把
握其变化趋势和规律的实效性,指导计生和卫生决策.
ChiI1~S~JournalofHealthStatistics.Aug2010.Vo1.27,No.4
以妇幼卫生监测网点妇幼死亡率为例探析预测模型,
资料参考国家卫生部统计数据,如表1.
表1监测网妇幼各指标历年死亡率数据
死亡率数据具有混沌特征,影响因素异常复杂而
难以因果建模,但各因素短期内较稳定,数据呈较稳定
时序规律并假设未来短时内仍会延续,可考虑灰色时
间序列建模问题,根据一段时期内离散死亡率数据建
立灰色模型拟合时序规律和延续趋势.
先以新生儿死亡率预测为例研究.参考2000,
2006年数据X’.)={‘.(1),…,’.(7)}={22.8,21.4,
20.7,l8,15.4,13.2,l2},数据平滑且延续性规律较好;
假设2007年{‘(8)}未知,也近似遵循该规律而进行
建模预测.求’.累加生成数列’’及均值序列z’?:
‘={‘.(1),…,X’(7)}={22.8,44.2,64.9,
82.9,98.3,111.5,123.5};
Z(1)={Z’.(1),…,Z((7)}={33.5,54.55,
73.9,90.6,104.9,117.5}.
计算中间参数:c=474.95,D=100.7,E=
7366.205,F=42577.78.再计算模型参数:a=
0.121456,b=26.39762.
级比’.’={‘.(2),…,(.(7)}={1.065,
1.034,1.15,1.169,1.167,1.1},计算级比界区U=
(e-1/4,e)=(0.779,1.284),上述’.’(k)?U,又OL
?[一2,2],表明建模可行.然后确定预测模型为主?
(k+1)=一194.542e+217.3423,分别计算
王’’(k),还原计算预测值序列王’.(七),其中’.(k)=
((七)一王((|c=一1).
分别进行残差和后验差检验.平均残差=?
?7IJ=0.
o28,平均精度P=
97.2%>90%.由{?()}={0,一0.85,0.995,
0.549,一0.056,一0.488,一0.122},得A=0.004以及
=
0.570,再计算S=3.906,则后验差比C=S/S1
=
0.146<0.35.对Vk,I?(k)一?I<0.6745S1=
2.635均成立,故小误差概率P=1,因此模型拟合能
力和模型精度均非常好.由模型预测2007年新生儿
死亡率=乏’.(8)=10.736,与实际10.7相比,相对误差
为0.3%,也说明了模型适用性很好.
须说明,时间序列建模基于历史资料,目标受外界
因素突变而较大程度违背历史规律,即使规律性强,模
型拟合好,预测也可能不佳.以下仍以新生儿死亡率
预测说明.以2001,2007年共7年的原始数据为参
考,并假设2008年数据未知.
类此试验,计算级比(k)?(e,e)且a?
[一2,2],验证建模可行,预测模型为?’(k+1)=
一
160.561e加?”+181.
9605.计算平均残差;=
0.002,平均精度P’=99.8%,残差检验很好;再作后
验差检验,也说明模型性能很好.但2008年预测值
互(8)=9.034,与实际10.2相比预测不佳.历史数
据变化稳定,但2008年外界因素导致违背此规律.因
此定量预测模型应结合定性分析,以把握外界因素或
环境的较大改变.
婴幼儿死亡率为时序稳定变化指标,以下仍采用
GM(1,1)模型分别根据2000,2006年婴儿,5岁以下
儿童以及孕产妇死亡率数据预测2007年未知数据.
同上原理,分别建立各指标死亡率GM(1,1)模型
互((k+1)=(X’.(1)一a/b)e+a/b.建模前同样
经过可行性检验,事后还要进行残差和后验比检验,预
测结果见表2.
表2婴儿,5岁以下儿童及孕产妇死亡率GM(1,1)灰色模型预测结果
结果表明,CM(1,1)模型对婴儿和5岁以下儿童
死亡率灰色系统预测均非常优良.但孕产妇死亡率预
测误差较大.经分析,2000,2006年孕产妇死亡率数
据剧烈波动且规律不显着,急剧下降后又上升,维持两
年平台期后又急剧下降,如图1.
时间序列拟合模型要求数据时序变化规律性强,
波动数据不能随意用作建模.由于GM(1,1)允许数
据取舍少到几个,可将2003—2006年数据作平滑预处
理.2005年前后年数据加权平均(48.3+41.1)/2=
44.7用作建模,预处理为建模数据{51.3,48.3,44.7,
图12000,2006年孕产妇死亡率时序图
41.1},验知’.(k)?(e-2/5,e),但a=一3.76683
每(一2,2),说明GM(1,1)建模仍不适用.
?
368?
观察近年孕产妇死亡率数据与时序折线图大致呈
直线趋势,可考虑线性回归预测模型Y=a+.为验
证模型可行性,利用历史观测值数据(1,51.3),(2,
48.3),(3,44.7),(4,41.1)进行相关分析,计算相关
系数r=一0.99908,查自由度df=2,检验水平为ot=
0.05的相关系数检验表,得临界值,说明>ra且
接近于1,通过性检验,建模可行.最小二乘法计算系
数b=54.9,a=一3.42,则回归模型为Y=54.9—
3.42t.分别预测孕产妇死亡率2007年为37.8,2008
年为34.38,与实际值相比,相对误差分别为3.28%和
0.53%,说明数据具有线性时序规律时线性回归建模
简单,预测性能更优.
讨论
妇幼卫生监测网婴幼儿及孕产妇死亡率的影响因
素复杂,如民族,风俗,经济,环境以及社会等,作为时序
变化相对稳定的灰色系统,GM(1,1)模型优先考虑.
时序模型以系统规律稳定性和时间延续性为假
中国卫生统计2010年8月第27卷第4期
设,未知数据也近似符合此规律,拟合后外推预测.模
型对数据分布和个数无严格要求,适应性强,信息利用
度高,但与事物规律性和数列光滑度有关,对急剧变化
或扰动明显的原始数据拟合不佳,须作平滑预处理;原
始数据段建模时可作不同取舍,建模;数据段太长反而
会融人噪声及远期历史规律.
GM(1,1)模型拟合灰色系统中信息类指数规
律,预测性能好.对于线性变化特征明显的序列,线性
回归模型更简单,优良.前者不能描述线性变化趋势,
而后者不能描述指数变化趋势,需要根据资料特征和
模型原理科学论证预测模型的检验与选择.
事物外界因素复杂变化而难免突然违背资料时序
规律,必要时定量预测模型应辅之以定性论证分析.
参考文献
1.金如锋,邱宏,周霞,等.ARIMA模型和GM(I,1)模型预测全国3种
肠道传染病发病率.复旦学报(医学版),2008.35(5):675.
2.秦侠.卫生管理运筹学.北京:人民卫生出版社,2005:281-287.
(上接第365页)
总之,新疆维吾尔族妇女乳腺癌的发生可能与月
经状况,生育因素,社会心理因素,遗传和饮食等多因
素综合作用有关.发病危险因子与其他区域人群相
比,既有共性,也有独特之处.这些危险因素大多是可
防,可控的.因此,加强乳腺癌预防的健康教育,倡导
身心健康的生活方式,有助于减少乳腺癌的发生.
ACase-controlStudyonRiskFactorsofUygurNationality
wimBreastCancerinXinjiangAreaChengFang.MuKe—dai一
,SiMayi,eta1.AffiliatedTumorHospitalofXinjiangMedicalU-
niversity(830011),Urumqi
【Abstract】0bjectiveToexploretheriskfactorsofUygur
nationalitywithbreastcancerinXinjiangarea.Methods1:1matched
ease-controlstudywasconductedin103casesofUygurnationalityfemale
breastcancerwithhistopathologicaldiagnosisand103matchedcontrols,u—
singconditionallogisticregressionanalysis.ResultsTheriskfactorsof
UygurfemalebreastealiccrinXinjiangal’eaincludedlaterageofmeno-
pause,familyhistoryofcancer,psychologicalirritation,highintaketimesof
meat.However,laterageofmenarche,havingoccupation,longtimeof
breastfeedingandmoleparitymaydecreasetheriskofbreastcancer.Con-
clusionTheriskfactorsofUygurbreastc~cerinXinjiangareaalenot
onlyrelatedtophysiologicalandgeneticconditions,butalsotopsychologi—
ealstatusanddiet.Theincidenceofbreastcancermaybeloweredbyen-
hancingtheknowledgeofpreventionofbreastcancerandinitiatinga
healthylifestyle.
【Keywords】Breastcancer;Riskfactors;Case—controlstudy
参考文献
1.丁锦辉,黄先国,于冰,等.新疆维吾尔族女性乳腺癌临床病理特点
与预后分析.肿瘤研究与临床,2006,18(8):550-552.
2.ZhengW,XieD,CerhanJR,eta1.Sulfotransfcrasc1A1polymorphism,
endogenousestrogenexposure,Well-donemeatintake,andbreastganc?
errisk.CancerEpidemiolBiomarkersPrey,2001,10(2):89~94.
3.袁宝君,戴月,史祖民,等.妇女乳腺癌危险因素病例对照研究.中国
公共卫生,2004,20(9):1036.
4.韩定芬,马骏,周新,等.武汉地区女性乳腺癌危险因素的病例对照
研究.中华流行病学杂志,2004,25:256-26o.
5.VachonCM,SellersTA,VierkantRA,eta1.Case—controlstudyofin—
creasedmammo~aphicbreastdensityresponsetohormonereplacement
therapy.CancerEpidemiolBiomarkersPrev,2002,l1(11):1382—1388.
6.林杰,虞建锋.慈溪市女性乳腺癌危险因素病例对照研究.浙江预防
医学,2008,20(6):3-5.
7.LipworthL,BaileyLR,TrichopoulosD.Historyofbreast-feedinginre-
lationtobreastcancel-risk:areviewoftheepidemiologicliterature.J
NatlCancerInst,2000,92(4):302-312.
8.王启俊,李玲,祝伟星.等.jE京市乳腺癌危险因素病例对照研究.中
国慢性病预防与控制,2000,8(4):165?167.
9.周亮,贺天锋,靳雅丽,等.女性乳腺癌危险因素的病例对照研究.中
国肿瘤,2009,l8(1):28_30.
10.MurffHJ,SpigelDR,SyngalS.Doesthispatienthaveafamilyhistory
ofcancer?Anevidence?basedanalysisoftheaccuracyoffamilycancel”
history.JAMA,2004,292(12):1480—1489.
11.NogueiraSM,ApplingSE.BreastCancer:genetics,risks,ands~tegies.
NursClinNorthAm,2000,35(3):663-669.
12.付欣鸽,王振华,李锋,等.I1O例维吾尔族及汉族乳腺癌中BRCAI
基因突变及p53蛋白表达的研究.中国组织化学与细胞化学杂志,
2007,16(3):270-274.
13.方亚,胡海兰.女性乳腺癌危险因素及其变化.中国卫生统计,2009.
26(3):241.246.