艾滋病疗法的评价及疗效的预测
参赛队员:叶 萌(通信学院),
刁寅亮(通信学院)
简福斌(通信学院)
指导教师:龚 劬
参赛单位:重庆大学
参赛时间:2006年9月22∼25日
艾滋病疗法的评价及疗效的预测
【摘要】本问题要求我们根据几种治疗
方案
气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载
下艾滋病治疗效果的测试数据,对艾滋病治疗的方案:包括最佳治疗终止时间,各种疗法的优劣选择,治疗所需的费用三个问题建立模型进行科学分析。
第一个问题归结为一个对大量样本数据的统计分析及预测问题。首先定义了标准浓度来综合刻画CD4浓度和HIV指标。因为所给的数据较为分散,直接处理的难度很大,所以我们首先用聚类分析方法,以CD4和HIV浓度为两个指标将所有测试病人进行分类,共分成三类:轻度,重度和中度病人,并用回归分析方法得到了每一类病人的标准浓度函数的估计,检验表明其回归模型较为准确。然后我们建立了用于预测疗效的数学模型,引入疗效函数η(t),根据η(t)的值便能够判断是否应该继续治疗以及治疗的效果,或者得到停止治疗的最佳时间。我们得出轻度病人最佳终止治疗时间为27周;中度病人为29周;重度病人应该继续治疗。
对第二个问题,为了避免对大量数据进行回归分析时的复杂计算,我们依据患者CD4指标的差别将患者分为轻症和重症两类。并定义了轻症率作为全局评价的标准,为t时刻样本中轻症患者数量与该时刻样本总量的比值。对每一种疗法,我们统计了样本量大于30的测试时刻的轻症率,用回归分析方法,得到了比较理想的轻症率变化曲线。我们用轻症率曲线来评价四种疗法的优劣,大大简化了模型。我们还引入了评价指标()pt()ptZ刻画治疗方案的治疗效果,它综合了每种疗法的疗效和治疗时间,更具有实际意义。 模型分析得到疗法4为最佳的治疗方案,其优劣次序依次为4,2,3, 1。
第三个问题需要综合考虑疗法的优劣和费用高低,我们以疗效、费用、治疗时间为目标,建立了一个多目标规划模型。然后我们将这三个目标进行了优先级划分,采用目标规划中的序贯式算法编写lingo程序,很快得到综合选择的结果。在认为疗效最重要,费用次要,时间最次要的优先级别划分下,得到最好的治疗方案仍为疗法4。
关键字:聚类分析 回归分析 轻症率 评价指标 多目标优化 序贯式算法
- 1 -
一. 问题的重述
第一个问题要求对一种方案治疗期间内测试记录的样本数据建立适当的数学模型进科学分析,要求能够预测往后的治疗效果或预测最佳停止治疗的时间。
第二个问题要求我们综合考虑四种治疗方法下测试得到的样本数据,对数据进行适当的处理,建立模型评价四种疗法的优劣,并预测较优方法的继续治疗效果或最佳终止时间。
第三个问题给出了第二题疗法中所用药品的价格。要求对综合治疗价格和疗效两方面的因素,建立一个新的添加了优化思想的疗效评价和预测模型。并分析在综合了价格因素考虑之后,模型有什么变化。
二. 模型的基本假设
1.艾滋病在现有医学条件下是无法彻底治愈的。
2.测试所得的疗效规律基本符合艾滋病治疗的真实规律。
3.所有病人均严格按照治疗方案进行治疗。
4.不考虑病人年龄的影响。
三. 符号说明
符号
所表示的意义
,ttcdhivCC
t时刻CD4,HIV的浓度
C
标准浓度lg(1)cdhivCC+
iΩ
第i类病人的样本集合
t
测量的时间(周)
()iFt
第i类样本的回归函数
*()iFt
()iFt的极值
CV
()iFt的一阶微分
Ca
()iFt的二阶微分
I
标识是否停止治疗的0—1变量
η
治疗方案的预测效果
ijβ
第i类样本第j个回归参数
- 2 -
cdCb
ln(1)cdC+
()pt
轻症率
mT
最佳终止治疗时间
n
样本总数
t C
t时刻回归预测值
iε
残差
2R
决定系数(回归误差检验参数)
s
剩余方差(回归误差检验参数)
F
F检验参数(回归误差检验参数)
()Wi
标识第i个病人是否为轻症病人的0—1变量
Z
对方案优劣的评价指数 ()ei
第i种疗法的疗效
()ki
第i种疗法的日费用
()ti
第i种方案所需的治疗时间
()xi
标识是否选用方案i的0—1变量
,dd+−
优化时所用的偏差变量
四.问题的分析及模型的建立
4.1 预测治疗效果的模型及最佳治疗终止时间的确定。
4.1.1 问题的分析
第一组数据给出了一种治疗方案下的一组艾滋病病人CD4和HIV两种指标的变化情况,我们的任务是从这些离散的测试数据得出CD4和HIV两个指标随治疗时间的变化规律,进而对继续治疗可能出现的结果进行预测,并确定最佳终止治疗的时间。
首先根据所给的数据进行分析,因为人体中的CD4细胞起着抵御HIV病毒的作用,同时CD4可能被HIV感染而裂解,其数量会急剧减少,这两个指标之间有着密
- 3 -
不可分的联系,不能由其中任意一个数据的变化来确定病情的发展,需要一个能联系两者的标准指标。
因为两者之间此消彼长,可以选择两个数据量的比值作为观察的标准,'C=cdhivCC而题中过给的和的浓度数量级相去甚远,为了准确分析,通过简单的变形得到我们接下作为分析指标的标准浓度: cdChivClg(1)cdhivCCC+=
我们认为C越小,病人的病情越严重。由于数据相对较多,为了能较为快速直观地得到模型的建立方向,可以先随机挑选一些病人的治疗情况进行分析。因为并不是所有的病人在每一周都进行了测试,所以得到的治疗效果关系并不准确,但是仍能看出一些趋势,在D4初值较高的人(即轻度病人)中随机选择了10个病人作为第一组,在C初值较低的人中随机选择了20个病人作为第二组(即重度病人),治疗期间变化的折线图如下所示: CC
图1 轻度病人治疗效果抽样趋势图2 重度病人治疗效果抽样趋势
从上图中可以发现这两组病人的治疗趋势有一定的区别,轻度的病人在治疗一段时间之后,很多样本的治疗效果都呈现了下降的趋势;而重度病人在治疗期间,多数样本并没有比较明显的转折点,呈现一直缓慢向上的走势.同时两组中都有病人在后阶段C值下降,我们认为这些人需要停止治疗。
于是可以考虑将所有的病人根据治疗开始时初始病况进行分类,分为几类分别建立模型进行分析,能够因病情而异较为准确地得到治疗预测方法。分类的标准应该综合考虑CD4和HIV的情况,不能直接依据某一个指标,所以这个分类的问题可以转化为一个多元统计中的聚类分析问题[1]。
聚类步骤如下:
1.设,分别表示病人第t周测试所得的CD4,HIV的浓度,那么提出第i个病人第零周初始值,。()tcdCi()thivCi(0)tcdC(0)thivC
2.将所有的样本分别以,为横纵坐标在坐标平面上标志出来。同样考虑到CD4与HIV的浓度量纲不同,将稍做处理,变换为()tcdCi()thivCi()tcdCi
- 4 -
()'tcdCi=。lg(()1)tcdCi+
3.将指标“靠近”的点进行聚类,两个指标之间的“靠近程度”用相似系数表示。设'tcdC,thivC分别为两个指标的均值,n为样本总数。
则相似系数 0011020211(()'')(())[(()'')(())]nttcdcdhivhivinnttcdcdhivhiviiCiCCiCrCiCCiC===−−=−−ΣΣΣ 2
此方法为系统聚类法[1]。
4.用matlab软件编写程序进行求解,令iΩ为第i类病人的集合,那么将所有的病人分成三类,分别表示轻度、中度和重度的病人,再将该病人的所有数据归到相应的集合下(程序及结果见附录1.1) 123,,ΩΩΩ123,,ΩΩΩ
分类结果见下表:
表1 各类病人人数
用这些通过聚类分析得到的数据分别将三个集合中的数据做平面坐标系中的tC−关系散点图。
图3 图4
要从这些样本点中直观地观察出指标变化的趋势并不容易,治疗过程中CD4与HIV的变化与药物疗效、病人病情、体质情况、药物作用时间等多个因素密切相关。但是因为该问题要求我们对该种治疗方法在时间推进下疗效进行预测或者确定最佳停止治疗的时间,那么这些样本点就可以简单抽象为时间和标准浓度两个变量之间的关系模型。
轻度病人
中度病人
重度病人
23人
243人
85人
- 5 -
图5
4.1.2模型的建立
假设对一个病人而言,第t 周的标准浓度与时间的关系为
()tCft= ①
艾滋病治疗的目的是要尽量减少HIV的浓度,以及增加CD4的含量,若CD4的含量没有增加,也至少要保证降低CD4减少的速度,则
tC变化的速率为的一阶微分: ()tCft=()CdftVdt=
tC的速率变化的快慢则为的二阶微分: ()tCft=22()Cdftadt=
通过治疗,要求,既标准浓度C处于增长状态。或者若,则需要,表示即使C在降低,也能够使C 降低的速率变缓。用就能够方便地预测继续治疗的效果。0CV>0CV<0Ca>()tCft=
再引入0—1变量I,表示治疗效果不明显,可以停止治疗。0I=1I=表示效果较好,应继续治疗。那么
101000CCCVIVa>⎧⎪=<>⎨⎪⎩可继续治疗且可继续治疗其他可停止治疗
综上所述,治疗效果的数学模型表示为: ()dftIdtη=⋅ ②
模型解释:对任意一个时间点t,η值越大表示效果越好,如果η=0效果不佳可以停止治疗。而最佳停止治疗点应该为第一个使η=0的时间点。
标准浓度函数的回归模型()tCft=
通过翻查一些医学统计资料,在对很难看出走势的待回归样本集,通常先选择二次项回归的方法[2]。通过观察图1和图2发现,对于需要停止治疗的病人的标准浓度曲线呈二次曲线型, 所以我们用matlab软件对已分组的三个集合分别进行二次项回归处理。(程序及运行结果见附录1.2)。对于不需要停止治疗(即C()tCft=t逐渐稳定)的病人的标准浓度曲线呈函数()tCft=01()tFttββ=+的曲线型。
- 6 -
需要停止治疗的病人在治疗过程的标准浓度函数的回归模型为
20122(0,)CttNβββεσ⎧=+++⎨⎩∼
ε
可继续治疗的病人在治疗过程的标准浓度函数的回归模型为 012(0,)tCtNβεβεσ⎧=+⎪+⎨⎪⎩∼
4.1.3模型的求解
第一次对集合中所有的样本数据进行回归得到结果,同时用matlab命令可以直接得到相应的误差分析。通过误差分析可直观地判断回归的效果。
参阅相关统计书籍,举例来说:计算出参数β后,得到的iC可以看作对的期望值的估计,那么设误差的iCiε的估计值为iε,称为残差,那么记残差的平方和21niQε==Σ,再引入变量22Qsn=−作为样本的剩余方差,作为其中一个评判标准。另外还有误差分析参数2,,RFp。因为这些误差分析方法都已经是成熟的算法,所以在此不一一赘述推导过程,每个参数的意义及matlab对三个样本集合的回归分析见表1。回归后第i个集合的C关系为t−2012()iiiiFtttβββ=++.
表2 三类病人初次二次回归结果
集合
回归系数
回归系数估计值
系数置信区间
10β
0.7520
[0.6569 ,0.8470]
11β
0.0441
[0.0286 ,0.0597]
12β
-0.0008
[-0.0012 ,-0.0004]
1Ω(轻度病人)
2R= 0.4106 =33.7895 =0.0000 =0.0802 Fp2s
20β
0.4879
[0.4554 ,0.5204]
21β
0.0419
[0.0366,0.0471]
22β
-0.0008
[-0.0009,-0.0006]
2Ω (中度病人)
2R=0.3770 = 205.5920 =0.0000 =0.1029 Fp2s
- 7 -
30β
0.2801
[0.23, 0.33]
31β
0.0417
[0.03 , 0.05]
32β
0.0000
[0.00, 0.00]
3Ω(重度病人)
2R= 0.28 =73.05 =0.0000 =0.01 Fp2s
其中各检验系数所表示意义:
2(0,1)R∈---决定系数,即相关系数R的平方,2R越大表示自变量对因变量起的决定作用越大
2s---样本方差,为残差的方差,越小表示回归后的函数越准确
F---检验参数,当时,表示回归效果显著F0FF>(临界值)
p---表示F统计量落到零假设的拒绝域之外的概率, 值越小,回归效果越好p
从表1中可以看出,对集合中的所有样本点进行回归分析,结果显示:得到的模型精度不高,三个集合回归后的误差均比较大。
对,得到的二次项系数为零,回归得到的是一个C关于t线性增长的函数,这显然表示二次项回归并不符合该样本集合的特征,同时也说明至少测试的时间范围内,C的趋势一直处于上升或不降的状态,并没有出现二次项中一阶微分为零的点。其实际意义表示对重度病人在测试的时间段内,病情一直在好转或稳定,因此这类人可继续治疗,其标准浓度曲线呈函数3Ω()tCft=01()tFttββ=+变化规律。
对和,得到的系数和置信区间均正常,但是1Ω2Ω2R都未超过0.5,而F和s2的值也不理想。这有可能是样本中的异常点造成的,这些异常点偏离整体的变化趋势(在模型中表现为残差的置信区间不包含零点),给模型的的有效性和精度带来不利影响。
(1)先对这两个集合结果进行改进,图6为剔除异常点前后残差置信区间的。变化情况。
- 8 -
图6
通过matlab程序,逐次剔除异常点后,就能得到比较精确的二次回归函数(程序及运算结果见附录1.3):轻度与中度病人样本回归后的曲线与散点图如图7-10所示。
图7轻度病人集回归曲线图8 轻度1Ω1Ω的回归置信区间及转折点
图9 中度病人集回归曲线图10 中度病人集2Ω2Ω的回归置信区间及转折点
- 9 -
表3:轻度与中度病人二次回归最终结果
从表3中各项回归参数的误差检验可以看出该回归模型较符合数据的分布规律。
(2)对重度病人的回归结果进行改进
由于回归得到的二次项系数为零,那么表示C在测试的时间段内一直趋势都在增长。通过观察图2发现,用01()tFttββ=+对样本集合进行回归分析比较合适。该函数的变化如右图所示。对该函数进行简单变形, 3Ω 0112200
11tβ(程序见附录1.4) 得到回归后的函数曲
3Ω3Ω
集合
回归系数
回归系数估计值
系数置信区间
回归方程
10β
0.6899
[0.6252, 0.7471]
11β
0.0601
[0.0498, 0.0703]
12β
-0.0011
[-0.0013, -0.0008]
1()Ft=0.6899+0.0601t
−0.0011 2t
1Ω 2R=0.7613 =130.7694 =0.0000 = 0.0301 Fp s2
20β
0.4090
[0.3930,0.4250]
21β
0.0644
[0.0614,0.0674]
22β
-0.0011
[-0.0012,-0.0010]
2()Ft=0.4090+0.0644t0.0011t −2
2Ω
2R= 0.8124 =1957.31 =0.0000 =0.0002 Fp s2
( ) 1
( )
Ft t
t Ft t
β
α α
β β β
= → = + = +
+
变成了一个一阶线性的函数关系,容易通
过程序实现该样本集的回归分析。或者用非线性回归的方法直接回归都能得到结果
线如图 11 所示:
图 11 的回归曲线 的回归置信区间 图12
- 10 -
回归得到的参数果如下表:表4 重度病人样本回归结果
结
从表 4 可以看出,回归所得的结果各项误差检验都达到了理想状态,表明这样
函数关系基本上可以反映真实的治疗情况。
合 4.1.3 得到的三个集合回归得出的函数关系:再结合 4.1.2 中列写出的数学模型
的
4.1.4模型求解结果
综
(即4.1.2中的②式)
()dftI
dt
η=⋅
对各种病情的病人分别进行疗效预测得到的结果如表 5,
表 5 标准浓度函数及停止治疗时间
4.1.5 模型的结果分析
对病情较轻的病人,在使用该治疗方法在治疗的前期,基本可以增大标准浓度
慢 C 的降低速率,使得病情得到较好的控制。但是治疗持续
了一
C的含量或者有效地减
段时间以后,可能因为人体的抗药性增强或者病毒本身的扩散特性问题,会出现一个治疗效果的极值点,往后的继续治疗效果并不明显甚至会出现病情的反弹。所以在当治疗进行到一定程度时,可以停止该种方案的治疗考虑另外的治疗方法。而对病情较重的病人,在治疗前期好转的效果比较明显,到后期虽然好转的速度减缓,但是治疗仍旧在发挥积极
的作用。我们给出的治疗效果模型η越大,表示该方案的治疗效果越明显。根据实际情况分析,也可以确定一个η的下限sη,当sηη<时,可以认为基本上已经没有疗效,也能考虑停止用药。于是由此可以得到比较明该模型得到的结果,重度的病人需要治疗更长的时间,也与实际情况相符。
确的预测方向。
病情 标准浓度函数
30β
1.3714
[0.5693,2.4230]
31β
6.4286
[4.1465,8.0974] 31.3714()6.4286tFtt=+
3Ω
2R= 0.6944 =664.37 Fp=0.0000 =0.0020 s2
预测结果
轻度
1()Ft =0. .001 第 27 周左右
6899+0.0601t-0
12t
是最佳停止治疗时间
中度
2()Ft=0.4090+0.0644-0.0011
t2t
第29周左右是最佳停止治疗时间
重度31.3714()tFtt=
6.4286 +
继续治疗的效果函数为3()tη
- 11 -
4.2
在探索阶段,并没有某种绝对的治疗方案,所以需
要确定判别疗法好坏的指标。从病患的愿望出发,治疗的目的就是希望
四种疗法优劣的评判模型
4.2.1 问题的分析及模型的建立
目前对艾滋病的治疗仍然处
要对各种治疗方案的测试结果建立模型进行科学分析,用以判断及预测相应治疗方案的优劣。首先需
能够尽量痊愈或者减轻病症,所以我们考虑根据患者的CD4含量(本题只要求考虑CD4指标)分为轻症和重症两类ΩΩ。在治疗过程中,如果有一定效果,则必有[3]ln(1)3.6。重轻,
重症病人向轻症病人转化。根据相关的资料,若以 为判别标准,临床艾滋病重症
与轻症的判别点约为 33 ,转化为附件 2 种所给的数据形式,则判别点为
设 ,i 为病人序号,第 i 个病人的 CD4 浓度指标为 ,
所给的数据
cdCcdC+=
cdCb=ln(1)cdC+()cdCbi
ln(1)(0,6.298)cdC+∈ ,可以将该区域均分为两个病情判别区
轻症区间为 , 重症区间为
()cdCbi∈(0,3.6)()cdCbi∈ (3.6, 6.298)
变量 设一个0—1
0(),()1()(3.6,6.298),cdcdCbiiWiCbii⎧∈∈Ω⎪=⎨∈∈⎪⎩重轻(0,3.6)
Ω
那么在一个时刻点 t,对一组病人进行统计,在 t 时刻样本集合中的轻症率为
1()()
n
i
W i
p t
n
= =
Σ
③
假设一个治疗方案一定存在一个最佳终止治疗的时间点 T。
以设定,一个行
之有
2.如果以各疗法存在最佳终止治疗的时间点,那么在这个时间点 T 上, 应大
于初始值 。
3. 曲线的一阶导数表示病情好转的速率,应大于零且越大越好。
4. 增量和病情好转速率综合考虑时,应优先考虑 增量,因为艾滋病是不
可治愈的,好的疗法应该追求使更多的人好转。
关于一个疗法的治疗效果判定,依据上述引入的变量,我们可
效的治疗方案,需要满足1.()pt随时间变化的曲线总趋势应该是上升的,表示治疗后,重症病人减少。
()pT(0)p
()pt
()pt()pt
- 12 -
综上所述,判别某一疗法疗效的数学模型为:
设第m种治疗方案的轻症率为()
mpt,最佳终止治疗的时间点为
mT 。
建立评价指标模型
mZ=()(0)mmmmpTpT−
将 开方就是增强
mT()mpt 增量的重要程度。
mZ 越大,治疗方案越好。
4.2.2 模型的求解
型求解步骤:
据轻重症的划分方法计算附件 2 中所给样本的初始轻症率。
有些
的计算方法(即 4.2.1 中③式)分
行回归分析,得到近似的连续函
模
首先,计算根
其次,考虑到并不是在所有的时间点上,都有足够多的样本点进行分析。在
周次,只有零星几个数据。所以,提取样本数据在30个以上的时间点及该点上的样本集合。第三步,对四种不同的疗法,根据轻症率
()pt别在所有提取的时间点上,计算离散轻症率的值。第四步,分别对四种疗法下轻症率的离散数据进
数()mpt。
第五步,用 4.1 中建立的模型,对回归得到的函数
()mpt ,预测最佳停止治疗的
时间点 ,并得到该处的 mT()mmpT 。
最后,4.2.1 中建立的模型评价几种治疗方案的优劣。
据以上步骤,用 excel 和 matlab 软件求解。得到结果如下图:
的点,以得到较为理想的回归曲线。)
图 13
根
四种疗法的下()tpt−散点图及回归曲线。(这里回归时同样经过几次回归剔除了异常
1()pt 图14 2()pt
- 13 -
62.1)
表6 四种疗法()pt回归系数及误差检验
回归系数 回归系数估计值
图15 3()pt 图16 4()pt
四种疗法都使用二次多项式回归,回归得到的参数及误差检验如表 :
(程序见附件
集合 系数置信区间
10
β
0.2235 [0.185
0 ,0.2620]
11β
0.0046
[0.0006 ,0.0098]
12β
-0.0003 [
-0.0004 ,-0.0001]
2R = 0.9478 =5 =0.000
F
4.4979
p
1 2s=0.0003
20β 0.2548 [0.103 ,0.3 7 394]
21β
0.0049
[0.0006 ,0.0121]
22β
-0.0002
[-0.0005,-0.0001]
2R =0.7624 = =0.0134
F
9.6274
p
2s=0.0017
30β 0.2637 [0.180 ,0.3 7 494]
31β
0.0043
[0.0012 ,0.0093]
32β
-0.0003 [
-0.0006 ,-0.0001]
2R = 0.7219 =6 =0.0408
F
.4898
p
2s=0.0013
40β 0.2684 [0.629 , 0.37
41β
0.0137
[0.0019 , 0.0256]
疗法 1
疗法 2
疗法 3
疗法 4 1 38]
- 14 -
42β
-0.0004 [
-0.0007 , -0.0001] 2R=0.4782 F = 4.58 .0387
27 p=0
2s=0.0035 1,3的二次回归效果不是很明显,在剔除 四种疗法在初次做回归时,疗法 2,
几个异常点之后,回归的效果如上表所示,变得比较理想。
四种疗法的优劣评价
回归方程
了
对得到的四条回归曲线,用4.2.1中建立的模型,可以对四种疗法的优劣进行评价,评价后得到的结果见表7。
表7
最佳终止T
绘出四种疗法的轻症率函数
()pt
疗法4为最有效的治疗方案,对其治疗
()mpt
mT
m()mm
(0)mp
mZ
1()pt =0.2235+ -0.0003 7.7667 0.2411 0.2235 0.0064 0.0046t2t
疗法2
1()pt=0.2548+-0.0002t 0.0049
t2
12.25
0.2848
0.2548
0.0086
疗法3
1()pt=0.2637+0.0043t-0.0003t
2
7.1667
0.2791
0.2637
0.0058
疗法4
1()pt=0.2684+0.0137t-0.0004t
2
17.1250
0.3857
0.2684
0.0283
劣疗法4
>
法2> 疗法
> 疗法
治疗时间
时刻
的轻症率
p T
初始轻
症率
评价指标
疗法 1
从优到
疗 3 1
的回归曲线进行直观比较,如图 17 所示。
模型评价的结果是 效果可以用 4.1 中建
立的模型进行模拟。得到该方案治疗下最佳终止治疗时间应在第 20 周左右。
图17 四种疗法的轻症率函数曲线
- 15 -
4.3综合考虑药价与治疗效果的评价和预测模型
4.3.1 问题的分析
学模型,可以评价一种治疗方案的
个病人在实际求医过程中,自然会考虑到药品价格的问题,希望
程度或者说优先顺序上,我们将疗效放在首位,费用
重于金钱,而对于艾滋病这样一种不能彻底痊愈的
疾病
上题中我们通过临床获得的数据和建立的数
优劣。但是对于一
可以挑选一种既有效,又经济的治疗方案。对于这样一个理想的方案,我们认为大致需要满足以下条件 1.治疗的效果尽可能好。
2.治疗费用尽可能少。
3.治疗的时间尽可能短。
在满足这三个目标的重要
其次,治疗时间最次。毕竟生命
,需要做好长时间治疗的准备。综合上述分析,该问题已经逐渐明朗化为一个具有层次性的多目标规划问题。 4.3.2 模型的建立和求解
根据4.3.1中的分析,
假设一组0—1变量()xi,当()1xi=时表示选择第i种方案,
()0=时表示不选择。由上述分析可以得到以下数学模型: x()()eixi⋅Σ
x i
s.t. .
可以用序 法能求解多目标规划问题,算法思想如下:
i 的 i p
ma
min()()kixi⋅Σ
min()()tixi⋅Σ
()1xi=Σ lingo程序贯式算
引入偏差变量 ,dd,建立以下目标:
+− 1.设()ei为方案疗效,令()()iieipT=−
(0)11()min{xidd+−
()⋅ +
表示所选方案的疗效至少要大于各方案中的最小疗效
2. i 所需的 i =所选方案的日花费,
k i }
−=Σ
则目标为1min{}d
−设()ki为方案费用,令(k
,
e i e(i)}
) 22()max{()xiddki+−−=Σ
()表示所选方案的费用至少要低于到各方案中的最大费用
目标为2min{}d
+设()ti为方案
⋅ +
3. i 所花的时间,另
()itiT=
- 16 -
33()max{()}xiddti+−−=Σ
() 表示所选方案的治疗时间至少要短于各方案中最长的时间
3
min{}d+
给出四种疗法(),(),()eikiti 的表格:
表8 各种疗法的各项指标
用
mq 表示某种方案的优先级,那么疗效、费用、治疗时间的优先级分别为
,
当疗效>
其数学模型为:
123,,qqq把原来的多目标规划模型转化为单目标规划。费用>治疗时间
min
11
2233Bqdqdqd−=+ ++ +
Σe i ⋅ x i + d +−d − =
go 软件编写程序(程序及运行见附录 3.1)
4。
本模型综合考虑了疗效、费用、治疗时间三个目标的关系,并通过优先级的确
重缓急,同时也简化了优化的程序。现在得到的结果是在本模型
s.t. 0.0154
11()()
22()()3.65kixidd+−⋅+−=Σ
33()()17.125tixidd+−⋅+−=Σ
()1xi=Σ 用lingdo/lin运行得到的结果:最优的治疗方案为方案
4.3.2 模型的分析
定明确了目标的轻
优先级划分的标准下得到的。当改变几个目标的优先级之后,得到的结果也会随之改变。比如若将费用放在考虑的首位,那么最优的结果将变成疗法1。所以在具体求解使可以根据具体情况考虑,以得到最为准确的选择。
t i ⋅ +
目标为
经过上述分析,发现可以采用目标规划的序贯式算法,即根据优先级的先后次序,
编写程序将目标规划问题分解成一系列的但目标规划问题,然后再依次求解。
治疗方法 1 2 3 4
疗效()
ei 0.0 0.0 0 0.0 0. 3
176
30
154
117(美
()ki
1.225
3.45
2.45
3.65 治疗时间(周)(ti
) 7 1
7.6667
12.25
.1667
7.1250
治疗费用 元/日)
- 17 -
五. 模型的优缺点及推广
5.1 模型的优缺点
在问题一和问题二中,为了计算模型一我们均
结果的准确性有很大提高。
际情况的变量间的函数关系。另
外回
模型一、二中对大量数据的处理方法具有可借鉴性,可以推广到很多具有类别
。模型三的处理方法对很多多目标规划问题具有普遍的意义。
六. 参考文献
[1] 何晓群, 现代统计分析方法与应用,
P222-P224。
eoside Analogues plus Indinavir in Persons with Human Immunodeficiency Virus
金明,张莲花,刘波, MATLAB 工具箱应用, 北京:电子工业出版社,2004。
七. 附录
1.1
采用了聚类的办法来简化处理大
量而离散的数据。对
模型一、二采用回归分析方法处理数据,在难以用机理分析找出自变量与因变量之间关系的情况下,通过回归分析确定了接近实
归还能够在计算的同时检验回归的误差,能很好地说明模型的准确性。模型二还通过病症轻重分类和定义轻症率,大大减少了回归的数据量,进而方便的确定了变量间的关系,对模型所做的有效性检验也得到了很令人满意的结果。模型三具有灵活和易推广性,指标的选择和优先级的确定都是自由的,会可以对具体的问题进行具体分析。但是在模型二中对轻重症分类的标准我们本身也并不确知,所以分类指标带有一定的主观性。
5.2 模型的推广
特性的问题分析中
北京:中国人民大学出版社, 1998,
[2]http://www.math.tku.edu.tw/chinese/faculty/cyc/class/Training%20Courses/doct2.pdf
[3] Scott M. Hammer ,etc.,for The AIDS Clinical Trials Group 320 Study Team, A ControlledTrial of Two Nucl
Infection and CD4 Cells Counts of 200 per Cubic Millimeter or Less, N Engl J Med 1997; 337: 725-733, Sep 11,1997. [4] 姜启源,邢文训,谢金星,杨顶辉, 大学数学实验, 北京:清华大学出版社,2005
[5] 刘琼荪,龚劬,何中市,傅鹏,任善强,数学实验,北京:高等教育出版社,2004
[6] 谢金星,薛毅, 优化建模与LINDO/LINGO软件,北京:清华大学出版社,2005。 [7] 苏
- 18 -
程序
tt=1;p=1;tt=[];
qq(i+1,1)
qq(i+1,1);
)
=tt(:,2);
');
ind(T==2);
ind(T==3);
T]=dendrogram(Z);
23638
23583
Q2=
23446
23524
23545 23708
tt(t,1)=qq(1,1);
tt(t,2)=qq(1,3);
tt(t,3)=qq(1,4);
for i=1:1571
if qq(i,1)~=
t=t+1;
tt(t,1)=
tt(t,2)=qq(i+1,3);
tt(t,3)=qq(i+1,4);
end
end
size(tt
>> vv(:,1)
>> vv(:,2)=tt(:,3);
Y=pdist(vv);
Z = linkage(Y,'ward
T = cluster(Z,3);
q=find(T==1);
q
q=f
q
q=f
q
[H,
结果:
Q1=
23721
23508
23519
23731
23688
23680
23612
23582
23650
23462
23591
23737
23542
23455
23481
23572
23777
23655
23675
23691
23571
23735
23744
23705
23494
23495
23527
23733
23435
23548
23550
23546
23544
23598
23736
23448
23730
23578
23439
23575
23592
23610
23665
23769
23613
23447
23484
23621
23520
23584
23576
23523
23547
23605
23654
23431
23506 - 19 -
23727
23432
23551
23479
23651
23536
23611
23483
23741
23663
23760
23723
23558
23496
23443
23643
23554
23515
23534
23562
23714
23761
23602
23677
23430
23454
23693
23540
23630
23480
23686
23754
23775
23460
23620
23531
23476
23585
23619
23759
23451
23599
23672
23757
23743
23745
23640
23695
23669
23608
23750
23493
23465
23528
23459
23748
23629
23501
23535
23541
23631
23526
23649
23717
23603
23658
23709
23704
23502
23604
23644
23440
23563
23746
23765
23707
23609
23642
23767
23682
23668
23633
23660
23685
23990
23555
23538
23566
23438
23511
23751
23623
23513
23568
23452
23718
23720
23678
23428
23768
23518
23716
23441
23514
23689
23701
23552
23564
23445
23662
23437
23424
23657
23589
23756
23758
23492
23740
23559
23753
23617
23590
23606
23509
23645
23711
23512
23626
23553
23543
23679
23703
23474
23726
23684
23567
23771
23529
23670
23666
23676
23442
23532
23577
23661
23635
23464
23601
23458
23471
23426
23579
23588
23763
23594
23596
23510
23694
23749
23491
23636
23507
23719
23573
23616
23574
23715
23772 - 20 -
23457
23690
23667
23648
23497
23600
23537
23490
23569
23504
23607
23485
23722
23530
23622
23522
23770
23696
23652
23659
23647
23618
23639
23468
23627
23683
23580
23625
23565
23628
23671
23463
23738
23487 23488
Q3=
23453 23472 23516 23624
.2
a;
,4)';
1),x1,x2];
ess(y',X);
23456
23467
23556
23641
23615
23461
23482
23489
23664
23469
23498
23646
23614
23560
23499
23713
23595
23505
23732
23429
23734
23593
23681
23478
23586
23697
23747
23570
23653
23637
23766
23500
23521
23702
23764
23698
23427
23712
23710
23597
23729
23692
23752
23475
23434
23587
23706
23780
23425
23450
23776
23674
23739
23774
23755
23539
23549
23470
23632
23581
23561
23473
23742
23762
23449
23503
23477
23773
23728
23736
23700
23533
23634
23687
23466
23486
23444
23557
23724
23656
23436
1
bo=a
n=1529;
>> y=bo(:
>> x=bo(:,3)';
>> x1=x';
x2=(x.^2)';
>> X=[ones(n,
>> [b,bint,r,rint,s]=regr
>> b,bint,s - 21 -
1.3
size(rint);v=[];t=1;
)*rint(i,2)<=0
v);
1;
o(i,:);
)
.4
12;
,4)';
1),x1];
egress(y',X);
n(b,t)
n’,b0) ;
01 :1 ;
2)+xx) ;
e
2.1
7 8 16 17 23 31 32 33];
0.2128 0.2 0.1111 0.0781 0.1025];
ww=
for i=1:ww(1)
if rint(i,1
v(t)=i;
t=t+1;
end
end
w=size(
m=size(bo);
tt=1;aa=[];j=
for i=1:m(1)
for j=1:w(2)
if i==v(j)
aa(tt,:)=b
tt=tt+1;
end
end
end
size(aa
1
n=10
>> y=bo(:
>> x=bo(:,3)';
>> x1=x';
>> X=[ones(n,
>> [b,bint,r,rint,s]=r
>> b,bint,s
Function y=fu
Y=b(1)*t./(b(2)+x) ;
[b,R,J]=nlinfit(x,y,’fu
bi=nlparci(b,R,J) ;
b,bi ;
xx=0 :0.
yy=b(1)*xx./(b(
plot(x,y, ‘+’,xx,yy),paus
nlintool(x,y,’fun’,b)
x=[0
y=[0.2125 0.25 0.2655 0.2121
- 22 -
n=9;
x2=x.^2;
,1),x',x2'];
s(y',X);
果
0.2235
0.1850 0.2620
=
0.2548
0.1703 0.3394
0.7624 9.6274 0.0134 0.0017
=
0.2637
int =
0.1780 0.3494
X=[ones(n
[b,bint,r,rint,s]=regres
结
b =
0.0046
-0.0003
bint =
-0.0006 0.0098
-0.0004 -0.0001
b
0.0049
-0.0002
bint =
-0.0053 0.0151
-0.0005 0.0000
s =
b
0.0043
-0.0003
b
0.0002 0.0158
-0.0006 -0.0001
- 23 -
s =
0.7219 6.4898 0.0408 0.0013
=
0.2684
int =
0.1629 0.3738
=
0.4782 4.5827 0.0387 0.0035
.1
el:
el/1..3/:P,z,Goal,dplus,dminus,a;
? ?;
0;
17.125;
1250;
m(level:P*z);
dminus(1)-dplus(1)=a(1);
b
0.0137
-0.0004
b
0.0019 0.0256
-0.0007 -0.0001
s
3
mod
sets:
lev
qq/1..4/:k,t,x,f;
endsets
data:
P=?
Goal=? ?
a=0.0154 3.65
k=1.225 3.45 2.45 3.65;
t=7.667 12.25 7.1667 17.
f=0.0176 0.0300 0.0154 0.1173;
enddata
min=@su
z(1)=dminus(1);
z(2)=dplus(2);
z(3)=dplus(3);
@sum(qq:f*x)+
- 24 -
@sum(qq:k*x)+dminus(2)-dplus(2)=a(2);
@sum(qq:t*x)+dminus(3)-dplus(3)=a(3);
@sum(qq:x)=1;
@for(qq:@bin(x));
size(level):
Global optimal solution found at iteration: 0
0000
Variable Value Reduced Cost
0000
Variable Value Reduced Cost
0000
Variable Value Reduced Cost
@for(level(i)|i#lt#@
@bnd(0,z(i),Goal(i)));
end
Objective value: 0.00
P( 1) 1.000000 0.000000
P( 2) 0.000000 0.000000
P( 3) 0.000000 0.000000
Z( 1) 0.000000 0.000000
Z( 2) 200.0000 0.000000
Z( 3) 0.000000 0.000000
X( 1) 1.000000 0.000000
X( 2) 0.000000 0.000000
X( 3) 0.000000 0.000000
X( 4) 0.000000 0.000000
Global optimal solution found at iteration: 0
Objective value: 0.00
P( 1) 0.000000 0.000000
P( 2) 1.000000 0.000000
P( 3) 0.000000 0.000000
Z( 1) 0.000000 0.000000
Z( 2) 0.000000 0.000000
Z( 3) 0.000000 0.000000
X( 1) 1.000000 0.000000
X( 2) 0.000000 0.000000
X( 3) 0.000000 0.000000
X( 4) 0.000000 0.000000
Global optimal solution found at iteration: 0
Objective value: 0.00
P( 1) 0.000000 0.000000
- 25 -
P( 2) 0.000000 0.000000
P( 3) 1.000000 0.000000
Z( 1) 0.000000 0.000000
Z( 2) 0.000000 0.000000
Z( 3) 0.000000 0.000000
X( 1) 0.000000 0.000000
X( 2) 0.000000 0.000000
X( 3) 0.000000 0.000000
X( 4) 1.000000 0.000000
- 26 -__