首页 一个决策树算法案例分析

一个决策树算法案例分析

举报
开通vip

一个决策树算法案例分析nullnull 兵者,国之大事也。死生之地,存亡之道,不可不察也。故经之以五事,效之以计,而索其情。一曰道,二曰天,三曰地,四曰将,五曰法。 夫未战而庙算胜者,得算多者;未战而庙算不胜者,得算少也。多算胜,少算不胜,而况於无算乎? 兵法:一曰度,二曰量,三曰数,四曰称,五曰胜。地生度,度生量,量生数,数生称,称生胜。null4.1 决策分析案例背景 匹兹堡开发公司(PDC)已购得一块地用于建造一个高档的沿河综合商业楼,其位置对繁华的匹兹堡和金三角有很好的景...

一个决策树算法案例分析
nullnull 兵者,国之大事也。死生之地,存亡之道,不可不察也。故经之以五事,效之以计,而索其情。一曰道,二曰天,三曰地,四曰将,五曰法。 夫未战而庙算胜者,得算多者;未战而庙算不胜者,得算少也。多算胜,少算不胜,而况於无算乎? 兵法:一曰度,二曰量,三曰数,四曰称,五曰胜。地生度,度生量,量生数,数生称,称生胜。null4.1 决策分析案例背景 匹兹堡开发公司(PDC)已购得一块地用于建造一个高档的沿河综合商业楼,其位置对繁华的匹兹堡和金三角有很好的景观,所谓金三角是指两条小河汇流成俄亥俄(Ohio)河的地段。每一个建筑物单元的价格是30万~120万,取决于单元所处楼层,面积以及备选的设施。  公司对这套楼房的设计,已制定三个 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 : d1——小型楼,有6层,30个单元; d2——中型楼,有12层,60个单元; d3——大型楼,有18层,90个单元。 决策问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 是要从这三个方案中选择其中之一,并提出决策分析的书面报告,包括分析计算书,建议,以及风险提示。常规(用)决策技术和效用理论null为了进行决策分析,必须做好以下两项工作: (1)市场调研,综合楼被市场接受的程度如何?亦即市场的需求如何? 对此问题,公司管理者通过调研认为,只有两种市场接受状态,称为决策者无法控制的自然 状态: S1——高的市场接受程度,对楼房有显著需求; S2——低的市场接受程度,对楼房需求有限。 (2)要根据工程设计与造价核算以及销售价格计算出不同方案,不同自然状态时,楼房的盈 亏(益损) 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 。对该问题,经计算得到如下益损矩阵Vij:null 其中i——表示方案,j——表示状态。比如:V32=-900万,表示大型楼方案 d3在低 的市场接受S2时,楼房不能正常销售,估计可能带来亏损900万。 4.2 常用决策分析 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载  按照问题面临的自然状态出现的概率无法知道,抑或可以通过调研统计得到,常用决策方法划分为不确定性决策方法与风险决策方法。 一、不确定性决策方法(自然状态出现的概率不知道) 其常用方法有: 1大中取大法或乐观法 对各方案先从不同状态的Vij中取一最大值者,得: 最大值 小型楼d1→800万 中型楼d2→1400万 大型楼d3→2000万←Max·Max 再从不同方案的最大值中取一最大值,为2000万,所对应的方案——大型楼方案d3为决策的最佳方案。 null2 小中取大法或保守法 对各方案,先从不同状态的Vij中取一最小值者,得: 最小值d1→700←Max·Min d2→500 d3→-900 再从不同方案的最小值中取一最大值,如700万,所对应的方案——小型楼方案d1为决策的最佳方案。 3等概率法 该方法认为,不同自然状态出现的概率彼此相等。在等概率原则下,则可分别先将各不同方案的所有自然状态的益损值求和,得: d1→800+700=1500万 d2→1400+500=1900万←Max d3→2000-900=1100万 再从各方案的合计和值中取一最大值,如1900万,所对应方案d2的最佳方案。  null4 最小后悔值原则的方法 该方法相似于保守方法,取悲观态度。首先从益损矩阵中求后悔值,即机会损失值Rij: Rij= V*j-Vij (j=1,2,…,n) (i=1,2,…,m) 式中V*j——对状态Sj而言的最佳决策的益损值; Vij——状态Sj、方案di相应的益损值。 由此,可得后悔值Rij矩阵为:再分别对各方案,从不同自然状态的后悔值中取一最大者,得到: 最大的后悔值 d1 →1200万 d2 →600万←Min d3 →1600万 然后从各方案的最大后悔值中选取一最小者,为600万,则它对应的方案d2为最佳方案。null二、风险决策方法(自然状态出现的概率已知) 既然各种可能的自然状态出现的概率已经通过调研获得,则可以以此求各方案的期望益损值。 令n——自然状态数目; P(Sj)——自然状态Sj的概率。 则有P(Sj)≥0,(j=1,2,…,n); 各方案dj的益损期望值为: 益损期望值为最大者对应的方案,可选为最佳方案。 对本问题而言,若已知:P(S1)=0.8,P(S2)=0.2,则 有: EV(d1)=0.8×800+0.2×700=780万 EV(d2)=0.8×1400+0.2×500=1220万 EV(d3)=0.8×2000+0.2×(-900)=1420万 可见,方案d3建大楼为最佳方案。null 为了较形象直观地作出决策,也可应用决策树方式进行分析,决策树由结点和树枝构成: 决策结点用□表示,由它生出方案枝;各方案枝分别生出状态结点,用○表示,由状态结点引出各种状态分枝,分枝末梢绘上相应的益损值。对本问题有:31420.8 0.20.8 0.20.8 0.280070014005002000-90078012201420d2d3d1首先计算出各个状态结点的期望值,从中选取一个最大期望值,往回找对应的方案,为最佳方案,如上图,④点最大 ,选d3方案为最佳方案。 null§4.4 灵敏度分析 灵敏度分析是将自然状态出现的概率加以改变,来考察这一改变对决策方案选取将带来什么样的影响。比如:高的接受程度S1的概率降到0.2,低的接受S2的概率升为0.8,即P(S1)=0.2,P(S2)=0.8,则有: EV(d1)=0.2×800+0.8×700=720万 EV(d2)=0.2×1400+0.8×500=680万 EV(d1)=0.2×2000+0.8×(-900)=-320万 可见,小楼方案d1为最佳,大楼方案为最差的。 如果问题只涉及两种自然状态,则可以按以下方式求出各方案的临界的自然状态概率: 设自然状态S1的概率P(S1)=P,则自然状态S2的概率P(S2)=1-P。按本问题的益损矩阵,可算得: EV(d1)=P×800+(1-P)×700=100P+700 EV(d2)=900P+500 EV(d3)=2900P-900 null(1)当EV(d1)=EV(d2)时,即100P+700=900P+500 可解得P=200/800=0.25 (2)当EV(d2)=EV(d3)时, 可解得P=0.7 按此,用不同P值(P=0~1.0)可绘出下图: 从图可见,当高的市场 接受状态的概率P<0.25 时,第一方案d1最佳; 当0.25≤P≤0.7时,方案 d2最佳; 当P>0.7时,方案d3最佳。 0.2 0.4 0.6 0.8 1.02000 1500 1000 500 0 -500 -1000 d1可得最大EV的P区间d2可得最大EV的P区间d3可得最大EV的P区间EV(d3)EV(d2)EV(d1)null§4.5 贝叶斯决策方法 前述两种自然状态出现的概率P(S1)=0.8,P(S2)=0.2,只是一种比较粗糙地调研而获得的自然状态的概率分布,也即是一种所谓先验概率。如果我们能够再深挖一些新信息,用以修正先验概率,最终获得一种所谓后验概率,用来进行决策,则决策的效果更好、更科学。  一般讲,补充信息是可以通过对自然状态样本信息设计的实验方法来取得,包括原始资料的采样、产品检验、市场调研等等。比如:通过天气预报的验证信息,来修正天气状态的先验概率;通过产品检验的正确与否的信息,来修正产品的正、废品先验概率。对PDC问题来讲,可以通过市场调查,调查有多少比率的人有兴趣买楼,记为I1,有多少比率的人没有兴趣买楼,记为I2,则可以获得四个条件概率,记为:P(I1|S1),P(I2|S1),P(I1|S2),P(I2|S2),它们也叫做似然函数。 对PDC问题,经过调查,获得了下表的似然函数。 null 这个似然函数的意义是:在真正高接受者中核查为有兴趣(即支持建楼)买楼的概率为0.9,而不支持的为0.1;在真正低接受者中,核查为不支持的概率为0.75,反而支持的为0.25。这些补充信息是在明确了高、低接受者的条件下,进一步调查核实的信息,由此统计出的条件概率。 有了先验概率和似然函数,可以运用贝叶斯全概率 公式 小学单位换算公式大全免费下载公式下载行测公式大全下载excel公式下载逻辑回归公式下载 ,计算出后验概率P(S|I): I=1,2,…..n, k=1,2,…,m 按以上数据,可算得其后验概率为: 有兴趣(支持)买楼者I1的有关概率计算表 没有兴趣(支持)买楼者I2的有关概率计算表 null根据上列概率计算表,可以画出如下决策树:123987654高接受S1,P(S1|I1)=0.935 低接受S2,P(S2|I1)=0.065高接受S1,P(S1|I1)=0.935 低接受S2,P(S2|I1)=0.065高接受S1,P(S1|I1)=0.935 低接受S2,P(S2|I1)=0.065高接受S1,P(S1|I2)=0.348 低接受S2,P(S2|I2)=0.652高接受S1,P(S1|I2)=0.348 低接受S2,P(S2|I2)=0.652高接受S1,P(S1|I2)=0.348 低接受S2,P(S2|I2)=0.6528 百万 7 14 5 20 -98 7 14 5 20 -9小型d1 中型d2 大型d3小型d1 中型d2 大型d3支持的,I1 P(I1)=0.77支持的,I2 P(I2)=0.77null可算出: 状态结点④的EV=0.935×8+0.065×7=7.935 状态结点⑤的EV=13.416 状态结点⑥的EV=18.118……被选 状态结点⑦的EV=0.348×8+0.652×7=7.348 状态结点⑧的EV=8.130……被选 状态结点⑨的EV=1.086  故在决策结点上,应选d3方案;在决策结点上,应选d2方案。 结论是:当市场报告是支持建楼,I1时,应建大型楼;当市场报告是不支持,I2时,应 建中型楼。 23null§4.5 效用与风险分析(Utility and Risk Analysis) 以前所述的决策分析方法是按照最好的货币期望值选择方案,但在决策分析中除了要考虑方案的货币益损因素以外,还要考虑风险程度,包括决策人对待风险的态度这一主观偏好因素。因而,往往单从货币益损期望值选择的方案,不一定是最佳方案。本节将介绍决策分析中的期望效用。 所谓效用是一种特定结果的总价值的相对尺度,它反映决策者面对诸如利润、损失和风险等因素集合的态度。 一般在一些技术较复杂、投资费用较大,开发周期较长的项目中,往往存在许多不确定因素。如前所述如果可以给出这些不确定因素的概率分布,最常用的决策方法是采用益损期望值、其方差和效用函数来进行分析。 案例:某公司有一投资项目,有3个投资方案A、B、C,这三个方案的经济收益取决于今后两年的经济状态,经济状态估计为三种及其概率为:好(0.3);中(0.5);差(0.2)。现估算出如下表的收益值:null各方案的收益期望值Vi,其均方差σi和方差系数γi可按下列公式计算:式中方差系数γ,又称风险系数,因为均方差σ是收益风险的一种测度。按上表的数据,可算得各方案的有关结果为:  VA=1450, σA=350, γA=0.2414  VB=1280, σB=223, γB=0.1742  VC=1580, σC=382, γC=0.2418 从这些结果看,三个方案中没有一个占绝对优势,即没有一个方案既有较大的收益期望值,同时又有较小的均方差和方差系数。因此,无法确定最佳方案,需要进一步分析。为此,可根据效用理论来权衡。 效用函数U(x)是一种相对度量尺度,0≤U(x)≤1,或者0≤U(x)≤10,其中x对本问题而言是收益期望值。 效用函数U(x)值的确定方法较多,其中常用的一种方法是标准博奕法 ,即针对具体决策问题及其收益数据,由决策分析者向决策人一一提问(或决策人自问自答),由决策人一一回答其偏好,或者表明某两个事件之间是否无差异。为此,首先要从数据中选出一最大收益Vmax,设定其效用函数U(Vmax)=10,选出最小收益值Vmin,令U(Vmin)=0。null 对本例而言,U(2000)=10,U(800)=0;然后,由决策者的偏好,一一确定其余7个收益值V的效用值(0
本文档为【一个决策树算法案例分析】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_568629
暂无简介~
格式:ppt
大小:239KB
软件:PowerPoint
页数:0
分类:互联网
上传时间:2012-11-30
浏览量:97