首页 企业财务预警PCASVM模型研究

企业财务预警PCASVM模型研究

举报
开通vip

企业财务预警PCASVM模型研究 第32卷 110L32 第9期 旭9 计算机工程 ComputerEngineering 2006年5月 May2006 ·开发研究与设计技术· 文章缩号,100(卜’3428(2006)09卅233—m3文献标识孙A 中圈分类号一TP311 企业财务预警PCA.SVM模型研究 李贺It冯天瑾2,丁香乾2,张红兰2 (1.青岛理工大学通信与电子工程学院,青岛266033;2.中国海洋大学信息工程中心,青岛266071) 籀耍:将主成分分析(PCA)和支撑向量机(SVM)结合,提出了一种分行业、适...

企业财务预警PCASVM模型研究
第32卷 110L32 第9期 旭9 计算机工程 ComputerEngineering 2006年5月 May2006 ·开发研究与设计技术· 文章缩号,100(卜’3428(2006)09卅233—m3文献标识孙A 中圈分类号一TP311 企业财务预警PCA.SVM模型研究 李贺It冯天瑾2,丁香乾2,张红兰2 (1.青岛理工大学通信与电子工程学院,青岛266033;2.中国海洋大学信息工程中心,青岛266071) 籀耍:将主成分分析(PCA)和支撑向量机(SVM)结合,提出了一种分行业、适用小样本空间的财务预警模型:PCA—SVM模型。以传统财 务指标为基础,通过主成分分析,简化输入向量,并利用SVM作为判别企业状态的工具。该文利用了SVM提取优秀企业各比率之间的内 在相关知识,作为评判企业状态的依据,克服了以往在区分企业状态方法上线性判别的局限性,也克服了小样本条件下BP网络推广能力 不强的缺陷。 关健诃:主成分分析;支撑向量机;上市公司财务;企业危机预测 PCA-SVMModelsforEarlyWarningofEnterprises ThroughFinanceData LIHel,FENGTianjin2,DINGXiangqian2,ZHANGHonglan2 (1.CollegeofCommunicationsandElectronics,QingdaoTechnologicalUniversity,Qingdao266033; 2.InformationEngineeringCenter,OceanUniversityofChina,Qingdao266071) [Abstract]Thispaperproposesanewmethod:PCA—SVMmodelwhichiscomposedofPCAandSVMtoclassifythestateofenterprisethrough financedata.Themodelisfitforcompanyinonespecialtrade.ItusesPCAtOpredigesttheinputvectorandusesSVMtOjudgethestatementofthe company.ItovercomesthelocalizationoflinearitydistinguishinoldmodelsanditneedslesssamplestotrainthenetthanBE [Keywords]PCA;SVM;Financedataoflistedcompanies;Earlywarningofenterprise 1概述 企业财务预警,是通过对企业财务报表及相关经营数据 的分析,判断企业所处的经营管理状态。企业预警的传统模 型主要包括:一元判别法(单变量模型)(FitzPatrick,1932), 以单变量作为评判企业的依据,都存在单个指标无法全面反 映企业财务特征的缺陷。1968年,Altrnan首次提出z—score 多元判别模型,通过多元线性判别式产生判别分,称为z值, 依据z值进行判断。该模型弥补了一元判别分析法的某些缺 陷,成为预测财务危机和破产的经典模型。1977年,z模型 被改进为AZETA模型(Altman,Haldeman&Narayanan),通 过对z模型比率进行修正和增补,提高了预测准确率。我国 学者杨淑娥、徐伟刚⋯利用主成分分析法建立v分数模型。 另有Fisher线性判定分析、多元线性回归分析和Logistic回 归分析等方法“1。但是,这些传统财务预警模型都没有突破 线形判别方法的局限性,而且均为静态判别,无容错性,无 法动态学习和调整。 由于神经网络在模式识别领域的良好表现,近些年来已 被用于企业预警。杨保安等将BP神经网络用于企业危机预 警¨J。用足够的已知分类的财务比率作为样本,训练神经网 络,使不同的输入向量对应不同的输出值。神经网络模型在 训练(学习)过程中发现、归纳与概括财务比率的特性及相互 关系,以隐含形式分布存储在网络模型内部,并具有推广(泛 化)能力。 。 但是,传统BP神经网络需要大量的训练样本作基础; 如果样本数据量不足,训练后神经网络的推广能力就非常有 限。为此,本文将SVM(SupportVectorMachine)这一基于统 计的模式识别工具引入企业预警模型。SVM在小样本空间的 良好分类能力,不仅突破了线性判别模型的限制,也克服了 BP神经网络要求大量训练样本的困难。 2模型构建与研究思路 本文提出的方法是:(1)对原始数据进行预处理,形成样 本数据;(2)对样本数据进行主成分分析(PCA);(3)利用SVM 构建企业预警模型。对数据进行主成分分析和利用SVM分 类可看作是一个完整的模型的两部分。 PCAnl的基本思想是,将原有多个变量用少数几个潜在 的主成分(因子)、具有正交特征的线性组合来表示,即将众 多变量压缩为若干具有代表性的、信息最丰富的少数合成变 量,克服了变量选择时的冗余和相关。主成分分析是使数据 维数减少,将复杂数据变成相对简单数据,便于进一步分类、 处理、存储和管理的有力工具。SVM是一种统计学习方法p‘, 它的主要思想是:把输入空间中线性不可分问题通过非线性 变换映射到高维线性可分的特征空间,在此高维空间中构造 最优线性分类面。SVM是一种有效的模式识别工具,尤其适 合于小样本问题。而企业财务预警实质上是根据财务指标对 企业状态进行分类的问题,所以采用PCA与SVM联合模型 实现企业财务预警。 本文选择酒类行业17家上市公司1999~2003年连续4 年的年报财务数据作为基础数据。主要基于如下考虑: 基金项目:青岛市自然科学基金资助项目(2002—1—2r-11) 作者倚介:李贺(1980一),女,硕士生,主研万向:人工智能,神 经网络,模式识别;冯天瑾、丁香乾,教授;张红兰。硕士生 收藕日期:2005—06-09E-mail:sdlclh@yahoo.corn.cn 一233~ 万方数据 (1)上市公司企业财务报表经过第三方审计,可以保证 相关性。利用主成分进行初步分析,如表2。 一定的真实性; (2)以原始数据作为依据,可以减 少因不同统计方法带来的误差; (3)选用酒类一个行业的企业,可 以消除行业不同带来的财务比率的差 异,而酒类行业受宏观经济景气循环 影响较小。 由于我国证券市场现实因素,破 产公司鲜有出现,因此只能把上市公 司中的ST类公司定义为“财务危机” 或“财务失败”的企业,另外某些虽 不是ST企业,考虑其财务指标的优良 状况和专家意见,其经营状况明显不 佳的企业,将其划分为“具有潜在危 机的企业”。 我们删除了某些值明显偏离平均 值的个别奇异样本。在所选取的87个 企业样本中,经营状况良好48个;ST 公司20个;非sT企业,但需要引起 关注的19个。 本文在参考了以往研究文献和财 政部颁布国有企业绩效评价指标体系 的基础上,考虑破产公司的明显特征 (不能清偿到期债务),选定包括偿债 裹2财务比率膀檑美熏致 XlX2X3X4 X5 X6 X7 X8 X9X10XllX12X13x14X15X16X17 Xll D.78G0.060。o.735.o.4290.462.0.068.o.226.O.23lD.02I.0.132O.178o.276o.2490.109o.278o.249 X2 1 D.066.0.566.O.32lO|300.O.008.0.17l,O.180D.085-O.068o.254O.179o,190o.0460.18lO.190 X3 l -0.097.0.0640.101.o.016O.1530.15lo.2580.162.o.078O.06lo.047o.066o.038o.087 X4 1 o.369.0.852.o.0460.254o.196o.009O.148.0.158.o.458.o.43(3.o.053.o.337.0.515 X5 1 .0.073.o.038o.384o.300o.074o.234.o.028O.2810.179o.047o.008O.39l X6 l O.061.O.144.0.1080.039.o.0580.166O.5440.480o.073o.357o.645 X7 1 0.10lo.295D.017o.258O.0lOo.032o.022o.080o.099o.087 X8 l o,522D.227o.406.o.273O.1570.11lo.245o.085o.176 X9 l D.274o.806.o.047O.1770.【22o.375o.208O.26l X10 l o.696O.1150.2200.20lo509o.420o.392 X1l 1 o.045o.24lO.172o.597o.40lo.420 X12 l 0.1850。208o.[04o.2030,24l X13 1 o.850o.5890.55lo.845 X14 1 o.493o.4730.719 X15 0.719o.557 X16 l O.6ll X17 1 能力、盈利能力、现金流量能力、发展能力等在内的17个财 务比率指标作为研究对象(见表1)。 短期 流动比率X1 流动资产/流动负债 偿债 速动比率X2 (流动资产-存货),流动负债 能力 现金比率X3 (货币资金+短期投资)/流动负债 长期 资产负债率X4 负债平均总额/资产平均总额 偿债 负债权益比率x5 负债总额,股东权益 能力 股东权益比率X6 股东权益/总资产 应收账款周转率X7 主营业务收入净额/平均流动资产 存货周转率X8 主营业务收入净额/应收账款平均余额 营运 流动资产周转率X9 主营业务收入净额/平均固定资产净值 能力 固定资产周转率XIO 主营业务成本,存货平均余额 总资产周转率X11 主营业务收入净额/平均资产总额 主营业务毛利率X12 (主营业务收入净额一主营业务成本) ,主营业务收入净额 盈利 主营业务利润率X13 净利润/主营业务收入净额 能力 成本费用利润率x14净利润/(主营业务成本+销售费用+管 理费用+财务费用 净资产收益率X15 利润总额/平均股东权益 每股收益X16 利润总额/年末普通股股份总数 总资产收益率X17 利润总额/平均资产总额 3实证研究及分析 对样本集(共17家4年的财务比率数据)利用SPSS统计 软件进行主成分分析。 3.1原始比率变量分析 首先,提取主成分实现维数压缩,减小各输入值之间的 ~234一 (1)17个财务比率指标之间的互相关系数较大,存在较大的冗余 性,有简化空间; (2)由定义决定的较强相关比率:流动比率(x1)与速动比率(x2) 相关系数为0.78,说明二者相关性较强,与二者比率组成相符,流 动资产周转率(x9)与总资产周转率(Xl1)相关较强(0.806),主营业务 利润率(X13)与成本费用利润率(X14)相关性较强(O.85),净资产收益 率(X15)和每股收益(X16)相关性强(O.719),固定资产周转率(x10)与 总资产周转率(X11)相关系数为O.696; (3)相关性稍弱的有X6与XI3(O.544)、X6与X14(0.48)、X8与 X9(O.522)相关系数均为0.5左右,说明反映企业不同能力比率之间 的关系,存在冗余; (4)股东权益比率X6与总资产收益率X17相关系数为0645, 说明长期偿债能力与盈利能力有较强的相关性; (5)营运能力与盈利能力相关性较小,短期偿债能力和长期偿债 能力大体呈现负相关性。 3.2主成分逸舞及解释 各主成分的特征值和贡献率见表3。选取特征值超过1 的主成分,则有5个主成分因子,包含原来74.409%的信息 量。为了对这5个因子进行解释,就需要得到17个原始财务 比率指标对这5个主成分因子的因子载荷(即原始指标与主 成分因子的相关系数),见表4。 主成分 特征值 贡献率% 总贡献率 l 5.052 29.715 29.715 2 3.610 21.238 50.953 3 1.629 9.585 60.538 4 1.236 7.268 67.807 5 1.122 6.602 74.409 从因子负荷矩阵可知: (1)主成分Fl主要由x13、X17、X15、X16、X14、X6解释, 这6个比率的因予载荷量远大干其他指标,它代表的是企业的短期、 长期偿债能力(股东权益比率)和盈利能力。 万方数据 (2)主成分F2主要由X1、X2、X4、X5、X8、X9、X11节时, 这7个比率的因子载荷量远大于其他指标,它代表的是短期、长期 偿债能力和营运能力。 (3)主成分F3由X5、XIO和X11解释,代表长期偿债能力、企 业营运能力。 (4)主成分F4由X12、X3解释,代表的是营运能力和短期偿债 能力。 (5)主成分F5由X7解释,代表的是企业营运能力。 根据表3,可得各主成分因子与原始财务比率指标的关 系式为 F=X4A。 Component 1 2 3 4 5 l 0.441 .0.690 0.323 8.612E.02.4.725E.02 X2 0.364 .0.584 0.389 2.41lE.02.1 957E.02 X3 0.163 8.725E.020.343 0.503 .0.433 X4 .O.59l 0.698 .3.414E.02.O.271 .0.101 X5 O.12l 0.556 一O.613 3.234E.02.6.977E.02 X6 0.631 .0.486 .0.222 0.294 0.1lO X7 0.130 0.178 0.204 0.208 0.833 X8 0.172 0.630 .2.323E.020.419 .8.998E.02 X9 O.3ll 0.709 0.204 0.196 0.258 XlO 0.49l 0.389 0.439 .O.184 .0.298 Xll 0.494 0.692 O.391 .4.793E一029.179E.02 X12 O.281 .0.212 1.829E.02.0.609 0.163 X13 0.856 .2.745E.O§二.0.379 2.022E.02—4.535E.02 X14 0.778 .5.270E.02.0.360 .1.247E.02.4.867E—02 X15 0.701 0.363 0.174 .0.289 .9.479E.02 X16 0.758 7.466E.020.125 .0.253 “1.425E.03 X17 0.908 6.885E.02—0.284 3.637E.024.644E.03 3.3建立模型识别部分 根据主成分分析结果,以主成分变量F1~F5作为输入, 以SVM作为模式识别工具。 实验设计:软件环境,Matlab6.5,SupportVectorMachine Toolbox;采用SMO训练算法,结合DDAG(DecisionDirected AcyclicGraph)实现多类划分;采用高斯核函数,主要参数: kernel=rbf(0.1),c=100.0;5个输入节点,分别对应于选取 的5个主成分指标,输出为m×n矩阵,n为分类类别数, 此处为2或3。 实验1二类划分,将训练样本分为2类(正常、报警), 采用3类样本(正常、关注和报警)进行测试。具体如表5。 正常 关注 报警 总数 训练样本 20 20 无 40 测试样本 5 5 5 15 测试结果 5 lO 无 15 分析:正常类样本100%正确识别,关注类样本100%正 确识别,报警类测试样本被识别为关注。说明支撑向量机提 取正常与关注的区别特征,并可利用这种特征进行正确的分 类识别。证实了利用支撑向量机进行财务数据分类的可行性。 实验2三类划分,将样本数据分为3类(正常、关注和 报警)。具体如表6。 正常 关注 报警 训练样本 40 15 16 测试样本 8 4 4 测试结果 9 2 5 分析:正常类样本全部正确识别;关注类样本有2个正 确识别,1个误识为正常,一个误识为报警;报警类4个样 本全部正确识别。由于企业样本自身分类的模糊性,关注类 样本介于正常和报警类样本之间,此处测试结果在可接受范 围之内。由于SVM的c类划分是由c(c一1)/2个2类SVM分 类器组成,每个SVM只对其中的2类进行区别,可能出现 无法正确区分的情况。 实验3采用BP神经网络进行2类划分。BP网络采用 7×16×2结构,取r/=0.3,a=0.3,按误差定为0.05。网络输 出[1O】。表示正常类样本,【01]1表示预警类样本。训练样本 为:正常34,报警16;训练结果:网络经过5000步训练, 未能达到收敛到0.05的目标。采用正常、报警样本各3个进 行测试。 期望输出:l1 1 1 o o o LO 0 0 1 1 1J 实际输出: 0.4380.752O.3210.2720.512-0.198 0.7970.3llO.6730.98l O.87l 0.973 可见,只有第2、4、6个样本接近期望输出,BP网络不 能达到正确区分测试样本的预期目的。 3.4结果分析 (1)利用SVM提取样本的内在规律,作为判别企业状态 的根据。克服通过线性判别式得出得分和根据有限样本得分 确定评价标准局限性。同时,SVM的区分能力也优于BP神 经网络。 (2)Y分数模型建立在对所有行业企业数据的统计基础 上,较笼统。在特定行业中,受样本分布及数量限制,不能 确定一个有效的F值作为分类标准。本文提出的PCA·SVM 模型,将样本类别规律性包含在SVM内部参数中,无需再 次计算确定。可在某一具体行业、小范围内搜集数据,建立 模型,进行判断。这是由SVM小样本分类的良好区分能力 决定的。 (3)从实验结果可以看出,在训练样本确定的情况下,BP 神经网络不能有效提取不同类别企业的财务数据特征。 (4)由于样本数量的绝对限制,PCA-SVM模型尚有一定 缺陷,比如:准确率达不到100Vo的正确,多类划分出现误 差。但是,也可以看出,在相同样本数量条件下,多变量模 型根本无法使用,BP神经网络也未能提取其分类特征,SVM 在同等条件下达到的效果,也在我们可以接受的范围之内。 PCA.SVM模型是将人工智能算法与传统方法结合构成新型 专家系统的一次有效尝试。 4结论 从实证分析过程来看,PCA.SVM模型摆脱了单元和多 元判别模型方法的局限,突破了依赖线性函数建立判别模型 的限制,克服使用BP神经网络必须获得充分大量训练样本 的困难,用非线性函数更好地拟和了样本数据,实现了方法 上的创新。从结果来看,在小样本数据条件下,SVM预测精 度远远高于其他方法,具有其他方法所不具有的优越性。 (下转第238页) 一235— 万方数据 件发送请求,如果外网服务器或内网服务器指定的信息目录 内有需要交换的数据,则在外网或内网与信息渡船连通时, 通过数据交换服务软件将数据传递到信息渡船上,数据在信 息渡船缓冲区中暂存,在信息渡船切换到内网或外网时,将 数据传递到目的服务器的指定信息目录中,完成一次信息交 换的操作。具体过程如图2所示。 从图中可以看出,系统主要由信息渡船、内网数据交换 服务软件、外网数据交换服务软件3部分构成。其中,内网 数据交换服务软件、外网数据交换服务软件分别安装在内网 服务器和外网服务器上。 信息渡船子系统主要完成在物理隔离的状态下,通过继 电器开关的切换实现物理层的通断,从而保证信息交换在严 格的物理隔离情况下进行。 内网数据交换服务软件主要负责向信息渡船及内网上的 业务网络提供各种数据交换所必需的服务,包括用户注册与 权限分配,用户身份校核,对被交换信息进行打包、解包、 过滤、审核、装载入库等数据交换服务接El;外网数据交换 服务软件主要负责向信息渡船及外网上的公共用户提供包括 用户身份校核,对被交换信息进行打包、解包、过滤、审核、 装载入库等数据交换服务接口。 在此基础上,可以集成各类应用模块如邮件自动接收发 送模块、自动数据交换模块以及其它电子政务应用扩展模块, 完成各类内外网数据安全交换服务。 3系统的设计特点 3.1安全交换特点 (1)物理隔离策略 利用网络电子开关切换交换部分与网间连接,保证了网 间的物理隔离。 (2)信息交换系统整体策略 采用“码头一渡船一码头”的分解控制信息交换模式, 以加强管理、认证、审计。 (3)“瘦”信息渡船策略 减缩信息渡船的资源,去除硬盘,只用内存,简化操作 系统和服务软件功能等,不为黑客、病毒等留有可用资源。 (4)码头服务及强访问控制策略 网间信息交换应是专用的非公用信息通道,增加码头管 理节点不但可以提供信息交换的缓存,并可以为信息通道的 使用加岗设哨,实现码头服务强访问控制。从管理层面上建 议码头服务只向应用服务器开放,任何客户端不能直接调用 该服务。 (5)自用信息交换规范策略 采用上述相关策略,可以有效地防范在信息交换过程中 黑客和病毒的侵入。同时,本方案支持采用自用信息交换规 范和审核策略,以滤除非有效信息。即只检查是否为自用信 (上接第235页) 参考文献 1杨淑娥,徐伟刚一七市公司财务预警模型——Y分数模型的实证 研究[J].中国软科学,2003,(1):57—60. 2吴世农,卢贤义.我国上市公司财务困境的预测模型研究【J].经 济研究,2001,46(6):46—55. 一238一 息,而不去分析是否为脏数据、黑客和病毒信息,黑客和病 毒信息千变万化难于即时辨出。 (6)第三方安全防范产品接I:1策略 码头服务提供多种认证、过滤和安全防范接口,以最大 限度集成现有的安全产品,防止脏数据、黑客信息、病毒信 息的传入。 3.2其它扩展特点 (1)码头服务可扩展为数据交换中心 码头服务可扩展为所在网域中各应用服务间的数据交换 中心,并通过网间信息渡船实现安全可信的广泛信息交换和 共享。 (2)高效的信息交换服务 码头服务提供信息交换的缓存,可以不用等待渡船的到 来,快速响应应用服务的请求。“瘦”信息渡船采用闪存,简 捷的软件和快速的存取提供了高效的信息装卸能力。 (3)具有广泛的适用性 网间信息交换系统可以广泛地用于各种物理隔离网间的 信息交换。码头服务系统采用Java语言和Web服务计算模式 设计,实现跨平台。 4结束语 通过信息码头模型的建立,形成了独特的网间信息交换 体系结构,以及网间信息交换部分。该成果在《中国电子政 务应用试点示范工程》项目的课题《中国电子政务空间辅助 决策示范工程>>的专题《面向行政区域的国民经济与社会发 展的辅助决策支持技术的应用》中予以实现,并应用它完成 了电子政务建设大型项目“辽宁省党政信息网”的政务数据 交换业务的主体部分。目前,该产品已经在省政府办公厅开 始应用,通过该交换平台,实现了“省长信箱”来信和其它 电子邮件的快速、自动、安全收集并自动加载入库;实现了 信息的自动转入内网处理,大大提高了工作效率,并达到了 如下实际效果: (1)保证安全,实现及时信息交换; (2)提高了工作效率和准确性,减小了劳动强度; (3)实现了外网信件的安全过滤。 参考文献 1黄志澄.我国电子政务的现状与发展[J]国际技术经济研究,2003 6(1):12-18. 2宋军.加速我国电子政务建设的意义[J]中共山西省委党校学 报,2003,26(3):51-52. 3 HammerM,ChampyJ.ReengineeringtheCorporation:AManifeso forBusinessRevolution[M].NewYork:HarperCollins,1993. 4FerraioloDF’SandhuR,GavrliaS,eta1.ProposeNISTStandardfor Role—basedAccessControl[J].ACMTransactionsonInformationand SystemSecurity,2001,4(3):224. 3杨保安,季海,徐 晶等.BP神经网络在企业财务危机预警之 应用fJ】.预测,2001,20(2):49—54. 4袁志发,周静宇.多元统计分析[M].北京:科学出版社,2002. 5VladimirNV.张学工译.统计学习理论的本质【M】.北京:清华大 学出版社,2000. 万方数据
本文档为【企业财务预警PCASVM模型研究】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_859634
暂无简介~
格式:pdf
大小:355KB
软件:PDF阅读器
页数:4
分类:管理学
上传时间:2011-04-25
浏览量:28