BP神经网络在福利彩票预测中的应用

BP神经网络在福利彩票预测中的应用第36卷第4A期计算机科学 V01．36No．4A ；QQ2生!旦≤至!里巳坚!曼!墨!i曼翌兰曼 △巳!：；QQ! BP神经网络在福利彩票预测中的应用涂晔车文刚 (昆明理工大学信息工程与自动化学院昆明650051) 摘要采用BP网络的3种改进算法，对福彩双色球(2008073期一2008133期)的历史中奖数据进行分析，建立了基于BP神经网络的双色球预测模型，并对3种改进算法的训练结果进行了比较。与现存的彩票分析方法不同的是，本方法并非基于频数分析缩小样本集来产生预测号码，而是基于BP神...

第36卷第4A期计算机科学 V01．36No．4A ；QQ2生!旦≤至!里巳坚!曼!墨!i曼翌兰曼 △巳!：；QQ! BP神经网络在福利彩票预测中的应用涂晔车文刚 (昆明理工大学信息工程与自动化学院昆明650051) 摘要采用BP网络的3种改进算法，对福彩双色球(2008073期一2008133期)的历史中奖数据进行分析，建立了基于BP神经网络的双色球预测模型，并对3种改进算法的训练结果进行了比较。与现存的彩票分析方法不同的是，本方法并非基于频数分析缩小样本集来产生预测号码，而是基于BP神经网络对历史数据进行学习，挖掘其中隐含的规律，生成用来预测号码的神经网络节点的连接参数，再根据这些参数产生下一期预测号码。关键词BP神经网络，改进算法，福彩预测 ApplicationofBPNeuralNetworkint0PredictingtheWelfareLottery TUYeCHEWemgang (FacultyofInfonnationEngineeringaJldAuto眦tion，KunmingUniversityofSciencearIdTechnology，Kuming650051，China) AbstractAccordingtotheanalysisof(No．2008073一No．2008133)historicrecordeddataofwelfarelottery-Shuangse- qiu，amodelisdevelopedtopredictwelfarelotterybasedonBPneuralnetworkThemodelisopt确zedwiththreedi’ ff敛啦n遮零r钾edBPa【g蕊tk璐andthetrai趣res心tsarecolnpared．k’sdiffer镪nfromthee矗stedanalyzing订蛇thods oflottery．Thismethodisn’tbasedont畹esamlysisarldreducir培s锄plesettopredictdata，butbasedon上沪neural networktole锄thehistoricrecordeddataandfindthehidd朗regularity，thenautomatical】yproducethenextpredicting dataaccordingtotheconnectingpar帆eterofneuralnet、Ⅳorkjoint． K9ywor凼BPneuralnetwork，hnprovedalgorithm，Welfare10tterypredictillg 1 引言彩票业在我国是一个发展空闯极大的新兴产业，彩票业不仅在特定领域发挥了重要作用，还影响到出版、印刷、电视、广播、交通等多种行业的发展。积极发展我国的彩票业，将对我国经济建设和社会发展产生更加积极的影响。目前在中国，福利彩票双色球以每星期开奖三次，最高奖额五百万元人民币，每期奖池奖金累计过亿的雄厚实力，吸引着庞大数量的彩民，而彩民朋友们最为关心的就是如何预测当期的开奖号码，因此对福利彩票双色球奖号的预测具有十分重要的研究意义。 2福彩双色球预测依据首先必须强调的是，只要摇奖机的构造能够保证任何一个球的出现都完全随机，那么，每个号码的出现都具有相等可能性，即出现的机率都是一样的。据此，根据福利彩票双色球的游戏规则，数字完全自由组合后，将可能产生一千七百多万组不同号码，任何一个彩民购买一组号码，他的中奖机率都只有一千七百多万分之一，无论什么“专家”或者“大师”都无法准确预测所谓的中奖号码。然而，把每期出现的中奖号码进行统计，积累到一定量之后，就能发现各数字总共出现的频率特性。如奇偶比、遗漏期 K值、区段出号码数字、数出频率的次数、二数同出数组等。例如“上海风采”福利彩票网站根据上海风采发售以来的历史资料，认为数字分布具有一定的规律性：①奇数与偶数出现的次数应各占总数的1／2；②1～18数组、19—35数组的出现次数各占总数的l／2；③1—12区段、13—24区段、25—35区段，三段数的出现应各占总数的1／3。既然奖号的出现有了规律可循，各种各样的彩票预测方式也应运而生，这些方式都是通过数字统计与图表分析，运用概率论理论来判断冷热号码出现的周期，分析号码可能出现的区段，缩小精选号码范围，为新一期选择投注号码提供依据，从而达到排除某些号码组合，减小号码排列样本集，从而提高中奖率的目的。虽然号码是根据科学依据推算出来的，但这些选号方式明显带有个人喜好与主观意愿。这是因为从统计学的大数规律讲，再大的样本集也是估计，都有不中的可能。于是，研究其它科学有效的测算途径就显得迫切需要了。双色球号码预测过程可认为是一种复杂非线性函数关系的逼近过程，要对其进行较为准确的预测，就必须采用能捕捉非线性变化规律的预测方法。BP神经网络具有逼近任意连续函数和非线性映射的能力，并可进行高维非线性的精确映射。它是由大量的，同时也是很简单的神经元通过广泛的互涂晔女，硕士，主要研究领域为人工智能、多媒体通信等，E-mail：sher码r000@to札com；车文刚男，教授，硕士研究生导师，主要研究领域为模式识别与智能系统、金融时间序列分析等． ·310· 相连接而形成的复杂网络系统，它反映了人脑功能的许多基本特性。其信息处理是通过学习，动态修改各神经元之间的连接权值使系统不断产生“进化”来实现。本文所要讨论的方法就是基于BP神经网络对福彩双色球历史数据进行学习，挖掘中奖号码中隐含的规律，生成用来预测号码的神经网络节点的连接参数，然后再根据这些参数生成下一期预测号码。 3 BP神经网络及其改进学习算法 3．1 BP神经网络原理 BP神经网络是一种具有三层或三层以上阶层型结构的神经网络。层间各种神经元实现全连接，即下层的每一个神经元与上层的每个神经元都实现权连接，而每层各神经元之间不连接。网络中每一层神经元的连接权值都可以通过学习来调整。当给定一个输入节点数为竹、输出节点数为s的BP 网络，输入信号由输入层到输出层传递，通过非线性函数的复合来完成从行维空间到s维空间的映射，该过程是向前传播的过程；如果实际输出信号存在误差，网络就转入误差反向传播过程，并根据误差的大小来调节各层神经元之间的连接权值。当误差达到人们所希望的要求时，网络的学习过程就结束。 3．2 BP网络改进学习算法传统BP网络的学习算法实质上是一种简单的最速下降静态寻优算法，在修正权值w(走)时，只是按照志时刻的负梯度方式进行修正，而没有考虑到以前积累的经验，即以前时刻的梯度方向，从而常常使学习过程发生振荡，通常具有收敛速度慢、易陷入局部极小值和网络推广能力不强等方面的缺陷。本文采用MATLAB神经网络工具箱提供的3种改进快速学习算法，有效克服了传统BP网络学习算法的缺陷。 3．2．1动量梯度下降反向传播算法(trair培dm) 该算法在对权重和阈值更新时不仅考虑当前的梯度方向，而且还考虑了前一时刻的梯度方向，从而降低了网络性能对参数调整的敏感性，有效地抑制了局部极小，但收敛速度较慢。 3．2．2L创erll)e孵Marquardt优化方法(trainhn) kvenbe曾Marquardt优化方法能够根据网络训练误差变化情况，自动调节网络训练参数口，使网络实时采取适宜的训练方法。当口较小，网络训练过程主要依据GausS-Ne嘶on 法；当口较大，网络训练过程主要依据梯度下降算法。该训练函数的效率优于梯度下降法，但占用内存较大，适用于规模较小的网络。 3．2．3kVenbeWMarquardt优化方法与Bayesian正则化方法(trainbr) traillbr函数采用kvenberg_Marquardt优化方法进行网络权值和阈值的最优化搜索，并采用Bayesian正则化方法在网络训练过程中自适应地调节性能函数比例系数的大小，使其达到最优，并且采用trainbr函数训练后BP网络具有较好的推广能力。 4 BP神经网络的双色球预测模型的确定 4．1 BP网络模型确定输入层和输出层确定。福彩双色球的备选号码为01— 33号红球加上01—16号蓝球，其中从33个红球中选择6个号码，从16个篮球中选择1个号码，这样组成6+1的组合模式。每组历史中奖号码均为7个数字，因此，输入层神经元个数定为：以=7。网络的输出，即为预测的双色球中奖号码，所以输出层神经元个数为：s=7。BP神经网络预测模型如图l 所示。 Xl X2 输入层慧台是输出层 Y 图1 BP神经网络预测模型 4．2 BP网络设计中的数据处理 4．2．1输入数据的预处理由于BP神经网络的隐层一般采用SigⅡloid转换函数，所以，需要对输入数据进行归一化处理，这里采用如下公式：瓦：≠啬L砌+面^nHx^ m妇其中X～，k分别为输入样本五的最大值和最小值，X为处理后的样本输入值，d1，函分别取o．998和0．001。 4．2．2输出数据的反变换处理为了防止部分神经元达到过饱和状态，对输出样本亦需作如上变换。这样实际上将输入输出样本变换到[o．001， o．999]区间，避免了。和l两个值。因为。和1恰好是Sig— moid型函数的极小值和极大值，要求联接权足够大才能使网络的输出值与其匹配，从而需要相当多的训练次数来不断修正权值，导致训练速度缓慢。因此网络输出的结果要进行反变换才能得到预测值。 4．3双色球预测神经网络模型MAll。AB仿真实现 4．3．1创建改进的BP网络使用MATLAB利用如下代码创建一个符合上述要求的 BP网络：饥他饥D掰一[o1；o1；o1；o1；o1；o1；o1]； "以="叫(施僧访。掰，[隐层节点数，7]，{‘tansig‘， ‘logsig’}，‘训练函数’)；其中，threshoId设定了网络输入向量的取值范围[O，1]和输入神经元个数为7。输出层节点数为7．输入层到隐含层的变换函数为tansig，隐含层到输出层的变换函数为logsig，网络所用的训练函数将分别采用3种改进的BP学习算法，分别为：traindm，trainlm，trainbr。 4．3．2BP网络的训练与测试 ①隐含层节点的确定。分别选取节点数为15，18，20来对网络进行训练，设定预测精度为O．01，综合考虑网络性能和训练速度，发现隐含层节点数为18个时，网络对函数的逼近效果最好，20个时其次，15个时最差。 ②网络测试。经预处理后的训练样本数加载到所建立的人工神经网络上，即可用BP算法对网络训练。为了检验训 (下转第315页) ·311· overCableNetworks∥PrDceedjngsoftbeSev明tbI玎temational SymposiurnonComputersandconlnlufli∞tion＆IEEE，200Z (2)：577—562 [4]szigetiT，ch“stinaH．En士to-EndQ。sNetwDrkI)esign：Quali— tyofDleSigninLANswANs，Ⅵ1Ns[M]．P0sts＆Telecom Press，2007(1)：49—144 (上接第311页) 练后神经网络解决问题的能力，通常需要测试样本对训练后的网络进行测试和检验，以便对比分析预测结果和实际值之间的误差。通过训练和测试之后的神经网络模型才可用于双色球奖号的预测。 5预测结果分析以双色球历史开奖数据2008073期一2008133期的数据作为训练样本，2008130期的数据作为测试样本，对BP网络进行训练仿真。根据网络多次训练结果比较，确定隐层节点数为18，期望误差为o．02。用有效性系数COE和相对误差 EQ来判断经3种改进算法训练后网络的性能，比较拟合和预测效果，公式如下：魄一车挲二竺杀j蚤(y卜矽～墨lyi一刍EQ=型—_ 二yi l；I 3种改进算法的拟合结果如表1所列。表1 3种改进算法的拟合结果测试样本为2008130期的数据，即(011218283032+ 06)，期望输出(实际值)为2008131期数据，即(0212151822 32+08)，分别运用3种改进BP算法进行预测。预测值与实际值比较如表2所列。表2预测值与实际值比较 2008131期网络各媒体专家工作室预测结果选登如表3 所列。表3 由训练结果和预测结果可知，对传统BP网络学习算法作出不同改进的3种学习算法在实际应用中它们的性能各不相同。traingdm函数拟合精度最低，这是因为traingdm函数虽然采用了动量梯度下降反向传播算法，能够有效地抑制局部极小。但其收敛速度太慢，训练多次也不能达到期望误差，而且仍然难以找出最优的网络权值和阈值。而trainlm和 trainbr函数均采用Levenberg—Marquardt优化方法，能够快速获得最优的网络权值和阈值，收敛速度较快。虽然trainlm 函数的有效性系数都要比trainbr函数高，相对误差也都比 trainbr函数低。然而，推广能力是衡量神经网络性能好坏的重要标志。trainbr函数采用了Bayesian正则化方法，通过修正神经网络的训练性能函数来提高推广能力，防止出现“过度训练”。虽然有时候trainbr函数对训练样本的拟合精度要低于trainh函数，但其有效性系数都高于O．8．甚至绝大多数都大于o．9，相对误差也是绝大多数都小于O．01。经多次数值实验可知，采用trairIbr函数训练的BP网络稳定性要优于 trainhn函数和traingdm函数，且通常只需几百次的训练就能使网络收敛，找到最优的网络权值和阈值。结束语本文采用的3种改进算法，trainbr函数采用了 Levenberg-Marquardt优化方法与BayeSiaIl正则化方法，具有较好的推广能力，预测精度高于traingdm函数和trainlm函数，且经其训练的网络具有较好的稳定性。作为数据驱动型模型的BP网络，用来建模的学习样本质量至关重要，它直接影响网络的预测精度。trambr函数具有较好的推广能力，但其外推能力仍然较差。若采用引入部分常用公式的结果来增加样本以便让BP网络对样本充分学习，但是如果这种类型的训练样本过多，神经网络模型逼近的函数就会趋近于传统公式，从而失去了采用新模型的意义。所以今后应寻求能增强神经网络外推能力的算法来改进这项有意义的工作。 BP神经网络自身还存在着一些缺陷，特别是网络隐含层的层数及隐含层的节点数的选取尚无理论依据，通常是根据实验或经验确定，因此使网络具有很大的冗余性，也会影响拟合和预测效果，而本文选取的隐含层节点数18就是根据多次试验得出。 BP神经网络突出的优点是具有很强的非线性映射能力和柔性的网络结构，与传统的人为分析统计建模方法相比，预测精度较高，而且预测方法较为科学。参考文献 [1]高隽．人工神经网络原理及仿真实例[M]．机械工业出版社， 2003 [2]董长虹．Matl如神经网络与应用[M]．国防工业出版社，2∞5 [3]朱武亭，刘以建．BP网络应用中的问题及其解决．上海海事大学学报，2005。26(2) [4]陈晓梅，马晓茜．基于改迸BP神经网络的锅炉结渣预测模型．华东电力，2005，33(7) [5]顾军华，宋丽娟，赵文海．基于改进BP神经网络的税收收入预测模型．河北工业大学学报，2003，32(1) [6]杨琴，谢淑云．BP神经网络在洞庭湖氨氮浓度预测中的应用．水资源与水工程学报，2006，17(1) · 315· BP神经网络在福利彩票预测中的应用作者：涂晔，车文刚作者单位：昆明理工大学信息工程与自动化学院昆明 650051 本文链接：http://d.g.wanfangdata.com.cn/Conference_7150047.aspx

                    本文档为【BP神经网络在福利彩票预测中的应用】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

BP神经网络在福利彩票预测中的应用

你可能还喜欢