第36卷第4A期 计算机科学 V01.36No.4A
;QQ2生!旦≤至!里巳坚!曼!墨!i曼翌兰曼 △巳!:;QQ!
BP神经网络在福利彩票预测中的应用
涂晔车文刚
(昆明理工大学信息工程与自动化学院 昆明650051)
摘要采用BP网络的3种改进算法,对福彩双色球(2008073期一2008133期)的历史中奖数据进行分析,建立了基
于BP神经网络的双色球预测模型,并对3种改进算法的训练结果进行了比较。与现存的彩票分析
方法
快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载
不同的是,本
方法并非基于频数分析缩小
样本
保单样本pdf木马病毒样本下载上虞风机样本下载直线导轨样本下载电脑病毒样本下载
集来产生预测号码,而是基于BP神经网络对历史数据进行学习,挖掘其中隐含的规
律,生成用来预测号码的神经网络节点的连接参数,再根据这些参数产生下一期预测号码。
关键词BP神经网络,改进算法,福彩预测
ApplicationofBPNeuralNetworkint0PredictingtheWelfareLottery
TUYeCHEWemgang
(FacultyofInfonnationEngineeringaJldAuto眦tion,KunmingUniversityofSciencearIdTechnology,Kuming650051,China)
AbstractAccordingtotheanalysisof(No.2008073一No.2008133)historicrecordeddataofwelfarelottery-Shuangse-
qiu,amodelisdevelopedtopredictwelfarelotterybasedonBPneuralnetworkThemodelisopt确zedwiththreedi’
ff敛啦n遮零r钾edBPa【g蕊tk璐andthetrai趣res心tsarecolnpared.k’sdiffer镪nfromthee矗stedanalyzing订蛇thods
oflottery.Thismethodisn’tbasedont畹esamlysisarldreducir培s锄plesettopredictdata,butbasedon上沪neural
networktole锄thehistoricrecordeddataandfindthehidd朗regularity,thenautomatical】yproducethenextpredicting
dataaccordingtotheconnectingpar帆eterofneuralnet、Ⅳorkjoint.
K9ywor凼BPneuralnetwork,hnprovedalgorithm,Welfare10tterypredictillg
1 引言
彩票业在我国是一个发展空闯极大的新兴产业,彩票业
不仅在特定领域发挥了重要作用,还影响到出版、印刷、电视、
广播、交通等多种行业的发展。积极发展我国的彩票业,将对
我国经济建设和社会发展产生更加积极的影响。目前在中
国,福利彩票双色球以每星期开奖三次,最高奖额五百万元人
民币,每期奖池奖金累计过亿的雄厚实力,吸引着庞大数量的
彩民,而彩民朋友们最为关心的就是如何预测当期的开奖号
码,因此对福利彩票双色球奖号的预测具有十分重要的研究
意义。
2福彩双色球预测依据
首先必须强调的是,只要摇奖机的构造能够保证任何一
个球的出现都完全随机,那么,每个号码的出现都具有相等可
能性,即出现的机率都是一样的。据此,根据福利彩票双色球
的游戏
规则
编码规则下载淘宝规则下载天猫规则下载麻将竞赛规则pdf麻将竞赛规则pdf
,数字完全自由组合后,将可能产生一千七百多万
组不同号码,任何一个彩民购买一组号码,他的中奖机率都只
有一千七百多万分之一,无论什么“专家”或者“大师”都无法
准确预测所谓的中奖号码。
然而,把每期出现的中奖号码进行统计,积累到一定量之
后,就能发现各数字总共出现的频率特性。如奇偶比、遗漏期
K值、区段出号码数字、数出频率的次数、二数同出数组等。
例如“上海风采”福利彩票网站根据上海风采发售以来的历史
资料,认为数字分布具有一定的规律性:①奇数与偶数出现的
次数应各占总数的1/2;②1~18数组、19—35数组的出现次
数各占总数的l/2;③1—12区段、13—24区段、25—35区段,
三段数的出现应各占总数的1/3。
既然奖号的出现有了规律可循,各种各样的彩票预测方
式也应运而生,这些方式都是通过数字统计与图表分析,运用
概率论理论来判断冷热号码出现的周期,分析号码可能出现
的区段,缩小精选号码范围,为新一期选择投注号码提供依
据,从而达到排除某些号码组合,减小号码排列样本集,从而
提高中奖率的目的。虽然号码是根据科学依据推算出来的,
但这些选号方式明显带有个人喜好与主观意愿。这是因为从
统计学的大数规律讲,再大的样本集也是估计,都有不中的可
能。于是,研究其它科学有效的测算途径就显得迫切需要了。
双色球号码预测过程可认为是一种复杂非线性函数关系
的逼近过程,要对其进行较为准确的预测,就必须采用能捕捉
非线性变化规律的预测方法。BP神经网络具有逼近任意连
续函数和非线性映射的能力,并可进行高维非线性的精确映
射。它是由大量的,同时也是很简单的神经元通过广泛的互
涂晔女,硕士,主要研究领域为人工智能、多媒体通信等,E-mail:sher码r000@to札com;车文刚男,教授,硕士研究生导师,主要研究领域为
模式识别与智能系统、金融时间序列分析等.
·310·
相连接而形成的复杂网络系统,它反映了人脑功能的许多基
本特性。其信息处理是通过学习,动态修改各神经元之间的
连接权值使系统不断产生“进化”来实现。
本文所要讨论的方法就是基于BP神经网络对福彩双色
球历史数据进行学习,挖掘中奖号码中隐含的规律,生成用来
预测号码的神经网络节点的连接参数,然后再根据这些参数
生成下一期预测号码。
3 BP神经网络及其改进学习算法
3.1 BP神经网络原理
BP神经网络是一种具有三层或三层以上阶层型结构的
神经网络。层间各种神经元实现全连接,即下层的每一个神
经元与上层的每个神经元都实现权连接,而每层各神经元之
间不连接。网络中每一层神经元的连接权值都可以通过学习
来调整。当给定一个输入节点数为竹、输出节点数为s的BP
网络,输入信号由输入层到输出层传递,通过非线性函数的复
合来完成从行维空间到s维空间的映射,该过程是向前传播
的过程;如果实际输出信号存在误差,网络就转入误差反向传
播过程,并根据误差的大小来调节各层神经元之间的连接权
值。当误差达到人们所希望的要求时,网络的学习过程就结
束。
3.2 BP网络改进学习算法
传统BP网络的学习算法实质上是一种简单的最速下降
静态寻优算法,在修正权值w(走)时,只是按照志时刻的负梯
度方式进行修正,而没有考虑到以前积累的经验,即以前时刻
的梯度方向,从而常常使学习过程发生振荡,通常具有收敛速
度慢、易陷入局部极小值和网络推广能力不强等方面的缺陷。
本文采用MATLAB神经网络工具箱提供的3种改进快速学
习算法,有效克服了传统BP网络学习算法的缺陷。
3.2.1动量梯度下降反向传播算法(trair培dm)
该算法在对权重和阈值更新时不仅考虑当前的梯度方
向,而且还考虑了前一时刻的梯度方向,从而降低了网络性能
对参数调整的敏感性,有效地抑制了局部极小,但收敛速度较
慢。
3.2.2L创erll)e孵Marquardt优化方法(trainhn)
kvenbe曾Marquardt优化方法能够根据网络训练误差
变化情况,自动调节网络训练参数口,使网络实时采取适宜的
训练方法。当口较小,网络训练过程主要依据GausS-Ne嘶on
法;当口较大,网络训练过程主要依据梯度下降算法。该训练
函数的效率优于梯度下降法,但占用内存较大,适用于规模较
小的网络。
3.2.3kVenbeWMarquardt优化方法与Bayesian正则化方
法(trainbr)
traillbr函数采用kvenberg_Marquardt优化方法进行网
络权值和阈值的最优化搜索,并采用Bayesian正则化方法在
网络训练过程中自适应地调节性能函数比例系数的大小,使
其达到最优,并且采用trainbr函数训练后BP网络具有较好
的推广能力。
4 BP神经网络的双色球预测模型的确定
4.1 BP网络模型确定
输入层和输出层确定。福彩双色球的备选号码为01—
33号红球加上01—16号蓝球,其中从33个红球中选择6个
号码,从16个篮球中选择1个号码,这样组成6+1的组合模
式。每组历史中奖号码均为7个数字,因此,输入层神经元个
数定为:以=7。网络的输出,即为预测的双色球中奖号码,所
以输出层神经元个数为:s=7。BP神经网络预测模型如图l
所示。
Xl
X2
输入层慧台是 输出层
Y
图1 BP神经网络预测模型
4.2 BP网络
设计
领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计
中的数据处理
4.2.1输入数据的预处理
由于BP神经网络的隐层一般采用SigⅡloid转换函数,所
以,需要对输入数据进行归一化处理,这里采用如下公式:
瓦:≠啬L砌+面^nHx^ m妇
其中X~,k分别为输入样本五的最大值和最小值,X为
处理后的样本输入值,d1,函分别取o.998和0.001。
4.2.2输出数据的反变换处理
为了防止部分神经元达到过饱和状态,对输出样本亦需
作如上变换。这样实际上将输入输出样本变换到[o.001,
o.999]区间,避免了。和l两个值。因为。和1恰好是Sig—
moid型函数的极小值和极大值,要求联接权足够大才能使网
络的输出值与其匹配,从而需要相当多的训练次数来不断修
正权值,导致训练速度缓慢。因此网络输出的结果要进行反
变换才能得到预测值。
4.3双色球预测神经网络模型MAll。AB仿真实现
4.3.1创建改进的BP网络
使用MATLAB利用如下代码创建一个符合上述要求的
BP网络:
饥他饥D掰一[o1;o1;o1;o1;o1;o1;o1];
"以="叫(施僧访。掰,[隐层节点数,7],{‘tansig‘,
‘logsig’},‘训练函数’);
其中,threshoId设定了网络输入向量的取值范围[O,1]和输
入神经元个数为7。输出层节点数为7.输入层到隐含层的变
换函数为tansig,隐含层到输出层的变换函数为logsig,网络
所用的训练函数将分别采用3种改进的BP学习算法,分别
为:traindm,trainlm,trainbr。
4.3.2BP网络的训练与测试
①隐含层节点的确定。分别选取节点数为15,18,20来
对网络进行训练,设定预测精度为O.01,综合考虑网络性能
和训练速度,发现隐含层节点数为18个时,网络对函数的逼
近效果最好,20个时其次,15个时最差。
②网络测试。经预处理后的训练样本数加载到所建立的
人工神经网络上,即可用BP算法对网络训练。为了检验训
(下转第315页)
·311·
overCableNetworks∥PrDceedjngsoftbeSev明tbI玎temational
SymposiurnonComputersandconlnlufli∞tion&IEEE,200Z
(2):577—562
[4]szigetiT,ch“stinaH.En士to-EndQ。sNetwDrkI)esign:Quali—
tyofDleSigninLANswANs,Ⅵ1Ns[M].P0sts&Telecom
Press,2007(1):49—144
(上接第311页)
练后神经网络解决问
题
快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题
的能力,通常需要测试样本对训练后
的网络进行测试和检验,以便对比分析预测结果和实际值之
间的误差。通过训练和测试之后的神经网络模型才可用于双
色球奖号的预测。
5预测结果分析
以双色球历史开奖数据2008073期一2008133期的数据
作为训练样本,2008130期的数据作为测试样本,对BP网络
进行训练仿真。根据网络多次训练结果比较,确定隐层节点
数为18,期望误差为o.02。用有效性系数COE和相对误差
EQ来判断经3种改进算法训练后网络的性能,比较拟合和
预测效果,公式如下:
魄一车挲二竺杀j蚤(y卜矽
~墨lyi一刍EQ=型—_
二yi
l;I
3种改进算法的拟合结果如表1所列。
表1 3种改进算法的拟合结果
测试样本为2008130期的数据,即(011218283032+
06),期望输出(实际值)为2008131期数据,即(0212151822
32+08),分别运用3种改进BP算法进行预测。预测值与实
际值比较如表2所列。
表2预测值与实际值比较
2008131期网络各媒体专家工作室预测结果选登如表3
所列。
表3
由训练结果和预测结果可知,对传统BP网络学习算法
作出不同改进的3种学习算法在实际应用中它们的性能各不
相同。traingdm函数拟合精度最低,这是因为traingdm函数
虽然采用了动量梯度下降反向传播算法,能够有效地抑制局
部极小。但其收敛速度太慢,训练多次也不能达到期望误差,
而且仍然难以找出最优的网络权值和阈值。而trainlm和
trainbr函数均采用Levenberg—Marquardt优化方法,能够快
速获得最优的网络权值和阈值,收敛速度较快。虽然trainlm
函数的有效性系数都要比trainbr函数高,相对误差也都比
trainbr函数低。然而,推广能力是衡量神经网络性能好坏的
重要标志。trainbr函数采用了Bayesian正则化方法,通过修
正神经网络的训练性能函数来提高推广能力,防止出现“过度
训练”。虽然有时候trainbr函数对训练样本的拟合精度要低
于trainh函数,但其有效性系数都高于O.8.甚至绝大多数
都大于o.9,相对误差也是绝大多数都小于O.01。经多次数
值实验可知,采用trairIbr函数训练的BP网络稳定性要优于
trainhn函数和traingdm函数,且通常只需几百次的训练就能
使网络收敛,找到最优的网络权值和阈值。
结束语本文采用的3种改进算法,trainbr函数采用了
Levenberg-Marquardt优化方法与BayeSiaIl正则化方法,具有
较好的推广能力,预测精度高于traingdm函数和trainlm函
数,且经其训练的网络具有较好的稳定性。
作为数据驱动型模型的BP网络,用来建模的学习样本
质量至关重要,它直接影响网络的预测精度。trambr函数具
有较好的推广能力,但其外推能力仍然较差。若采用引入部
分常用公式的结果来增加样本以便让BP网络对样本充分学
习,但是如果这种类型的训练样本过多,神经网络模型逼近的
函数就会趋近于传统公式,从而失去了采用新模型的意义。
所以今后应寻求能增强神经网络外推能力的算法来改进这项
有意义的工作。
BP神经网络自身还存在着一些缺陷,特别是网络隐含层
的层数及隐含层的节点数的选取尚无理论依据,通常是根据
实验或经验确定,因此使网络具有很大的冗余性,也会影响拟
合和预测效果,而本文选取的隐含层节点数18就是根据多次
试验得出。
BP神经网络突出的优点是具有很强的非线性映射能力
和柔性的网络结构,与传统的人为分析统计建模方法相比,预
测精度较高,而且预测方法较为科学。
参考文献
[1]高隽.人工神经网络原理及仿真实例[M].机械工业出版社,
2003
[2]董长虹.Matl如神经网络与应用[M].国防工业出版社,2∞5
[3]朱武亭,刘以建.BP网络应用中的问题及其解决.上海海事大学
学报,2005。26(2)
[4]陈晓梅,马晓茜.基于改迸BP神经网络的锅炉结渣预测模型.
华东电力,2005,33(7)
[5]顾军华,宋丽娟,赵文海.基于改进BP神经网络的税收收入预
测模型.河北工业大学学报,2003,32(1)
[6]杨琴,谢淑云.BP神经网络在洞庭湖氨氮浓度预测中的应用.水
资源与水工程学报,2006,17(1)
· 315·
BP神经网络在福利彩票预测中的应用
作者: 涂晔, 车文刚
作者单位: 昆明理工大学信息工程与自动化学院 昆明 650051
本文链接:http://d.g.wanfangdata.com.cn/Conference_7150047.aspx