首页 基于时间序列的电子商务市场预测系统研发_陈远

基于时间序列的电子商务市场预测系统研发_陈远

举报
开通vip

基于时间序列的电子商务市场预测系统研发_陈远 收稿日期:2009-03-31 作者简介:陈 远(1963-),女,湖北武汉人,副教授,主要从事计算机信息系统工程、项目管理、电子商务管理研究;王菲菲 (1985-),女,山东滨州人,研究生,主要从事电子商务管理研究. 1 时间序列预测概述 时间序列是指同一种现象在不同时间上的相继 观察值排列而成的一组数字序列。 现实中的时间序 列一般是长期趋势、循环变动、季节性变动以及随机 变动等几种变化形式的叠加或组合。 时间序列预测就是通过对预测目标本身时间序 列的处理,研究预测目标的变化趋势。时间序列预测 ...

基于时间序列的电子商务市场预测系统研发_陈远
收稿日期:2009-03-31 作者简介:陈 远(1963-),女,湖北武汉人,副教授,主要从事计算机信息系统 工程 路基工程安全技术交底工程项目施工成本控制工程量增项单年度零星工程技术标正投影法基本原理 、项目管理、电子商务管理研究;王菲菲 (1985-),女,山东滨州人,研究生,主要从事电子商务管理研究. 1 时间序列预测概述 时间序列是指同一种现象在不同时间上的相继 观察值排列而成的一组数字序列。 现实中的时间序 列一般是长期趋势、循环变动、季节性变动以及随机 变动等几种变化形式的叠加或组合。 时间序列预测就是通过对预测目标本身时间序 列的处理,研究预测目标的变化趋势。时间序列预测 方法的基本思想是:预测一个现象的未来变化时,用 该现象的过去行为来预测未来。 即通过时间序列的 历史数据揭示现象随时间变化的规律, 将这种规律 延伸到未来,从而对该现象的未来做出预测【1】。 2 EC市场时间序列预测原理 随着电子商务(EC)的迅速扩张,EC 市场预测也 渐渐成为企业关注的热点。 电子商务市场与其他的 基于时间序列的电子商务市场预测系统研发 陈 远, 王菲菲 (武汉大学 信息资源研究中心,湖北 武汉 430072) 摘 要:随着互联网的普及,全球电子商务(EC)市场正在迅速扩大。 在数字化时代中的企业,只有及 时地了解市场的变化,才能更有效地进行经营决策和生产管理,市场预测便成为达到这一目标的必 不可少的环节。时间序列预测是预测领域内的一个重要研究方向。在综合分析移 动平均法、指数平 滑法、时间回归法、ARIMA 模型及神经网络预测模型等时间序列预测方法的基础上,探讨了针对 EC市场的时间序列预测系统的开发。 关键词:电子商务;时间序列;预测模型;市场预测;系统开发 中图分类号:G350;F270.7 文献标识码:A 文章编号:1007-7634(2009)12-1820-04 E-commerce Market Forecast System R&D Based on Time-series CHEN Yuan,WANG Fei-fei (Center for Studies of Information Resources of Wuhan University, Wuhan 430072, China) Abstract:With the popularity of the Internet, the global E-commerce market is rapidly expanding. The enterprises in the digital age, must understand the market changes timely in order to conduct business decision -making and production management more effectively. The market forecast becomes the essential link to achieve this goal. Time series prediction is an important research direction in the area of forecasting. The paper comprehensively analyses various time -series forecasting methods such as moving average method、exponential smoothing method、time -regressive method、ARIMA model and neural network forecasting model,and then discusses the development of the time -series forecasting system for EC market. Key Words:e-commerce(EC); time-series;forecasting methods; market forecast; system development 情 报 科 学 Vol . 27 ,No .12 December,2009 第27卷第12期 2009 年 12 月 12期 基于时间序列的电子商务市场预测系统研发 1821 经济市场相比,有其独特之处。综合参阅文献及实践 观察, 笔者认为:EC市场信息来源广, 数据收集方 便,成本较低;市场 要求 对教师党员的评价套管和固井爆破片与爆破装置仓库管理基本要求三甲医院都需要复审吗 预测的反馈时间短,能够动 态、实时地对市场变化做出预测。这些特点就决定了 应用于 EC 市场的预测方法需要在一定程度上有其 特别的适应性。 目前主要应用于 EC 市场的时间序 列预测方法有算术平均数法、移动平均法、指数平滑 法等,但其应用还不具有相应的系统性。 鉴于 EC市 场的高速发展,以及现有方法在应用中出现的弊端, 本文全面分析了各种时间序列预测方法应用的广泛 性、普遍性、适用性以及预测精度,针对可以应用于 EC市场的不同时序预测方法作了较深入的研究,并 综合运用 【2】,化繁为简,进行了 EC 市场时间序列预 测系统开发实践,供 EC市场预测人员参考和应用。 2.1 移动平均预测 移动平均法指动态序列时距扩大,逐期移动,分 别计算序时平均数, 将计算结果排列成新的动态序 列的方法。 当预测目标的基本趋势是在某一水平上 下波动时,可用一次移动平均法建立预测模型,即收 集一组观察值,计算均值,利用这一均值作为下一期 的预测值;当其基本趋势与某一线性模型相吻合时, 常用二次移动平均, 但序列同时存在线性趋势与周 期波动时,可用趋势移动平均法建立预测模型。另外 也可根据过去若干时期的实际数据按其距预测期的 远近分别确定不同的权数,形成加权移动平均。移动 平均预测考虑了动态发展的连续性, 它能把隐藏在 原序列中的变动规律较明显的反映出来。 该方法在经济金融市场的技术分析中有重要应 用,也是 EC市场中许多技术分析指标的计算基础。 2.2 指数平滑预测 指数平滑法是在加权移动平均法的基础上发展 起来的一种方法。 它通过对预测目标历史统计序列 进行逐层的平滑计算, 消除由于随机因素造成的影 响,找出预测目标的基本变化趋势并以此预测未来。 按次数的不同,有一次指数平滑、二次指数平滑、三 次指数平滑和高次指数平滑。 考虑到不同序列的统 计特征还可进一步引入趋势参数和季节参数, 分别 建立霍尔特双参数线性指数平滑预测模型和温特线 性 & 季节性指数平滑预测模型。 另外,还可以借助 一种动态确定平滑参数的思想 【3】,引入自适应的平 滑参数 φ (t)= α1-(1-α)t 去完善各种指数平滑预测 模型, 就可以在一定程度上解决指数平滑应用的初 值难以选取、 平滑参数适应性差及系统预测偏差等 问题,进一步提高预测精度,形成较好的适应性。 时间序列指数平滑法有两个显著特点: 一是利 用了全部历史数据和相关信息; 二是遵循 “厚近薄 远”的原则加权平均、修匀数据。 如此得到的预测模 型具有抵御或减弱异常数据影响的功能, 从而使时 间序列所包含的历史规律性能较显著地体现出来。 该方法的优点是使用简单, 并具有可以与高级预测 方法相比拟的预测精度, 因此在各个领域的时间序 列预测中都有极为广泛的应用。 EC 市场中 B2B/ B2C/C2C等的交易额及电子企业的市场规模都可以 利用此方法进行短期预测。 2.3 时间回归预测 虽然指数平滑法应用广泛, 但当序列具有较为 复杂的变化形式时,指数平滑法计算量很大,此时用 时间回归法更为方便和适用。 该方法的实质就是用 一条固定的曲线来拟合时间序列数据的发展趋势。 常用来描述时间序列的趋势变动的拟合模型有线性 方程、二次曲线、指数曲线、修正指数曲线、Gompertz (龚帕兹)曲线、Logistic(逻辑斯谛)曲线以及振动曲 线七种。前两种方法比较常见,一般采用最小二乘法 原理就可以进行参数估计和拟合。 后面几种指数曲 线的拟合原理稍微复杂。 指数曲线用于描述以几何 级数递增或递减的现象, 即时间序列的观察值按指 数规律变化, 或者说是序列的逐期观察值按一定的 百分比增长或衰减。 修正指数曲线用于描述这样一 类现象:初期增长迅速,随后增长逐渐降低,最终则 以 K为增长极限。 龚帕兹曲线所描述的现象的特点 是,初期增长缓慢,以后逐渐加快,当达到一定程度 后,增长率又逐渐下降,最后接近一条水平线。 逻辑 斯谛曲线所描述的现象特征与龚帕兹曲线类似 【4】。 在此, 本文统一采用最小二乘法对各曲线进行参数 估计和数据拟合。 2.4 ARIMA模型预测 ARMA方法是一种精确度较高的短期时间序列 预测模型。它将预测对象随时间变化形成的序列,看 作是一个随机序列。ARMA法的基本思想是:一串随 时间变化而又相互关联的数字序列, 可以用相应的 模型加以近似描述。 通过对相应数学模型的分析研 究, 能更本质地认识这些动态数据内在结构和复杂 性,从而达到在最小方差意义下的最佳预测。该模型 有三种基本形式:自回归模型 (AR)、移动平均模型 (MA)和混合模型(ARMA) 【1】。 如果时间序列{yt}满足 yt=Φ1yt-1+Φ2yt-2+……+Φpyt-p+δ+εt-θ1εt-1-θ2εt-2-……- θqε,其中{εt}是独立同分布的随机变量序列,且满足 E(εt)=0,Var(εt)=σ2ε>0,则称时间序列{yt}服从(p,q)阶 自回归移动平均模型,记为 ARMA(p,q)。 若 q=0,则 模型即为 AR(p); p=0,模型即为 MA(q)。 ARMA模型所适用的序列应该是平稳序列。 在 实际问题中,许多序列并不近似平稳,这就要对序列 进行差分使其平稳。若序列含有季节性,还要按季节 周期进行季节差分。 此时的 ARMA(p,q)模型可以改 进为 ARMA(p,d,q)(P,D,Q)s。 其中 p 是自回归阶数,d 是平稳差分数,q 是移动平均阶数。 P是季节性自回 归阶数,D 是季节性平稳差分数,Q 是季节性移动平 均数,s是季节周期数。 一般,ARIMA 模型的预测流 程可分为:数据预处理,模型识别,参数估计,模型检 验和预测五步 【5】。 ARIMA 模型的优点在于:该方法 作出的预测比传统的计量经济建模方法作出的预报 更为可靠,特别是在短期预测方面。 2.5 BP神经网络预测 任何一个时间序列都可以看成是一个由非线性 机制确定的输入输出系统,神经网络理论中的 Kol- mogorov 连续性定理, 从数学上保证了神经网络用 于时间序列预测的可行性。 BP 网络(误差反向传播 神经网络),是一个有隐含层的多层前馈网络。 如果 网络的输入节点数为 M,输出节点数为 N,则此神经 网络可看成是从 M 维欧氏空间到 N 维欧氏空间的 映射,这种映射是高度非线性的。 BP 学习算法是非 循环多级网络的训练算法, 其基本思想是利用最小 二乘法,即算法采用梯度搜索技术,以期使网络的实 际输出值与期望输出值之间的误差均方值最小 【6】。 在此, 本文选用通过加入动量因子对传统 BP 算法 进行改进了的一种方法, 其实质就是将上一次权值 调整量的一部分迭加到按本次误差计算所得的权值 调整量上, 以作为本次的实际权值调整量, 即△ωji (n+1)=ηδpjOpi+α△ωji (n),η 为学习率,α 为动量项,δp 为 j节点 p 样本 保单样本pdf木马病毒样本下载上虞风机样本下载直线导轨样本下载电脑病毒样本下载 的误差项。 利用 BP 网络进行时间序列预测, 首先要对数 据进行预处理(归一化处理),使输入的数据取值在 [0,1]之间。 归一化公式为: X(t)= d(t)-min(d(t))max(d(t))-min(d(t)) 其中 d(t)为原始序列,X(t)为网络的输入。 将处理后的数据输入网络,利用[0,1]上的 Sig- moid激励函数 f(x)= 11+e-λx 和改进后的 BP 算法调整 权值训练网络,找出适合的 BP 网络结构,即确定使 预测误差最小的输入层节点 n1、隐层节点 n2、输出 层节点 m, 这样就成功建立了 BP 神经网络预测模 型 (n1,n2,m)。 用建立好的模型输入预测样本进行预 测, 输出预测值后, 要对输出数据进行反归一化处 理,其公式为:Y(t)=O(t)*(max(d(t))-min(d(t)))+min(d (t)),其中 O(t)为网络的输出,Y(t)预测值。 采用 BP 神经网络用于非线性时间序列预测的 特点是: 学习过程由信号的正向传播与误差的逆向 传播两个过程组成, 它较好地揭示了非线性时间序 列的内在相关性, 信息损失较少, 易于达到预测目 的。 又由于预测中,所有的信息均来自单一的序列, 所以在应用中一般使用反向传播方向来进行有记忆 地训练和预测, 可以较好地揭示非线性时间序列在 时延状态空间中的相关性,从而达到预测目的。 以上分析的后两种预测模型对非线性非平稳时 间序列数据的预测有较好的应用,且精度较高,但其 专业要求也比较高。 在 EC 市场中这两种方法可以 应用于市场调研人员对各种交易数据的细致分析。 3 EC市场时间序列预测系统设计 3.1 系统规划与分析 目前时间序列分析及预测的系统和软件比较 多,但对于 EC市场的应用还有诸多限制和缺陷。 考 虑到时间序列预测方法的专业性难度, 本系统试图 采用几乎完全对象化的形式,不需要任何编程,只要 求使用人员对时间序列预测的各种方法有大概的应 用了解, 从而就在很大程度上扩大了系统的使用对 象,提高了系统的适用性。 另外,由于 EC 市场中时 间序列的不确定性, 市场预测系统也应该有相应的 时序预测方法对序列进行处理和预测。鉴于此,本系 统就努力做到尽量满足使用者的预测意图, 将现实 应用较为广泛的预测方法设计其中, 提高了其普遍 性应用。 本系统的开发环境是软件开发的重要组成部 分,主要包括两个方面:软件环境、硬件环境。本系统 的硬件及系统配置环境为:CPU,Pentium 800MHz; RAM,64M及以上;磁盘空间,400M以上。 软件开发 环境为: 操作系统,Windows98 、Windows2000 及以 1822 情 报 科 学 27卷 上 ;Microsoft Excel2003、Visual Basic6.0。 由于 Vi- sual Basic 的报 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 功能有限,而且一旦 报表 企业所得税申报表下载财务会计报表下载斯维尔报表下载外贸周报表下载关联申报表下载 格式发生 变化,就得相应修改程序,给应用软件的维护工作带 来极大的不便。 因此有很多程序员现在已经充分利 用 Excel 的支持来实现数据导入、导出和报表功能。 本系统就是利用 Microsoft Excel2003 建立数据,并 依靠 VB 中的 Excel 类型库实现二者之间的无缝连 接,从而也提高了用 Visual Basic开发时间序列预测 系统的可行性【7】。 本系统主窗体界面设计如图 1。 图 1 主窗体界面设计图 3.2 系统功能模块设计 本系统分为数据处理模块、移动平均预测模块、 指数平滑预测模块、 时间回归预测模块、ARIMA 模 型预测模块、神经网络预测模块和系统帮助模块。具 体完成的功能如下。 (1) 数据处理模块。 该模块的首要功能是建立、 打开和保存以 .xls 为文件形式的样本数据文件,方 便调用。 其次,还可以进行数据的插值处理。 这一功 能是针对原始数据中的缺损值和异常值的处理而设 置的, 本系统采用拉格朗日插值函数进行处理。 另 外,该模块还能对数据进行图形处理,包括散点图和 折线图的绘制。使用者可以参考图形显示,大概判断 数据的统计特性及走向趋势, 有利于选择恰当的预 测模型。 (2) 移动平均预测模块。该模块可以利用使用者 输入的样本移动期数、 预测期数及预测精度分析样 本区间分别完成一次移动平均预测和线性二次移动 平均预测。 该模块的重点是两种预测算法的实现。 (3) 指数平滑预测模块。这一模块同样是获得使 用者预设的相应的平滑系数、 预测时期数及预测精 度分析的样本区间分别完成子菜单下的一次指数平 滑预测、Brown 单参数线性平滑预测、Brown 单系数 二次式平滑预测、Holt双参数线性平滑预测、温特线 性和季节性指数平滑预测以及平滑参数自适应模型 的 Brown 线性平滑、Brown 二次平滑和 Holt 线性平 滑预测。 这八种算法的设计也正是本模块设计实现 的重点和难点。 (4) 时间回归预测模块。由于时间回归预测属于 对原始数据的拟合,与使用者没有较多的交互因素, 所以该模块设置了统一的输入框, 用户只需输入预 测时期数,系统即可利用预先设计的线性方程、二次 曲线、指数曲线、修正指数曲线、龚帕兹曲线以及逻 辑斯谛曲线六种最小二乘拟合算法进行预测。 (5) ARIMA 模型预测模块。 该模块的设计与实 现是本系统的难点之一。 其主要功能是对原始序列 进行差分、零均值处理,相关性分析,用户利用分析 结果界定模型中的阶数, 系统获得阶数后利用相关 的算法进行参数估计, 确定初始模型。 然后检验模 型,通过检验后即可进行预测。 其逻辑框如图 2。 图 2 ARIMA 模型预测逻辑图 (6) 神经网络预测模块。该模块的设计与实现是 本系统的难点之二。 其主要功能是按照 BP 神经网 络预测的基本步骤即数据归一化处理———依据改进 的 BP 算法训练神经网络———确定输入层、 隐层节 点和最大训练次数建立预测模型———预测并输出结 果,完成对时间序列的预测。 在此模块,系统精心设 计了 BP 神经网络结构训练的界面, 以便更好的让 用户了解 BP 网络的训练原理和过程, 其原始界面 如图 3所示。 图 3 BP 神经网络结构训练设计图 (下转第 1833 页 ) 12期 基于时间序列的电子商务市场预测系统研发 1823 ceedings of the 19th International Conference on Computa- tio- nal Linguistics, Taibai 2002. 4 D Zhang, WS Lee. Question Classifi- cation Using Support Vector Machines [C]. Proceedings of the 26th annual inter- national ACM SIGIR conference on Research and Develop- ment in informa- tion retrieval , 2003:26-32. 5 K. Hacioglu and W. Ward. Question Classification with Sup- port Vector Machines and Error Correcting Codes [C]. NAA- CL 2003, 2003:28-30. 6 N T Tri, N M Le, A Shimazu. Using Semi-supervised Learn- ing for Question Classification [C]. ICCPOL 2006, LNAI 4285, 2006:31-41. 7 卢志坚,张冬荣. 中文问答系统中的问句理解[J]. 计算机工 程,2004, 30(18): 64- 65. 8 孙景广,蔡东风, 吕德新, 董燕举. 基于知网的中文问题自 动分类[J].中文信息学报,2007,21(1): 90-95. 9 李 鑫,黄萱菁,吴立德. 基于错误驱动算法组合分类器及 其在问题分类中的应用 [J]. 计算机研究与发展,2008,45 (3): 535-541. 10 Hovy, E.H., U. Hermjakob, and D. Ravichandran: A Ques- tion/Answer Typ- ology with Surface Text Patterns [C]. In Proceedings of the Human Language Technology Confer- ence. San Diego, CA. NIST, Gaithersburg, MD.2002:229 - 241. 11 邱均平, 余以胜. 基于知识库系统的智能搜索引擎的研究 [J]. 情报科学, 2006,(3):413-416. 12 Kadoya, U. Morita, K. FUKTA, Moono, M. ATLAM, M. Sumitomo, T &Aoe, J. A Sentence Classification Technique Using Intention Association Expressions [J]. International Journal of Computer Mathematics. 2005,82(7): 777 -792. 13 Khoo, A. Maron, Y & Albrecht, D. Ex- periment with sen- tence classification [C]. Proceedings of the 2006 Australians Language Technology Workshop ALT –W,2006:18-25. 14 Andrei Border. A taxonomy of we search [C]//SIGIR Forum. New York, N Y, USA: ACM Press, 2002:3210. 15 Daniel E. Rose and Danny Levinson. Understanding user goals in web search [C]/ / WWW ’04 : Proceedings of the 13the international conference on World Wide Web. New York , N Y, USA : ACM Press , 2004:13,219. 16 张 森 ,王 斌 . Web 检索查询意图分类技术综述 [J]. 中 文信息学报, 2008, 22(4): 75-82. 17 吴晓晖,宋萍萍 .中文智能搜索引擎的分析和框架模型设 计.情报科学,2008,26(12):1814-18K5. 12期 有无查询意图的分类与实现架构模型研究 1833 (上接第 1823页) 上述每个预测模块运行完毕, 预测结果将会显 示预测指和预测方差、标准差,以便于使用者对不同 方法的预测进行比较分析,从而确定最佳预测结果。 (7) 系统帮助模块。考虑到时间序列预测的专业 性难度,本文针对非专业使用者设计了帮助文件。在 此模块中将对各种方法的特点、 适用情况以及使用 方法给出简单介绍, 从而帮助使用者针对性地选择 不同的预测方法, 并能够正确的按步骤使用所选的 方法进行预测。 4 结 语 EC 市场时间序列预测系统的实现是在对多种 时间序列预测方法原理进行细致分析后, 针对 EC 市场的应用而设计完成的。 它在完全对象化的基础 上充分避免了使用者编程实现这一繁琐的过程,将 界面设计、数据分析及算法实现简约化,在一定程度 上降低了时间序列预测应用的专业性难度, 提高了 系统的普遍适用性,对于 EC市场部工作人员的高 效预测起到了辅助作用。 参考文献 1 王振龙 ,胡永宏 .应用时间序列分析 [M].北京 :科学出版社 , 2007:36-38. 2 K.K.Lai,Y.Nakamori.TIME SERIES FORECASTING WITH MULTIPLE CANDIDATE MODELS:SELECTING OR COM- BINING? [J]. Journal of Systems Science and Complexity, 2005,(1):1-18. 3 黎锁平,刘坤会.平滑系数自适应的二次指数平滑模型及其 应用[J].系统工程理论与实践,2004,(2):95-99. 4 田爱国 .统计学 (修订版 )[M].北京 :中国铁道出版社 ,2005: 189-192. 5 王丽娜 ,肖冬荣 .基于 ARMA 模型的经济非平稳时间序列 的预测分析 [J]. 武汉理工大学学报 (交通科学与工程版), 2004,(01):133-136. 6 丁士圻,郭丽华.人工神经网络基础[M].哈尔滨:哈尔滨工程 大学出版社,2008:43-45. 7 高春艳, 李俊民, 刘彬彬. Visual Basic 应用开发完全手册 [M].北京:人民邮电出版社,2005:178-190. (责任编辑:孙晓明) (责任编辑:孙晓明)
本文档为【基于时间序列的电子商务市场预测系统研发_陈远】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_671527
暂无简介~
格式:pdf
大小:336KB
软件:PDF阅读器
页数:5
分类:互联网
上传时间:2013-12-22
浏览量:34