基于GA算法的智能导购系统的研究与实现
基于GA算法的智能导购系统的研究与实现
王婷婷王志良
(北京科技大学信息工程学院,北京100083)
摘要论文以服装导购系统为例,以模拟顾客思维方式,喜好特点为目标.搭建了一个智能的Web导购系统.文中首
次提出将交互式遗传算法和数量化I类理论这两种算法结合.进行系统在线学习并构建顾客的心理模型.使系统兼顾数
量化I类理论的运算速度和遗传算法的非线性仿真模拟效果;同时为解决进化时间过长导致的用户疲劳问题,提出采用
自主式GA来对用户历次所选的个体进行离线学习.通过对系统预测能力,运行速度的测试,以及用户对实验结果满意
度的调查,证明这两种算法的结合弥补了原系统在非线性预测上的不足,使系统能够更快速,更准确,更人性化地追踪,
模仿顾客的心理.
关键词人工心理智能导购系统情感信息处理遗传算法
8331一(2006)22,0214-03文献标识码A中图分类 文章编号1002—
号TP391
TheStudyandRealizationofIntelligentGuideSystem
BaseonGeneticAlgorithm
WangTingtingWangZhiliang
(SchoolofInformationEngineering,USTB,Bingjing100083)
Abstract:Takensellingclothingforexample,anintelligentshoppingguidesystemisbuiltinthispaper,whichisaimed
tosimulateuser’Smindandfavorcharacter.ThispaperproposesfirstlycombiningInteractiveGeneticAlgorithmwith
QuantificationTheoryItoimplementsystem’Scustomerpsychologicalmodelconstructionandon-linelearning.Because
thesetwokindsofalgorithmshavetheirownstrongpointseach,thenewsystempossessedbothQuantificationTheoryI’
SspeedandGA’Snon—linearsimulateeffect,Atthesametime,IndependentGeneticAlgorithmshasbeenproposedto
implementoff,
linelearningusingthepictures,whichtheuserchosedbefore,tosolvetirednessproblemcausedbythe
longtimeevolvingprocess,Throughexaminingthesystem’Spredictionability,runtime,andinvestigatinguser’ssatisfaction
degreetotheexperimentalresult,ithasbeenprovedthatthecombinationofthesetwokindsofalgorithmshasremedied
thedeficiencyoftheoriginalsysteminnon-linearprediction,andhasmadethesystemtrackandimitatethecustomer’s
psychologyfaster,moreexactlyandhumanized,
Keywords:artificialpsychology,intelligentguidesystem,emotionalinform
ationprocessing,GeneticAlgorithm
l引言
智能化是现代Web商务系统的一个发展趋势.也是人T
心理的一个研究方向.建立个性化智能导购系统的研究目的是
在人工心理理论的基础上,通过
分析
定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析
人类的情感.把人的感性
需要加入到商品的选购中去.即模拟顾客的思维.为顾客优先
展示在其特定的心理状态下所偏好的商品.从而呈现出一个人
性化,个性化的购物环境.本文选用服装作为研究对象.
此导购系统已有一定的前期T作基础:使用了数量化I类
理论公式对顾客心理进行建模川,并引入了HSV色彩模型表示
服装特征.本文主要是对顾客心理模型的构建算法进行了进
一
步的探索,在原先的在线算法基础上引入了交互式遗传算
法.并且提出采用自主式GA进行离线学习的方法解决进化时
间过长导致的用户疲劳问题.GA算法的引入,弥补了数量化I
类理论公式在人类心理非线性推导上的不足,使此智能的导购
系统更快速,更准确,更人性化的追踪,模仿顾客的心理.
2信息处理
流程
快递问题件怎么处理流程河南自建厂房流程下载关于规范招聘需求审批流程制作流程表下载邮件下载流程设计
改进后的信息处理流程如图1所示.图中三个虚框由左至
右分别表示预处理模块,交互式GA模块和自主式GA模块.
用户提
出大致
要求
用户提
不出大
致要求
1.预处理
从服装库
巾搜寻初
始图片
从服装库
巾随机产
生初始图
用户评
估并记
录最佳
个体
2.交互式GA
铲N
一
图1系统信息处理流程图
基金项目:国家自然科学基金资助项目(编号:60573059);北京市”现
代信息科学与网络技术”重点实验室资助项目(编号:TDXX0503);北京
科技
大学重点基金资助项目
作者简介:王婷婷,硕士研究生,研究方向为基于人T心理理论的个性空间设计与开发.王志良,博士后,教授,博士生导师,研究方向为人丁心理,
个人机器人,人性化的计算机,智能交通系统等.
2142oo6.22计算机T程与应用
预处理模块主要完成交互式GA操作之前的数据预处理
工作.交互式GA分别由用户评估,选择,交叉,变异和群体更
新这几个功能模块所组成131.自主式GA则根据所记录的历次
最佳个体对新的个体进行适应度值的自动计算.以机器评估代
替用户评估.
2.1预处理模块
预处理模块工作原理的基本思路是先根据数量化I类理
论公式将数据库中的所有被检索对象进行划分,并根据此划分
分别计算出数据库中每一个对象的的上近似和下近似,然后确
定每一个对象与目标检索的相关联程度,最后根据其相关联程
度从高向低依次检索出用户感兴趣的图片.此外.若用户提不
出任何具体要求,则随机产生若干个服装图片呈现给用户.
预处理建模的一般过程如下:
(1)收集表达心理的形容词对;
(2)抽选调查的对象来做评价实验,以服装图片为对象进
行SD评价实验,得到的评价运用因子分析的方法来处理,完
成形容词对的量化,得到情感矩阵y;
(3)抽取服装的特征值,得到特征空间反应矩阵:
(4)将心理描述和特征值的关系定量化——使用数量化I
类理论公式(1):
曰=(‘X)一.Y(1)
建立形容词对与商品特征的数量化关系.求曰之后.利
用式(2):
Y=XB(2)
就可以通过曰和商品特征的反应矩阵来预测该商品的
评价值.求出对应于所有评价服装的形容词对的曰值.即建立
了商品的预处理模型.每一位用户在进入到个性空间后.都必
须进行注册.在注册中对训练
样本
保单样本pdf木马病毒样本下载上虞风机样本下载直线导轨样本下载电脑病毒样本下载
图像做出评价,构成大众情
感矩阵y,进而得到曰.参与的人越多.越准确,对图像的预
测就会越近似.对于系统的准确度和速度都有极大的影响.随
后当用户提出个性选购要求时,系统首先根据预处理模块给出
基于大众心理的图像,然后再根据用户对这些图像的满意度评
价来决定遗传方式.
2.2交互式GA模块
交互式GA模块由评估,选择,交叉和变异及群体更新等
主要算法模块所组成.由于遗传算法在优化搜索中基本上不用
外部信息,仅用适应度函数为寻找依据.而且遗传算法对适应
度函数的唯一要求是该函数不能为负.所以在这里取用户对系
统检索出的图片的满意度值作为IGA的适应度函数.一般将
用户的满意度用五种口气表达.极其不满意,不满意,一般,满
意,非常满意.这四种口气分别对应l,2,3,4,5.为保证收敛
性,采用优秀个体保护法将每代中的最优个体即适应度最高的
个体不进行配对交叉而直接复制到下一代中,相应淘汰其子代
中适应度最差的个体,使种群规模不变.在所挑选出的图片中,
用户的评价小于2所对应的图片将直接被淘汰,而用户的评价
大于4所对应的图片将直接遗传进入下一代.其余的图片进行
交叉或变异操作.系统框图如图2所示.
通过上述进化操作产生的新染色体.可能其在图象库中未
必有完全一致的对应项.因此为提高交互式GA性能,本文提
}H了相似距离值这一方法.所以应将图象库中的每一幅图象与
其进行比较,并按相似距离计算它们的相似度,再取出其中相
似度最小的6幅图象作为新的群体.显示给用户,供用户作进
一
步分析判断.
@【<酣Y——
l编码l_———_一—
—1一InteractiveGeneticAlgorithm
l
l遗传操7卜——[夏—H用户满意度I
图2交互式GA系统框图
假设两个体A,B的编码为:
A=(0l,o,2,…,%)及=(6l,b2,…,b)(3)
两个体之间的相似距离值定义如下:
n
d(A,)=I(6)I(4)
ifl
其中:ifm=bthenmQb~=l
ifq?bthen,~~b,---O
d(A,B)值越大,
说明
关于失联党员情况说明岗位说明总经理岗位说明书会计岗位说明书行政主管岗位说明书
两个体间的相似距离值越小,反之亦
然.同样用户也可通过比较两个体间的相似距离值来对新的个
体进行评估.
2.3自主式GA模块
自主式GA模块自主式GA部分与交互式GA部分的不同
之处在于前者的每一代个体适应度值是自动计算得到的,而不
是根据用户评估得到的.在交互式GA过程中,系统自动记录
了用户历次所选的最新,最佳个体若干.当用户感到疲劳时,可
退出交互式GA过程,而进入自主式GA过程.系统记录的每
一
个体对应一个输入向量.基于输入向量分别计算每一个体与
其他个体间的相似性.本文以两向量间夹角的余弦作为向量的
相似性度量.
?qxb.
cos=—兰—==
V×V(5)
相似性的值分别对应权值大小,角度越小,相似性越大,权
值也就越大.故权值P可定义如下:
~--eos(6)
新的适应度值被定义为原始适应度值的加权平均.例如,
记录有编号分别为l,2,3,4的四个最佳个体,设其原始适应度
值分别为Js.,Js:,Js,,5d;各个体之间相似性值分别为Pl:,PI,,Pl,
,,;则个体l的新的适应度值可计算如下:
fitness[1]=Pl2xS2+P~3xS3+尸l4xS,(7)
计算出新的适应度值之后.再进行GA过程.所产生的新个
体若满足用户的要求则停止此过程.若不满足用户的要求则重
复自主式GA过程,或退出此过程进入交互式GA过程.直至
产生用户满意的个体为止.这里用户满意的含义是所产生的新
个体超过75%的个体是用户所期望的.这样通过交互式GA与
自主式GA相结合.可以在某种程度上有效缓解用户的疲劳程度.
3实验结果与分析
为了验证系统的有效性.首先创建了包含200张服装图片
的特征库,由于服装是由四个部分组成.通过编码可以将每一
个服装图片的特征表示成一个46位的二进制数.5O名用户分
别对lO个tnI练样本进行评价.系统的用户评价采集界面如图
3(a)所示,显示最终预测结果的客户选购界面如图3(b)所示.
分别进行三组实验.
计算机丁程与应用2006.22215
(a)(b)
图3评价的采集和结果显示
第一组是验证数量化I类公式在预测客户评价值方面的
可行性实验.收集用户评价.求出B后.再分别与20个校检
样本相乘,得到20个校检样本的预测评估值’,,与客户对20
个校检样本的真实评价值’,比较可以看出,预测值相对比较
集中在【2,4】这个范围内,在此范围内的预测基本比较准确,相比
较而言对两个极端评估的预测稍差.但这是合理的.因为作为人
来讲,大多数人对一个事物的评价都会比较中庸,所以对这个范
围的预测率会相对高.这也是为何数量化I类公式无法体现个性
化的问题所在.实验结果说明用此
方案
气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载
来作为预处理是可行的.
实验结果如图4所示,图中深色曲线代表20个校检样本的真实
评价值,浅色曲线代表20个校检样本的预测评估值.
6
5
要
嚣3
警z们
1
0
1
图4
3579l113151719
样本号
2O个校验样本的预测值与实际值比较
第二组实验对单独使用交互式GA与交互式GA和数量
化I类公式结合使用进行比较.前者随机产生?幅图片,再进
人交互过程;后者则按照数量化公式从图片库中先分别搜索出
能大致满足大众用户对此要求的图片l一3个,再进人交互过
程.比较结果如表l所示.
表1两种方法比较
实验结果表明:这种预处理的方法与IGA相结合进行识
别的效率要比单独使用IGA进行识别的效率高,速度快.图5
显示了单独使用交互式GA进行实验的收敛曲线.
第三组实验是在IGA过程中加进了相似距离值和自主式
GA.每一代记录用户所选的最佳个体数量分别从2到6.在计
‘u
辍15
尝10
5
123456
服装图片数目
图5第二组实验的收敛曲线(单独使用IGA)
算其新的适应度值和相似性后.进行GA操作过程.同样每一
组实验重复五次.取其收敛步数的平均值来绘制收敛曲线,实
验结果如图6所示.
10
辍8
6
搦4
2
O
1234567
服装图片数目
图6第三组实验的收敛曲线
(加进了相似距离值和自主式GA)
图6的收敛曲线表明:所提供的满足用户大致要求的个体
越多,产生用户满意结果的速度就越快.第三组实验表明:记录
的个体数目越多.通过相似性计算.再进行GA操作,其收敛步
数也是加快的趋势.需要说明的是,记录的个体数目越多,交互
式GA进化的代数就越多,所产生的相似个体也就越多.用户
需要对相似个体进行评估.心理压力较大,评估时有波动现象
产生.但从实验结果的曲线图看此波动现象对个体间相似性的
计算影响不大
4结束语
由如上的实验结果表明.在系统推理机中选取遗传算法与
数量化I类理论公式相结合的方法的确使推算结果更为接近
用户心理,从而提高了用户的满意度.另一方面,数量化I类理
论公式为遗传算法的操作提供了良好的数据前提,达到了加快
系统推理速度的目的.(收稿日期:2005年l1月)
参考文献
1.ZhiliangWang,YanlingZhao.AComputerSystemDesignedforFash-
ionFittingBaseconallArtificialPsychologyModel[C].In:Proceedings
ofthe3rdwoddCongressonIntelligentControlandAutomayion
Heifei,China,2000
2.马望,王志良.基于HSV颜色模型和个性空间的商品选购系统研究
【C】.
见:第一届中国情感计算与智能交互大会,北京,2003
3.ChamberL.PracticalHandbookofGeneticAlgorithms[C].CRCPress.
1995
(上接203页)
4.CAMuecher,KTSteinocher,KTKresslereta1.Landcoverchar—
acterizationandchangeddetectionforenvironmentalmonitoringof
pan—Europe[J].InternationalJournalofRemoteSensing,2000;21:
l159一ll8l
5.GMSmith.RMFuller.Anintergratedapproachtolandcover
classification:allexampleintheIslandofJersey[J】.International
21620o6.22计算机工程与应用
JournalofRemoteSensing,2001;22(16):3123~3142
6.冯仲科,余新晓.”3S”技术及其应用【M】.北京:中国林业出版社,2000:
l52—165
7.章孝灿,黄智才,赵元洪.遥感数字图像处理【M】.杭州:浙江大学出
版
社,2oo3:174—175
8.CharlesSheffield.Selectingbandcombinationfrommuhispectraldat虮
PhotogrammetricEngineeringandRemoteSensing,1985;51(6):681--687