首页 广告审查系统中绝对化词语自动审查的实现

广告审查系统中绝对化词语自动审查的实现

举报
开通vip

广告审查系统中绝对化词语自动审查的实现广告审查系统中绝对化词语自动审查的实现TheRealizetionofAutomaticReviewofAbsoluteTermsintheAdReviewSystemDINGHao1,2,LIYue-hua2(1.CollegeofInformationEngineering,YangzhouUniversity,Yangzhou225009,China;2.CollegeofComputerScience&Technology,NantongUniversity,Nantong226019,China):The...

广告审查系统中绝对化词语自动审查的实现
广告审查系统中绝对化词语自动审查的实现TheRealizetionofAutomaticReviewofAbsoluteTermsintheAdReviewSystemDINGHao1,2,LIYue-hua2(1.CollegeofInformationEngineering,YangzhouUniversity,Yangzhou225009,China;2.CollegeofComputerScience&Technology,NantongUniversity,Nantong226019,China):Theimplementationofautomaticreviewofabsolutetermsisdiscussed.Throughavarietyoftechniques,theSystemwithlowerdatatransmissionandidealperformanceisrealized.Andthisimplementationwillreducetheloadoftheexaminer,andimprovetheintelligenceofthesystem.广告审查系统(文献[1])实现了由人工审查广告向计算机软件辅助审查广告的转变。从总体上看,系统主要解决了四大问题:第一,解决了人工审查模式下工商行政管理部门总是事后监管的状态,系统即代表监管员,审查员通过系统进行广告审查时,就等于监管员在实时监管,能够有效降低违法违规广告的发布率;第二,解决了因审查员并非专业的工商行政管理人员,从而对各类广告需要哪些证明材料、对应哪些广告法律法规经常掌握不完全、熟悉程度有限的问题,系统根据广告类型会明确地显示出某广告需要哪些证明材料、对应哪些法律法规。第三,解决了无法明确违法违规广告发布的责任问题,由系统可以明确查出某违法违规广告由哪位审查员审查通过,可据此采取相应处罚措施。第四,建立了可用于统计、查询的审查记录信息。虽然系统在很大程度上提高了广告审查的效率,降低了违法违规广告的发布率,但在审查过程中仍然是以审查员浏览广告内容为主的审查方式,系统仅提供必要的提示,审查通过与否完全在于审查员。本文将针对“《中华人民共和国广告法》第七条第二款第三项:广告不得使用国家级、最高级、最佳等用语”设计并实现对广告词进行绝对化词语自动审查的功能。功能需求绝对化词语自动审查的性能广告词的输入与修改广告审查系统的一大初衷就是要减轻审查员的工作量,因此,无论广告词是长还是短,广告词都应当是从广告主提供的相关文档拷贝粘贴到系统中去,不应该是人工输入,这就 要求 对教师党员的评价套管和固井爆破片与爆破装置仓库管理基本要求三甲医院都需要复审吗 系统含有存放广告词的容器,并具备粘贴功能。自动审查结果的显示减少网络数据传输量由于系统采用B/S架构,服务器在工商行政XX局,XX局,不得不考虑网络性能问题,这就要求系统尽可能地减少网络数据传输量,保证系统在客户端运行流畅。实现方法及相关技术2.2采用javascript操作剪贴板、textarea过滤html标签的方法实现广告词的粘贴功能根据1.2的需求,系统需实现粘贴广告词的功能。实现的思路比较简单:通过点击“粘贴广告词”的按钮,将系统剪贴板中的广告词粘贴到广告词容器iframeAdWords中。思路简单但实现细节却较为复杂。将剪贴板的内容获取出来或粘贴到指定容器内有两种方法,一是通过clipboardData.getData("TEXT")获取剪贴板内容,即iframeAdWords.document.body.innerHTML=clipboardData.getData("TEXT"),这种方法的缺点是将剪贴板中文本的所有格式全部去除,造成粘贴进iframeAdWords中的文本没有换行符,与源文本格式差别较大,对审查员的浏览造成困难。二是通过document.execCommand("Paste")方法粘贴文本,与第一种方法相反,这种方法会保留所有源文本的格式,若剪贴板的内容是从word文档或其他丰富格式文档复制而来,粘贴到iframeAdWords中将会产生众多的html样式标签,这对后续的自动审查会造成困难,而且也不应将这样的文本存储到数据库中。第一种方法去除了全部格式,无法利用,只能采取第二种方法,再进行去除大部分无用的html标签,保留需要的换行标签。实际实现时,巧用了textarea标签的一个特性:使用document.execCommand("Paste")方法将文本粘贴进textarea容器内时,textarea自动过滤掉了绝大多的html标签,仅剩余换行标签。因此,需要增加一个textarea控件:,这里采用服务器端控件TextBox是为了服务器端获取广告词存入数据库,粘贴广告词时先粘贴至txtAdWords控件,再从txtAdWords中复制到iframeAdWords中。考虑实际操作时可能会分批粘贴广告词,故还需实现保留iframeAdWords原来内容的基础上定位粘贴功能,其详细javascript代码为:functionpasteText(){iframeAdWords.document.body.focus();rng=iframeAdWords.document.selection.createRange();//获取当前iframeAdWords中内容的TextRange对象strLen=iframeAdWords.document.body.innerHTML.length;txtAdWords=$get("");//获取textarea控件txtAdWords.value="";//每次粘贴前清空textarea控件中保留的上次粘贴的内容将textarea中内容增加txtAdWords.focus();//textarea控件获得焦点document.execCommand("Paste");//将剪贴板内容粘贴至textarearng.text=txtAdWords.value;//到TextRange对象中iframeAdWords.document.body.focus();rng.moveStart('character',strLen+txtAdWords.value.Length);rng.collapse();//光标定位至新粘贴内容的最后rng.select();}系统的右键粘贴功能已在WebBrowser控件中禁用,为防止使用Ctrl+V进行粘贴,将Ctrl+V进行重新定义:iframeAdWords.document.onkeydown=fliterCtrlV;functionfliterCtrlV(){if(iframeAdWords.event.keyCode==86&&iframeAdWords.event.ctrlKey){pasteText();returnfalse;}}2.3采用客户端正则表达式替换实现绝对化词语自动审查根据1.4的数据传输量需求,为防止上万字的广告词传输到服务器端,审查后再将结果发回客户端,造成网络资源的浪费,系统最终采取客户端审查的方法,从而大大降低网络数据传输量,同时减轻服务器负担,保持系统在客户端运行流畅。绝对化词语的自动审查其实是多模式字符串匹配的问题,目前多模式匹配算法如经典的AC算、Wh算法等算法以及他们的改进算法对于中英文混合环境下的多模式匹配都存在一定的缺陷,因此,本系统并未采取这些多模式匹配算法,而是采用简单方便且准确的正则表达式替换来实现自动审查。实际测试时,采用3万字的广告词、10个左右绝对化词语,匹配替换的时间均在50毫秒以内,匹配准确无误,符合需求。其代码如下:functionautoReview(keyWords){……//略去验证等准备工作代码keyWords=eval(keyWords);varadWords=iframeAdWords.document.body.innerHThL;varagainstKeyWordID=newArray();//存放检测到的绝对化词语的IDvarregStr="";varreg=newRegExp("()(.+?)()","g");if(adWords.test(reg))//再次审查前将原高亮显示的文本取消高亮显示adWords=adWords.replace(reg,"$2");{againstKeyWordID.push(keyWords[i].keyWordID);regStr+=keyWords[i].name+"|";//构建正则表达式}}regStr.substring(0,regStr.length-1);reg=newRegExp("("+regStr+")","g");//创建正则对象adWords=adWords.replace(reg,"$1");//正则替换}ListlistKeyWord=newList();……//略去从数据库中获取listKeyWord的代码JavaScriptSerializerserializer=newJavaScriptSerializer();lbtnAutoReview.Attributes.Add("onclick","returnautoReview('"+serializer.Serialize(listKeyWord)+"')");//为lbtnAutoReview控件添加客户端事件,将listKeyWord序列化为JSON字符串作为autoReview方法的参数客户端获得到的参数keywords形如:[{"keyWordlD":1,"name":最佳},{"keyWordlD":2,"name":第一},……],即为图1所示二维数组,客户端javascript就可使用keyWords[i].name和keyWords[i].keyWordlD这种类似于对象的方式使用参数keyWords。结束语绝对化词语自动审查的功能减轻了审查员的工作量,体现了计算机辅助的优势,使系统向智能化方向前进了一步。后续的工作是进一步对审查功能实现自动化,如对广播中的广告实行语音直接审查、对图片广告进行广告词识别、甚至对视频广告进行视频审查等等。
本文档为【广告审查系统中绝对化词语自动审查的实现】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
zhuyue
暂无简介~
格式:doc
大小:13KB
软件:Word
页数:0
分类:交通与物流
上传时间:2021-10-17
浏览量:1