下载
加入VIP
  • 专属下载特权
  • 现金文档折扣购买
  • VIP免费专区
  • 千万文档免费下载

上传资料

关闭

关闭

关闭

封号提示

内容

首页 阿里巴巴电子商务平台质量评价体系

阿里巴巴电子商务平台质量评价体系.doc

阿里巴巴电子商务平台质量评价体系

那段残缺的记忆变成我今生的唯一
2017-09-28 0人阅读 举报 0 0 暂无简介

简介:本文档为《阿里巴巴电子商务平台质量评价体系doc》,可适用于企业制度领域

阿里巴巴电子商务平台质量评价体系电子商务应用现状电子商务的概念电子商务泛指通过电子手段进行的商业贸易活动由于其涵盖的范围很广国内外尚无统一的定义。其英文名称即有用EC(ElectronicCo~erce)也有用EB(EleetronicBusiness)并无统一的定论。国内外各个有影响的国际组织、跨国公司都有自己对电子商务的定义。电子商务的分类电子商务按电子商务交易涉及的参与方、电子商务交易所涉及的商品内容和进行电子业务的企业所使用的网络类型等对电子商务进行不同的分类。本文按照电子商务中进行商务活动的参与方来划分。电子商务参与方主要有四部分即企业、个人消费者、政府和中介方。应该看到中介方只是为电子商务的实现与开展提供技术、管理与服务支持而前三者则是以另一种姿态成为参与方的。尽管有些网上拍卖形式的电子商务属于个人与个人之间的交易但是可以这样讲企业是电子商务的核心考察电子商务的类型主要从企业的角度来进行分析。信用卡的普及应用:信用卡以其方便、快捷、安全等优点而成为人们消费支付的重要手段并由此形成了完善的全球性信用卡计算机网络支付与结算系统使“一卡在手、走遍全球”成为可能同时也为电子商务中的网上支付提供的重要的手段电子安全交易协议的制定:年月日由美国v工SA和Mastercard国际组织等联合指定的SET(SeeureEleetronieTransferProt。eol)即电子安全交易协议的出台以及该协议得到大多数厂商的认可和支持为在开发网络上的电子商务提供了一个关键的安全环境政府的支持与推动:自年欧盟发布了欧洲电子商务协议美国随后发布“全球电子商务纲要”以后电子商务受到世界各国政府的重视许多国家的政府开始尝试“网上采购”这为电子商务的发展提供了有利的支持。通过纸面打印来传递和管理信息的不能将信息直接转入到信息系统中因此人们开始采用电子数据交换网络(EleetronieDataInterehangeEDI)作为企业间电子商务的应用技术这也就是电子商务的雏形。ED工在年代末期产生于美国当时的贸易商们在使用计算机处理各类商务文件的时候发现由人工输入到一台计算机中的数据rk是来源于另一台计算机输出的文件由于过多的人为因素影响了数据的准确性和工作效率的提高人们开始尝试在贸易伙伴之间的计算机上使数据能够自动交换EDI应运而生。基于EDI的电子商务系统按照统一规定的标准格式将标准的网络为基础以国家金关工程为代表以外经贸管理服务为重要内容逐步发展起来的。我国政府相继实施了金桥、金卡、金关等一系列金字工程为我国电子商务的发展作了良好的铺垫。年全国电子商务交易总额达万亿元比上年度增长。中国网络购物发展迅速年月底网络购物用户人数达到万半年内增加k。截至年月电子商务类站点的总体用户覆盖已经从万户提升至万户。我国电子商务面临的问题当前我国电子商务呈现多层次、多元化的发展态势。电子商务正在从大城市、沿海城市向中小城市、内地城市扩张同时其行业应用进一步普及外贸、能源、制造、金融等行业成为发展电子商务的先行行业。在经济发达的东部地区行业网站发展迅速仅浙江地区就有上千家约占全部行业网站的二分之一。据介绍我国网民年月已达到亿超过美国居全球第一。第页共页国际出口宽带量已经超过G年增长率达到域名近万个年增长约在国家级域名中实用域名仅次于德国居全国第二。网站已经超过万个网页超过亿年增长达到。我国电子商务取得了快速发展但依然面临很多新的挑战函待进行电子商务技术、发展模式和业务模式上的创新。虽然电子商务交易额形成一定规模但其发展依然受到国际贸易跨境物流问题、地区间数字化差异问题、网上信用制度不健全问题、网络安全问题、标准问题以及法规障碍等一系列问题的制约。因此我国电子商务的发展任重道远。电子商务评价的现状电子商务评价的定义评价的概念电子商务评价是指根据一定的评价方法和评价内容与指标对电子商务网站运行状况和工作质量进行评价。通过评价活动促进电子商务网站的整体水平和质量的提高从而推动电子商务的发展。评价内容电子商务系统涉及企业的各个方面是一个综合的系统电子商务系统主要有以下几个部分组成:l)电子商务基础平台。包括负荷均衡、连接传输管理、网站管理、数据管理、事务管理和安全管理等部分。)企业内部信息系统。包括企业内部MIS、EDP和DDS等子系统。)电子商务服务平台。包括支付网关接口、客户关系管理、内容管理、认证中心接口、搜索引擎和商务智能工具等。)电子商务应用系统。电子商务应用系统以实现企业的商务目的为目标使用各种与工nternet有关的技术手段在Web上建立起自己的电子商务应用系统是电子商务系统的核心。电子商务应用系统是应用开发人员根据企业的特定应用背景和需要而开发出来的对企业的电子商务活动提供具体的支持。其中电子商务中的搜索引擎系统是应用系统的核心。)电子商务应用平台。电子商务应用平台直接面对电子商务系统的最终用户建立在电子商务系统的顶层。电子商务系统平台以Web服务器为核心。作用一是作为与用户的接口接受用户的各种请求并将用户的请求传递给应用系统二是将应用系统的结果以不同的形式表达将其提供给不同的用户形象终端(个人电脑、个人数字助理、掌上电脑、无线移动通讯设备等)。)安全保障环境。主要包括安全体系、安全策略和安全措施等。安全策略负责电子商务系统的安全提高是企业保障电子商务系统安全的指导原则安全体系利用各种安全手段设置安全防线、防范各种非法访问和攻击安全体系需要各种必需的设备和关键技术。电子商务评价方式和方法电子商务评价方式电子商务系统的评价是一项系统工程需要专业知识和技术作为支持目前电子商务系统评价的主要方式有以下几种:)委托国内外权威专业评价机构进行评价。国内外的一些权威专业评价机构不但具有比较先进的评价方法和设备、而且拥有一支具有丰富评价经验的专业评价人员队伍他们能够站在比较公正的立场来进行电子商务系统的评价得出比较客观、公正的评价结果但是评价费用往往比较局。)权威机构网站评比活动。国内外诸如中国互联网络信息中心(CNNIc)的一些权威网站管理机构会定期不定期地进行网站经营状况的统计和评比。)客户评价。客户评价是针对客户对企业电子商务系统的满意情况的定性评价客户评价采取向客户发送包括所需评价项目的网上调查表以有奖的形式收集客户的意见。然后由管理人员自己对获得的反馈信息进行统计分析。客户的评价一般是比较真实可信并且也是很全面的。)自我评价。自我评价是指企业自己组织进行自我评价或者利用专业评价机构提供的评价系统进行的自我评价。自我评价与委托权威专业机构进行评价相比自我评价有保密性好、成本较低和使用方便等优点:但是网站流量指标统计就是通过特定的软件统计、分析网站的浏览量。国际上著名的咨询调查机构如MediaMetrix公司(wwwmediametrixeom)、AeNielsen媒体研究所(~netratingscom)等采用独立用户访问量指标来确定网站流量并据此定期发布网站排名。ALEXA是专门供网站排名的世界著名公司ALEXA排名被公认为网站知名的体现。ALExA的三个指标:百万人访问率(reachPermillionusers)可粗略看到其吸引新人的能力及趋势人均浏览页数印ageviewsperuser)可以粗略看到其内容留住来访者能力和趋势流量排名(trafficrank)是一个综合指标被许多公司和研究机构当作衡量网站知名度的标准。国内有一定影响的网站访问量统计机构如中国互联网络信息中心(CNNIC)的第三方网站流量认证系统(http洲认氏切以cunienetcn)、网易中文网站排行榜(http:肠estneteaseeom)也是采用网站流量指标排名方法。网站的排名一般有每周排名、每月排名也有昨天最新排名。国际上对独立用户通用的定义是:在一定统计周期内(一个月或一个星期)对于一个用户来说访问一个网站一次或多次都按一个用户数计算。但是国内外关于网站流量指标的定义并不一致国内各网站采取的定义方法也有所不同。这样在一定程度上限制了国内网站流量排名的权威性和一致性。而且最重要的是国外咨询机构采用的是实际监测的手段而上述国内网站流量主要采取在被测网站加入代码的方式并且对于是否参与排名、是否公开排名结果完全出于自愿这样网站访问量排名的真实性、全面性等均无法保证。即使如此参加类似的网站排名对于提高网站知名度仍然起到一定作用。专家评价专家评价法是一种采用规定的程序对专家进行调查依靠专家的知识和经验由专家通过综合分析研究对问题做出判断、评价的一种方法。例如CTe中国竞赛在线(http刃~weteorgen)于年月举办的“中国优秀网站评选”将网站分为综合与门户、政府与组织、电脑与网络等个第页共页类别。初选由评选机构选定个以内的候选网站评选活动首先由公众在网上投票并发表意见最终结果则由评选委员会根据综合因素评定实际上主要决定于专家评价。专家评价法有集思广益的优点可以对各被选网站进行综合评价但其局限性也十分明显。例如:专家团人数有限代表性不够全面难以避免部分专家的倾向性个别权威人物或言辞影响力较大的专家可能左右讨论结果有些专家出于情面因素即使不同意他人观点也不便于当面提出从而影响整个评价结果的公正性。问卷调查问卷调查是一种常用的调查方式通常有抽样调查和在线调查等形式。中国互联网络信息中心历次中国十大网站的评比结果都是基于在线问卷调查的方式。这种形式的主要弊端在于有人为作弊的可能为剔除无效问卷要花费较多人力。但是由于问卷调查结果的可信水平与问卷的设计、抽样方法、样本数量、样本分布、系统误差、调查费用等多种因素有关问卷调查的结果也只能在一定程度上反映出网站在人们心目中的“形象”。对于任何一家评比网站来说建立科学的评价标准并保持自身的公正形象至关重要。但是无论是在线调查还是专家评价都摆脱不了主观因素的影响因为各人的经历、偏好有所不同对每种标准的判断就会有差异。所以无论定量分析还是定性描述各种评比方法都存在一定的缺陷。综合评价方法鉴于以上各种网站评价方法都有一定的局限性电子商务网站评价需要一种综合性的评价方法即动态监测、市场调查、专家评价为一体的综合评价模式。这需要有科学的分析评价方法全面、公平、客观的评价体系权威、公正的专家团体也需要有科学、合理并有足够样本量的固定样本作为基础。在这种评价方法中首先是建立加权的综合评价指标体系然后通过技术测量、专家调查、用户调查等方法收集数据并建立监测数据库、调查数据库等再采用定性与定量方法、比较分析方法、模型分析方法等对数据库存及其相关资源进行挖掘和分析。国内外评价对比及问题分析第页共页本小节对比分析中外两家知名的第三方评价公司的评价内容和指标。找出中外评价上的差距和问题。国内外电子商务评价内容对比Gomez公司是国外著名的网站测评机构该公司主要从客户需求、客户满意的角度来制定网站的评价内容和指标。Gomez公司制定了个一级指标:易用性、用户信心、站点资源、客户关系服务和总成本评价指标及指标解释如下:)易用性(EaseofUse):网页应与一致的形式和直观的网站外观相结合布局要合理并与内容和功能相结合提供有用的示范和广泛的联机帮助。)用户信心(CustomerConfidence):网站应高度可靠拥有知识丰富且易于访问的客户服务机构并且提供质量和安全保护。)站点资源(onsitehiformation):不仅在站点上提供广泛的产品和服务方面的信息还要通过电子账户、交易、工具和信息查询等方式提供针对这些产品和服务的全方位的深度服务。)客户关系服务(RelationshipServices):企业通过个性化服务建立电子化的客户关系服务允许客户在线提出服务请求通过客户联谊活动和额外津贴等方式提高客户的忠诚度和集体感。)总成本(OveranCost):指企业为用户提供的定制一揽子服务所需要的成本包括一揽子服务的原材料成本、运输和处理的附加费用、最小的收支差额和利率。CNNIC主要从技术的角度来制定网站的评价内容和指标。CNNIC制定了个一级指标:网站、网页、在线数据库。评价指标及指标解释如下:l)网站:网站相关特征(每天页面访问数、服务器拥有情况、网站的链接数、网站的员工数、网站成立时间、频道数、网站版本、网站的可访问性、安全性)网站效果指标(信息发布、业务结合)。)网页:网页长度、网页的更新周期、网页编码状况。)在线数据库:使用情况、服务方式、在线数据库更新状况、数据库容量、是否同时具有其他载体。从上述两种评价体系的对比中可以看到国内外在企业电子商务网站评价指标上有较大的区别。首先在评价内容上国外更注重网站的功能与业务以及客户服务的水平和质量而国内主要是对网站的技术性能进行评价。这既反映了我国企业电子商务发展的水平差距也反映了我国企业电子商务活动中对客户的重要性和价第页共页值认识存在不足。其次在评价方法上虽然国内外都普遍采取网站流量指标评价、专家评价、问卷调查评价、计算机搜索等方法但国内网站评价所采用的问卷调查其数据采样中存在数量上的不足因为我国真正参与电子商务交易的企业数量有限。此外在数据处理与分析时较少采取加权指标评价、模型评价、动态分析评价等方法影响了评价的准确性。再次虽然我国官方和非官方的测评机构在网站评价方面均有一定的影响但它们在评价方法和内容上都存在不足对企业电子商务网站的发展也没有起到应有的促进作用。存在问题分析综上所述尽管对电子商务的各类指标按照网站、技术、客户个角度细化并取得一定的成果但还是存在以下问题的不足。l)电子商务的相关者包括开发者、用户、管理者等。成功的电子商务与这些角色息息相关。而角色的不同使他们对电子商务的要求、理解不同导致对电子商务不同的评价。现在的研究没有讲电子商务的这些相关者的视点结合在一起。)电子商务网站中的搜索没有纳入到指标体系中。随着搜索功能的普及以及网民对电子商务的熟悉越来越多的BZB、BZC、CZC等网站的用户习惯用搜索来寻找所需商品。但是目前搜索功能几乎很少纳入到指标体系中。)忽略了用户需求。用户的需求是不断的变化。随着市场竞争的日趋激烈以及人们期望的不断提高今天是用户满意的产品明天或许被用户所遗忘所以需要有衡量用户需求的评价连续不断的满足用户需求。针对以上问题作者拟从我国电子商务的实际环境和发展条件研究基于用户的电子商务搜索质量的评价方法建立一套基于用户需求的搜索评价体系并从我国电子商务网站的实证来验证。电子商务网站搜索及用户需求年初美国知名市场调研公司Comscore发布的年全球大搜索引擎排名报告第一名是美国的Google然后是雅虎搜索引擎令人关注的是排在第名的是阿里巴巴网站。阿里巴巴网站是面向中间交易市场的一家BZB公司。这一报告显示BZB这类模式不仅是电子商务中的一种也被归入了搜索引擎市场中是垂直搜索引擎中的一种新的类型BZB垂直搜索。随着电子商务的普及越来越多的公司通过电子商务平台对自己的产品和品牌进行推广。BZB平台能否提供符合用户需求的准确有效的信息是电子商务网站竞争力的核心因素之一。本章将在回顾传统搜索信息理论的基础上介绍搜索用户及BZB用户需求、电子商务平台搜索上存在的问题以及问题的原因。搜索引擎的基本情况数据索引和搜索的处理过程数据索引数据的索引分为三个步骤:网页内容的提取、词的识别、标引库的建立。互联网上大部分信息都是以HTML格式存在对于索引来说只处理文本信息。因此需要把网页中文本内容提取出来过滤掉一些脚本标示符和一些无用的广告信息同时记录文本的版面格式信息。词的识别是搜索中非常关键的一部分通过字典文件对网页内的词进行识别。对于西文信息来说需要识别词的不同形式例如:单复数、过去式、组合词、词根等对于一些亚洲语言(中文、日文、韩文等)需要进行分词处理。识别出网页中的每个词并分配唯一的wordID号用于为数据索引中的标引模块服务。标引库的建立是数据索引中结构最复杂的一部分。一般需要建立两种标引:文档标引和关键词标引。文档标引分配每个网页一个唯一的docID号根据docID标引出在这个网页中出现过多少过wordiD每个wordID出现的次数、位置、大小写格式等形成docID对应wordiD的数据列表关键词标引其实是对文档标引的逆标引根据wordiD标引出这个词出现在那些网页(用wordiD表示)出现在每个网页的次数、位置、大小写格式等形成wordID对应docID的列表。搜索的过程搜索的处理过程是对用户的搜索请求进行满足的过程通过用户输入搜索关键字搜索服务器对应关键词字典把搜索关键词转化为wordID然后在标引第页共页库中得到docID列表对docID列表进行扫描和wordID的匹配提取满足条件的网页然后计算网页和关键词的相关度根据相关度的数值返回前K篇结果(不同的搜索引擎每页的搜索结果数不同)返回给用户。如果用户查看的第二页或者第多少页重新进行搜索把排序结果中在第Kl到*K的网页组织返回给用户。其处理流程如下图所示:搜索相关性理论及评价方法相关性排序技术的产生主要是由搜索引擎的特点决定的。首先现代搜索引擎能够访问的W亡b网页数量已经达到上十亿的规模哪怕用户只是搜索其中很少的一部分内容基于全文搜索技术的搜索引擎也能返回成千上万的页面。即便这些结果网页都是用户所需要的用户也没有可能对所有的网页浏览一遍所以能够将用户最感兴趣的结果网页放于前面势必可以增强搜索引擎用户的满意度。其次搜索引擎用户自身的搜索专业能力通常很有限在最为普遍的关键词搜索行为中用户一般只是键入几个词语。例如SPink等曾对Excite等搜索引擎的近位用户做过实验调查发现人均输入的搜索词为个。国内部分学者也有相似的结论发现左右的用户输入的中文搜索单字为一个而且字词居多约占其次为字词(约占)和字词(约占)。过少的搜索词事实上无法真正表达用户的搜索需求而且用户通常也不去进行复杂的逻辑构造只有相当少的用户进行布尔逻辑搜索、限制性搜索和高级搜索等方法仅有的搜索式中包含有布尔逻辑算符。国内的部分学者的研究结果也表明约的用户不能正确运用字段搜索或二次搜索左右的用户不能正确运用高级搜索功能甚至还发现用户缺乏动力去学习复杂的搜索技能多数用户都寄希望于搜索引擎能够自动地为他们构造有效的搜索式。由于缺乏过去联机搜索中常常具备的搜索人员因此用户实际的搜索行为与用户理想的搜索行为存在事实上的差距搜索结果的不满意也是不奇怪的。正是由于这个特点搜索引擎就必须设法将用户最想要的网页结果尽可能地放到网页结果的前面这就是网页相关度排序算法在搜索引擎中为什么非常重要的原因。现阶段的相关度排序技术主要有以下几种:一是基于传统信息搜索技术的方式它主要利用关键词本身在文档中的重要程度来对文档与用户查询要求的相关度做出测量如利用网页中关键词出现的频率和位置。一般而言搜索出的网页文档中含有的查询关键词个数越多相关性越大并且此关键词的区分度越高同时查询关键词如果出现在诸如标题字段等重要位置上则比出现在正文的相关度要大。二是超链分析技术使用此技术的代表性搜索引擎有Google和Baidu等。和前者相比它以网页被认可的重要程度作为搜索结果的相关度排序依据。从设计思想上看它更注重第三方对该网页的认可如具有较大链入网页数的网页才是得到广泛认可的重要网页而根据关键词位置和频率的传统方法只是一种网页自我认可的形式缺乏客观性。最后还有一些其他方式如由用户自由定义排序规则的自定义方式。北京大学的天网FTP搜索引擎就采用这种排序方式它可以让用户选择诸如时间、大小、稳定性和距离等具体排序指标来对结果网页进行相关度排序。再如收费排名模式它作为搜索引擎的一种主要赢利手段在具有网络门户特点的大型搜索引擎中广为使用但是担心影响搜索结果的客观性这种方式不是它们的主流排序方式而仅仅作为一个补充显示在付费搜索栏目中。搜索引擎中的相关性指标是衡量信息搜索系统性能的重要指标之一这个指标也是质量评价系统的重要组成部分。电子商务网站中的站内搜索实现原理同搜索原理一致相关性的指标也是电子商务网站质量体系中的重要指标。第巧页共页由于搜索引擎系统的评价一般都需要人工参与通过用户对各个查询结果的正确性进行人工标注综合用户对结果的正确性标注来评价搜索引擎系统的性能。下面是常用的几种评价方法准确率评价方法比萨大学的PaoloFerragina和伊利诺伊大学香槟分校的XuehuaShen分别提到了使用排序靠前的检索结果的准确率(precisionatNdocument简称为PN)作为系统性能评价度量的人工评价方法。该评价方法只利用用户每次查询结果中排序靠前的结果来对系统性能进行评价因此参与评价的用户只对自己每个查询返回的前N个结果的正确性进行标注。系统利用每个查询前N个结果中标注为正确的结果所占比例作为系统性能的评价指标此值越高则说明系统性能越好。PN方法与信息检索中普遍使用的准确率方法类似其优点在于计算公式简单根据普通用户使用检索系统的习惯只利用前N个结果的准确率可以突出重点而且减少了评价用户的工作量实现起来较简单。此方法的缺点是用户的相关性标注缺乏指导、随意性较大。模糊综合评价方法模糊数学理论是近年来发展起来的科学相关性的好坏具有模糊的概念因此也可以用它来评价相关性。对相关性进行综合评价打破以往仅用一个确定性的数字指标来评价相关性的方法并可以弥补其中的不足更客观、科学地对相关性进行评价。专家对搜索结果的相关性打分打分标准通常是非常好、很好、一般好、不好等内容。对不同的打分标准赋予相应的数值这样有利于定性指标定量化。标DCG评价方法‘麻省理工大学的JaimeTeevan提出了利用人工对查询结果打分的方式结合DCG(DiseountedCumulativeGain)公式来评价个性化检索系统的方法。此方法依据不同网页在检索结果中排序的不同给其赋予不同的重要度排序越高的检索结果重要度越大用户对其的打分对系统性能的影响也越大因此利用DCG公式将用户对检索结果的打分与结果的排序位置结合计算出的值作为系统性能的评价指标。实际使用中用户更加倾向于查看检索结果中排序靠前的网页因此对于用户来说检索结果排序越靠前的网页对于系统性能的影响也越大DCG评价方法将用户对查询结果的打分与结果在系统检索中的排序结合的做法更加符合用户使用的习惯对系统整体的评价更加符合实际情况。BZB的用户特点和需求搜索用户的行为特点中国互联网络信息中心(简称CNNIC)发布的《年中国搜索用户行为研究报告》显示:截至年底中国搜索引擎用户规模达到亿人年增长率达位列中国互联网第四大应用。报告还指出搜索引擎用户的收入水平高于全国网民的整体水平表明搜索引擎领域里商业价值浓厚。在用户行为上以上的搜索用户在搜索时会使用习惯的关键词。在个人层面上搜索能快速地根据关键词找到个人用户需要的咨询休闲、娱乐是如今网民使用搜索引擎的两大最主要目的。在企业层面上使用搜索可以快速了解相关行业的动态发展做出新一轮工作策略的调整但最大最关注的目的只是尽可能多尽可能快地达成交易。搜索引擎用户中以上的用户都能够自述进行搜索时首先输入的关键词类型只有的人群不固定地输入关键词。其中输入“主要一个关键词”的搜索用户占比最高达。几个关键词搜索得不到理想结果时的做法。当用户在第一次搜索不能得到理想结果后会做出不同的反应。当一次搜索得不到理想结果时平均每个用户会有个不同的应对措施。有的用户会在搜索不到理想结果后采用“更换关键词”的方法重新搜索有的用户会用“增加或者减少关键词”的方法重新搜索这两个方法是用户选择率最高的。另外有的用户会选择更换搜索引擎的用户会选择从结果中再次搜索还有的用户表示放弃继续搜索。进一步研究表明:不同城市、不同网龄、不同首选搜索引擎的用户在第一次搜索失败后的行为选择有明显差异。BZB网站用户的一般行为特点在市场营销原理教课书中对企业用户(或集团购买)和一般消费者的行为特征都有分析相对于消费品市场而言企业用户的购买者数量较少而购买数量或金额通常较大、买卖双方关系比较紧密、没有弹性需求和冲动购买、购买决策过程比较复杂等。在企业间电子商务的初级阶段实际上涉及到的仅仅是企业供求合作信息的发布咨询、买卖双方的沟通和谈判等至于交易过程等高级阶段如合同签定、支付、发货等往往需要利用传统方式在网下完成因此目前需要关注的也只是用户在网上相关的行为特征。BZB网站区别于BZC的基本点之一在于用户行为的差别因为对于BZC模式的电子商务来讲消费者在整个交易过程中是单向的即只有购买而没有销售行为而对于企业用户来讲一般要集买卖双方于一体企业不仅要出售产品还要为生产产品购买原材料、设备、零配件等因此在BZB网站中一个企业可以同时为采购商和供应商有时甚至作为中间商出现。用户登录BZB网站的主要目的在于企业网址推广、发布产品信息、寻找商业机会、寻找新的供应商、研究同行业竞争状况等等无论那种目的其共同之处都在于有明确的利益预期对于长期得不到信息反馈的网站他们会失去信心。由于BZB网站数量在不断增加并没有一个网站可以完全满足所有用户的需求同时用户为寻求最大可能的信息来源或最广泛的宣传效果往往会在多个网站或寻找发布同样的信息即用户具有非固定性。同样是由于大量BZB网站不断涌现的原因为充分利用网上的信息资源用户可能对新发布的网站进行测试性的访问和试用这些试用的用户将来有可能发展为长期用户。综上所述BZB网站用户的一般行为特征是:试用性、非固定性和利益驱动险。BZB网站用户的需求行为供应商的需求行为特征从供应商的状况来看多数为没有建立企业网站或上网不久的企业在网上经营活动中处于最初级的阶段一些网页自动生成系统或自助营销系统通常就是考虑到这些企业的需要而出现的。但是企业的目的显然不是建一个简单的网页来自娱利用网络营销手段来扩大企业的市场空间才是根本目的所以供应商对BZB网站有更大的预期。由于在BZB网站发布供应信息的用户一般为企业(包括私营、个体企业)第页共页为保证自己所发布的信息可以获得最好的效果供应商希望有最合适的产品分类并且希望自己的信息能够排列在最容易被访问者发现的地方如网站首页、相关类别最突出的位置或者在搜索结果中可以显示在比较靠前的地方正像登录搜索引擎一样通过企业站设计的优化将自己的网站排名靠前。但是由于各BZB网站所采取的分类方式和搜索技术不同用户很难了解每个网站的具体情况因而在信息排列位置上几乎总是被动的。采购商的需求特征虽然多数网站的供应信息总是多于求购信息但是这种表面现象并不一定说明供应商比采购商更加依赖BZB网站这是因为需求方有时是隐性的不一定要发布求购信息但是网站设计功能的侧重点和适用性对用户需求的差异的确产生了一定影响。对于采购商用户来说希望有丰富的商品信息以增加可选择的范围所以通常不会在新开业的网站或者信息比较少的网站花费太多的时间。同样面对大量的商品信息如果不能迅速找到自己所需要的产品用户也不会有很大的耐心。这是因为采购商通常已经有相对固定的供应渠道在网上希望发现更加适合自己或成本更低的供应商这需要进行大量对比转换过程可能较长同时又不希望转换成本过高。中间商的需求特征网上的中间商既有商业流通领域中的中间商如批发商等又有信息中介商虽然他们的运作方式有所不同但它们对BZB网站都具有类似的需求特征:不仅希望买卖双方的信息量大而且对信息的实效性要求较高同时希望网站可以提供完善的交易撮合机制。从上面分析可以看出虽然不同类别的用户不论是搜索用户还是商业用户对网站的要求和关注的侧重点是不一样但是都希望能通过搜索快速、省时的找到相关的信息。而BZB电子商务公司的搜索质量成为一个优秀BZB公司的重要衡量指标。BZB电子商务网站质量评价体系设计BZB电子商务能打破地域时空和国界的限制帮助中小企业迅速成长。第三方BZB电子商务平台数量也在不断增加。这些平台为企业减少运作成本、展示企业产品、增加销售途径、提高企业形象等方面都起到了积极作用。但是随着BZB用户的大量增加大批信息充斥在BZB网站上:网络搜索效果不佳面对大量的信息普通用户需要花费大量时间成本投入到搜索和信息选择上。用户需要电子商务平台把最相关的结果排在前面这样能节约用户在搜索筛选上的时间。国内的电子商务提供商中谁能把信息排序做的好谁就能吸引更多的用户。所以提高电子商务平台的搜索质量建立质量评价体系已经成为电子商务平台商迫切要解决的问题。本章主要内容是设计一套适用于BZB电子商务平台的内容质量评价体系这个体系主要由单项测试方法和比较测试方法两部分组成。本章依据传统搜索引擎评价理论进行了基于用户的评价方法的设计包括了评价指标、评价尺度、评价工具以及评价规范。BZB电子商务网站质量评价系统构成基础质量评价体系的需求在竞争日益激烈的BZB电子商务市场中BZB质量评价在网站搜索产品创新开发和引擎质量提升中发挥着重要作用。如果精心设计的搜索产品在市场上不能正确传达概念那么即使是最有创意的概念或者是精心设计的产品都将注定失败。在搜索产品投放市场或引擎质量改进发布前进行科学的质量评价应该成为BZB电子商务网站的运营准则。质量评价看似非常简单因为是基于用户的评价站在用户的角度来评价。然而没有精心设计和可操作的质量评价并不一定能得到理想的结果而且非常可能提供无效甚至错误的评价结果从而导致网站运营的失败。一个设计完善的质量评价系统能提供并满足以下三方面的需求:l)贯穿一致的各种指标和方法包括样本量、数据收集方法、评价指标、评价尺度以及报告格式等)为质量评价体系所关注的重要指标建立标准数据库为新测试提供可比的标准值)为阶段性的分析搜索产品或引擎质量改进提供有效的数据支持。质量评价系统构成要素介绍构成质量评价体系的要素包括以下几个方面。评价目的首先必须明确评价的目的这是评价工作的根本性指导方针。对某一项目展开评价首先要明确为什么要评价评价项目的哪一方面评价的精准度要求等等。被评价对象评价的对象通常是用户搜索的一个搜索词在不同场景下的评价。一种场景下一个搜索词和它搜索出来的搜索结果之间的相关性评价另一种场景下一个搜索词在两个不同的搜索展示页面下的比较测试。被评价对象构成了对象系统而评价对象系统的特点直接决定了评价的内容、方式和方法。评价者评价者可以是某个人或某个团体。评价目的的确定、被评价对象的确定、评价指标的建立、权重系数的确定等等因素都与评价者有关。因此评价者在评价过程中的作用是非常重要的。评价指标指标是指那些根据评价的对象和目的能够确定地反映评价对象某一方面情况的特征数据。每一个评价指标都是从不同侧面刻画评价对象所具有的某种特征一系列相互联系的指标所构成的整体构成了指标体系。指标体系能够根据评价的对象和目的综合反映出评价对象和各方面的情况。需要注意的是评价体系不仅受被评价对象和评价目标的制约而且受评价者主体价值观念的影响。权重系数相对于某一个评价目标来说评价指标之间的相对重要性是不同的。评价指标之间的这种相对重要性大小可以用权重系数来刻画。指标的权重系数是指标对总目标的贡献程度。当被评价对象及评价指标都确定时评价的结果就依赖于权重系数。权重系数确定的是否合理关系到评价结果的可信程度。因此对权重系数的确定应特别谨慎。第页共页评价规范规范是指群体所确立的行为标准。它们可以由组织正式规定也可以是非正式形成。质量评价体系中的规范是评价者在评价过程中共同遵守的评判标准。制定规范的目的是避免千人千面的评价结果。评价者按照共同的评价规范可以保证评价结果集相对准确性。评价结果评价人员测试标注结束后输出评价结果并解释其含义根据评价结果进行决策。要注意的是应当正确认识评价方法公正看待评价结果。评价结果是评价活动的最终输出是评价活动的目的。但对评价结果要注意的问题有:)评价结果具有主观性:任何一种评价方法都要依据一定的权重对各单项结果评判权重比例的改变会变更评价的结果。另外定性评判因素的评判主要依赖于评价者对评价对象的主观感受而对同一被评价对象不同评判者的主观感受是不一样的。所以评价结果存在一定的主观性这是客观存在的。)评价结果具有相对性:评价结果是相对的只能用于性质相同的对象之间的比较和排序而且影响评价结果的因素很多上述的评价目的、评价指标、评价者、权重系数、评价方法等等都对最终评价结果有影响。建立质量评价体系的关键环节评价体系的构成一般可分为以下几个阶段:》熟悉评价对象》确定评价方法》建立评价指标》确定指标的权重》评价指标的验证》分析评价结果其中确定评价方法、建立评价指标、确定指标权重、评价指标验证是评价体系中的关键环节。第页共页BZB电子商务质量评价系统的组成BZB的质量评价体系评价方法、评价指标、评价规范、以及评价工具等构成。一个评价体系可以由一个评价方法或是多个评价方法构成。BZB电子商务平台的用户进入网站复现的搜索场景是:在搜索框中输入要查找的内容>浏览查看结果>对符合自己需求的条目点击进入查看一一再进入另外一页并查看。这个过程就是一个普通BZB电子商务用户的搜索行为。针对BZB电子商务用户的搜索行为特点作者把用户的搜索行为分成部分。用户在搜索框输入搜索词BZB电子商务平台用分页展现的形式给出搜索结果。用户在一页内查找对自己有价值的信息。用户在这个页面中根据页面上的图片、标题、描述等各种信息按照自己的搜索意图筛选信息对有价值的信息会点击进入。这个过程用户是依据搜索词和结果之间的相关联系作为判断标准。评价一个搜索词和搜索结果之间的内容质量是否相关是否能给出用户满意的结果需要在这个过程中制定一个评价方法。这个评价方法称为单项测试法用户在一页内搜索后选择另外一页然后再次重复上述的相关性选择的行为。用户选择进入另外一页的过程是页面之间的对比。页面之间的对比是一个模糊比较的过程也是主观性非常强的判断过程。判断页面之间的整体效果需要用另外一种方法来评价。这种方法也可以叫比较测试法。单项测试在设计中评价人员站在用户的角度来评价较真实模拟用户的行为。该项测试能暴露出搜索产品存在的潜在相关质量问题或引擎质量改进中的问题。单项测试法的理论来自于DCG评价方法。比较测试是一种模糊对比测试通过对算法改进前后两套系统的对比评价者通过对整体页面的主观感受如果能敏感的发现两个页面间有变化说明页面变化较大。例如在测试新旧产品时可以直接用比较测试。因为比较测试能较好的判别产品间的差异。比较测试法的理论来自于模糊综合评价方法最后把两种评价方法汇总最终形成一个质量评价体系。下面分别来介绍一下这两种评价类型。单项测试法设计用户在搜索框输入搜索词后查看整体搜索结果选择并点击进入的这个过程是用户和搜索的一个互动之间的联系纽带就是相关性。所以单项测试方第页共页法也被称为相关性评价法。单项测试法是引用了搜索引擎常用评价方法中的DCG方法。评价目的对搜索词和搜索结果之间的相关性做人工判断按照Likert的量表划分相关性。按照指标计算最后的相关性结果。评价对象从网站日志中选择一定数量的用户搜索词用这些词匹配上对应的搜索结果。评价的对象是每个搜索词对应的一条搜索结果相关性强弱查看的是该搜索词和每一条搜索之间的相关联系。评价指标单项测试中的指标也被称为相关性指标。同传统的搜索引擎类似电子商务平台也是把最相关的、最满足用户需求的结果排在搜索页的前面。单项测试法的评价指标采用的是DCG方法中的指标。单项测试法处理过程搜索词的选择和处理从某一天的搜索日志中均匀抽取个搜索词。搜索词的数量选择依据统计理论中的样本。‘其中日期的选择上要选择工作日中的周二至周四避开节假日和休息日。因为节假日或休息日许多采购商休息这时候的网上用户并不能足够代表采购商的搜索意图。而在工作日周二到周四之间是采购商上网查询、采购的热点时期。在这个期间用户的搜索词能够代表采购商的搜索意图。所以在搜索词日期的选择上选在周二至周四的任一天。接下来对个搜索词进行过滤处理的去噪音工作。去掉其中的无意义、拼写错误、残缺的词、无法判断的词。无意义的词没有任何搜索意义的词比如html拼写错误的词绿头(拼写错误应该是豆)饼无法判断的词动完(无法确定这个词的含义)。搜索词选择处理后用这些搜索词匹配搜索结果。搜索结果的选择》搜索词经过人工筛选处理后再和搜索结果匹配。》保留前页的搜索结果。》最后导出搜索结果。评价人对相关性的判断是搜索词和搜索结果之间的相关程度的判断。一个搜索词对应着几条搜索结果评价人员分别对每对(搜索词搜索结果)之间的相关性做判断所以我们讲相关性的判断是对pair(对)的判断。如果一个搜索词有条结果那么就有对Pair的判断。搜索结果的人工标注BZB电子商务网站的搜索结果是由图片和文字共同构成。本文对搜索的每一条记录按照构成结构分别做不同的人工标注。一条搜索记录中用户关键查看的是图片、标题和描述其他信息如地址、价格绝大多数用户是在查看完前面的内容后再去查看。吸引用户的信息主要有图片、标题、摘要构成。所以本文的设计中对搜索人工标注的内容只包括图片(Picture以下简称P)、标题(tiUe以下简称T)对价格、产地中因素忽略不考虑。其他电子商务网站可以根据自己网站排序的特点来自主定义评价的内容。第页共页搜索词处理后匹配上搜索结果。评价人员开始对每一对Pair进行人工标注。标注的尺度参考Likert量表(Likertscale)。Likert量表属于一种测量态度的方法由美国社会心理学家RensisALikert年在原有的总加量表基础上改进而成。我们借鉴Likert量表的划分范围在特别好和差之间划分成个等级即特别好很好一般很差每个量度都对应着一个分数。形成定量的判断。我们可以得出来一个搜索词的相关性分数。单项测试法是一种定性和定量结合的方法。用户按照量度区间去判断是一种定性的判断给每个量度赋予一个分值这是一种定量的方法。定性与定量结合、权值结合的方法可以比较客观的反映电子商务平台是否能满足用户的需求。即使用户的需求是动态变化即使外界科技、技术手段或搜索需求发生改变通过单项测试法可以跟踪用户的需求变化。比较测试方法设计上文介绍的单项测试法关注于搜索词和每一条搜索结果之间的关系。页面之间的内容质量将通过另外一种评价方法来检验。这种方法是比较测试法。比较测试是一种主观定性的方法学术上称为模糊综合评价法「’“因为简单易行容易操作常被应用在受多因素影响的网站评价中。因为电子商务网站中主观满意度、内容可用性等都属于模糊指标。是对单项测试法的一个补充。比较测试法的适用范围》每一次的电子商务网站的技术升级或搜索展示页面改动的效果影响可以用这种方法查验。》每次技术升级影响了排序结果或是页面筛选内容发生变化时需要经过评价。比较测试的设计数据准备准备两套搜索结果一套是技术升级前或是页面改动前的数据一套是技术升级后或是页面改动后的数据。确定评价等级采用Likert量表的等级度量分为“左边很好左边好一样好右边好右边很好”评价工具质量评价体系中的一个重要因素是评价工具的设计和开发。选择一套合适的质量评价体系的工具至关重要。一个优秀的质量评价工具不仅能解决评价人员的数量短缺避免excel中评价中出现的误判等问题还能大大解决评价的成本。目前市场上尚未有针对电子商务质量评价的第三方工具。下面介绍一下评价工具应该具备的几个条件。稳定性一个评价工具首先要保证的是性能的稳定。评价人员在评价的过程中如果发生工具系统不稳定的情况不仅评价的记录可能消失而且可能会耽误评价的进度导致评价项目的延期。所以一个评价工具在设计初期就要选择好数据库类型和编程语言避免在未来使用中出现问题。操作简易型评价工具的主要目的是支持评价任务评价人员在评价的过程中其实也相当于是用户在搜索判断的过程。工具在设计的时候尽可能的模仿自己电子商务网站的风格尽可能的再现搜索的模拟场景。同时在用户选择、评判、提交的每一个动作点需要用明显的颜色或字体标注方便评价人员操作。工具的使用路径尽可能简短。评价人员登陆后在两步能找到评价项目是最有效的路径设计。工具授权这里的工具授权包括二种含义。一种是使用工具要授权一种是访问工具的不同模块要授权。授权的目的是保证评价项目不会受到外来的噪音干扰。没有经过培训的人员进入工具后没有目的的浏览可能会破坏正在评价的项目。所以对使用工具的评价人员要有授权的功能。未授权的人不能访问工具也不会浏览到工具内的内容。一个评价工具内随时有可能出现多个评价项目并行的情况。如果一个单项测试和比较测试同时进行不同评价项目的人员不熟悉其他类型的评价项目。所以需要对不同评价内容的工具模块进行授权。能评价单项测试的评价人员第页共页没有经过培训不能访问比较测试的工具模块。反之亦然。工具统计的功能评价指标确定后可以把指标公式放入到工具中。好处是每次评价项目结束后会马上看到评价的效果不必再把数据从工具中导入人工计算。不仅节省了人力还避免在人工计算中出现的失误。如果对一个评价项目不停的改进升级在工具中可设计一个改进效果趋势图。方便直观的查看这个项目的改进情况。下面是一张评价工具的简易设计图。阿里巴巴网站质量评价体系本章对第章提出的BZB电子商务网站质量评价系统进行实证研究和分析。本研究选择的BZB电子商务平台中的知名公司阿里巴巴网站站点做研究对象。研究对象介绍阿里巴巴介绍阿里巴巴网站(AlibabaCom)是全球企业间(BZB)电子商务的著名品牌是目前全球最大的网上交易市场和商务交流社区。阿里巴巴创建于年年底总部设在杭州并在海外设立美国硅谷、伦敦等分支机构。阿里巴巴是全球企业间(BZB)电子商务的著名品牌是目前全球最大的网上贸易市场。阿里巴巴两次被哈佛大学商学院选为MBA案例在美国学术界掀起研究热潮四次被美国权威财经杂志《福布斯》选为全球最佳BZB站点之一多次被相关机构评为全球最受欢迎的BZB网站、中国商务类优秀网站、中国百家优秀网站、中国最佳贸易网被国内外媒体、硅谷和国外风险投资家誉为与YahooAmazoneBayAOL比肩的五大互联网商务流派代表之一。全球著名的检测权威网站AlexaCom针对全球商务及贸易类网站进行排名调查阿里巴巴网站排名首位。下图是国内第三方评价公司艾瑞发布的《年第一季度中国BZB电子商务市场检测报告》中对国内BZB电子商务平台用户的注册用户和付费用户的规模统计。图OSQI中国主要BZB电子商务运营商付费用户规模阿里巴巴的注册用户和付费用户在中国的BZB市场占有绝对的优势。平台上的用户群体能够代表我国BZB的用户群体。阿里巴巴网站平台介绍阿里巴巴网站的搜索引擎工Search是一套垂直搜索引擎系统。垂直搜索是网页搜索的细分和延伸。阿里巴巴的工Search是完全自主开发的一套分布式计算的搜索引擎。在年之前阿里巴巴网站没有一套独立的质量评价体系质量改进效果只能通过准确率和召回率等传统的网站指标来衡量。这些指标只能衡量引擎本身质量的问题而无法衡量引擎本身的相关性和排序功能。引擎提供的搜索内容是否跟得上用户需求的变化只能通过随机的、零散的、没有形成规范的评价来衡量而缺乏一套系统的、专业的评价体制来衡量。阿里巴巴网站质量评价体系的构建年年初阿里巴巴开始筹划并建立自己的质量评价体系。作者作为质量评价体系的设计人员之一全程参与了质量评价体系的设计、验证、实施过程。质量评价体系的目标设计并建立一套稳定的质量评价体系。可以满足以下需求:)可以衡量引擎技术改进、搜索产品改进或新搜索产品发布的效果)有具体、稳定的指标可以衡量)评价场景可以复现)有稳定的工具支持评价人员的评价工作评价指标的设计和制定质量评价体系中的指标需要不断的修正以适合不同的BZB电子商务网站的需求。阿里巴巴网站属于垂直搜索领域可以使用DCG指标作为质量评价体系的指标。不过上一章提到DCG这个指标中的标注内容、权重是否适合使用需要经过验证后才能确定。评价的内容阿里巴巴平台上每一条搜索结果是由多组信息构成。要判断搜索词和搜索结果的相关性首先要确定要搜索结果中哪些信息对用户起到决定性的影响。对用户有影响的信息是应该纳入到评价测试中。用户在阿里巴巴网站上的搜索框内输入搜索词搜索引擎分析用户的意图并提供相对应的搜索结果。每一个搜索词可能有上万条搜索记录分页形式展现。每一页有条记录。每条记录主要由图片、标题、摘要、发布人、询价、联系方式、地区、价格、诚信通指数、以及阿里旺旺组成。阿里巴巴公司内部做的眼动测试发现用户在查看搜索结果时大多数用户关注的分别是图片、标题、摘要而对其他显示的内容则没有规律性的显示。结合用户调研部门的问卷调查可以汇总出绝大多数的用户会关注图片、标题和摘要。根据上面的结论在设计评价方案时确定了要评价的内容分别是图片、标题。评价指标中的权重上一章设计的评价指标时我们设计的单项测试指标在传统的DCG指标公式上大胆的采用了这个新的概念“屏”的概念。这个概念的来源是提取、分析最近年的公司搜索用户对第一页的点击记录发现用户在条结果中的点击趋势是逐渐下降。阿里巴巴网站中每一页会有条搜索结果。我们把一个页面的条结果做个“屏”的划分。这种权重方法没有学术上的理论依据也不能说是完全正确。为了验证“屏”的趋势是否正确我们收集了前条结果的点击统计日志。计算每个位置的权值。权值的计算如下:第页共页设定第一条搜索结果的权值为第二条搜索结果的权值计算用第二条搜索结果的点击数除以第一条搜索结果的点击数以此类推获取前条搜索结果的权值。获得的权值结果如下表所示:根据累计的用户点击统计分析不同位置(排序位置也称rank)搜索结果用户的点击是不同点击率由高到低逐渐降低。但是每一部分总是会聚在一起虽然数值上有一点差距但是差距不大可以划分出区块这个区块和“屏”的划分一致。每一个屏的点击率也随着排序的降低而降低。而权值的降低趋势并没有点击的趋势明显。权值是可以归类的。通过对点击日志的分析可以说采用“屏”的概念作为评价的一种标准是在分析用户日志的基础上制定出来的是有实践意义的权值指标。阿里巴巴的搜索内容己经超过百万级这么大的样本集人工是无法都评价的。在确定评价样本数量时我们首先分析一年年间的用户行为日志用户查看网页最关注的是前页的结果。页以后的结果用户点击的数量逐渐减少。一个搜索词对应的搜索结果即使全部相关用户也很难把所有的结果都查看。能保证前页即条搜索数据的准确性基本能满足搜索用户的搜索需求。所以样本数量上一个搜索词对应的搜索数量是条即页结果。结合上一章提到的DCG指标以及阿里巴巴搜索本身的特点制定了阿里巴巴的单项测试的指标公式评价数据的选择从阿里巴巴网站的搜索日志中选取评价的测试词。测试词的条件:具有BZB商业特征的词有带英文的搜索词也有带字母的搜索词。具体的选择类别如下:》Top词选择前个》按照不同行业对不同行业的词各取个》随机选取个搜索词评价规范的制定评价规范指的是评价人员共同遵守的标注准则。多人评价工作中如果没有一套共同遵守的标注准则大家按照不同的理解来标注人面标注的结果不统一这样的评价数据是无法用来统计计算也无法发现被评价的主要问题。所以需要制定一套评价规范并培训评价人员学习和遵守。不同的测试方法应该有不同的评价规范。质量评价体系中的比较测试法因为是一项主观性的评价用户可以根据自己的喜好来确定。所以比较测试法不用规定评价规范。第页共页单项测试法需要评价人员遵循共同的标注准则以保证每次测试的数据质量一致。所以单项测试法需要制定规范以保证评价数据的准确性和统一性。我们根据阿里巴巴搜索的特点根据人工经验建立评价级别按照等级度量对每一对pair(搜索词对应的一条搜索结果)做相关性的标注。评价级别制定是特别号、很好、一般好、不好对应的分数分别为、、、O。评价工具设计和开发评价方法不同设计开发不同的评价工具。根据单项测试和比较测试的特点分别设计了单项测试工具和比较测试工具。工具的设计除了保证性能稳定性和访问权限授权外同时也增加了对数据的统计分析和工作量统计的功能。下图是单项测试工具的截图。质量评价体系的使用阿里巴巴质量评价体系的建立开始与年月至年月随着评价工具的完工标志着整个质量评价体系的建设完毕。从年月到至今质量评价体系开始担当质量保证的角色。第一次的评价是对阿里巴巴的搜索质量做评价。评价的分值保存在数据库中。以后的每一次算法改动或新算法上线前先经过质量评价体系获得一个分值然后用这个分值对比前一次改进的分值做比较。如果新的测试分数少于旧的测试分说说明算法改进有问题。通过对数据的人工分析整理案例提供给工程师分析。每次新的算法上线前先通过质量评价体系中的单项测试如果单项测试显示新算法质量优于旧算法再进入比较测试法目的是从用户直观角度查看新旧两个算法展现内容上是否有很大的差距。因为有了质量评价体系的保护算法改进和更新会更有保障。质量评价体系运行至今有年的时间这期间的算法升级给企业带来了稳定提到的收益。正因为有了质量评价体系保证了算法不断的升级和更新。也体现了建立质量评价体系的重要意义

用户评价(0)

关闭

新课改视野下建构高中语文教学实验成果报告(32KB)

抱歉,积分不足下载失败,请稍后再试!

提示

试读已结束,如需要继续阅读或者下载,敬请购买!

文档小程序码

使用微信“扫一扫”扫码寻找文档

1

打开微信

2

扫描小程序码

3

发布寻找信息

4

等待寻找结果

我知道了
评分:

/42

阿里巴巴电子商务平台质量评价体系

VIP

在线
客服

免费
邮箱

爱问共享资料服务号

扫描关注领取更多福利