推荐期刊

Web挖掘在电子商务中的应用研究

时间:2015-12-21 00:10:08 所属分类:微电子 浏览量:

[摘 要] 当今电子商务蓬勃发展,其网站服务器上积累了大量的数据,这些数据隐含着很多对市场分析及预测有用的知识,可以运用web挖掘技术加以获得,从而增强企业的竞争力。本文主要介绍了Web挖掘的概念和分类,论述了电子商务中Web挖掘的过程和方法,最后阐述

[摘 要] 当今电子商务蓬勃发展,其网站服务器上积累了大量的数据,这些数据隐含着很多对市场分析及预测有用的知识,可以运用web挖掘技术加以获得,从而增强企业的竞争力。本文主要介绍了Web挖掘的概念和分类,论述了电子商务中Web挖掘的过程和方法,最后阐述了Web挖掘技术在电子商务中的应用。
  [关键词] 电子商务 数据挖掘 Web挖掘
  
  电子商务采用数字化方式进行商业活动,是在电子网络环境中进行商品和服务的贸易活动。近年来,随着网络的普及和Internet的发展,各企业均积累了大量的数据。如何从这些数据中发现潜在的规律,来帮助制定企业今后的发展战略,是各电子商务平台急待解决的问题。Web挖掘作为数据挖掘的一个重要分支,为上述问题提供了有效的解决途径。
  一、web挖掘
  数据挖掘就是从大量的、不完全的、有噪声的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的知识的过程。它融合了数据库、人工智能、机器学习等多个领域的理论和技术。Web 挖掘是数据挖掘在web上的应用,是指从与web相关的资源和行为中抽取感兴趣的、有用的模式和隐含知识。一般地,Web挖掘可分为三类:
  1.Web内容挖掘,是从文档内容或其描述中抽取知识的过程。它又可以分为Web 页面内容挖掘和搜索结果挖掘。页面内容挖掘指的就是对Web 页面上的数据进行挖掘, 而搜索结果挖掘则指的是以某一搜索引擎为基础,对已搜索结果进行挖掘。
  2.Web结构挖掘,是从www的组织结构和链接关系中推导知识。它又可以分为外部结构挖掘、内部结构挖掘和URL挖掘。Web结构挖掘的目的是通过聚类和分析网页的链接, 发现网页的结构和有用的模式, 找出权威页面。
  3.Web使用挖掘,即Web日志挖掘,是通过挖掘Web日志记录,发现用户访问Web页面的模式。它又可分为一般访问模式挖掘和个性化服务模式挖掘。
  二、Web挖掘的过程
  1.数据收集。Web挖掘的数据对象包括服务器日志数据、代理服务器数据、web页面内容、web超链接信息、用户注册信息等,其中服务器日志数据是web挖掘的主要对象。
  2.数据预处理。数据预处理是web挖掘的重要步骤,直接影响到最后挖掘结果的正确性和准确性。它通常包括以下几个方面:
  (1)数据清洗,是指根据需要删除与web挖掘任务无关的数据,过滤掉不需要的记录。(2)反蜘蛛化。现在互联网上有大量的蜘蛛程序,它们模拟用户在各网页间爬来爬去。但它们并不代表真实的电子商务用户,因此需要把服务器日志中的蜘蛛记录过滤掉,以更真实地反映实际情况。(3)客户认证,是从服务器日志中识别出访问网站的每个用户。(4)会话识别。会话是指客户在一次访问中所访问的所有web页面,通过分析可以得到,用户对电子商务站点的兴趣所在。(5)路径补全。由于客户端缓存的存在,会造成一些重要的访问信息被遗漏,所以需要对用户访问的前后页面进行推理,补全访问路径。
3.模式发现,是运用各种方法,发现隐藏的模式和规则。常用的方法有:关联分析,分类分析,聚类分析,序列分析。
  4.模式分析。模式分析是找出所发现模式集合中的有用模式,以便对决策提供支持。如果所有模式均不令人满意,则需要重新挖掘。
  三、Web挖掘的方法
  1.关联分析,用于发现同一事件中不同数据项的相关性。常用的Apriori算法分为两步,首先找出满足最小支持度阈值的频繁项集;然后由它们形成满足最小置信度阈值的强关联规则。可以将web挖掘得到的关联规则用于改进电子商务站点的结构,将相关联的商品放在一起,减轻用户过滤信息的负担,增加交叉销售。
  2.分类分析,通过学习已被告知类标号的训练集,得到分类器模型,然后将其用于对其它数据的分类。常用的方法有贝叶斯分类法、决策树技术和支持向量机技术。
  3.聚类分析,使用划分方法、层次方法、基于密度的方法、基于网格的方法等技术,使同一类中的对象之间具有很高的相似度,而不同类中的对象高度相异。经聚类分析,可以对电子商务平台中的具有相似浏览模式的用户提供个性服务,以满足该类消费群体的特殊需要。
  4.序列分析,是挖掘频繁出现的有序事件或子序列模式,侧重于数据项间的前后关系。在电子商务平台上,可以帮助企业预测用户未来的购买行为,指导企业制定销售计划。
  四、Web挖掘在电子商务中的应用
  1.提供个性化服务。通过分析用户的访问模式,对用户进行聚类和分类,为每一类用户提供迎合其兴趣的个性化服务,提高电子商务平台的人性化设计,从而提高用户的满意度,留住老用户;对具有潜在消费能力的用户,通过提供个性化服务,可以刺激他们的消费,提高电子商务平台的亲和力。
  2.优化web站点结构。通过分析用户的浏览路径,用有向图来表示用户的整个页面访问过程,图中的顶点代表页面,图中的边代表页面的访问顺序。通过web挖掘找出频繁访问路径,得到电子商务平台上的主要页面,将重要的销售信息放在上面,有利于用户快速找到自己需要的商品。
  3.降低电子商务平台运营成本。通过挖掘用户的行为记录和反馈情况,预测未来的购买行为,进行有针对性的市场营销活动;通过分析用户感兴趣的页面,有针对性地投放广告。
  五、结束语
  随着信息技术的飞速发展,电子商务在商业贸易中的份额越来越大,使用web挖掘技术对企业积累的海量数据进行处理,挖掘出合适的模式,帮助企业在激烈的市场竞争中做出正确的决策,对提高企业的市场竞争力有重要意义。随着web挖掘技术的不断发展和成熟,一定会在电子商务应用领域有广阔的应用前景。
  参考文献:
  [1]Jiawei Han,Micheline Kamber 着,范 明,孟小峰 译:数据挖掘概念与技术[M].机械工业出版社,2001,8
  [2]朱志国 孔立平:Web使用挖掘技术在电子商务的研究与应用.长沙通信职业技术学院学报,2007,7(1):32~37

转载请注明来自:http://www.zazhifabiao.com/lunwen/dzxx/wdz/33033.html