严奉华
- 作品数:4 被引量:15H指数:2
- 供职机构:浙江理工大学信息电子学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 改进的Web访问日志会话识别算法被引量:12
- 2008年
- 针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界定内容页,并针对内容页,提出了一些启发式规则,突破了"参引长度法"所固有的一个会话中只包含一个内容页的瓶颈。该方法提高了会话识别的准确度,实验结果表明是有效的。
- 严奉华刘建平杨凡丁
- 关键词:WEB日志挖掘数据预处理会话启发式规则
- 基于WEB日志的个性化推荐系统研究
- 随着互联网的普及和电子商务的发展,电子商务系统结构变得越来越复杂,用户经常会迷失在大量的商品信息空间中。电子商务推荐系统能够直接与用户交互,向访问网站的顾客提供商品信息和建议,并模拟销售人员帮助顾客完成购买过程。推荐算法...
- 严奉华
- 关键词:WEB挖掘会话识别个性化推荐协同过滤WEB日志电子商务
- 文献传递
- 浏览行为数据在Web用法挖掘中的应用被引量:2
- 2008年
- 网站用户的浏览行为的不确定性导致从现有的Web日志文件挖掘出的事务模式来预测用户行为越来越困难。引入一种新的数据类型浏览行为数据(BAD)用于提高Web用法挖掘的质量,BAD是一种特殊的浏览数据,如"复制","滚动","另存为",并且没有被日志文件所记录,并给出了BAD的定义。为了象Web日志文件一样记录BAD,介绍并使用一种现有的在线数据收集模块来捕获用户BAD。通过一个电子商务程序的实例说明BAD能增加现有Web事务挖掘算法的有效性。
- 杨凡丁刘建平严奉华
- 关键词:浏览行为
- 一种基于页面兴趣度的关联规则研究被引量:1
- 2009年
- 给出了页面兴趣度的定义,并针对传统的Apriori关联规则算法必须经过大量反复扫描数据库才能产生候选项集的问题,提出了一种改进算法。此算法将数据库经过预处理后,对事务数据库进行分段,比较时可不针对所有事务记录,从而减少比较时间。最后将页面兴趣度应用于改进的Apriori算法中,形成一种基于页面兴趣度的关联规则算法——I_NEW_AR算法。实验结果表明,该算法不仅提高了挖掘效率,而且应用于网上推荐系统具有较好的准确率。
- 刘建东刘建平严奉华杨凡丁
- 关键词:页面兴趣度WEB数据挖掘关联规则