陕西省教育厅科研计划项目(06JK229)
- 作品数:2 被引量:3H指数:1
- 相关作者:冯博琴周红芳岳辉吕林涛更多>>
- 相关机构:西安交通大学西安理工大学更多>>
- 发文基金:国家高技术研究发展计划陕西省教育厅科研计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于语义模型的Web挖掘算法研究被引量:1
- 2009年
- 分析了Web日志和用户查询行为之间存在的潜在语义关系,提出了一个能够有效反映用户查询行为的语义模型.提出了一个Web挖掘算法.由于Web日志是一个典型的稀疏矩阵,进一步给出了加速的Web挖掘算法.实验结果表明,基于语义模型的Web挖掘算法是可行、有效的.
- 周红芳冯博琴岳辉吕林涛
- 关键词:WEB挖掘语义模型信息检索迭代算法
- 基于模糊集的主题提取和层次发现算法被引量:2
- 2007年
- 从语义相关性角度分析超链归纳主题搜索(HITS)算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,提出了一种基于模糊集的主题提取和层次发现算法(FSTH),通过用户日志扩展查询词,构造符合用户需要的个性化根集和基础集合,达到防止主题漂移的目的。FSTH采用模糊集划分方法,层次地发现与用户查询相关的主题页面集合,利用HITS算法分别计算每个主题页面集合中页面的权威值,返回与查询相关的其他主题权威页面。在14个查询上的实验结果表明,与HITS算法相比,FSTH算法不仅可以减少7%~53%的主题漂移率,而且可以发现与查询相关的多个主题。
- 周红芳冯博琴
- 关键词:模糊集主题提取主题漂移查询扩展