魏本洁
- 作品数:3 被引量:1H指数:1
- 供职机构:华南理工大学更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 企业级搜索引擎关键技术的研究与实现
- 企业搜索引擎为用户提供互联网和企业内部与特定组织或特定主题相关联的网络信息检索服务。随着网络信息量爆炸式的增长,企业搜索引擎需要提高采集数据质量,并保障系统的处理规模。本文通过改进搜索策略来提高采集数据的质量,此外,通过...
- 魏本洁
- 关键词:企业级搜索引擎用户查询搜索策略信息检索服务上下文信息
- 文献传递
- 基于网页主题重要性的专题搜索策略研究
- 网页之间的链接结构为评价网页的主题重要性提供了丰富的信息,但传统的基于链接结构评价的主题排序算法,虽然提出了用向量来表示网页在不同主题中的重要程度,但它们在计算过程中没有充分考虑网页本身的主题相关度。为解决这一问题,本文...
- 魏本洁董守斌
- 关键词:搜索引擎上下文信息主题相关度
- 文献传递
- 基于网页主题重要性的专题搜索策略研究被引量:1
- 2008年
- 网页之间的链接结构为评价网页的主题重要性提供了丰富的信息,但传统的基于链接结构评价的主题排序算法,虽然提出了用向量来表示网页在不同主题中的重要程度,但它们在计算过程中没有充分考虑网页本身的主题相关度.为解决这一问题,本文提出根据链接上下文信息得到主题相关度预测,并将其融合到主题重要性的计算中.同时,根据网页的主题重要性排序,来指导专题爬行器的爬行方向.实验结果表明,基于网页主题重要性的排序测度TopicalRank比PageRank、TSPR(Topical-Sensitive PageRank)对专题爬行更有指导意义.
- 魏本洁董守斌
- 关键词:链接结构