刘斌斌
- 作品数:4 被引量:16H指数:2
- 供职机构:重庆大学软件工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于HMM的Web信息抽取算法的研究与应用被引量:12
- 2010年
- 随着因特网技术的迅速发展,网上信息成几何级数增长,如何从这些海量联机非结构化文本中自动抽取出结构化信息成为目前重要的研究课题。研究了基于隐马尔可夫模型的Web信息抽取算法,着重探讨了隐马尔可夫模型在文本信息抽取中应该如何应用,数据应该如何标记,并对隐马尔可夫模型在文本信息抽取中的应用提出了几个改进的方法,建立了基于HMM的Web信息抽取模型,并对信息抽取后的数据进行了分析对比,验证了改进算法的有效性。
- 祝伟华卢熠刘斌斌
- 关键词:隐马尔可夫模型信息抽取
- 基于全文检索工具包Lucene的排序技术被引量:2
- 2008年
- 为了深入理解Lucene使用的排序技术和实际应用,需要研究矢量信息检索模型和td-idf加权策略.根据影响排序的因素,提出了Lucene的文档得分算法,分析了各因素对排序结果的影响.结合实例对基于Lucene排序的相关API进行应用,以提升Lucene排序的性能.
- 祝伟华张正龙刘斌斌
- 关键词:LUCENE相关度
- 二手汽车交易信息垂直搜索网的设计
- 2008年
- 分析二手汽车市场的市场表现及存在的不足开始,对当今比较有代表性的综合搜索引擎、专业化垂直搜索引擎的概念及特点做出了阐述和分析;并详细设计了二手汽车交易信息垂直搜索网站.
- 祝伟华李嘉毅刘斌斌
- 关键词:二手汽车搜索引擎交易信息
- 基于HMM模型的Web信息抽取方法的研究与改进
- 随着因特网技术的迅速发展,网上信息成几何级数增长,如何在海量联机文本中获取所需的信息成为目前重要的研究课题,因此,通用搜索引擎和垂直搜索引擎技术也日益成为人们研究的重点。相对于通用搜索引擎,垂直搜索引擎在信息抽取技术的支...
- 刘斌斌
- 关键词:垂直搜索引擎隐马尔可夫模型机器学习算法
- 文献传递