您的位置: 专家智库 > >

于雪丽

作品数:1 被引量:4H指数:1
供职机构:青岛大学信息工程学院更多>>
发文基金:国家科技支撑计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇中文
  • 1篇中文分词
  • 1篇分词
  • 1篇LUCENE

机构

  • 1篇青岛大学

作者

  • 1篇戴洪
  • 1篇蒋静
  • 1篇樊程
  • 1篇于雪丽

传媒

  • 1篇青岛大学学报...

年份

  • 1篇2011
1 条 记 录,以下是 1-1
排序方式:
一种基于LUCENE的中文分词算法研究被引量:4
2011年
由于Lucene自带的ChineseAnalyzer和CJKAnalyzer两种中文分析器不能够满足全文检索系统的应用,本文给出了一种新的中文分词算法,用于改进Lucene中文分析器。该算法基于字符串匹配原理,实现了正向和逆向相结合的最大增字匹配分词算法。通过实验仿真,比较改进后的分析器与Lucene自带的两种分析器在分词效果和效率上的差异。结果显示,改进后的分析器分词效果明显优于Lucene自带的两种分析器,提高了全文检索系统的中文处理能力,系统的查全率和查准率都达到用户的需求。
戴洪蒋静樊程于雪丽
关键词:LUCENE中文分词
共1页<1>
聚类工具0