杨晓军
- 作品数:2 被引量:7H指数:2
- 供职机构:南京工业大学电子与信息工程学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于Compass的全文检索系统的研究与设计被引量:5
- 2010年
- 相对于全文检索工具包Lucene,Compass是一个开源的、高性能的、可灵活配置的搜索引擎框架。在分析了Compass的技术基础之上,提出了1种基于Compass的FTP全文检索系统结构,讨论了系统实现的关键技术。由于Compass是由JAVA开源实现的,因此把它与轻量级的J2EE框架结合起来,增强系统的解耦性,提高应用的可扩展性,降低系统重构的成本,同时也具有可移植行。
- 杨晓军王一莉
- 关键词:COMPASSJ2EE搜索引擎LUCENE
- 一种GIS的中文分词算法研究被引量:2
- 2010年
- 提出了一种应用于GIS领域的中文分词算法.采用将首字和尾种类词用哈希表管理,其余中间字串用Trie树来实现的"首位Hash-Trie树"结构作为词典载体来实现地学词典的高效率存取操作,简化了Trie树的深度,并基于一种改进的正向最大匹配的算法,很好的解决了切分歧义和未登录词的问题.实验结果表明,该算法为GIS中文查询语句的正确理解提供了有效的语义信息.
- 杨晓军王一莉
- 关键词:地理信息系统中文分词TRIE树分词词典