高兵
- 作品数:3 被引量:9H指数:2
- 供职机构:国防科学技术大学信息系统与管理学院更多>>
- 发文基金:国防科技技术预先研究基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术社会学经济管理更多>>
- 基于词条组合的军事类文本分词方法被引量:2
- 2010年
- 针对传统的分词方法切分军事类文本存在未登录词多和部分词条特征信息不完整的问题,提出把整个分词过程分解为若干子过程,以词串为分词单位对军事类文本进行分词。首先基于词典对文本进行双向扫描,标识歧义切分字段,对切分结果一致的字段进行停用词消除,计算第一次分词得到的词条间的互信息和相邻共现频次,根据计算结果判定相应的词条组合成词串并标识,最后提取所标识的歧义字段和词串由人工对其进行审核处理。实验结果表明,词条组合后的词串的特征信息更丰富,分词效果更好。
- 黄魏高兵刘异杨克巍
- 关键词:军事文本分词词条
- 基于关联规则的武器装备体系能力分类被引量:1
- 2010年
- 针对武器装备体系能力分类涉及利益相关者众多的特点,提出基于关联规则的武器装备体系能力分类方法。介绍关联规则的基本概念,对武器装备体系能力进行预处理后,采用FPgrowth算法挖掘能力间的关联规则,然后对产生的关联规则剪技,根据关联规则完成能力的分类,通过编程对基于规则的武器装备体系能力分类进行测试。分类实验表明,该方法可以完成能力的自动分类,并具有较好的准确率和召回率。
- 黄魏田亮杨克巍高兵
- 关键词:关联规则FP树
- 基于词条组合的中文文本分词方法被引量:7
- 2010年
- 针对汉语自动分词后词条的特征信息缺失的问题,提出以词串为分词单位的中文文本分词方法,将整个分词过程分解为三个子过程:首先,采用逆向最大匹配法对文本进行切分;第二,对切分结果进行停用词消除;第三,计算第一次分词得到的词条互信息和相邻共现频次,根据计算结果判定相应的词条组合成词串。实验结果表明,词条组合后的词串的语义信息更丰富,有助于文本特征选择效果的改善和文本分类性能的提高。
- 黄魏高兵刘异杨克巍
- 关键词:文本文本特征分词词条