郭玲
- 作品数:2 被引量:15H指数:2
- 供职机构:中国人民解放军空军雷达学院更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于最大匹配法的中文分词技术改进被引量:2
- 2009年
- 在简介最大匹配法(MM)分词算法的基础上,指出了MM算法存在的不足,分析了MM改进分词算法的需求及过程设计,研究了MM改进分词算法以及过程处理原则,研究了改进算法过程中的歧义检测与切分、未登录词识别等问题,提出了消除策略和处理原则。
- 郭玲孟祥逢张峰
- 关键词:最大匹配法中文分词词频
- 基于遗传神经网络的相似重复记录检测方法被引量:13
- 2010年
- 为了有效解决数据清洗领域中相似重复记录的检测问题,提出了一种基于遗传神经网络的相似重复记录检测方法。该方法计算两条记录对应字段间的相似度,构建基于神经网络的检测模型,利用遗传算法对网络模型的权值进行优化,使用遗传神经网络组合多个字段上的相似度来检测相似重复记录。在不同领域数据集上的测试结果表明,该方法能够提高相似重复记录检测的准确率和检测精度。
- 孟祥逢鲁汉榕郭玲
- 关键词:相似重复记录检测神经网络遗传算法数据清洗数据集成