范贤
- 作品数:2 被引量:13H指数:2
- 供职机构:西安邮电大学计算机学院更多>>
- 发文基金:陕西省普通高等学校重点学科专项资金建设项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于信息抽取技术的问答系统被引量:8
- 2017年
- 通过分析实体关系和命名实体,提出基于层次的答案提取方法。在将问题分为实体关系型、实体型和关键词型3类的基础上,按照实体关系层、实体层、关键词层得到答案集,利用基础特征、命名实体匹配和实体关系匹配进行特征排序提取答案。基于NLPCCEVAL2015的测试结果表明,在考虑命名实体和实体关系的情况下,准确率比仅使用基础特征的情形提高了6.1%,达到54.05%。
- 于根李晓戈刘睿范贤杜丽萍
- 关键词:问答系统信息抽取
- 基于表示学习的中文分词被引量:5
- 2016年
- 为提高中文分词的准确率和未登录词(OOV)识别率,提出了一种基于字表示学习方法的中文分词系统。首先使用Skip-gram模型将文本中的词映射为高维向量空间中的向量;其次用K-means聚类算法将词向量聚类,并将聚类结果作为条件随机场(CRF)模型的特征进行训练;最后基于该语言模型进行分词和未登录词识别。对词向量的维数、聚类数及不同聚类算法对分词的影响进行了分析。基于第四届自然语言处理与中文计算会议(NLPCC2015)提供的微博评测语料进行测试,实验结果表明,在未利用外部知识的条件下,分词的F值和OOV识别率分别达到95.67%和94.78%,证明了将字的聚类特征加入到条件随机场模型中能有效提高中文短文本的分词性能。
- 刘春丽李晓戈刘睿范贤杜丽萍
- 关键词:聚类条件随机场中文分词