国家自然科学基金(61262041)
- 作品数:4 被引量:14H指数:3
- 相关作者:郭剑毅余正涛毛存礼潘清清周枫更多>>
- 相关机构:昆明理工大学更多>>
- 发文基金:国家自然科学基金云南省教育厅科学研究基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于深层神经网络(DNN)的汉-越双语词语对齐方法被引量:3
- 2016年
- 针对汉-越双语因语言特点差异较大而导致难以实现词语自动对齐的问题,提出了一种基于深层神经网络(deep neural network,DNN)的汉-越双语词语对齐方法。该方法先将汉-越双语词语转化成词向量,作为DNN模型的输入,再通过调整和扩展HMM模型,并融入上下文信息,构建DNN-HMM词语对齐模型。实验以HMM模型和IBM4模型为基础模型,通过大规模的汉-越双语词语对齐任务表明,该方法的准确率、召回率较两个基础模型都有明显的提高,而词语对齐错误率大大降低。
- 莫媛媛郭剑毅余正涛毛存礼牛翊童
- 关键词:越南语词语对齐DNN
- 融合语言模型和用户模型的个性化受限域问答检索方法研究
- 个性化领域问答系统答案检索要求系统能够根据用户的查询返回一个包含用户兴趣的答案文本列表,针对领域问答系统传统的答案检索方法不能体现用户个性化需求,提出融合语言模型及用户模型的个性化受限域问答检索方法,该方法首先利用MSV...
- 毛存礼余正涛沈韬杨立峰郭剑毅赵兴
- 关键词:语言模型用户模型个性化问答系统
- 文献传递
- 融合语言特性的越南语兼类词消歧被引量:2
- 2019年
- 兼类词歧义直接影响词性标注的准确率。本文针对越南语兼类词歧义问题提出一种融合语言特性的越南语兼类词消歧方法。通过构建越南语兼类词词典和兼类词语料库,分析越南语的语言特征和兼类词特点,选取有效的特征集;然后利用条件随机场能添加任意特征等优点,在使用词和词性上下文信息的同时,引入句法成分和指示词特征,得到消歧模型。最后在兼类词语料上实验,准确率达到了87.23%。实验表明本文所提出的越南语兼类词消歧方法有效可行,可以提高词性标注正确率。
- 郭剑毅赵晨刘艳超毛存礼余正涛
- 关键词:语言特征条件随机场模型越南语
- 基于条件随机场的越南语命名实体识别方法被引量:7
- 2014年
- 针对越南语特点,提出一种基于条件随机场模型的越语命名实体识别方法。该方法针对越语词和词性的特点,采用条件随机场算法,选取词和词性作为特征,定义特征模版,选取越南语新闻文本,标记地名、人名、组织机构等6类实体语料,训练获得越南语实体识别模型,实现实体识别。实验结果表明该方法提取实体的准确率达到83.73%。
- 潘清清周枫余正涛郭剑毅线岩团
- 关键词:越南语命名实体识别条件随机场