苏克毅
- 作品数:9 被引量:9H指数:2
- 供职机构:中央研究院资讯科学研究所更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 利用上下文相似度增强词对齐效果的自然语言推理方法被引量:2
- 2020年
- 当前的自然语言推理方法在进行词对齐时往往只关注如何利用上下文信息改善词汇的表示,而忽略了上下文相似度对词汇对齐的帮助。推理方法在融合局部判定信息进行结果预测时,通常赋予局部判定信息相同的权重,而实际上不同词汇对应的局部判定信息对最终结果具有不同的影响。因此,提出一种通过增强词对齐性能改善自然语言推理性能的方法,该方法在词对齐时同时考虑词汇的词义相似度和上下文相似度,并且利用选择门机制对不同的局部判定信息进行加权。实验表明,该方法能够获得与当前最优的模型相当的准确率,而且该方法更加符合人脑推理判定行为过程,且具有很好的可解释性。
- 杜倩龙宗成庆苏克毅
- 关键词:词对齐
- 文本蕴含识别方法及装置
- 本发明属于自然语言技术领域,具体提供了一种文本蕴含识别方法及装置,旨在解决现有技术在文本蕴含识别过程中存在大量噪声的问题。为此目的,本发明提供了一种文本蕴含识别方法,包括获取待识别文本蕴含句对中源句子和目标句子的词汇向量...
- 杜倩龙宗成庆苏克毅
- 文献传递
- 基于词汇依存三元组的文本蕴含识别方法及装置
- 本发明属于自然语言处理技术领域,具体提供了一种文本蕴含识别方法及装置。旨在解决现有技术需要对句子进行复杂的特征描述和特征提取的问题。本发明的文本蕴含识别方法包括对待识别文本蕴含句对的源句子和目标句子进行依存句法分析,并根...
- 杜倩龙宗成庆苏克毅
- 文献传递
- 统计机器翻译和翻译记忆的动态融合方法研究被引量:6
- 2015年
- 在融合翻译记忆和统计机器翻译的整合式模型的基础上,该文提出在解码过程中进一步地动态加入翻译记忆中新发现的短语对。它在机器翻译解码过程中,动态地加入翻译记忆片段作为候选,并利用翻译记忆的相关信息,指导基于短语的翻译模型进行解码。实验结果表明该方法显著提高了翻译质量:与翻译记忆系统相比,该方法提高了21.15个BLEU值,降低了21.47个TER值;与基于短语的翻译系统相比,该方法提高了5.16个BLEU值,降低了4.05个TER值。
- 汪昆宗成庆苏克毅
- 关键词:统计机器翻译翻译记忆
- 一种融合翻译记忆和短语翻译模型的统计机器翻译方法
- 本发明公开了一种融合翻译记忆和短语翻译模型的统计机器翻译方法,其包括:步骤1:利用训练集得到双语短语切分句对;步骤2:根据所得到的双语短语切分句对获得翻译记忆中相应的翻译记忆短语对,并抽取翻译记忆短语对的相关特征;步骤3...
- 汪昆宗成庆苏克毅
- 文献传递
- 一种融合翻译记忆和短语翻译模型的统计机器翻译方法
- 本发明公开了一种融合翻译记忆和短语翻译模型的统计机器翻译方法,其包括:步骤1:利用训练集得到双语短语切分句对;步骤2:根据所得到的双语短语切分句对获得翻译记忆中相应的翻译记忆短语对,并抽取翻译记忆短语对的相关特征;步骤3...
- 汪昆宗成庆苏克毅
- 文献传递
- 融合词义信息的文本蕴涵识别方法被引量:1
- 2021年
- 文本蕴涵识别是对两个文本之间语义关系的有向推理,而词汇的词义对理解文本的语义以及推理文本之间的语义蕴涵关系有着重要作用。因此,为了有效利用词汇的词义信息推断文本之间的语义蕴涵关系,该文提出一种融合词义信息的文本蕴涵识别方法。该方法首次提出将原始的词汇转化为对应的目标词义,然后利用词汇的词义信息改善文本的语义表示和文本间语义关系的推理。实验表明,该文所提出的方法可以有效改善文本间语义关系的推理,从而提升文本蕴涵识别的准确率。
- 杜倩龙宗成庆苏克毅
- 关键词:词义推断语义推理
- 文本蕴含识别方法及装置
- 本发明属于自然语言处理技术领域,具体提供了一种文本蕴含识别方法及装置。旨在解决现有技术需要对句子进行复杂的特征描述和特征提取的问题。本发明的文本蕴含识别方法包括对待识别文本蕴含句对的源句子和目标句子进行依存句法分析,并根...
- 杜倩龙宗成庆苏克毅
- 文献传递
- 文本蕴含识别方法及装置
- 本发明属于自然语言技术领域,具体提供了一种文本蕴含识别方法及装置,旨在解决现有技术在文本蕴含识别过程中存在大量噪声的问题。为此目的,本发明提供了一种文本蕴含识别方法,包括获取待识别文本蕴含句对中源句子和目标句子的词汇向量...
- 杜倩龙宗成庆苏克毅
- 文献传递