陈相
- 作品数:3 被引量:8H指数:2
- 供职机构:大连理工大学信息检索研究室更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于锚信息的生物医学文献双语摘要句子对齐被引量:5
- 2009年
- 双语句子对齐在双语语料库的处理中有着非常重要的地位,是构建双语词典的第一步工作。该文利用基于带权二部图的最大权重匹配模型为生物医学文献双语摘要建模。在无双语词典的情况下,将基于长度的句子对齐方法和句子的位置信息相结合,充分利用医学文献双语摘要语料中的锚信息,将生物医学摘要段落和句子进行分类计算相似度,实现了生物医学文献双语摘要的句子对齐,取得了较好的实验结果。
- 陈相林鸿飞
- 关键词:中文信息处理句子对齐二部图双语语料
- 基于高斯混合模型的生物医学领域双语句子对齐被引量:3
- 2010年
- 双语术语词典在生物医学跨语言检索系统中有着非常重要的地位,而双语句子对齐是构建双语词典的第一步工作。为了构想面向生物医学领域的双语词典,该文将分类思想和迁移学习方法引入汉英句子对齐任务中,将句子对齐任务看成一个多类分类任务,考虑生物医学领域双语摘要的锚信息,利用高斯混合模型完成分类目标。同时,在模型训练过程中,该文引入了迁移学习的思想,结合无噪音的《新概念英语》双语语料对模型的句子长度特征进行训练,使得模型在测试语料上句子对齐的正确率得到较大提高。
- 陈相林鸿飞杨志豪
- 关键词:计算机应用中文信息处理句子对齐高斯混合模型
- 面向生物医学领域的双语对齐技术研究
- 本文以国家863基金项目《基于语义的跨语言信息检索平台》为依托,以生物医学领域跨语言信息检索的查询翻译为应用背景,以构建生物医学文献双语术语词典为目的。主要工作分为双语句子对齐和双语术语抽取两个步骤。针对以上两个步骤,本...
- 陈相
- 关键词:自然语言处理信息检索双语语料库双语对齐
- 文献传递