您的位置: 专家智库 > >

国家高技术研究发展计划(2001AA114101)

作品数:6 被引量:56H指数:4
相关作者:赵铁军李生吕雅娟郑德权于凤更多>>
相关机构:哈尔滨工业大学哈尔滨商业大学更多>>
发文基金:国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 7篇会议论文
  • 6篇期刊文章

领域

  • 7篇自动化与计算...
  • 6篇语言文字

主题

  • 5篇语料库
  • 5篇翻译
  • 4篇双语语料
  • 4篇双语语料库
  • 4篇机器翻译
  • 3篇知识获取
  • 3篇句法
  • 3篇汉语
  • 3篇分词
  • 2篇英语
  • 2篇语句
  • 2篇语言处理
  • 2篇自然语言
  • 2篇自然语言处理
  • 2篇句法分析
  • 2篇汉语分词
  • 1篇单语
  • 1篇登录
  • 1篇等价
  • 1篇对齐

机构

  • 13篇哈尔滨工业大...
  • 1篇哈尔滨商业大...
  • 1篇黑龙江省信息...

作者

  • 9篇赵铁军
  • 6篇李生
  • 4篇吕雅娟
  • 2篇于浩
  • 2篇郑德权
  • 2篇陈鄞
  • 1篇于凤
  • 1篇吴岩
  • 1篇曹海龙
  • 1篇姚建民
  • 1篇孟遥
  • 1篇王青松
  • 1篇杨沐昀
  • 1篇李秀坤
  • 1篇于传武
  • 1篇黄玉
  • 1篇张晶

传媒

  • 2篇计算机研究与...
  • 1篇计算机学报
  • 1篇计算机应用研...
  • 1篇高技术通讯
  • 1篇计算机工程与...

年份

  • 1篇2007
  • 5篇2003
  • 7篇2002
6 条 记 录,以下是 1-10
排序方式:
基于目标语词汇组合合理性评价的译文选择模型被引量:1
2003年
机器翻译使用计算机实现自然语言的翻译功能 ,是计算机技术在语言学领域的新兴应用和研究 其中 ,源语言词汇的译文选择直接决定机器翻译的质量 ,是人们关注的难题 基于目标语词汇组合合理性评价的模糊分类模型试图以语言学和模糊数学为理论基础 ,尝试解决歧义词的译文选择问题 将该模型用于英汉机器翻译系统的译文选择实验 ,具有良好的译文选择性能 ,它的优势还在于可以同时为全句范围内的所有歧义词选择译文 。
张晶李生姚建民赵铁军
关键词:机器翻译
基于双语语料库的翻译等价对自动抽取被引量:14
2003年
提出了一种利用双语语料库自动抽取多词翻译等价对的方法。首先利用N-gram模型获得候选翻译单元,然后根据统计同现计算候选等价对的翻译概率,并用贪心策略实现翻译等价对的自动抽取。在翻译概率的计算中对3种常用的统计同现测度进行了比较。实验表明,当语料规模较小时,对数似然比(Log Likelihood Ratio)测度对于翻译等价对的抽取具有较好的效果。与现有方法相比,该方法较好地解决了翻译等价对抽取中多词单元对应及间接相关问题。
吕雅娟李生赵铁军杨沐昀
关键词:双语语料库自动抽取N-GRAM模型知识获取
一个改进的头驱动英语句法分析模型
句法分析是自然语言处理和机器翻译的基础。目前头驱动英语句法分析模型是公开发表的效果最好的模型之一。本文分析了头驱动模型的特点,并针对其不足提出了用极大熵原理估计依存关系概率的方法,在保证模型消歧能力的情况下提高了模型的归...
曹海龙孟遥李生赵铁军
关键词:句法分析机器翻译
文献传递
基于混合策略的汉语未登录词整体识别
未登录词的识别一直是汉语分词研究的焦点和难点,本文通过对各类未登录词的用字频率及上下文进行了详细地分析,提出一种基于混合策略的未登录词识别方法。实验表明,该方法对于多种未登录词的整体识别取得了较好的结果。
于传武李生陈鄞赵铁军
关键词:未登录词汉语分词全局统计
文献传递
迭代策略和词典相结合的机器翻译词典获取
翻译词典对于跨语言信息检索、计算机翻译等许多领域具有重要意义。为了解决基于汉英双语语料库的翻译词典获取问题,本文首先比较了四种常见的基于共现信息的词汇对译关系计算模型,并以对数相似性模型为基础,设计了一种迭代策略和词典相...
刘晓月杨沐昀赵铁军
关键词:翻译词典机器翻译
文献传递
基于双语模型的汉语句法分析知识自动获取被引量:9
2003年
提出了一种汉语句法分析知识自动获取的新方法 .该方法以双语语料库为基础 ,在双语语言模型的指导下 ,利用英语句法分析和双语词汇对齐得到汉语句子分析结果 .根据得到的句子分析可以提取汉语组块边界信息和简单的句法分析规则 .实验结果表明 ,自动获取的组块分析边界和已有的汉语句法分析体系取得了很好的一致性 ,证明了该方法的可行性和有效性 .文中提出的方法充分利用现有的英语句法研究成果 。
吕雅娟李生赵铁军
关键词:汉语句法分析知识自动获取自然语言处理知识获取双语语料库
基于大规模语料库的英语从句识别
英语从句识别对于英语复合句的分析至关重要。本文基于Penn tree bank语料库,通过分析从句的组成规律,利用统计规则,通过分析从句的结构,从句在主句中的位置以及与主动词的关系来识别从句的左右边界,在识别的过程引入了...
黄玉李生孟遥丁华福
关键词:语料库
文献传递
单语句法分析指导的双语结构对齐被引量:10
2003年
提出了一种单语句法分析指导的双语语料库结构对齐方法 该方法以统计的双语模型———反向转换文法为基础 ,通过把英语句法分析知识融入到双语模型中 ,实现英汉双语的结构对齐 与现有方法相比 ,只需要一种语言的句法分析结果 ,避开了汉语句法分析的难题 ,同时保证了双语结构对齐的语法合理性 实验结果表明 ,这种方法充分利用现有的句法分析知识 ,有效地提高了结构对齐的正确率
吕雅娟赵铁军李生
关键词:双语语料库词对齐知识获取
汉英机器翻译中数词的识别和翻译
汉语数词的翻译是汉英机器翻译系统中一个虽小但不容忽视的问题,本文通过对各类汉语数词及其上下文进行详细地分析,采用了汉语数词识别和将数词统一转换为阿拉伯数字串的翻译方法,较好地解决了复杂数词的汉英转换问题。实验表明,该方法...
陈鄞赵铁军吕雅娟于浩
关键词:数词机器翻译汉语分词
文献传递
基于汉语二字应成词的歧义字段切分方法被引量:20
2003年
文章提出了利用汉语中的二字应成词,计算汉语句内相邻字之间的互信息1及t-信息差这两个统计信息量的新方法,进而应用这两个统计量,解决汉语自动分词中的歧义字段的自动切分问题。实验结果表明,采用该文所述的方法,对歧义字段的切分正确率将达到90%,与其他分词方法相比较,进一步提高了系统的分词精度,尤其与文献1所述方法比较,对于有大量汉语信息的语料,将降低系统的时间复杂度。
郑德权于凤王开涛赵铁军
关键词:中文信息处理自动分词汉语文本
共2页<12>
聚类工具0