骆卫华
- 作品数:23 被引量:191H指数:6
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字文化科学更多>>
- 中文文本自动校对中的语法错误检查被引量:16
- 2003年
- 文章将中文文本的语法错误分为搭配错误和与句型成分相关的错误两大类。分别采用模式匹配的方法和基于句型成分分析的进行检查,这两种方法的结合,可以同时考虑局部和全局的语法限制信息,并且降低了语法检查的复杂度。通过对实验结果的分析和评测,证明文章所述的方法是可行的。
- 龚小谨罗振声骆卫华
- 关键词:语法错误
- 汉语句子谓语中心词的自动识别被引量:26
- 2003年
- 谓语中心词的识别是句法成分分析中的一个非常重要的部分。本文提出了一种规则和特征学习相结合的谓语识别方法 ,将整个谓语识别的过程分为语片捆绑、谓语粗筛选和谓语精筛选三个阶段。在谓语粗筛选中 ,利用规则过滤掉明显不能充当谓语的词 ,得到一个准谓语集 ;在精筛选阶段 ,选择谓语的支持特征 ,根据统计计算得到每个特征对谓语的支持度 ,然后利用准谓语在句子中的上下文出现的特征对准谓语集中的词进行再次筛选 ,从而确定出句子的谓语中心词。经过测试表明 。
- 龚小谨罗振声骆卫华
- 关键词:计算机应用中文信息处理
- 基于Web的大规模双语语料库挖掘及翻译知识自动获取技术
- 吕雅娟刘洋米海涛叶莎妮王建华骆卫华任志祥何中军黄瑾
- 该课题得到国家自然科学基金的资助。双语语料库是统计机器翻译及多语自然语言处理研究的重要基础资源。课题研究了基于Web的双语语料库及翻译知识自动获取技术,为大规模、多粒度、多领域的翻译资源的自动获取提供了有效的解决方案。主...
- 关键词:
- 关键词:双语语料库机器翻译
- 话题检测与跟踪技术的发展与研究
- 本文介绍了话题检测与跟踪技术的由来和发展历程,并展望其应用前景,同时比较系统地介绍了现有的话题检测与跟踪系统主要采用的方法,并对其效果进行了比较。
- 骆卫华刘群程学旗
- 关键词:话题检测与跟踪向量空间模型语言模型
- 文献传递
- 中文文本自动校对中的词级和语义级查错方法研究
- 骆卫华
- 关键词:中文文本自动校对N元模型相似度
- 用于计算机辅助翻译的候选短语查询方法及辅助翻译系统
- 本发明提供了计算机辅助翻译的方法及系统,在机器翻译结果的基础上,利用机器翻译中的中间信息、用户记忆库、词典等其他方面的辅助翻译信息来修改和完善机器自动翻译的结果。其中,采用基于AC自动机的候选短语查询方法,在线性复杂度之...
- 刘群王洋刘洋骆卫华吕雅娟
- 基于Web的大规模双语语料库挖掘及翻译知识自动获取
- 吕雅娟刘洋米海涛叶莎妮王建华骆卫华任志祥何中军黄瑾
- 本课题得到国家自然科学基金的资助。双语语料库是统计机器翻译及多语自然语言处理研究的重要基础资源。课题研究了基于Web的双语语料库及翻译知识自动获取技术,为大规模、多粒度、多领域的翻译资源的自动获取提供了有效的解决方案。主...
- 关键词:
- 关键词:WEB双语语料库机器翻译
- 跨语言信息检索方法概述被引量:5
- 2006年
- 本文介绍了跨语言信息检索问题的由来与发展,通过对单语言信息检索技术的介绍引入了跨语言检索的关键问题,并分别介绍了跨语言信息检索中基于词典、基于语料和基于机器翻译模块这三种主流方法,最后对跨语言检索的一体化方法等较新的思想和跨语言检索评测等做了简要说明。
- 骆卫华
- 关键词:跨语言信息检索词典语料机器翻译
- 跨语言检索中机器翻译技术的应用和进展被引量:6
- 2006年
- 本文以跨语言检索为背景,主要介绍了机器翻译技术的应用和进展。文章介绍了跨语言检索中机器翻译技术的应用形式,简单回顾了机器翻译技术发展历史中出现的各种方法及其基本思想和优缺点、特别是近年来统计机器翻译的发展。本文通过一个实例较为详细地介绍了目前主流的基于短语的统计机器翻译原理,然后通过一个实际的新闻长句子对几个典型的基于规则的和基于统计的机器翻译系统的翻译结果给出了细致的比较和分析。最后对机器翻译在跨语言检索中的应用前景做出了展望。
- 刘群骆卫华
- 关键词:跨语言检索统计机器翻译
- 基于多策略优化的分治多层聚类算法的话题发现研究
- 话题发现与跟踪是一项评测驱动的研究,旨在依据事件对语言文本信息流进行组织利用。自1996年提出以来。该研究得到了越来越广泛的关注。本文在研究已有成熟算法的基础上,针对其不足,提出了基于分治多层聚类的话题发现算法。基于该算...
- 骆卫华于满泉许洪波王斌程学旗
- 关键词:系统聚类向量空间模型
- 文献传递