您的位置: 专家智库 > >

中国博士后科学基金(2005038026)

作品数:5 被引量:99H指数:3
相关作者:张仰森俞士汶曹元大黄改娟肖建涛更多>>
相关机构:北京大学北京理工大学北京信息科技大学更多>>
发文基金:中国博士后科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 4篇自动化与计算...
  • 1篇语言文字

主题

  • 3篇汉语
  • 2篇语词
  • 2篇语言模型
  • 2篇消歧
  • 2篇规则与统计相...
  • 2篇汉语词
  • 2篇汉语词义
  • 2篇词义
  • 2篇词义消歧
  • 1篇信息处理
  • 1篇语料
  • 1篇语料库
  • 1篇知识源
  • 1篇中文
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇字词
  • 1篇文本
  • 1篇消歧方法
  • 1篇计算机

机构

  • 3篇北京大学
  • 2篇北京信息科技...
  • 2篇北京理工大学
  • 1篇北京机械工业...

作者

  • 5篇张仰森
  • 3篇俞士汶
  • 2篇曹元大
  • 1篇谢宇
  • 1篇肖建涛
  • 1篇黄改娟

传媒

  • 1篇计算机应用研...
  • 1篇小型微型计算...
  • 1篇中文信息学报
  • 1篇北京机械工业...
  • 1篇汉语学报

年份

  • 1篇2008
  • 1篇2007
  • 3篇2006
5 条 记 录,以下是 1-5
排序方式:
规则与统计相结合的汉语词义消歧模型被引量:1
2007年
针对已有的词义消歧研究方法的不足,在分析了多种不同结构知识词典的可计算性及其计算复杂度之后,选择北大计算语言所的《现代汉语语法信息词典》和《现代汉语语义词典》,并结合已经标注了词义的人民日报语料作为词义消歧知识源,从中获取汉语词义消歧所需要的统计知识和规则知识,并采用统计与规则相结合的方法构建词义消歧模型,取得了比较满意的词义消其效果。
谢宇张仰森肖建涛
关键词:词义消歧语料库规则与统计相结合词义标注
基于规则与统计相结合的中文文本自动查错模型与算法被引量:47
2006年
中文文本自动校对是自然语言处理领域具有挑战性的研究课题。本文提出了一种规则与统计相结合的中文文本自动查错模型与算法。根据正确文本分词后单字词的出现规律以及“非多字词错误”的概念,提出一组错误发现规则,并与针对分词后单字散串建立的字二元、三元统计模型和词性二元、三元统计模型相结合,建立了文本自动查错模型与实现算法。通过对30篇含有578个错误测试点的文本进行实验,所提算法的查错召回率为86.85%、准确率为69.43%,误报率为30.57%。
张仰森曹元大俞士汶
关键词:计算机应用中文信息处理规则与统计相结合
语言模型复杂度度量与汉语熵的估算被引量:12
2006年
运用信息论理论,从信息熵的角度对统计语言模型的复杂度度量方法进行了定量化的推理与描述,得出了语言模型对语言熵的估算值越小,说明该模型对语言的描述越精确以及两个n-1元文法模型插值形成的新模型,其性能好于n-1元文法模型,但不及n元文法模型的结论.并对应用语言模型估算汉语信息熵的方法进行了探讨.
张仰森曹元大俞士汶
关键词:语言模型复杂度
文本自动校对技术研究综述被引量:47
2006年
概述了文本自动校对技术的产生背景,分析了中西文文本的各自特点以及它们之间的异同,对中西文文本校对的技术难点和解决方法以及国内外的研究现状进行了回顾和评述,探讨了文本校对技术未来的发展方向及需要解决的问题。
张仰森俞士汶
关键词:语言模型
基于多知识源的汉语词义消歧方法被引量:2
2008年
针对已有词义消歧研究方法的不足,分析了多种不同结构知识词典的可计算性及其计算复杂度,选择北大计算语言所的《现代汉语语法信息词典》、《现代汉语语义词典》和已经标注了词义的人民日报语料作为词义消歧知识源,研究异构知识源的知识获取与融合方法,并结合统计与规则方法构建词义消歧模型,取得了比较满意的词义消歧实验结果。
张仰森黄改娟
关键词:多知识源词义消歧方法
共1页<1>
聚类工具0