段慧明
- 作品数:28 被引量:386H指数:10
- 供职机构:北京大学信息科学技术学院计算语言学研究所更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字文化科学自然科学总论更多>>
- 中文缩略语还原技术初探
- 缩略语是自然语言语汇的重要组成部分,是未定义词的主要来源之一,因此,缩略语研究也是自然语言处理的一个重要课题。本项研究的最终目标是探索中文缩略语(简称)的规律,包括缩略语的生成和还原,也就是缩略语的编码和解码。本文的工作...
- 支流朱学锋段慧明俞士汶
- 关键词:自然语言处理缩略语
- 文献传递
- 非相关文献知识发现的数据基础研究——以中医药古文献语言知识库的构建为例被引量:10
- 2006年
- 非相关文献知识发现法是一种全新的、独特的情报学方法,对文献的有效使用及隐藏知识的发掘起到了较大的作用。通过对非相关文献知识发现方法的概述及其在中医研究中的应用前景的探讨,在通用语言知识库成功构建的基础上,并结合中医药文献特点提出了具体的实施方案与方法,展开了相应的工程实施,取得了显著成效,为基于非相关文献的知识发现奠定了坚实的数据基础。
- 刘耀段慧明穗志方
- 关键词:非相关文献知识发现语言知识库数据基础
- 中文缩略语知识库建设
- 缩略语是自然语言语汇的重要组成部分,是未定义词的主要来源之一,因此,缩略语研究是自然语言处理的一个重要课题。本项研究的最终目标是探索中文缩略语的规律,包括缩略语的生成和还原,也就是缩略语的编码和解码。本项研究旨在建立一个...
- 支流段慧明朱学锋俞士汶
- 关键词:自然语言处理缩略语
- 文献传递
- 《汉语高频词语法信息词典》的研制被引量:4
- 2004年
- 北京大学计算语言学研究所自 2 0 0 3年 1月起承担了国家重点基础研究973项目《汉语高频词语法信息词典》的研制任务 ,至 2 0 0 3年 9月已完成。本文详细介绍《汉语高频词语法信息词典》
- 朱学锋张化瑞段慧明俞士汶
- 关键词:综合型语言知识库
- 中医药古文献语料库设计与开发研究被引量:10
- 2008年
- 专业领域语料库是对专业领域文献进行自然语言处理的重要的不可或缺的基础,是对专业文本内容与意图进行深层把握的必由之路。通过对研究背景的分析,进一步明析了专业文献进行自然语言处理的必要性,并在对专业文献语料库的研究特点进行分析的基础上,深入探讨了专业语料库的设计思想及原理,同时,对语料库词类的标注信息进行了深入研究。成功地开发了针对专业领域语料库的辅助加工系统,为专业领域语料库建设提供了理论指导和技术支撑。
- 刘耀段慧明王惠临周扬王振国李宏展
- 关键词:计算机应用中文信息处理自然语言处理语料库知识工程
- 面向自然语言处理的现代汉语短语信息库被引量:9
- 1998年
- 传统的自然语言处理模式是“语法规则+词典”,但语言中许多词语组合不能或很难用语法规则加以描述。把这些组合作为整体收入词库中可以使语法得到简化,从而降低系统的复杂度。基于这种“大词库,小语法”的思想,本文论述了建立现代汉语短语信息库的必要性,并对建库的方法、收录的原则和信息库进行了简要的介绍。
- 孙宏林段慧明
- 关键词:自然语言处理汉语短语固定短语词语搭配词汇化计算语言学
- 北京大学现代汉语语料库基本加工规范(续)被引量:33
- 2002年
- 北京大学计算语言学研究所已经完成了一个有 2 70 0万汉字的现代汉语语料库的基本加工。加工项目除词语切分和词性标注外 ,还包括专有名词 (人名、地名、团体机构名称等 )标注、语素子类标注以及动词、形容词的特殊用法标注。这项大规模语言工程的顺利完成得益于事先制订并不断完善的规范。发表《北京大学现代汉语语料库基本加工规范》是为了抛砖引玉 ,更广泛地向专家、同行征询意见 ,以便进一步修订。
- 俞士汶段慧明朱学锋孙斌
- 关键词:词语切分词性标注汉字处理系统
- 大规模汉语标注语料库的制作与使用被引量:29
- 2000年
- 随着自然语言处理研究的深入开展 ,大规模语料库的作用越来越重要。自从70年代美国制作了著名的BrownCorpus以来 ,世界上已制作了各种语料库。富士通研究开发中心和北京大学计算语言学研究所合作 ,以人民日报语料为对象 ,制作大规模汉语标注语料库 ,这个语料库是世界上规模最大的标注语料库之一。
- 段慧明松井久仁於徐国伟胡国昕俞士汶
- 关键词:自然语言处理大规模语料库语言资源
- 动词对宾语的语义选择限制被引量:31
- 2005年
- 动词对论元的语义选择限制一直是自然语言处理研究领域一个备受关注的问题。本文选取现代汉语中4 6个高频的、可以带体词性宾语的动词,借助知网的名词语义分类体系,基于《人民日报》语料,考察了动词对宾语的语义选择限制,归纳成5种类型,在此基础上讨论了语义选择限制在汉语信息处理中的应用和局限,并进而讨论了上下位语义关系、部分整体语义关系在动词语义选择限制中的作用。
- 吴云芳段慧明俞士汶
- 关键词:语义关系词义消歧
- 基于语料统计的现代汉语量名搭配研究
- 本文对现代汉语量词与名词的搭配进行了定量研究,设计并实现了一个有效的数量名短语的识别方法,基于识别结果,统计了部分名词受量词修饰的情况。该统计结果不但可以为名词的概率语法属性研究提供数据,而且在对外汉语教学中也有借鉴意义...
- 王萌俞士汶段慧明孙薇薇
- 关键词:现代汉语汉字处理词汇搭配语料统计
- 文献传递