您的位置: 专家智库 > >

俞士汶

作品数:159 被引量:1,839H指数:25
供职机构:北京大学信息科学技术学院计算语言学研究所更多>>
发文基金:国家重点基础研究发展计划国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字一般工业技术文化科学更多>>

文献类型

  • 106篇期刊文章
  • 51篇会议论文
  • 1篇专利

领域

  • 93篇自动化与计算...
  • 63篇语言文字
  • 3篇一般工业技术
  • 2篇文化科学
  • 1篇电子电信
  • 1篇自然科学总论
  • 1篇理学

主题

  • 50篇汉语
  • 38篇自然语言
  • 33篇语言处理
  • 32篇信息处理
  • 32篇自然语言处理
  • 27篇知识库
  • 23篇中文
  • 20篇语言学
  • 20篇语言知识库
  • 20篇中文信息
  • 20篇中文信息处理
  • 19篇语料
  • 18篇计算语言
  • 18篇计算语言学
  • 16篇现代汉语
  • 15篇语料库
  • 15篇计算机
  • 14篇语义
  • 13篇语言
  • 12篇词典

机构

  • 155篇北京大学
  • 8篇北京语言大学
  • 7篇郑州大学
  • 6篇清华大学
  • 3篇北京师范大学
  • 3篇江南大学
  • 3篇北京理工大学
  • 3篇教育部
  • 2篇北京信息工程...
  • 2篇华中师范大学
  • 2篇中国科学院
  • 2篇香港理工大学
  • 2篇元智大学
  • 2篇北京拓尔思信...
  • 1篇哈尔滨工业大...
  • 1篇北京信息科技...
  • 1篇东北师范大学
  • 1篇鲁东大学
  • 1篇南京师范大学
  • 1篇武汉大学

作者

  • 158篇俞士汶
  • 46篇朱学锋
  • 24篇段慧明
  • 10篇贾玉祥
  • 10篇昝红英
  • 10篇穗志方
  • 10篇王治敏
  • 9篇吴云芳
  • 9篇孙斌
  • 7篇陈玉忠
  • 7篇刘扬
  • 6篇王萌
  • 6篇张仰森
  • 5篇李保利
  • 5篇常宝宝
  • 4篇刘云
  • 4篇王惠
  • 4篇柏晓静
  • 4篇王洪俊
  • 4篇张化瑞

传媒

  • 42篇中文信息学报
  • 17篇语言文字应用
  • 5篇术语标准化与...
  • 4篇北京大学学报...
  • 3篇计算机工程与...
  • 3篇辞书研究
  • 3篇全国第八届计...
  • 2篇当代语言学
  • 2篇清华大学学报...
  • 2篇计算机学报
  • 2篇外语电化教学
  • 2篇广西师范大学...
  • 2篇小型微型计算...
  • 2篇语言科学
  • 2篇第二届全国信...
  • 2篇第四届全国学...
  • 2篇第六届汉语词...
  • 1篇世界汉语教学
  • 1篇社会科学战线
  • 1篇中国翻译

年份

  • 1篇2020
  • 3篇2019
  • 4篇2018
  • 4篇2017
  • 3篇2015
  • 8篇2014
  • 2篇2013
  • 3篇2011
  • 5篇2010
  • 10篇2009
  • 9篇2008
  • 7篇2007
  • 14篇2006
  • 19篇2005
  • 8篇2004
  • 14篇2003
  • 8篇2002
  • 8篇2001
  • 5篇2000
  • 5篇1999
159 条 记 录,以下是 1-10
排序方式:
汉语短语标注标记集的确定被引量:46
1996年
本文提出了一个汉语短语标注的基本标记集,并从句法功能和结构组成方面对不同短语的性质进行了深入的分析和探讨,以期为汉语短语划分和标注的自动处理和人工校对提供一个统一的处理标准。
周强俞士汶
关键词:汉语汉语语料库
现代汉语虚词知识库的研究被引量:30
2007年
现代汉语虚词在句法中所起的作用比较复杂,其个性较强,用法各异。目前已有的虚词研究成果大都是面向人用的,对虚词个性的描写难以避免主观性和模糊性,很难直接应用于自然语言处理的研究。本文从计算语言学的观点出发,根据目前已有的虚词研究成果以及对真实语料中虚词用法规律的考察,着力构建面向机器的现代汉语虚词用法信息词典和虚词用法规则库,旨在为现代汉语虚词用法的机器识别打下一定的数据基础。
昝红英张坤丽柴玉梅俞士汶
关键词:计算机应用中文信息处理虚词语言知识库规则库
现代汉语介词知识库的建设被引量:4
2009年
现代汉语介词知识库是现代汉语广义虚词知识库的重要组成部分。文章主要讨论现代汉语介词知识库建设的意义、与现代汉语广义虚词知识库的关系、建构的原则以及主要内容。
彭爽俞士汶
基于词典的名词性隐喻识别
隐喻是用一个事物来类比另外一个事物的语言表达,在自然语言中非常普遍,要实现自然语言理解隐喻处理不可避免。本文针对最基本的隐喻类型——名词性隐喻,提出基于词典的识别方法。结合同义词词林的语义距离与HowNet的语义关系来识...
贾玉祥俞士汶
关键词:名词性隐喻词典语义距离语义关系
文献传递
现代汉语语素库的开发及应用被引量:14
1999年
俞士汶朱学锋李峰
关键词:单汉字未登录词汉语字词单纯词
词语兼类暨动词向名词漂移现象的计量分析
<现代汉语语法信息词典>建立了面向信息处理的汉语词类体系并完成了8万词语的归类,进而分类描述每个词语的详细语法属性."大规模基本标注语料库"则对数千万字文本完成了词语切分和词性标注等基本加工.以北大计算语言学研究所拥有的...
俞士汶段慧明朱学锋
关键词:自然语言处理现代汉语语料库兼类词动词名词
文献传递网络资源链接
语言工程实践之体验
北京大学计算语言学研究所积30余年之努力,建成以《现代汉语语法信息词典》为基础的综合型语言知识库,为中文信息处理技术的发展发挥了重要作用.本文总结作者主持这项大规模语言工程的体验.以具体案例阐述自然语言处理技术为什么需要...
俞士汶朱学锋
关键词:自然语言处理语言知识库语法分析机器词典
基于连接关系的汉语词典信息的推断被引量:1
1991年
日本和印度尼西亚、泰国、中国、马来西亚正在合作开发多国语言机器翻译系统。本文介绍这个项目中的正在研究开发的汉语词典开发辅助系统的词典信息推断功能。 这个项目从1987年开始,计划用6年时间,采用中间语言方式,实现5国语言间的互相翻译,打算利用本词典开发辅助系统进行编制的汉语词典,将主要用于这个项目中的汉语分析、汉语生成以及中文输入。 本汉语词典开发辅助系统,以大量语料为基础,收集单词,推断能从例句导出的词典信息,还可以检验人工完成的词典记述并补充词典信息。本文叙述了从分析大量语料入手,在提取词典中尚未登录的单词(形态素)的同时,建立KWIC(上下文中关键词)索引,井以这种大规模的KWIC为基础,根据源于连接关系的束缚条件推断语法特征尚不清楚的汉语单词的语法属性的方法。
朱美英内田裕士俞士汶
关键词:汉语词典汉语生成语法属性未登录词中文输入结果补语
中文缩略语知识库建设
缩略语是自然语言语汇的重要组成部分,是未定义词的主要来源之一,因此,缩略语研究是自然语言处理的一个重要课题。本项研究的最终目标是探索中文缩略语的规律,包括缩略语的生成和还原,也就是缩略语的编码和解码。本项研究旨在建立一个...
支流段慧明朱学锋俞士汶
关键词:自然语言处理缩略语
文献传递
人称代词和名词的组合搭配研究
人称代词(r)和名词(n)的线性序列中人称代词和名词的关系呈现出多样性,本文在现代汉语语法信息词典的基础上考察了r和n的组合类别,指出汉语r+n的搭配存在选择限制,r和n可以形成表示领属关系的定中结构,也可以形成表示同指...
王治敏李芸俞士汶
文献传递
共16页<12345678910>
聚类工具0