您的位置: 专家智库 > >

孙薇薇

作品数:8 被引量:5H指数:2
供职机构:北京大学更多>>
发文基金:国家自然科学基金国家社会科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 4篇会议论文
  • 3篇期刊文章
  • 1篇学位论文

领域

  • 6篇自动化与计算...
  • 3篇语言文字

主题

  • 5篇汉语
  • 3篇中文
  • 3篇现代汉语
  • 2篇动词
  • 2篇信息处理
  • 2篇语料
  • 2篇语料统计
  • 2篇语义角色
  • 2篇语义角色标注
  • 2篇色标
  • 2篇浅层句法分析
  • 2篇中文信息
  • 2篇中文信息处理
  • 2篇句法分析
  • 2篇计算机
  • 2篇计算机应用
  • 2篇角色标注
  • 2篇汉语动词
  • 2篇搭配
  • 1篇语法

机构

  • 8篇北京大学
  • 1篇中国传媒大学

作者

  • 8篇孙薇薇
  • 3篇王萌
  • 3篇俞士汶
  • 3篇段慧明
  • 3篇穗志方
  • 2篇冀铁亮
  • 1篇袁毓林
  • 1篇王璐璐
  • 1篇王鑫

传媒

  • 2篇中文信息学报
  • 1篇计算机工程与...
  • 1篇第四届全国学...

年份

  • 1篇2015
  • 1篇2010
  • 1篇2009
  • 3篇2008
  • 2篇2007
8 条 记 录,以下是 1-8
排序方式:
“把”字句的自动释义与句式变换研究
2015年
针对"把"字句在机器翻译中的困难,探索一种规则和统计相结合的"把"字句的自动释义和句式变换的方法。具体的计算步骤为:(1)根据"把"字句与其他句式的变换关系,将"把"字句分为不同的小类,并总结出每一小类的句法语义特征,得到"把"字句的语言模型;(2)选取北大中文树库中的"把"字句作为语料,并标注上每一小类句式的句法语义特征,从而得到富含句法语义信息的标注文本;(3)在此基础上,分别用组块分析的方法和完全句法分析的方法来对"把"字句进行自动识别;(4)再利用判别式机器学习的方法来对"把"字句进行自动分类。在识别结果和分类结果的基础上,根据释义模板和变换模板得到了一个"把"字句的自动释义与句式变换程序。
王璐璐孙薇薇袁毓林
语言学与统计方法结合建立汉语动词SCF类型集被引量:3
2007年
动词子语类框架(Subcategorization Frame以下简称SCF)在句法分析、语义角色标注等方面的研究中具有不可或缺的重要作用。在子语类框架信息的获取过程中,首先要建立标准完备的子语类框架类型集。目前英语研究已经建立了获得普遍共识的子语类框架类型集。而汉语方面还没有标准的动词子类框架类型集。本文提出一种语言学知识与统计方法相结合的汉语动词子语类框架类型集的半自动获取方案。初步建立起既符合统计结果又基本符合语言学理论的汉语动词子语类框架类型集。实验证明,加入语言学理论的子语类框架类型集降低了对语料的依赖程度,比完全由分析语料产生的类型集更完备。
冀铁亮孙薇薇穗志方
关键词:计算机应用中文信息处理
基于语料统计的现代汉语量名搭配研究
本文对现代汉语量词与名词的搭配进行了定量研究,设计并实现了一个有效的数量名短语的识别方法,基于识别结果,统计了部分名词受量词修饰的情况。该统计结果不但可以为名词的概率语法属性研究提供数据,而且在对外汉语教学中也有借鉴意义...
王萌俞士汶段慧明孙薇薇
关键词:现代汉语汉字处理词汇搭配语料统计
文献传递
多句法理论下的语义角色标注方法与实现
对语义的获取是自然语言处理领域的一个重要议题,作为一种重要的语义分析技术,语义角色标注的目标在于分析给定句子的论旨结构,亦即识别出和特定动词搭配的论元并对其进行语义分类。语义角色标注在自然语言处理的很多领域——如问答系统...
孙薇薇
关键词:语义角色标注浅层句法分析自然语言处理
语言学与统计方法结合建立汉语动词子类框架类型集
动词子语类框架(subcategorization frame 以下简称 SCF)在语义角色标注等方面的研究中具有不可或缺的重要作用。在于语类框架信息的获取过程中,首先要建立标准完备的子语类框架类型集。目前英语研究已经建...
冀铁亮孙薇薇穗志方
文献传递
基于语料统计的现代汉语量名搭配研究
本文对现代汉语量词与名词的搭配进行了定量研究,设计并实现了一个有效的数量名短语的识别方法,基于识别结果,统计了部分名词受量词修饰的情况。该统计结果不但可以为名词的概率语法属性研究提供数据,而且在对外汉语教学中也有借鉴意义...
王萌俞士汶段慧明孙薇薇
关键词:现代汉语量词搭配
文献传递
现代汉语名词语法属性的计量研究初探被引量:2
2008年
以《现代汉语语法信息词典》中语法属性的概率化描述为目标,基于1998年上半年《人民日报》标注语料,对名词语法属性的概率化进行了初步的实验研究。首先,考察了名词与数词、名词与量词搭配的相关属性,引进"分散度"概念,利用它对"数名"结构进行了定量分析;其次,考察了名词受不同量词修饰的分布情况。最后,把实验结果与《现代汉语语法信息词典》的相应属性进行了比照和分析,在属性概率化的同时也对其正确性进行了验证。
王萌俞士汶段慧明孙薇薇
关键词:计算机应用中文信息处理现代汉语
基于浅层句法分析的中文语义角色标注研究
语义角色标注是获取语义信息的一种重要手段。许多现有的语义角色标注部是在完全句法分析的基础上进行的,但由于现阶段中文完全句法分析器性能比较低,基于自动的完全句法分析的中文语义角色标注效果并不理想.因此本文将中文语义角色标注...
王鑫孙薇薇穗志方
关键词:语义角色标注浅层句法分析语素构词法
文献传递
共1页<1>
聚类工具0