您的位置: 专家智库 > >

国家社会科学基金(09BYY032)

作品数:6 被引量:32H指数:4
相关作者:穗志方王鑫朱学锋俞士汶康为更多>>
相关机构:北京大学中央民族大学更多>>
发文基金:国家自然科学基金国家社会科学基金教育部人文社会科学研究基金更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 6篇期刊文章
  • 1篇会议论文

领域

  • 6篇自动化与计算...
  • 1篇语言文字

主题

  • 3篇中文
  • 2篇语义
  • 2篇语义角色
  • 2篇语义角色标注
  • 2篇色标
  • 2篇角色标注
  • 2篇词法
  • 1篇信息处理
  • 1篇依存
  • 1篇引擎
  • 1篇语素
  • 1篇语言处理
  • 1篇语言学
  • 1篇语言知识库
  • 1篇语义关系
  • 1篇语义依存
  • 1篇知识库
  • 1篇三字词
  • 1篇搜索
  • 1篇搜索引擎

机构

  • 6篇北京大学
  • 1篇北京城市学院
  • 1篇中央民族大学

作者

  • 5篇穗志方
  • 2篇王鑫
  • 1篇康为
  • 1篇邱立坤
  • 1篇俞士汶
  • 1篇朱学锋
  • 1篇李文杰
  • 1篇曾立英
  • 1篇邵艳秋

传媒

  • 5篇中文信息学报
  • 1篇武汉大学学报...

年份

  • 2篇2012
  • 3篇2011
  • 2篇2010
6 条 记 录,以下是 1-7
排序方式:
基于浅层句法分析的中文语义角色标注研究被引量:10
2011年
语义角色标注是获取语义信息的一种重要手段。许多现有的语义角色标注都是在完全句法分析的基础上进行的,但由于现阶段中文完全句法分析器性能比较低,基于自动完全句法分析的中文语义角色标注效果并不理想。因此该文将中文语义角色标注建立在了浅层句法分析的基础上。在句法分析阶段,利用构词法获得词语的"伪中心语素"特征,有效缓解了词语级别的数据稀疏问题,从而提高了句法分析的性能,F值达到了0.93。在角色标注阶段,利用构词法获得了目标动词的语素特征,细粒度地描述了动词本身的结构,从而为角色标注提供了更多的信息。此外,该文还提出了句子的"粗框架"特征,有效模拟了基于完全句法分析的角色标注中的子类框架信息。该文所实现的角色标注系统的F值达到了0.74,比前人的工作(0.71)有较为显著的提升,从而证明了该文的方法是有效的。
王鑫孙薇薇穗志方
关键词:语义角色标注浅层句法分析语素构词法
基于依存树距离识别论元的语义角色标注系统被引量:5
2012年
在基于依存的语义角色标注研究中,大多数系统采用机器学习方法进行论元识别和分类。该文分析了依存树的特点,发现论元集中分布于依存树上的特定局部范围内,因此提出一种基于依存树距离的论元识别方法。该方法将候选论元限制在与目标动词的依存树距离不超过3的范围内,通过制订规则,提取目标动词的最佳候选论元集合。在CoNLL2009中文语料上采用正确的依存树,识别出了98.5%的论元。在此基础上,结合基于机器学习的角色分类,系统F值达到89.46%,比前人的方法 (81.68%)有了较为显著的提升。
王鑫穗志方
关键词:语义角色标注
基于并列结构的概念实例和属性的同步提取方法被引量:4
2012年
在概念实例和属性的提取研究中,针对基于模式的方法召回率比较低的特点,该文提出了一种基于并列结构的概念实例和属性的同步提取方法。首先利用并列结构模式去网页集合中提取同类词语集合,然后再用基于种子的弱指导方法去学习实例和属性共现的上下文模式,最后再通过模式去提取候选实例或候选属性。在此过程中,每提取出一个候选,就将该候选所在的同类词语集合合并到候选集合中。实验结果表明,该文的方法在不降低准确率的基础上,能大大提高提取结果的召回率。
李文杰穗志方
关键词:搜索引擎
中文语义依存树库构建及自动分析技术
语义依存分析是一种对句子进行深层语义分析的技术。语义依存树库是依存分析的基础。本文综合了不同学者定义的汉语语义关系体系,面向语义分析的实际应用,设计了一套语义关系体系,该体系中除了常规的语义关系定义,对定语加中心语的短语...
邵艳秋邱立坤梁春霞毛宁
关键词:语义依存语义关系
文献传递
综合型语言知识库及其前景被引量:7
2011年
北京大学计算语言学研究所自1986年起,历时25年建成综合型语言知识库(CLKB)。CLKB包括6个语言知识库、10项规范与标准、基础软件工具集和4个应用系统,它们相互支撑,形成一个有机整体。CLKB的系列化的语言知识涵盖词、词组、句子、篇章各单位和词法、句法、语义各层面,从汉语向多语言辐射,从通用领域深入到专业领域。尽管CLKB已形成阶段性成果,但它仍在发展中。该文重点介绍CLKB的语言知识库,也探讨其发展方向。
俞士汶穗志方朱学锋
关键词:自然语言处理计算语言学综合型语言知识库
基于Web弱指导的本体概念实例及属性的同步提取被引量:5
2010年
该文提出了一种基于Web弱指导的本体概念实例和属性的同步提取方法,利用小规模的种子实例和属性集,该文从Web上自动获取实例和属性共现的上下文模式,并利用种子实例和属性的关联性来评价这些模式。进一步,根据上下文模式提取候选概念实例和属性后,该文提出两种方法来评价提取的候选实例和属性。第一,利用概念实例和属性的关联性来互相评价对方的准确度;第二,利用候选实例或候选属性与种子实例或属性在上下文模式分布上的相似度来评价准确度。在疾病类实验结果表明,人工确认候选实例的准确率在前500个结果达到94%,前1 000个结果的准确率也高达93%。
康为穗志方
关键词:计算机应用中文信息处理WEB
三字词的词法模式研究被引量:2
2010年
对《现代汉语语法信息词典》数据库的统计发现,三字词的构词具有一些比较固定的词法模式,该模式中那些能产性强的语素在构词时形成了一种"类义功能",在语法结构上也可以单独切分,称之为"部件词"。"部件词"包括26个接头词,185个接尾词,考察部件词构词时的词性、义项、词频等,有利于进一步分析部件词意义的聚类。
曾立英
关键词:三字词
共1页<1>
聚类工具0