您的位置: 专家智库 > >

国家自然科学基金(10871019a0107)

作品数:2 被引量:6H指数:2
相关作者:田盛丰龚书瞿有利更多>>
相关机构:北京交通大学更多>>
发文基金:教育部科学技术研究重点项目国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇语义
  • 2篇自动文摘
  • 2篇文摘
  • 1篇多文档
  • 1篇多文档文摘
  • 1篇语言处理
  • 1篇语义分析
  • 1篇语义模型
  • 1篇自然语言
  • 1篇自然语言处理
  • 1篇维基百科
  • 1篇文档
  • 1篇基于语义
  • 1篇本体

机构

  • 2篇北京交通大学

作者

  • 2篇瞿有利
  • 2篇龚书
  • 2篇田盛丰

传媒

  • 1篇南京大学学报...
  • 1篇北京交通大学...

年份

  • 1篇2011
  • 1篇2009
2 条 记 录,以下是 1-2
排序方式:
基于语义的自动文摘研究综述被引量:4
2009年
基于语义的自动文摘方法能解决自动文摘处理中语言复杂性问题,在克服领域局限性的同时从本质上提高文摘的质量.常用语义模型包括统计主题模型和语义知识模型.基于语义的自动文摘是对传统文摘技术基于语义模型的扩充,在自动文摘的预处理、文档转换、文档候选片段提取和文摘生成4个基本过程中使用各种语义分析方法.
龚书瞿有利田盛丰
关键词:自然语言处理自动文摘语义语义模型本体
基于维基语义的多文档文摘研究被引量:2
2011年
多文档文摘作为自然语言处理领域的重要技术之一,能从不同角度辅助用户实现高效的信息获取.由于文档集合内的内容往往来自不同的信息源,文本之间通常存在丰富而复杂的语义关系.常用的基于词的文档表示法,难以为文摘的语义分析过程提供充足而准确的数据信息.为此,我们提出使用维基百科——当今世界最大的在线概念语料库——为多文档文摘的提取提供语义支持.一方面,我们通过提取文档中的维基概念,生成准确一致的句子表示形式.另一方面,在计算句子特征时,我们利用维基词条的首段指导机器文摘的提取.我们首先通过计算概念在维基中的全局相关性和当前文档集内的局部相关性,获取概念的权重.然后在维基概念表示的基础上,为文档中的句子提取多种基于维基的特征,并最后用于文摘生成.在实验中,我们依次用各个维基特征独立生成文摘,并使用ROUGE(Recall-Oriented Understudy for Gisting Evaluation,面向召回率的要点评估)指标评价文摘质量.通过比较,实验验证了维基词条首段能较好的提升文摘质量.
龚书瞿有利田盛丰
关键词:自动文摘语义分析维基百科
共1页<1>
聚类工具0