您的位置: 专家智库 > >

武汉大学信息管理学院信息检索与知识挖掘研究所

作品数:4 被引量:56H指数:4
发文基金:国家自然科学基金教育部人文社会科学重点研究基地度重大研究项目更多>>
相关领域:文化科学自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 2篇自动化与计算...
  • 2篇文化科学

主题

  • 2篇文本分类
  • 1篇段落
  • 1篇学术搜索
  • 1篇医学图像
  • 1篇医学图像检索
  • 1篇语言模型
  • 1篇章节
  • 1篇章节内容
  • 1篇搜索
  • 1篇图像
  • 1篇图像标注
  • 1篇图像检索
  • 1篇文本挖掘
  • 1篇模型组合
  • 1篇加权
  • 1篇词汇
  • 1篇词汇特征

机构

  • 4篇武汉大学

作者

  • 4篇陆伟
  • 3篇程齐凯
  • 3篇黄永
  • 2篇桂思思
  • 1篇丁恒
  • 1篇林霞

传媒

  • 4篇情报学报

年份

  • 4篇2016
4 条 记 录,以下是 1-4
排序方式:
学术文本的结构功能识别——基于章节内容的识别被引量:37
2016年
学术文本的结构功能是对学术文本结构及章节功能的阐述和概括,主要分为引言、相关研究、方法、实验、结论五种。根据研究对象的不同,结构功能识别的方法可分为基于章节标题的识别、基于章节内容的识别和基于段落的识别三个层次。然而,基于章节标题的结构功能识别法存在较多的局限性,如数据集构建困难、含未登录词的标题的识别率较低等。因此本文以章节内容为研究对象,探讨学术文本结构功能识别的第二个层次,并将基于章节内容的结构功能识别问题转化为文本分类问题,在特征选择上,除了传统的词汇特征,还引入词汇的聚类特征,并使用支持向量机作为分类器在基于自然标注的实验数据集上进行了实证研究。实验结果表明相比较于只使用词汇特征,本文所提方法的识别效果有明显提升。
黄永陆伟程齐凯
关键词:文本分类词汇特征
学术文本的结构功能识别——基于段落的识别被引量:35
2016年
学术文本的结构功能识别是学术文本章节层次的文本分类问题,其本质就是识别章节的结构功能。本文将基于段落的学术文本结构功能识别分为两个子问题:段落位置识别及基于段落投票的章节结构功能识别。在自动构建的大规模数据集上的实验结果表明,虽然基于段落的结构功能识别效果不如基于章节整体内容的识别,但仍然取得了不错的效果。本文结合实验结果着重分析了影响基于段落的识别效果的两个重要因素:段落长度及章节中段落数量,并在最后对学术文本结构功能识别的三个层次做了总结,指出了拟进一步探讨的问题和方向。
黄永陆伟程齐凯桂思思
关键词:文本分类文本挖掘
学术文本的结构功能识别——在学术搜索中的应用被引量:13
2016年
在学术大数据环境下,学术文本挖掘研究向细粒度和语义化方向发展。学术文本的结构功能是对学术文本正文的结构及章节功能的概括。为探讨结构功能在学术搜索中的作用,本文将学术文本看作是个结构功能域的集合,使用域加权语言模型对学术文本结构功能进行加权,并以一般语言模型为基准,在INEX04数据上进行了文档级检索实验。实验结果表明本文所提出的模型取得了较大的提升,尤其在P@5上的相对提升达到13.93%。根据模型中各个结构功能域的权重参数分析可以得知,引言功能作用最大,相关研究、方法的作用次之,实验及结论的作用最小。本文的实验也证明了学术文本的结构功能在学术搜索中的应用价值。
黄永陆伟程齐凯桂思思
关键词:学术搜索语言模型
医学图像模态特征表达及其比较研究被引量:6
2016年
医学图像模态的自动标注是建立检索词和医学图像间准确关联,实现医学图像检索的基础。当前医学图像的模态特征表达多采用基于单一表达模型的方法,没有充分运用不同表达模型的互补优势,医学图像的语义描述框架与医学图像检索需求不匹配。针对这些不足,本文在介绍医学图像模态分类框架和标准数据集的基础上,分析了文本特征和视觉特征对医学图像模态自动标注的影响,对比了向量空间模型(VSM)、潜在语义索引(LSI)、视觉词袋模型(B0W)、卷积神经网络模型(CNN)等多种特征表达模型在医学图像模态自动标注上的效果,研究发现文本特征与视觉特征各适用于部分医学模态的识别与区分,组合多种表达模型能够获得最佳的标注效果。
丁恒陆伟林霞曹光超
关键词:医学图像检索图像标注模型组合
共1页<1>
聚类工具0