您的位置: 专家智库 > >

孙亚琳

作品数:2 被引量:4H指数:2
供职机构:中国人民大学信息学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇中文期刊文章

领域

  • 2篇自动化与计算...

主题

  • 2篇主题词表
  • 1篇形式概念分析
  • 1篇语义距离
  • 1篇约简方法
  • 1篇属性约简
  • 1篇网页
  • 1篇文本型
  • 1篇相似度
  • 1篇本体
  • 1篇TF
  • 1篇FCA
  • 1篇词语相似度

机构

  • 2篇中国人民大学
  • 1篇怀化学院
  • 1篇中国地质调查...

作者

  • 2篇孙亚琳
  • 2篇杨小平
  • 1篇廖俊宇
  • 1篇何伟
  • 1篇赵林林

传媒

  • 1篇计算机应用研...
  • 1篇小型微型计算...

年份

  • 1篇2014
  • 1篇2012
2 条 记 录,以下是 1-2
排序方式:
基于主题词表和FCA的网页语义概念树构建研究被引量:2
2014年
针对用户使用网站效率低和网站质量差的问题,提出了利用形式概念分析(FCA)来构建网页语义概念树的方法。该方法首先利用信息抽取、自然语言处理等技术对网页集进行文本抽取、分词,提取出描述文本语义的特征词;再以主题词表为参照,设计基于搜索引擎的词语相似度算法,将抽取的特征词全部转换成主题词表中主题词,对将抽取的语义信息转换成形式背景,利用规则、聚类等技术对形式背景进行约简。最后通过设计的建格算法构建概念格,实现概念树构建。实验结果表明,利用该方法构建的概念树可以作为网站本体模型的基础,对语义评估具有积极的意义,具有一定的应用价值和借鉴意义。
孙亚琳赵林林杨小平
关键词:本体形式概念分析词语相似度
TFC-Reducing:一种基于属性语义距离和规则的文本型形式背景约简方法被引量:3
2012年
形式概念分析作为数据分析和知识处理的形式化工具,可以有效的从海量文本数据中挖掘出人们感兴趣的知识,受到许多研究人员的推崇.形式概念分析的前提条件是必须有一个纯净、良好定义的形式背景.从文本中直接提取特征词,利用文本-特征词形成的文本型形式背景(Textual Formal Context TFC)是一个高度稀疏的二维表,带有很多的噪音信息,严重影响形式概念分析的建格效率以及概念格的结构.因此找到一种有效的文本型形式背景约简方法很有必要.本文综合考虑文本型形式背景的本质特征,从属性语义距离和数学原理出发,提出了一种文本型形式背景的约简方法TFC-Reducing,并给出文本型形式背景约简的评价方法--信息损失熵和语义覆盖度.
杨小平何伟孙亚琳廖俊宇
关键词:语义距离属性约简
共1页<1>
聚类工具0