您的位置: 专家智库 > >

高洁

作品数:3 被引量:1H指数:1
供职机构:中国人民大学信息学院更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇会议论文
  • 1篇期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇相似度
  • 2篇WORDNE...
  • 1篇信息提取
  • 1篇英文
  • 1篇语义相似
  • 1篇语义相似度
  • 1篇主题发现
  • 1篇网页
  • 1篇网页信息
  • 1篇网页信息提取
  • 1篇链接
  • 1篇链接分析
  • 1篇聚类
  • 1篇基于语义
  • 1篇WEB
  • 1篇WEB社区
  • 1篇HITS算法
  • 1篇层次聚类
  • 1篇抽取

机构

  • 3篇中国人民大学

作者

  • 3篇刘秀德
  • 3篇杨楠
  • 3篇高洁
  • 3篇薛鸿鹄

传媒

  • 2篇全国Web信...
  • 1篇Journa...

年份

  • 3篇2008
3 条 记 录,以下是 1-3
排序方式:
基于语义相似度的Web社区主题发现
针对Web社区的真实性和有效性的自动评估的关键技术开展研究,在社区发现技术的基础之上,结合了信息检索技术以及语义信息,深入研究了社区主题词提取的方法。根据网页的DOM信息对页面进行处理与过滤,去除导航块、广告块;然后提取...
薛鸿鹄高洁刘秀德杨楠
关键词:WEB社区网页信息提取WORDNET
文献传递
Web紧密核的抽取和评价方法(英文)被引量:1
2008年
针对web社区的发现和链接分析技术的一些关键问题,基于面向主题的技术,重点研究了二分图的特征,引入了x二分核集来更为明确地定义抽取的方法.通过扫描主题子图构造x二分图,对该子图的(i,j)裁剪后得到x二分核集,这也是社区的最小元素.最后,对所抽取的所有x二分核集应用层次聚类的方法得到社区内部结构的树状图,证明了构造和裁剪方法的正确性并设计了算法.实验采用HITS(hyperlink-induced topic search)算法中的典型数据集获取方法,选择了10个主题和4个搜索引擎并综合返回的结果.采用社会网中测量社区结构强度的模块化度量来验证所提方法的有效性,实验结果表明所提方法是有效并可行的.
杨楠高洁薛鸿鹄刘秀德
关键词:链接分析层次聚类
基于WordNet语义相似度的HITS算法
本文对HITS算法及其改进算法进行分析.针对HITS算法及其改进算法的不足,提出一种新颖的计算语义相似度的方法——利用WordNet计算文本的语义相似度,并将其引入链接权重矩阵中,对原有HITS算法进行改进.实验表明,本...
刘秀德高洁薛鸿鹄杨楠
关键词:WORDNET语义相似度
文献传递
共1页<1>
聚类工具0