您的位置: 专家智库 > >

李佳珊

作品数:1 被引量:1H指数:1
供职机构:北京邮电大学计算机学院网络与交换技术国家重点实验室更多>>
发文基金:国家自然科学基金国家高技术研究发展计划国家科技重大专项更多>>
相关领域:电子电信更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇电子电信

主题

  • 1篇新闻
  • 1篇主题模型
  • 1篇聚类
  • 1篇层次化
  • 1篇层次聚类

机构

  • 1篇北京邮电大学

作者

  • 1篇卢美莲
  • 1篇王梓
  • 1篇李佳珊

传媒

  • 1篇北京邮电大学...

年份

  • 1篇2014
1 条 记 录,以下是 1-1
排序方式:
利用改进LSH算法进行层次化新闻话题检测被引量:1
2014年
针对回顾式话题检测方法存在的话题检测时效性较差的问题,提出了改进的位置敏感哈希(LSH)算法,并应用于互联网新闻层次化话题检测.在挖掘新闻内容特征的同时,应用潜在狄利克雷分布主题模型挖掘新闻的语义特征,将非二进制空间的内容特征向量和主题特征向量转换到二进制特征空间上,依次应用LSH算法对新闻文本基于内容特征和主题特征聚类,得到具有"主题-内容"层次的话题.实验结果表明,该方法通过挖掘新闻的内容特征和主题特征,能更准确和完整地表现新闻内容;将内容特征和主题特征转换到统一的二进制空间,有效降低了聚类过程的时间复杂度,在保证话题检测准确率和话题在语义层面上扩展性的前提下,提高了话题检测的效率.
卢美莲王梓李佳珊
关键词:层次聚类主题模型
共1页<1>
聚类工具0