您的位置: 专家智库 > >

国家教育部博士点基金(2009321110006)

作品数:1 被引量:16H指数:1
相关作者:马彬朱巧明陆剑江洪宇姚建民更多>>
相关机构:苏州大学更多>>
发文基金:国家教育部博士点基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇文本
  • 1篇聚类
  • 1篇TA
  • 1篇LDA

机构

  • 1篇苏州大学

作者

  • 1篇姚建民
  • 1篇洪宇
  • 1篇陆剑江
  • 1篇朱巧明
  • 1篇马彬

传媒

  • 1篇中文信息学报

年份

  • 1篇2012
1 条 记 录,以下是 1-1
排序方式:
基于线索树双层聚类的微博话题检测被引量:16
2012年
微博作为一种全新的信息发布模式,在极大程度上增强了网络信息的开放性和互动性,但同时也造成微博空间内信息量的裂变式增长。利用话题检测技术将微博文本信息按照话题进行归类和组织,可以帮助用户在动态变化的信息环境下高效获取个性信息或热点话题。该文针对微博文本短、半结构、上下文信息丰富等特点,提出了基于线索树的双层聚类的话题检测方法,通过利用融合了时序特征和作者信息的话题模型(Temporal-Author-Topic,TAT)进行线索树内的局部聚类,借以实现垃圾微博的过滤,最后利用整合后的线索树进行全局话题检测。实验结果显示该方法在解决数据稀疏方面取得了较好的效果,话题检测的F值达到31.2%。
马彬洪宇陆剑江姚建民朱巧明
共1页<1>
聚类工具0