您的位置: 专家智库 > >

朱磊

作品数:1 被引量:130H指数:1
供职机构:西南大学计算机与信息科学学院更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇文本分类
  • 1篇文档
  • 1篇向量
  • 1篇向量表示
  • 1篇TF-IDF

机构

  • 1篇西南大学

作者

  • 1篇邹显春
  • 1篇唐明
  • 1篇朱磊

传媒

  • 1篇计算机科学

年份

  • 1篇2016
1 条 记 录,以下是 1-1
排序方式:
基于Word2Vec的一种文档向量表示被引量:130
2016年
在文本分类中,如何运用word2vec词向量高效地表达一篇文档一直是一个难点。目前,将word2vec模型与聚类算法结合形成的doc2vec模型能有效地表达文档信息。但是,这种方法很少考虑单个词对整篇文档的影响力。为了解决这个问题,利用TF-IDF算法计算每篇文档中词的权重,并结合word2vec词向量生成文档向量,最后将其应用于中文文档分类。在搜狗中文语料库上的实验验证了新方法的有效性。
唐明朱磊邹显春
关键词:TF-IDF文本分类
共1页<1>
聚类工具0