您的位置: 专家智库 > >

国家科技部专项基金(2009DFA12970)

作品数:1 被引量:5H指数:1
相关作者:郑方唐国瑜夏云庆更多>>
相关机构:清华大学更多>>
发文基金:国家科技部专项基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇信息检索
  • 1篇文档
  • 1篇文档聚类
  • 1篇聚类
  • 1篇跨语言信息检...

机构

  • 1篇清华大学

作者

  • 1篇夏云庆
  • 1篇唐国瑜
  • 1篇郑方

传媒

  • 1篇中文信息学报

年份

  • 1篇2012
1 条 记 录,以下是 1-1
排序方式:
基于跨语言广义向量空间模型的跨语言文档聚类方法被引量:5
2012年
跨语言文档聚类主要是将跨语言文档按照内容或者话题组织为不同的类簇。该文通过采用跨语言词相似度计算将单语广义向量空间模型(Generalized Vector Space Model,GVSM)拓展到跨语言文档表示中,即跨语言广义空间向量模型(Cross-Lingual Generalized Vector Space Model,CLGVSM),并且比较了不同相似度在文档聚类下的性能。同时提出了适用于GVSM的特征选择算法。实验证明,采用SOCPMI词汇相似度度量算法构造GVSM时,跨语言文档聚类的性能优于LSA。
唐国瑜夏云庆张民郑方
关键词:文档聚类跨语言信息检索
共1页<1>
聚类工具0