您的位置: 专家智库 > >

苏振魁

作品数:2 被引量:15H指数:2
供职机构:大连理工大学国家示范性软件学院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 1篇期刊文章
  • 1篇学位论文

领域

  • 2篇自动化与计算...
  • 1篇文化科学

主题

  • 2篇文本相似度
  • 2篇相似度
  • 2篇向量
  • 2篇向量空间
  • 2篇向量空间模型
  • 1篇马尔科夫
  • 1篇马尔科夫模型
  • 1篇词序

机构

  • 2篇大连理工大学

作者

  • 2篇苏振魁
  • 1篇郭武斌
  • 1篇周宽久

传媒

  • 1篇情报学报

年份

  • 1篇2008
  • 1篇2007
2 条 记 录,以下是 1-2
排序方式:
基于词序方法的文本相似度计算模型被引量:10
2008年
针对传统向量空间模型对文本相似度的计算未考虑词序导致偏差的问题,提出使用马尔可夫模型的状态转移矩阵、两两文本的最长公共子序列以及它们的所有公共子串信息来描述词序信息,在此基础上提出一种将马尔可夫状态转移矩阵、最长公共子序列、公共子串和TF-IDF相结合,兼顾词序和词频信息的文本相似度计算方法,并使用英文TREC-9的部分数据集对基于词序方法的文本相似度计算方法进行了测试。试验结果表明:在同等分词及评估条件下,基于词序方法的文本相似度计算结果的准确率相对于单纯采用传统的基于向量空间模型的TF-IDF方法提高了5%~15%。
郭武斌周宽久苏振魁
关键词:文本相似度词序向量空间模型
基于马尔科夫模型的文本相似度研究
在信息处理中,文本相似度的计算广泛应用于信息检索、分类、聚类以及其他与知识管理相关的领域,是一个非常基础而重要的问题,长期以来一直是人们研究的热点。目前的文本相似度研究多利用统计学原理来进行研究,投入了较多的精力去关注词...
苏振魁
关键词:文本相似度马尔科夫模型向量空间模型
文献传递
共1页<1>
聚类工具0