2024年7月12日
星期五
|
欢迎来到青海省图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
苏振魁
作品数:
2
被引量:15
H指数:2
供职机构:
大连理工大学国家示范性软件学院
更多>>
发文基金:
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
文化科学
更多>>
合作作者
周宽久
大连理工大学国家示范性软件学院
郭武斌
大连理工大学管理科学与工程学院...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
期刊文章
1篇
学位论文
领域
2篇
自动化与计算...
1篇
文化科学
主题
2篇
文本相似度
2篇
相似度
2篇
向量
2篇
向量空间
2篇
向量空间模型
1篇
马尔科夫
1篇
马尔科夫模型
1篇
词序
机构
2篇
大连理工大学
作者
2篇
苏振魁
1篇
郭武斌
1篇
周宽久
传媒
1篇
情报学报
年份
1篇
2008
1篇
2007
共
2
条 记 录,以下是 1-2
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于词序方法的文本相似度计算模型
被引量:10
2008年
针对传统向量空间模型对文本相似度的计算未考虑词序导致偏差的问题,提出使用马尔可夫模型的状态转移矩阵、两两文本的最长公共子序列以及它们的所有公共子串信息来描述词序信息,在此基础上提出一种将马尔可夫状态转移矩阵、最长公共子序列、公共子串和TF-IDF相结合,兼顾词序和词频信息的文本相似度计算方法,并使用英文TREC-9的部分数据集对基于词序方法的文本相似度计算方法进行了测试。试验结果表明:在同等分词及评估条件下,基于词序方法的文本相似度计算结果的准确率相对于单纯采用传统的基于向量空间模型的TF-IDF方法提高了5%~15%。
郭武斌
周宽久
苏振魁
关键词:
文本相似度
词序
向量空间模型
基于马尔科夫模型的文本相似度研究
在信息处理中,文本相似度的计算广泛应用于信息检索、分类、聚类以及其他与知识管理相关的领域,是一个非常基础而重要的问题,长期以来一直是人们研究的热点。目前的文本相似度研究多利用统计学原理来进行研究,投入了较多的精力去关注词...
苏振魁
关键词:
文本相似度
马尔科夫模型
向量空间模型
文献传递
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张