江西省教育厅科学技术研究项目([2007]344)
- 作品数:1 被引量:3H指数:1
- 相关作者:谭德坤更多>>
- 相关机构:南昌工程学院更多>>
- 发文基金:江西省教育厅科学技术研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 模糊粗糙集在科技文档检索中的应用研究被引量:3
- 2011年
- 关于提高文献的检索效率,在科技文献检索过程中,传统的基于关键词匹配的检索方法缺乏对知识的理解和处理,只能检索出包含关键词的文献,而不能检索出与关键词语义相似的文献,因而检索结果在查全率和查准率都无法满足检索者的要求。将模糊粗糙集理论引入信息检索当中,对信息检索模型的缺陷进行了改进。首先用传统的互信息函数计算标引词之间的语义关联权重,构建出模糊近似空间;然后用TF-IDF方法获得文档的模糊向量表示,在计算标引词重要度权重时,不但考虑了标引词出现的频度,还考虑位置因素,查询的模糊向量表示完全由用户的兴趣确定;最后用模糊近似空间对关键词进行概念扩展,挖掘出相似概念类,计算文档和查询模糊表示的上、下近似集,文档和查询的匹配不再是关键词匹配,而是利用布尔逻辑的合取、析取公式对上、下近似集进行模糊匹配,并返回按相似度值排序的检索结果。仿真测试表明,方法能提高科技文档检索的性能,能对科技文献进行概念意义上的检索。
- 谭德坤
- 关键词:模糊粗糙集互信息语义相似度