田迪
- 作品数:1 被引量:0H指数:0
- 供职机构:哈尔滨工程大学计算机科学与技术学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种改进的XML向量空间模型及其近似匹配算法
- 2006年
- XML已成为网上数据交换和存储的标准,然而现有的XML文档模型存在很多问题.综合了数据挖掘和信息检索两方面的技术,对传统的向量空间模型加以扩展,提出一种新的基于语义和支持度的XML向量空间模型并给出其生成算法,该模型抽取文档集的频繁路径作为特征,然后利用XML本身的语义特性,对标签之间作ontology判断.最后,基于该模型提出一种XML近似查询算法,将文档矩阵从改进的VSM空间映射到潜在语义空间,并在转换后的空间获得近似查询结果并排序.对提出的方法进行理论分析和实验验证,得到满意的结果.
- 王桐刘大昕田迪孙伟张万松
- 关键词:向量空间模型XMLLSI