国家自然科学基金(61070714)
- 作品数:3 被引量:10H指数:1
- 相关作者:曹建军刁兴春谭明超冯径更多>>
- 相关机构:解放军理工大学总参第六十三研究所更多>>
- 发文基金:国家自然科学基金中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于函数依赖的属性相似度调整算法被引量:1
- 2015年
- 属性相似度的准确性是影响实体分辨准确程度的重要因素之一.为提高属性相似度的准确性,分析了属性相似度与函数依赖的关系,给出了属性相似度调整原则,提出了依据函数依赖进行相似度划分、相似度传递调整和计算相似度调整代价的方法,提出了通过属性相似度调整提高属性相似度准确性的属性相似度传递调整算法.实验结果表明,该算法能够更好地区分匹配记录对和不匹配记录对,获得更高的查全率、查准率和F1值.
- 谭明超刁兴春曹建军冯径
- 关键词:属性相似度函数依赖
- 基于有向无环图的函数依赖一致性数据生成
- 2014年
- 针对函数依赖一致性数据生成问题,采用有向无环图作为函数依赖集合的描述模型,提出一种单函数依赖一致性数据生成算法(TGSFD);并通过属性排序解决多函数依赖一致性数据生成问题;为了利用流水线技术提高数据生成效率,提出最小独立属性子集概念,并给出了属性集划分算法.实验表明本文提出的TGSFD和属性排序算法能够保证生成的数据满足函数依赖一致性,属性集划分和流水线技术可以有效提高数据生成效率.
- 谭明超刁兴春曹建军冯径
- 关键词:数据生成一致性函数依赖有向无环图流水线
- 实体分辨研究综述被引量:10
- 2014年
- 实体分辨是数据集成、信息检索等领域的重要研究内容,目的是发现数据集合中的不同实体和同一实体的不同描述。将实体分辨过程划分为数据分块、记录比较和匹配决策等3个主要步骤。从记录聚集方式的角度介绍了实体分辨的数据分块方法;从字符串划分粒度的角度分析了实体分辨的记录比较方法;从记录关联方式的角度阐述了实体分辨的决策模型。最后对实体分辨研究下一步需要解决的问题进行了展望。
- 谭明超刁兴春曹建军
- 关键词:数据分块相似度