王爱军
- 作品数:1 被引量:7H指数:1
- 供职机构:吉林大学计算机科学与技术学院更多>>
- 发文基金:吉林省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于项目属性的相联规则提取被引量:7
- 2002年
- 相联规则是数据库知识发现领域的重要方法之一 ,用于发现满足用户指定最小支持度和最小信任度阈值的规则 .其中 ,最小支持度阈值确定了研究数据集的规模 ,最小信任度阈值用来衡量一个规则可靠性 .在通常的支持度 /信任度框架下 ,用户只能给出一对最小支持度和最小信任度阈值 ,因此 ,对于所有数据项均采用统一标准处理 .但是 ,实际数据库中的数据项目具有各自的特点 ,该文旨在根据项目的属性特征 ,通过模糊综合评判 ,决定项目合理的最小支持度阈值 ,进而确定各个项目的支持度区间 ,达到在一次数据挖掘中同时发现频繁规则和稀有规则的目的 .由于基于最小信任度的规则提取具有冗余性 ,文中提出规则前件和后件的重要程度对比的思想 ,借助主观判断去除冗余规则 ,从而挖掘出尽可能接近自然的完全规则 .
- 李雄飞苑森淼王爱军郇丹丹
- 关键词:重要度对比度超市数据库