黄志兰
- 作品数:4 被引量:25H指数:1
- 供职机构:中山大学信息科学与技术学院计算机科学系更多>>
- 发文基金:国家自然科学基金广东省自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种有效的文本聚类算法
- 本文提出了一种新的有效的文本聚类算法RTC,该算法在球形k-means的基础上运用两种不同的策略:优化的初始中心选择和划分调整来解决文本聚类中容易陷入质量差的局部最优状态问题.实验结果表明,RTC算法具有很好的聚类精确度...
- 蔡嘉荣印鉴刘玉葆黄志兰
- 关键词:文本信息数据挖掘文本聚类算法
- 文献传递
- 基于有损分解的数据隐私保护方法被引量:25
- 2009年
- 隐私保护的数据挖掘近来已成为数据挖掘研究的热点,而数据隐私的保护则是其中的重要问题之一.针对已有方法信息损失程度高、聚集查询精度低的不足,在(alpha,k)隐私保护模型基础上,利用关系数据库理论的有损分解思想,提出了一种改进的数据隐私保护方法Alpha+.该方法首先利用(alpha,k)生成原始数据的匿名数据库,然后,将匿名数据库投影为2个可连接的数据库表NSS和SS,并利用NSS和SS有损连接的冗余信息保护数据隐私.接下来,Alpha+对NSS和SS的元组进行合并,以减少最终发布的数据库表大小.最后比较了Alpha+方法与其他类似方法的安全性.实验结果表明Alpha+在聚集查询精度方面明显优于同类方法.
- 刘玉葆黄志兰傅慰慈印鉴
- 关键词:K-匿名化聚集查询
- 基于最大访问模式挖掘的数据库异常行为检测
- 2006年
- 引入访问模式描述用户访问数据库系统的主要行为特征,利用从数据库审计记录中挖掘的最大访问模式来检测数据库系统的异常行为.基于FP-tree结构,提出了一种最大访问模式挖掘算法MMAP.基于数据库系统中关系之间的外键依赖提出了一种关系距离约束,进一步减少挖掘算法的搜索空间.基于MMAP算法建立了一个检测模型,测试表明该模型能有效地检测数据库系统的异常行为.
- 刘玉葆蔡嘉荣印鉴黄志兰
- 关键词:数据库入侵检测数据挖掘
- 基于枚举树的最大子空间聚类算法研究
- 本文对基于枚举树的最大子空间聚类算法进行了研究。文章提出了一种新的基于枚举树的最大子空间聚类算法MSC,算法在聚类的过程中,直接生成最大子空间中的聚类。MSC用枚举树表示子空间,根据子空间中聚类分布的单调性,对枚举树进行...
- 黄志兰
- 关键词:软件工程高维数据聚类算法
- 文献传递