您的位置: 专家智库 > >

屈亚楠

作品数:3 被引量:42H指数:3
供职机构:陕西师范大学计算机科学学院更多>>
发文基金:中央高校基本科研业务费专项资金陕西省科技攻关计划国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 2篇聚类
  • 2篇聚类算法
  • 2篇聚类中心
  • 2篇初始聚类中心
  • 1篇准则函数
  • 1篇粒计算
  • 1篇基于密度
  • 1篇ME

机构

  • 3篇陕西师范大学

作者

  • 3篇谢娟英
  • 3篇屈亚楠
  • 1篇高红超
  • 1篇王明钊
  • 1篇鲁肖肖

传媒

  • 2篇计算机科学与...
  • 1篇南京大学学报...

年份

  • 2篇2016
  • 1篇2015
3 条 记 录,以下是 1-3
排序方式:
粒计算优化初始聚类中心的K-medoids聚类算法被引量:13
2015年
针对快速K-medoids聚类算法所选初始聚类中心可能位于同一类簇的缺陷,以及基于粒计算的K-medoids算法构造样本去模糊相似矩阵时需要主观给定阈值的缺陷,提出了粒计算优化初始聚类中心的K-medoids聚类算法。该算法结合粒计算与最大最小距离法,优化K-medoids算法初始聚类中心的选取,选择处于样本分布密集区域且相距较远的K个样本作为初始聚类中心;使用所有样本的相似度均值作为其构造去模糊相似矩阵的阈值。人工模拟数据集和UCI机器学习数据库数据集的实验测试表明,新K-medoids聚类算法具有更稳定的聚类效果,其准确率和Adjusted Rand Index等聚类结果评价指标值优于传统K-medoids聚类算法、快速K-medoids聚类算法和基于粒计算的K-medoids聚类算法。
谢娟英鲁肖肖屈亚楠高红超
关键词:粒计算初始聚类中心
密度峰值优化初始中心的K-medoids聚类算法被引量:26
2016年
针对快速K-medoids聚类算法和方差优化初始中心的K-medoids聚类算法存在需要人为给定类簇数,初始聚类中心可能位于同一类簇,或无法完全确定数据集初始类簇中心等缺陷,受密度峰值聚类算法启发,提出了两种自适应确定类簇数的K-medoids算法。算法采用样本x i的t最近邻距离之和倒数度量其局部密度ρi,并定义样本x i的新距离δi,构造样本距离相对于样本密度的决策图。局部密度较高且相距较远的样本位于决策图的右上角区域,且远离数据集的大部分样本。选择这些样本作为初始聚类中心,使得初始聚类中心位于不同类簇,并自动得到数据集类簇数。为进一步优化聚类结果,提出采用类内距离与类间距离之比作为聚类准则函数。在UCI数据集和人工模拟数据集上进行了实验测试,并对初始聚类中心、迭代次数、聚类时间、Rand指数、Jaccard系数、Adjusted Rand index和聚类准确率等经典聚类有效性评价指标进行了比较,结果表明提出的K-medoids算法能有效识别数据集的真实类簇数和合理初始类簇中心,减少聚类迭代次数,缩短聚类时间,提高聚类准确率,并对噪音数据具有很好的鲁棒性。
谢娟英屈亚楠
关键词:聚类初始聚类中心准则函数
基于密度峰值的无监督特征选择算法被引量:4
2016年
针对现有无监督特征选择算法所选特征分类准确率不高的缺陷,提出两种新的无监督特征选择算法EDPFS(unsupervised Feature Selection algorithm based on Exponential Density Peaks)和RDPFS(unsupervised Feature Selection algorithm based on the Reciprocal Density Peaks).该两算法提出特征密度与特征距离的概念,并以此定义特征代表性与特征区分度,特征代表性越高表明特征越重要,特征区分度越高表明特征冗余度越小,以特征代表性与区分度之积作为特征重要性评价准则,采用基于特征子集的支持向量机分类正确率评价特征子集的分类性能.在8个UCI机器学习数据库数据集和4个图像数据集上测试这两种新算法,以及多类簇特征选择方法、Laplacian分值特征选择方法、无监督判别特征选择方法和扩展的无监督特征选择方法,实验结果表明:以特征代表性与区分度之积定义的特征重要性评价准则是有效的,提出的两种基于该准则的无监督特征选择算法EDPFS和RDPFS选择的特征子集具有很好的分类性能.
谢娟英屈亚楠王明钊
共1页<1>
聚类工具0