张开活
- 作品数:2 被引量:3H指数:1
- 供职机构:福建师范大学软件学院更多>>
- 发文基金:软件工程国家重点实验室开放基金国家自然科学基金福建省教育厅资助项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种新的并行自动聚类算法:CGC-Cluster被引量:2
- 2015年
- 针对基于基因表达式编程的自动聚类算法聚类速度较慢和聚簇质量较差的问题,提出一种新的并行自动聚类算法:基于统一计算设备架构和粗粒度并行模型的基因表达式编程自动聚类算法(CGC-Cluster).采用GRCM方法对基于基因表达式编程的自动聚类算法(GEP-Cluster)中聚类中心的筛选与聚合步骤进行了改进,基于统一计算设备架构以达到提高并行处理能力,基于粗粒度并行演化模型以提高并行度.选择了较知名的数据集,从算法的聚类速度和聚类质量两方面与GEP-Cluster算法进行了统计实验对比分析,实验结果表明,CGC-Cluster算法不仅获得了3倍左右的加速比,而且从簇内方差、Ocq指标和Dunn指标三种评判质量的指标进行比较,CGC-Cluster显著地改进了聚簇的质量.最后还通过实验分析了算法参数对并行算法的影响.
- 杜欣刘大刚倪友聪张开活谢大同
- 关键词:统一计算设备架构基因表达式编程聚类算法
- 基于统一计算设备架构和基因表达式编程的自动聚类算法被引量:1
- 2013年
- 针对基于基因表达式编程(GEP)的自动聚类算法GEP-Cluster中聚类中心的筛选和聚合、计算数据对象到各聚类中心距离两个关键步骤效率不高的问题,提出了一种基于统一计算设备架构(CUDA)和GEP的自动聚类改进算法(CGEP-Cluster)。CGEP-Cluster算法采用基因阅读运算器方法对GEP-Cluster算法的聚类中心筛选和聚合步骤进行改进,并基于CUDA将GEP-Cluster算法中数据对象到各聚类中心距离的计算并行化。实验结果表明,在数据对象规模较大时,CGEP-Cluster算法可获得8倍左右的加速比。CGEP-Cluster算法可用于聚类数未知且数据对象规模较大情况下的自动聚类。
- 杜欣刘大刚张开活申远赵康倪友聪
- 关键词:统一计算设备架构基因表达式编程聚类算法GEPCLUSTER演化算法