您的位置: 专家智库 > >

孙婧昊

作品数:7 被引量:106H指数:5
供职机构:中山大学信息科学与技术学院计算机科学系更多>>
发文基金:国家自然科学基金广东省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 6篇期刊文章
  • 1篇学位论文

领域

  • 7篇自动化与计算...

主题

  • 5篇遗传算法
  • 4篇聚类
  • 2篇维数
  • 2篇文本聚类
  • 2篇基因表达
  • 2篇基因表达数据
  • 2篇高维
  • 2篇高维数据
  • 2篇初始化
  • 1篇信息增益
  • 1篇数据挖掘
  • 1篇聚类算法
  • 1篇均值聚类
  • 1篇均值聚类算法
  • 1篇可分离性
  • 1篇基于遗传算法
  • 1篇高维数据挖掘
  • 1篇边界点
  • 1篇K均值
  • 1篇K均值聚类

机构

  • 7篇中山大学

作者

  • 7篇孙婧昊
  • 6篇任江涛
  • 6篇印鉴
  • 6篇黄焕宇
  • 2篇施潇潇

传媒

  • 3篇计算机科学
  • 2篇计算机应用
  • 1篇计算机工程

年份

  • 1篇2007
  • 6篇2006
7 条 记 录,以下是 1-7
排序方式:
基于边界点的可分离性度量及特征选择被引量:1
2007年
提出了一种新的面向高维数据的特征选择方法,在特征子集搜索上采用遗传算法进行随机搜索,在特征子集评价上采用基于边界点的可分性度量作为评价指标及适应度。实验结果表明,该算法可有效地找出具有较好的可分离性的特征子集,从而实现降维并提高分类精度。
任江涛孙婧昊黄焕宇印鉴
关键词:边界点可分离性遗传算法
面向高维数据挖掘的特征选择方法研究
数据挖掘是目前国际上数据库和信息决策领域最前沿的研究方向之一。由于高维数据日益成为主流,在实际应用中经常会遇到高维数据的情况,对高维数据挖掘的研究有着越来越重要的意义。但高维数据本身独有的一些特点,使得高维数据挖掘变的非...
孙婧昊
关键词:高维数据数据挖掘文本聚类基因表达数据遗传算法
文献传递
基于相关性分析及遗传算法的高维数据特征选择被引量:26
2006年
特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象,特征选择一方面可以提高分类精度和效率,另一方面可以找出富含信息的特征子集。针对此问题,提出了一种综合了filter模型及wrapper模型的特征选择方法,首先基于特征与类别标签的相关性分析进行特征筛选,只保留与类别标签具有较强相关性的特征,然后针对经过筛选而精简的特征子集采用遗传算法进行随机搜索,并采用感知器模型的分类错误率作为评价指标。实验结果表明,该算法可有效地找出具有较好的线性可分离性的特征子集,从而实现降维并提高分类精度。
任江涛黄焕宇孙婧昊印鉴
关键词:遗传算法
一种改进的基于特征赋权的K均值聚类算法被引量:17
2006年
聚类分析是数据挖掘及机器学习领域内的重点问题之一。近年来,为了提高聚类质量,借鉴和引入了分类领域特征选择及特征赋权思想,提出了一些基于特征赋权的聚类算法。在这些研究基础上,本文提出了一种基于密度的初始中心点选择算法,并借鉴文[1]所提出的特征赋权方法,给出了一种改进的基于特征赋权的K均值算法。实验表明该算法能较为稳定地得到较高质量的聚类结果。
任江涛施潇潇孙婧昊黄焕宇印鉴
关键词:聚类初始化
基于遗传算法及聚类的基因表达数据特征选择被引量:10
2006年
特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象(如基因表达数据)的特征选择,一方面可以提高分类及聚类的精度和效率,另一方面可以找出富含信息的特征子集,如发现与疾病密切相关的重要基因。针对此问题,本文提出了一种新的面向基因表达数据的特征选择方法,在特征子集搜索上采用遗传算法进行随机搜索,在特征子集评价上采用聚类算法及聚类错误率作为学习算法及评价指标。实验结果表明,该算法可有效地找出具有较好可分离性的特征子集,从而实现降维并提高聚类及分类精度。
任江涛黄焕宇孙婧昊印鉴
关键词:遗传算法聚类基因表达数据
一种基于信息增益及遗传算法的特征选择算法被引量:23
2006年
特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象,特征选择一方面可以提高分类精度和效率,另一方面可以找出富含信息的特征子集。针对此问题,本文提出一种综合了filter模型及wrapper模型的特征选择方法,首先基于特征之间的信息增益进行特征分组及筛选,然后针对经过筛选而精简的特征子集采用遗传算法进行随机搜索,并采用感知器模型的分类错误率作为评价指标。实验结果表明,该算法可有效地找出具有较好的线性可分离性的特征子集,从而实现降维并提高分类精度。
任江涛孙婧昊黄焕宇印鉴
关键词:信息增益遗传算法
一种用于文本聚类的改进的K均值算法被引量:29
2006年
K均值算法是聚类分析中使用最为广泛的算法之一。针对文本聚类所面临的维数灾难,稀疏向量以及标准K均值算法初始中心点选择的随机性等问题,提出了一种面向文本聚类的改进的K均值算法,通过运用特征选择及降维、稀疏向量筛除、基于密度及散布的初始中心点搜索等方法进行改进。实验结果表明,改进后的算法无论在聚类精度还是在稳定性等方面,都明显优于标准的K均值算法。
任江涛孙婧昊施潇潇黄焕宇印鉴
关键词:文本聚类初始化
共1页<1>
聚类工具0