杨小兵 作品数:12 被引量:163 H指数:5 供职机构: 中国计量学院信息工程学院 更多>> 发文基金: 国家自然科学基金 浙江省自然科学基金 浙江省科技厅国际合作项目 更多>> 相关领域: 自动化与计算机技术 天文地球 更多>>
嵌入代价敏感的极限学习机相异性集成的基因表达数据分类 被引量:7 2014年 极限学习机的相异性集成算法(Dissimilarity Based Ensemble of Extreme Learning Machine,D-ELM)在基因表达数据分类中能够得到较稳定的分类效果,然而这种分类算法是基于分类精度的,当所给样本的误分类代价不相等时,不能直接实现代价敏感分类过程中的最小平均误分类代价的要求。通过在分类过程中引入概率估计以及误分类代价和拒识代价重新构造分类结果,提出了基于相异性集成极限学习机的代价敏感算法(CS-D-ELM)。该算法被运用到基因表达数据集上,得到了较好的分类效果。 安春霖 陆慧娟 魏莎莎 杨小兵关键词:极限学习机 基因表达数据 切换回归模型的抗噪音聚类算法 被引量:1 2009年 对切换回归模型的聚类方法一般都没有考虑到噪音的影响,因此在含有噪音数据的情况下,用这些方法聚类的结果就会出现一定的偏差.为了减弱聚类过程中噪音数据的影响,提出了一种新的具有抵抗噪音能力的聚类算法,称为抗噪音聚类算法.该算法通过将已知数据集划分为非噪音数据集和噪音数据集2个子集,然后对非噪音数据集进行聚类分析,估计出模型的各个参数.通过对噪音数据集和非噪音数据集进行不断地调整,同时不断地修正得到的参数估计值,从而得到对聚类结果的优化.实验表明,抗噪音聚类算法能够有效地克服噪音数据对聚类结果的影响,并估计出优质的参数. 杨小兵 何灵敏 孔繁胜关键词:聚类 基于测地距离与极限学习机的监督型LLE算法研究 被引量:1 2015年 局部线性嵌入算法LLE(Locally Linear Embedding)是一种有效的非线性降维方法,但是该算法没有考虑样本的类别标签,并且欧式距离无法精确表示非线性数据的流形结构。针对以上LLE方法的缺陷,提出一种结合测地距离与样本类别信息的监督型LLE算法(ISO-SPLLE)。首先在LLE算法的近邻选择中使用测地距离作为相似性度量,然后利用极限学习机求出其映射函数后进行分类测试。将ISO-SPLLE算法与其他改进的LLE算法在UIC标准数据集与基因数据集上进行对比实验,结果表明,该方法对已知类别的数据能更有效地进行降维与识别。 金伟 何灵敏 杨小兵 王康健关键词:局部线性嵌入 极限学习机 测地距离 降维 基于测地距离与极限学习机的监督型LLE算法研究 局部线性嵌入算法(LLE)是一种有效的非线性降维方法,但是该算法没有考虑样本的类别标签,并且欧式距离无法精确表示非线性数据的流形结构。针对以上LLE 方法的缺陷,本文提出一种结合测地距离与样本类别信息的监督型LLE 算法... 金伟 何灵敏 杨小兵 王康健关键词:局部线性嵌入 极限学习机 测地距离 降维 基于输出不一致测度的极限学习机集成的基因表达数据分类 被引量:41 2013年 选择性集成学习已经成为分析基因表达数据、获取生物学信息的有力工具.为了更好地挖掘基因表达数据,利用极限学习机的集成,克服单个ELM用于数据分类时性能欠稳定的缺点,文中提出了一种基于输出不一致测度的ELM相异性集成算法(D-D-ELM).算法首先以输出不一致测度为标准对多个ELM模型进行相异性判断,其次根据ELM的平均分类精度剔除掉相应的模型,最后对筛选后的分类模型用多数投票法进行集成.算法被运用到Breast、Leukemia、Colon、Heart基因表达数据上,并通过理论和实验得到验证.实验结果的统计学分析表明D-D-ELM能够以更少的模型数量达到较稳定的分类精度. 陆慧娟 安春霖 马小平 郑恩辉 杨小兵关键词:极限学习机 基因表达数据 超高层建筑风致响应中的数据挖掘 被引量:2 2005年 超高层建筑的风致响应问题已经越来越受到人们的重视。应用数据挖掘技术对广州中信广场大厦的实测数据进行了分析,并对该原型实测风致响应中的时间序列数据进行了相似性挖掘,发现了一些特征和规律,对该问题的进一步研究具有一定的参考价值。 杨小兵 孔繁胜 李正农关键词:超高层建筑 风致响应 数据挖掘 基于数学形态学的聚类分析 被引量:7 2006年 数学形态学广泛应用于图像识别之中,经典的聚类方法在聚类形状复杂时难于获得满意的结果。本文提出一种新的基于数学形态运算的聚类方法,通过合理选择离散化参数和结构元素,这种基于分级数学形态操作序列的聚类方法能较好地将各个簇分离开来,实验证明此方法比传统方法效果更好,并且能有效确定聚类数。 罗会兰 孔繁胜 杨小兵 刘必红关键词:数学形态学 聚类分析 一种基于FCM的图像分割方法 被引量:5 2011年 提出一种新的图像分割方法 FWFCM(fast walvet fuzzy C-means method),该方法对图像像素点的灰度进行模糊隶属度的分析,将需要聚类的像素空间投影到灰度直方图空间,从而减少了经典FCM算法的迭代计算量,提高了算法的收敛速度;并且利用小波变换的多分辨率的分析,抑制噪声点对图像分割的影响,提高了图像分割的精度. 彭立军 何灵敏 杨小兵关键词:模糊C均值 小波变换 灰度直方图 基于特征选择的过抽样算法的研究 被引量:1 2012年 为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法。该算法考虑了不同的特征列对分类性能的不同作用,首先对训练集进行特征选择,选出一组特征列,然后根据选出的特征列合成少数类样本,合成的每个少数类样本的特征由两部分组成,一部分是特征选择的特征列对应的特征,另一部分是按照SMOTE原理合成的特征。将基于特征选择的过抽样算法和SMOTE算法进行实验比较,结果表明基于特征选择的过抽样算法的性能优于SMOTE算法,能有效降低数据的不平衡性,提高少数类的分类精度。 陆慧娟 张金伟 马小平 杨小兵关键词:不平衡数据集 过抽样 遗传算法 一种多聚类中心的划分方法 2014年 提出了一种多聚类中心的算法(DMC),新算法将原划分算法中每类单个中心替代为多个中心,判断数据归属时以最近中心为目标进行划分,最后对多个中心调整得到聚类结果.实验证明,在不增加算法复杂度的前提下,DMC能够客服划分方法倾向识别大小相近、凸形分布的数据的缺陷,解决不同数据分布的问题,获得良好的聚类效果. 宁永恒 杨小兵 王康健关键词:时间复杂度