杨荣丽
- 作品数:2 被引量:16H指数:2
- 供职机构:南京农业大学信息科学技术学院更多>>
- 发文基金:中央高校基本科研业务费专项资金国家科技支撑计划江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术生物学更多>>
- 集成改进KNN算法预测蛋白质亚细胞定位被引量:3
- 2017年
- 基于Adaboost算法对多个相似性比对K最近邻(K-nearest neighbor,KNN)分类器集成实现蛋白质的亚细胞定位预测。相似性比对KNN算法分别以氨基酸组成、二肽、伪氨基酸组成为蛋白序列特征,在KNN的决策阶段使用Blast比对决定蛋白质的亚细胞定位。在Jackknife检验下,Adaboost集成分类算法提取3种蛋白序列特征,3种特征在数据集CH317和Gram1253的最高预测成功率分别为92.4%和93.1%。结果表明Adaboost集成改进KNN分类预测方法是一种有效的蛋白质亚细胞定位预测方法。
- 薛卫王雄飞赵南杨荣丽洪晓宇
- 关键词:NEIGHBORALIGNMENTADABOOST
- 空间密度相似性度量K-means算法被引量:13
- 2018年
- 传统K-means算法的缺陷有初始聚类中心选择的不稳定、聚类效果对初始聚类中心过于依赖、非簇型数据集分类效果不佳等问题.为克服以上不足,本文提出空间密度相似性度量K-means算法.该算法采用可伸缩空间密度的相似性距离度量数据点间的相似度,并将密度和距离共同作为选择新初始聚类中心的相关因子,以及根据类内距离进行迭代的一种新的类中心迭代模型.在非簇型人工数据集和UCI标准数据集上的实验证明,与传统及其他改进K-means算法相比,本文提出的算法可得到更加合理的初始聚类中心,能反映任意形状的复杂数据集分布规律,算法更加稳定、准确.
- 薛卫杨荣丽赵南徐焕良任守纲
- 关键词:K-MEANS初始聚类中心