李凯
- 作品数:6 被引量:8H指数:2
- 供职机构:福建师范大学数学与计算机科学学院计算机科学系更多>>
- 发文基金:福建省自然科学基金国家自然科学基金福建省农科院青年科技人才创新基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 健壮的流形学习算法及其应用研究
- 现实世界的数据往往具有较高维度.直接应用传统数据挖掘技术将面临“维灾”问题。因此,研究有效的降维算法,寻求在低维上进行数据分析,成为数据挖掘研究热点。但是,许多传统降维算法只针对线性分布数据,无法满足现实中大量非线性分布...
- 李凯
- 有监督的噪音流形学习算法
- 2011年
- 流形学习算法是维度约简与数据可视化领域的重要工具,提高算法的效率与健壮性对其实际应用有积极意义。经典的流形学习算法普遍的对噪音点较为敏感,现有的改进算法尚存在不足。本文提出一种基于监督学习与核函数的健壮流形学习算法,把核方法与监督学习引入降维过程,利用已知标签数据信息与核函数特性,使得同类样本变得紧密,不同类样本变成分散,提高后续分类任务的效果,降低算法对流形上噪音的敏感性。在UC I数据与白血病拉曼光谱数据上的实验表明本文改进的算法具有更高的抗噪性。
- 黄添强李凯郑之
- 关键词:流形学习核函数
- 基于少量标签的高维数据半监督聚类
- 半监督聚类算法常用于提高聚类效果.针对现实中高维标签数据较少的问题,提出利用聚类融合扩充高维标签数据集,在此基础上训练“测评”分类器,用于评估高维数据各维度的重要性权重,用半监督的方法实现降维并聚类,避免了“维度灾难”问...
- 李凯黄添强郭躬德余养强
- 关键词:半监督聚类分类器维度灾难
- 文献传递
- 基于调和平均测地线核的局部线性嵌入算法被引量:1
- 2010年
- 为解决现有局部线性嵌入算法不适合处理非均匀分布数据和未利用距离远点信息的问题,提出相应的改进算法。首先引入测地线距离,以便能利用远点信息;然后使用调和平均规范化构造调和平均测地线核矩阵,使算法能更好地处理分布不均匀数据并具有鲁棒性。在UCI数据集上的实验结果表明,改进后的算法能够取得比局部线性嵌入算法更好的降维效果。
- 曾文赋黄添强李凯余养强郭躬德
- 关键词:局部线性嵌入核方法测地线流形学习
- 非线性降维算法及其在医院绩效考核上的应用被引量:4
- 2010年
- 流形学习算法中的等距嵌入算法(ISOMAP)具有对离群点敏感的瑕疵,针对此问题,提出利用基于共享近邻的距离度量方式,并充分利用了流形上对象的局部密度信息,有效改善了算法的性能,提高了算法的健壮性。同时,首次尝试将该改进的流形学习算法应用于医院绩效考核。人工数据与真实数据上的实验表明,改进的算法健壮且有效,在绩效考核上应用成功。
- 李凯黄添强余养强郭躬德
- 关键词:非线性降维离群点绩效考核
- 基于局部相关维度的流形离群点检测算法被引量:3
- 2011年
- 传统的离群点检测算法不适合检测流形离群点,目前专门针对流形离群点检测的算法报道较少.为此,基于实验观察的启示,提出用流形局部相关维度检测流形离群点的算法.首先探讨内在维度的性质,并基于实验观察提出用流形局部相关维度来度量流形离群点,然后证明流形局部相关维度可表征数据样本离群的性质,最后基于此性质提出流形离群点检测算法.在人工数据与真实数据上的实验表明本算法可检测流形离群点,且本算法比最近报道的流形除噪算法具有更优的性能.
- 黄添强李凯郭躬德
- 关键词:数据挖掘离群点检测流形学习