江苏省自然科学基金(BK2009067) 作品数:33 被引量:374 H指数:8 相关作者: 王士同 邓赵红 钱鹏江 王骏 蒋亦樟 更多>> 相关机构: 江南大学 香港理工大学 浙江大学 更多>> 发文基金: 江苏省自然科学基金 国家自然科学基金 中央高校基本科研业务费专项资金 更多>> 相关领域: 自动化与计算机技术 文化科学 金属学及工艺 理学 更多>>
极大熵Relief特征加权 被引量:10 2011年 Relief特征加权的最新研究进展表明其可近似地表述为一个间距最大化优化问题.尽管该类算法广为应用,但仍然存在一些缺陷.为了提高Relief特征加权的适应性和鲁棒性,融合间距最大化和极大熵理论,并由此探讨了新的鲁棒的具有更好适应性的Relief特征加新方法.首先,构造了一个结合极大熵原理的间距最大化目标函数.对于该目标函数,运用优化理论得到一些重要的理论结果.在此基础上,对于两类数据、多类数据和在线数据,提出了一组鲁棒的Relief特征加权算法.利用UCI基准数据集和基因数据集进行了实验验证,结果表明提出的新Relief特征加权算法对噪音和例外点显示出了更好的适应性和鲁棒性. 张翔 邓赵红 王士同 蔡及时关键词:RELIEF算法 特征加权 极大熵 支撑向量数据域描述优化问题最优解理论分析 被引量:8 2011年 支撑向量数据域描述(support vector data description,简称SVDD)作为一种已经得到广泛应用的核方法,目前研究主要集中在其性能和效率的提高上,然而该算法优化问题最优解性质的理论性质却没有得到足够的关注.为此,首先把SVDD定义的原始优化问题等价转化为一个凸约束二次优化问题,然后从理论上证明了其构建的超球圆心具有唯一性,然而超球半径在一定条件下却存在不唯一性,并且给出了半径存在不唯一性的充分必要条件.还从对偶优化问题的角度分析了超球的圆心和半径性质,并且给出了SVDD算法中在根据优化问题最优解构建超球半径不唯一情况下计算超球半径的方法.完善了该算法的理论和方法体系,从而为其更深入的研究和应用奠定了理论基础. 王晓明 王士同关键词:核方法 凸优化 唯一性 一种面向演进数据流的结合相似准则和反例信息的分类方法 2013年 提出一种面向演进数据流数据的分类方法,在有效利用相邻演进窗内数据间相似性信息的基础上,通过引入反例信息,构建一种面向演进数据流的增强型演进分类器优化目标函数,从而推导出面向演进数据流的分类方法.该方法在保有最大间隔原则和全局优化特性的同时,充分考虑了反例信息对待解分类平面的影响.在模拟和真实数据集上进行实验,结果表明了所提出方法的有效性. 倪彤光 王士同 邓赵红 王骏关键词:支持向量机 反例 基于粗糙集特征约减的网络异常检测方法 2010年 讨论了基于粗糙集特征约简的SVM(支持向量机)异常检测方法,对源自KDD99的实验数据集分别采用SVM和特征约减后SVM进行仿真实验,依据实验结果的比较,说明在网络异常检测中基于特征约减后的SVM和直接采用SVM相比,在保持检测精度不显著降低的同时,前者能够有效的缩短训练时间. 赵爱军 谢林柏关键词:粗糙集 支持向量机 异常检测 基于方差权重矩阵模型的高维数据子空间聚类算法 被引量:3 2012年 在处理高维数据时,聚类的工作往往归结为对子空间的划分问题。大量的真实实验数据表明,相同的属性对于高维数据的每一类子空间而言并不是同等重要的,因此,在FCM算法的基础上引入了方差权重矩阵模型,创造出了新的聚类算法称之为WM-FCM。该算法通过不断地聚类迭代调整权重值,使得其重要的属性在各个子空间内更为显著地表征出来,从而达到更好的聚类效果。从基于模拟数据集以及UCI数据集的实验结果表明,该改进的算法是有效的。 蒋亦樟 王士同关键词:子空间聚类 模糊C-均值聚类 高维数据 基于移相加权球面单簇聚类的周期时间序列异常检测 被引量:2 2011年 针对传统的单分类器不适用于周期时间序列的异常检测,提出了一种基于移相加权球面单簇聚类的单分类器PS-WS1M-OCC.通过在聚类过程中增加高效的循环移位操作,解决了时间序列记录之间相似度计算的问题.另一方面,基于时间序列记录的权重分布,提出了新的阈值自适应确定方法,从而使单分类器对训练集包含的异常数据和参数设置不敏感.实验表明,本文提出的单分类器可以用于周期时间序列的异常检测;与传统的单分类器相比,可以成功地从包含异常数据的训练集中进行无监督学习,对训练集包含的异常数据鲁棒,并且对参数不敏感. 王骏 钟富礼 王士同 邓赵红基于最大中心间隔的缩放型η-极大熵聚类算法 被引量:7 2013年 为了调控数据之间的差异性,一般化的处理方式是对数据简单地进行按比例缩放,而此类做法本身对于数据的信息是不存在任何破坏的。但在进行聚类分析时,大部分算法对于按比缩放的数据都是很敏感的,其中较典型的算法有极大熵聚类(MEC)算法。大量的实验表明,当缩放尺度位于10-3数量级以下时,极大熵聚类算法已经失效,通过该算法得到的聚类中心趋于一致。为了解决上述问题,在MEC算法的基础上引入最大中心间隔项与缩放因子η,构造出了全新的目标函数,称为η型最大中心间隔极大熵聚类(η-MCS-MEC)算法。该算法通过调控中心点间的距离使之达到最大,并有效利用缩放因子η对各类划分进行调控,从而避免了聚类中心趋于一致。通过在模拟数据集以及UCI仿真数据集上的实验,结果均显示出算法对变化的数据不再敏感而具有鲁棒性。 陈爱国 蒋亦樟 钱鹏江半监督中心最大化模糊C均值算法 被引量:5 2012年 在模式识别领域内,对于数据的分析方法一般分为:有监督的学习方法及无监督的学习方法。而这两类方法均与实际应用不符,一般生产所获之数据既不可能毫无信息可知又不可能全部信息已知。此外,由于实际生产的干扰因素过多导致所获之数据样本信息通常包含一些干扰信息,这些数据对传统的分析方法影响较大,其中尤以聚类方法最为敏感。针对以上两大问题,以经典的无监督聚类算法FCM算法为基础,通过引入半监督性质的隶属度补偿项以及减弱干扰点影响的中心最大化项构造出了新的聚类算法称之为半监督中心最大化模糊C均值算法,简称SCM-FCM。通过在UCI数据集上的仿真实验结果表明该算法较之于传统的无监督聚类分析方法有着更好的应用价值。 姚紫阳关键词:抗干扰性 基于模糊规则自适应弹性图像配准的视频跟踪 2010年 把形变视频跟踪看作一个动态图像配准问题,基于已有的模糊规则自适应学习弹性图像配准方法,提出了一个具有较好鲁棒性的视频跟踪算法。较之于一些经典的跟踪算法,提出的新算法显示出了更鲁棒的跟踪效果。 邓赵红 王士同关键词:弹性图像配准 模糊推理规则 自适应学习 聚类分析研究中的若干问题 被引量:196 2012年 聚类分析是重要的数据挖掘方法,目的是寻找数据集中所包含的簇结构.以往研究工作中聚类分析的一些基本问题始终是人们关注的重点,为此在简要回顾具有代表性的研究成果的基础上,总结了该研究所面临的若干基本问题及解决方法,以期能够对相关研究提供有益的参考. 王骏 王士同 邓赵红关键词:聚类分析 聚类方法 无监督学习