江苏省自然科学基金(BK2009067) 作品数:33 被引量:373 H指数:8 相关作者: 王士同 邓赵红 钱鹏江 王骏 蒋亦樟 更多>> 相关机构: 江南大学 香港理工大学 浙江大学 更多>> 发文基金: 江苏省自然科学基金 国家自然科学基金 中央高校基本科研业务费专项资金 更多>> 相关领域: 自动化与计算机技术 文化科学 金属学及工艺 理学 更多>>
极大熵Relief特征加权 被引量:10 2011年 Relief特征加权的最新研究进展表明其可近似地表述为一个间距最大化优化问题.尽管该类算法广为应用,但仍然存在一些缺陷.为了提高Relief特征加权的适应性和鲁棒性,融合间距最大化和极大熵理论,并由此探讨了新的鲁棒的具有更好适应性的Relief特征加新方法.首先,构造了一个结合极大熵原理的间距最大化目标函数.对于该目标函数,运用优化理论得到一些重要的理论结果.在此基础上,对于两类数据、多类数据和在线数据,提出了一组鲁棒的Relief特征加权算法.利用UCI基准数据集和基因数据集进行了实验验证,结果表明提出的新Relief特征加权算法对噪音和例外点显示出了更好的适应性和鲁棒性. 张翔 邓赵红 王士同 蔡及时关键词:RELIEF算法 特征加权 极大熵 支撑向量数据域描述优化问题最优解理论分析 被引量:8 2011年 支撑向量数据域描述(support vector data description,简称SVDD)作为一种已经得到广泛应用的核方法,目前研究主要集中在其性能和效率的提高上,然而该算法优化问题最优解性质的理论性质却没有得到足够的关注.为此,首先把SVDD定义的原始优化问题等价转化为一个凸约束二次优化问题,然后从理论上证明了其构建的超球圆心具有唯一性,然而超球半径在一定条件下却存在不唯一性,并且给出了半径存在不唯一性的充分必要条件.还从对偶优化问题的角度分析了超球的圆心和半径性质,并且给出了SVDD算法中在根据优化问题最优解构建超球半径不唯一情况下计算超球半径的方法.完善了该算法的理论和方法体系,从而为其更深入的研究和应用奠定了理论基础. 王晓明 王士同关键词:核方法 凸优化 唯一性 一种面向演进数据流的结合相似准则和反例信息的分类方法 2013年 提出一种面向演进数据流数据的分类方法,在有效利用相邻演进窗内数据间相似性信息的基础上,通过引入反例信息,构建一种面向演进数据流的增强型演进分类器优化目标函数,从而推导出面向演进数据流的分类方法.该方法在保有最大间隔原则和全局优化特性的同时,充分考虑了反例信息对待解分类平面的影响.在模拟和真实数据集上进行实验,结果表明了所提出方法的有效性. 倪彤光 王士同 邓赵红 王骏关键词:支持向量机 反例 基于粗糙集特征约减的网络异常检测方法 2010年 讨论了基于粗糙集特征约简的SVM(支持向量机)异常检测方法,对源自KDD99的实验数据集分别采用SVM和特征约减后SVM进行仿真实验,依据实验结果的比较,说明在网络异常检测中基于特征约减后的SVM和直接采用SVM相比,在保持检测精度不显著降低的同时,前者能够有效的缩短训练时间. 赵爱军 谢林柏关键词:粗糙集 支持向量机 异常检测 基于方差权重矩阵模型的高维数据子空间聚类算法 被引量:3 2012年 在处理高维数据时,聚类的工作往往归结为对子空间的划分问题。大量的真实实验数据表明,相同的属性对于高维数据的每一类子空间而言并不是同等重要的,因此,在FCM算法的基础上引入了方差权重矩阵模型,创造出了新的聚类算法称之为WM-FCM。该算法通过不断地聚类迭代调整权重值,使得其重要的属性在各个子空间内更为显著地表征出来,从而达到更好的聚类效果。从基于模拟数据集以及UCI数据集的实验结果表明,该改进的算法是有效的。 蒋亦樟 王士同关键词:子空间聚类 模糊C-均值聚类 高维数据 基于移相加权球面单簇聚类的周期时间序列异常检测 被引量:2 2011年 针对传统的单分类器不适用于周期时间序列的异常检测,提出了一种基于移相加权球面单簇聚类的单分类器PS-WS1M-OCC.通过在聚类过程中增加高效的循环移位操作,解决了时间序列记录之间相似度计算的问题.另一方面,基于时间序列记录的权重分布,提出了新的阈值自适应确定方法,从而使单分类器对训练集包含的异常数据和参数设置不敏感.实验表明,本文提出的单分类器可以用于周期时间序列的异常检测;与传统的单分类器相比,可以成功地从包含异常数据的训练集中进行无监督学习,对训练集包含的异常数据鲁棒,并且对参数不敏感. 王骏 钟富礼 王士同 邓赵红基于最大中心间隔的缩放型η-极大熵聚类算法 被引量:7 2013年 为了调控数据之间的差异性,一般化的处理方式是对数据简单地进行按比例缩放,而此类做法本身对于数据的信息是不存在任何破坏的。但在进行聚类分析时,大部分算法对于按比缩放的数据都是很敏感的,其中较典型的算法有极大熵聚类(MEC)算法。大量的实验表明,当缩放尺度位于10-3数量级以下时,极大熵聚类算法已经失效,通过该算法得到的聚类中心趋于一致。为了解决上述问题,在MEC算法的基础上引入最大中心间隔项与缩放因子η,构造出了全新的目标函数,称为η型最大中心间隔极大熵聚类(η-MCS-MEC)算法。该算法通过调控中心点间的距离使之达到最大,并有效利用缩放因子η对各类划分进行调控,从而避免了聚类中心趋于一致。通过在模拟数据集以及UCI仿真数据集上的实验,结果均显示出算法对变化的数据不再敏感而具有鲁棒性。 陈爱国 蒋亦樟 钱鹏江半监督中心最大化模糊C均值算法 被引量:5 2012年 在模式识别领域内,对于数据的分析方法一般分为:有监督的学习方法及无监督的学习方法。而这两类方法均与实际应用不符,一般生产所获之数据既不可能毫无信息可知又不可能全部信息已知。此外,由于实际生产的干扰因素过多导致所获之数据样本信息通常包含一些干扰信息,这些数据对传统的分析方法影响较大,其中尤以聚类方法最为敏感。针对以上两大问题,以经典的无监督聚类算法FCM算法为基础,通过引入半监督性质的隶属度补偿项以及减弱干扰点影响的中心最大化项构造出了新的聚类算法称之为半监督中心最大化模糊C均值算法,简称SCM-FCM。通过在UCI数据集上的仿真实验结果表明该算法较之于传统的无监督聚类分析方法有着更好的应用价值。 姚紫阳关键词:抗干扰性 基于特征缺省的最小类内方差支持向量机 被引量:1 2010年 最近提出的基于特征缺失的支持向量机(support vector machine with absent features,AF-SVM)在处理具有特征缺失的数据分类时,得到的分类超平面不能很好地适应数据的总体分布,并存在两类误分的比例相差比较大的问题。为此,本文通过引入最小类内方差支持向量机(minimum class variance SVM,MCVSVM)分类机制,提出了基于特征缺失的最小类内方差支持向量机(minimum within-class variance SVM with absent features,AF-V-SVM)。AF-V-SVM一方面可以依据数据集的分布特性,改善分类超平面的方向性;另一方面,通过自由设置分类间隔的定义空间,调整误分的比例。实验表明,与其他基于特征缺省的分类方法相比,该方法不仅提高了分类正确率而且使分类效果更加合理。 宋玉丹 王士同关键词:支持向量机 基于Matlab仿真的模式分类实验研究 被引量:1 2013年 模式识别逐步成为高校本科生和研究生的主干课程,模式分类实验越来越受到重视。以目前广泛的模式分类方法———支持向量机为例,通过Matlab仿真,对模式分类实验方法进行探讨与研究。该实验有助于学生进一步理解模式分类的工作原理,为后续相关内容的学习奠定坚实的基础。人工数据集和标准数据集上的实验表明,支持向量机能较好地完成分类任务。 刘忠宝 赵文娟关键词:MATLAB仿真 支持向量机