徐风
- 作品数:14 被引量:97H指数:6
- 供职机构:安徽大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金安徽省自然科学基金安徽省高校省级自然科学研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 量化容差关系的不完备多粒度粗糙集模型被引量:3
- 2017年
- 在不完备信息系统中,针对量化容差关系和多粒度粗糙集模型的各自优点,提出一种基于量化容差关系的多粒度粗糙集模型。首先定义了基于量化容差关系的乐观和悲观多粒度粗糙集模型,并且研究了相关的性质;然后在对象分类方面,定义了分类阈值的概念,并且在不同粒度下选取不同的分类阈值,多个分类阈值可以使得提出的模型具有更好的灵活性。UCI数据集的实验结果表明,与单个分类阈值相比,多个分类阈值的多粒度粗糙集模型具有更好的近似效果,在各数据集中,其近似精度均有0.05至0.1的提高。
- 林梦雅姚晟陈菊汪杰徐风
- 关键词:不完备信息系统多粒度粗糙集
- 基于粗糙集理论的幸福指数评价方法及系统
- 本发明公开了一种基于粗糙集理论的幸福指数评价方法,通过建立两级评价指标体系以及评价标准;收集不同人群的评价值,提取条件属性,对数据进行离散化处理构建基于粗糙集理论的幸福指数评价决策体系;确定两级评价体系的权重并获得幸福指...
- 姚晟汪杰徐风
- 文献传递
- 不一致邻域粗糙集的不确定性度量和属性约简被引量:7
- 2018年
- 不确定性度量和属性约简是邻域粗糙集模型中重要的研究内容.针对目前已有的粗糙集不确定性度量方法难以应用于邻域粗糙集中,同时考虑到现有属性约简算法中很少考虑条件属性之间的关系也会影响约简结果和分类精度.首先分析了不一致邻域粗糙集的相关性质,然后提出了邻域条件熵的不确定性度量方法用来评价约简属性的质量,分析证明了相关的性质定理,接着引入统计学中秩相关系数的概念,通过计算条件属性之间的相关系数来剔除冗余属性,构造了基于相关系数的不一致邻域粗糙集属性约简算法(RNRS).最后在UCI数据集上与现有算法进行了比较分析,实验结果表明,本文的算法可以获取较少的属性特征和较高的分类精度.
- 姚晟汪杰汪杰徐风
- 关键词:粗糙集属性约简相关系数
- 基于改进邻域粒的模糊熵特征选择算法被引量:6
- 2017年
- 特征选择是一项重要的数据预处理技术,其目的是在不降低数据分类精度情形下选择一个特征子集,从而对原数据集达到降维的效果,同时也提高学习算法的性能.在邻域粗糙集模型中,传统方法构造出的对象邻域粒未考虑数据的分布问题,使得邻域粒存在一定的误差.首先通过方差来刻画数据的分布,然后根据数据分布提出一种改进的邻域粒,这种改进的邻域粒能够自适应数据的分布,有着较好的优越性,最后将改进邻域粒与邻域模糊熵结合,提出一种特征重要度的评估方式,并给出对应的特征选择算法.实验结果表明,新提出的特征选择算法在特征选择结果、时间消耗和特征子集的分类精度方面都更具一定的优越性.
- 姚晟徐风赵鹏刘政怡陈菊
- 关键词:粗糙集模糊熵
- 基于邻域粗糙互信息熵的非单调性属性约简被引量:25
- 2019年
- 属性约简是粗糙集理论一项重要的应用,目前已广泛运用于机器学习和数据挖掘等领域,邻域粗糙集是粗糙集理论中处理连续型数据的一种重要方法.针对目前邻域粗糙集模型中属性约简存在的缺陷,构造一种基于邻域粗糙集的邻域粗糙熵模型,并基于此给出邻域粗糙联合熵、邻域粗糙条件熵和邻域粗糙互信息熵等概念.邻域粗糙互信息熵是评估属性集相关性的一种重要的方法,具有非单调性变化的特性,对此,提出一种基于邻域粗糙互信息熵的非单调性属性约简算法.实验分析表明,所提出算法不仅比目前已有的单调性属性约简算法具有更优越的属性约简结果,而且具有更高的约简效率.
- 姚晟徐风吴照玉陈菊汪杰汪杰
- 关键词:邻域粗糙集属性约简
- 基于邻域量化容差关系粗糙集模型的特征选择算法被引量:27
- 2017年
- 数值型不完备信息系统的特征选择方法大多是以容差关系为基础,但是这种处理方式存在数据相似性刻画过于宽松的缺陷.文中提出邻域量化容差关系的粗糙集模型,在该模型的基础上定义邻域量化容差条件熵,分析相关性质,根据邻域量化容差条件熵的单调性构造相应的特征选择算法.实验表明,文中算法在特征选择结果、运行时间和分类精度方面具有优越性.
- 姚晟徐风赵鹏汪杰陈菊
- 关键词:不完备信息系统条件熵
- 基于模糊邻域粗糙集的信息系统不确定性度量方法被引量:10
- 2017年
- 邻域粗糙集和模糊粗糙集是粗糙集理论中处理数值型数据的两种重要模型.在数值型信息系统中融合两者在不确定性度量方面的优越性,首先引入了模糊邻域粗糙集模型,并在该模型上定义了模糊邻域粗糙度的概念.模糊邻域粗糙度是通过粗糙集的边界域来度量信息系统的不确定性,为了达到更为全面的度量效果,在模糊邻域粗糙集模型中定义了模糊邻域粒结构,并基于该粒结构提出了模糊邻域粒度的概念,模糊邻域粒度是对信息系统分类能力的一种度量.最后,通过将两种度量方法进行结合,提出了一种基于模糊邻域粗糙集的混合不确定性度量方法,并从理论上证明其有效性.实验结果表明,所提出的混合度量方法综合了两种单独度量方法的优点,在数值型信息系统中具有更好的度量效果,因此所提出的不确定性度量方法更具有一定的优越性.
- 徐风姚晟纪霞赵鹏汪杰
- 邻域粗糙集模型的规则提取方法研究被引量:4
- 2018年
- 邻域粗糙集是粗糙集理论中一种处理数值型数据的重要模型,而规则提取是数据挖掘中最重要和最关键的环节,由于数值型数据取值连续,目前在邻域粗糙集模型中的规则提取并没有系统化的方法,本文针对这一问题提出一种特殊的决策规则模型,首先通过对象集的形式来定义决策规则的前件,然后通过求取下近似的方法在邻域粗糙集模型中进行决策规则诱导,最后,通过距离度量来给出决策判别的方法.UCI实验结果表明本文提出的模型具有一定的可行性和合理性.
- 姚晟徐风赵鹏汪杰陈菊
- 关键词:邻域粗糙集
- 不完备邻域粗糙集的不确定性度量和属性约简被引量:16
- 2018年
- 针对现有的属性约简算法不适合处理数值型属性和符号型属性共同存在的不完备数据,提出了一种拓展不完备邻域粗糙集模型。首先,通过考虑属性值的概率分布来定义缺失属性值之间的距离,可以度量具有混合属性的不完备数据;其次,定义了邻域混合熵来评价属性约简的质量,分析证明了相关的性质定理,并构造了一种基于邻域混合熵的不完备邻域粗糙集属性约简算法;最后从UCI数据集中选取了7组数据进行实验,并分别与基于依赖度的属性约简(ARD)、基于邻域条件熵的属性约简(ARCE)、基于邻域组合测度的属性约简(ARNCM)算法进行了比较。理论分析和实验结果表明,所提算法约简属性比ARD、ARCE、ARNCM分别减少了约1,7,0个,所提算法的分类精度比ARD、ARCE、ARNCM分别提高了约2.5,2.1,0.8个百分点。所提算法不仅能够获得较少的约简属性,同时具有较高的分类精度。
- 姚晟汪杰徐风陈菊
- 关键词:粗糙集属性约简
- 基于改进邻域粒的模糊熵特征选择算法
- 特征选择是一项重要的数据预处理技术,其目的是在不降低数据分类精度情形下选择一个特征子集,从而对原数据集达到降维的效果,同时也提高学习算法的性能.在邻域粗糙集模型中,传统方法构造出的对象邻域粒未考虑数据的分布问题,使得邻域...
- 姚晟徐风赵鹏刘政怡陈菊
- 关键词:数据处理模糊熵