刘景华
- 作品数:8 被引量:52H指数:4
- 供职机构:闽南师范大学计算机学院更多>>
- 发文基金:国家自然科学基金福建省自然科学基金福建省教育厅科技项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于加权正域的特征选择算法被引量:1
- 2015年
- 基于邻域粗糙集的特征选择算法无法评价特征与样本之间的相互关系,为此,通过融合基于大间隔获得样本对特征的评价准则,提出了基于加权正域的特征选择算法。该算法有效地实现了特征对样本的区分能力与样本对特征的贡献程度的综合利用。在UCI数据集和5个高维小样本数据集上的实验结果表明,相比传统的单准则评价的特征选择方法,该方法不仅能有效地提高特征选择的分类性能,而且更加有利于处理高维小样本数据集。
- 王晨曦林耀进刘景华林梦雷
- 关键词:正域邻域粗糙集
- 基于信息粒化的特征选择算法研究
- 特征选择作为数据预处理的关键手段,是数据挖掘、模式识别和机器学习等领域的重要研究课题之一。它是指在原始数据中删除大量无关和冗余的特征,找到一组包含原始特征空间的全部或大部分分类信息的特征子集的过程。对于高维数据,借鉴表征...
- 刘景华
- 关键词:信息粒化邻域粗糙集数据处理
- 文献传递
- 一种启发式的局部随机特征选择算法被引量:5
- 2016年
- 深入研究大间隔从样本间相似性、信息熵从特征间相关性进行特征选择的特点,提出一种有效地融合这两类方法的特征选择算法。采用Relief算法得到一个有效的特征排序,进而将其划分为若干区段。设置各区段的采样率,以对称不确定性作为启发因子获得每个局部随机子空间的特征子集。将获得的所有特征子集作为最终的特征选择结果。实验结果表明该方法优于一些常用的特征选择算法。
- 刘景华林梦雷张佳林耀进
- 基于最近邻互信息的特征选择算法被引量:8
- 2016年
- 针对邻域信息系统的特征选择模型存在人为设定邻域参数值的问题。分别计算样本与最近同类样本和最近异类样本的距离,用于定义样本的最近邻以确定信息粒子的大小。将最近邻的概念扩展到信息理论,提出最近邻互信息。在此基础上,采用前向贪心搜索策略构造了基于最近邻互信息的特征算法。在两个不同基分类器和八个UCI数据集上进行实验。实验结果表明:相比当前多种流行算法,该模型能够以较少的特征获得较高的分类性能。
- 王晨曦林耀进刘景华林梦雷
- 关键词:最近邻互信息
- 基于局部子空间的多标记特征选择算法被引量:28
- 2016年
- 在已有的特征选择算法中,常用策略是通过相关准则选择与标记集合相关性较强的特征,然而该策略不一定是最优选择,因为与标记集合相关性较弱的特征可能是决定某些类别标记的关键特征.基于这一假设,文中提出基于局部子空间的多标记特征选择算法.该算法首先利用特征与标记集合之间的互信息得到一个重要度由高到低的特征序列,然后将新的特征排序空间划分为几个局部子空间,并在每个子空间设置采样比例以选择冗余性较小的特征,最后融合各子空间的特征子集,得到一组合理的特征子集.在6个数据集和4个评价指标上的实验表明,文中算法优于一些通用的多标记特征选择算法.
- 刘景华林梦雷王晨曦林耀进
- 关键词:互信息
- 基于最大近邻粗糙逼近的特征选择算法被引量:3
- 2015年
- 基于邻域粗糙集的特征选择模型受到邻域参数值的制约.为此,引入最大近邻确定样本的邻域,构造了基于最大近邻粗糙集模型.在此基础上,提出了基于最大近邻粗糙逼近的特征选择方法.首先计算样本到与它最近同类和最近异类样本的距离来确定近邻类的大小,其次分析最大近邻类的性质提出快速求解样本正域的方法,最后采用前向贪心搜索策略构造特征选择算法.该算法不仅避免了邻域参数值的不确定选择,而且降低了对样本正域的判断次数.在3个不同分类器和8个UCI数据集上的实验结果表明:该模型不仅能够选择较少的特征,而且有效地提高了分类性能.
- 刘景华林梦雷王晨曦林耀进
- 关键词:邻域粗糙集
- 基于目标用户近邻修正的协同过滤算法被引量:8
- 2015年
- 在基于用户的协同过滤算法中,用户评分倾向性和评分矩阵的稀疏性致使难以准确可靠地搜寻目标用户的近邻.基于此,文中提出基于目标用户近邻修正的协同过滤算法.首先定义积极评分和消极评分两类用户群体,选择从目标用户评分倾向性一致的用户群体中寻找其近邻.然后对与目标用户共同评分项数量少而相似度可能高的近邻进行修正,为目标用户寻找更准确的近邻集合.实验表明,文中算法在一定程度上能有效提高推荐质量.
- 张佳林耀进林梦雷刘景华
- 关键词:协同过滤用户群体稀疏性
- 融合特征排序的多标记特征选择算法被引量:3
- 2016年
- 在多标记学习框架中,特征选择是解决维数灾难,提高多标记分类器的有效手段。提出了一种融合特征排序的多标记特征选择算法。该算法首先在各标记下进行自适应的粒化样本,以此来构造特征与类别标记之间的邻域互信息。其次,对得到邻域互信息进行排序,使得每个类别标记下均能得到一组特征排序。最后,多个独立的特征排序经过聚类融合成一组新的特征排序。在4个多标记数据集和4个评价指标上的实验结果表明,所提算法优于一些当前流行的多标记降维方法。
- 王晨曦林梦雷刘景华王娟林耀进
- 关键词:聚类融合互信息