您的位置: 专家智库 > >

河北省高等学校科学技术研究指导项目(ZD20131028)

作品数:12 被引量:47H指数:5
相关作者:翟俊海王熙照张素芳张明阳王婷婷更多>>
相关机构:河北大学中国气象局河北省机器学习与计算智能重点实验室更多>>
发文基金:河北省高等学校科学技术研究指导项目国家自然科学基金河北省自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 12篇中文期刊文章

领域

  • 12篇自动化与计算...

主题

  • 3篇学习机
  • 3篇人脸
  • 3篇人脸识别
  • 3篇小波
  • 3篇K-近邻
  • 2篇信息熵
  • 2篇遗传算法
  • 2篇预处理
  • 2篇人脸识别方法
  • 2篇神经网
  • 2篇神经网络
  • 2篇识别方法
  • 2篇数据预处理
  • 2篇网络
  • 2篇小波变换
  • 2篇模糊积分
  • 2篇进化特征
  • 2篇积分
  • 2篇极限学习机
  • 2篇概率神经网络

机构

  • 12篇河北大学
  • 5篇中国气象局
  • 2篇河北省机器学...

作者

  • 12篇翟俊海
  • 4篇王熙照
  • 4篇张素芳
  • 2篇王婷婷
  • 2篇刘博
  • 2篇李塔
  • 2篇赵文秀
  • 2篇张明阳
  • 1篇万丽艳
  • 1篇苗青
  • 1篇张垚
  • 1篇刘明明
  • 1篇郝璞

传媒

  • 5篇计算机科学
  • 2篇河北大学学报...
  • 2篇模式识别与人...
  • 2篇小型微型计算...
  • 1篇山东大学学报...

年份

  • 3篇2017
  • 3篇2016
  • 2篇2015
  • 3篇2014
  • 1篇2013
12 条 记 录,以下是 1-10
排序方式:
基于相对分类信息熵的进化特征选择算法被引量:7
2016年
针对离散值数据集特征选择问题,提出基于相对分类信息熵的进化特征选择算法.使用遗传算法搜索最优特征子集,使用相对分类信息熵度量特征子集的重要性.以相对分类信息熵作为适应度函数,使用二进制编码问题的解,使用赌轮方法选择产生下一代个体.实验表明文中算法在测试精度上优于其它方法,此外还从理论上证明文中算法的可行性.
翟俊海刘博张素芳
关键词:数据预处理进化计算遗传算法信息熵
2种加速K-近邻方法的实验比较被引量:3
2016年
K-近邻(K-NN:K-nearest neighbors)是著名的数据挖掘算法,应用非常广泛.K-NN思想简单,易于实现,其计算时间复杂度和空间复杂度都是O(n),n为训练集中包含的样例数.当训练集比较大时,特别是面对大数据集时,K-NN算法的效率会变得非常低,甚至不可行.本文用实验的方法比较了2种加速K-NN的方法,2种加速方法分别是压缩近邻(CNN:condensed nearest neighbor)方法和基于MapReduce的K-NN.具体地,在Hadoop环境下,用MapReduce编程实现了K-NN算法,并与CNN算法在8个数据集上进行了实验比较,得出了一些有价值的结论,对从事相关研究的人员具有一定的借鉴作用.
翟俊海王婷婷张明阳王耀达刘明明
关键词:K-近邻数据挖掘MAPREDUCEHADOOP
不一致性进化特征选择方法被引量:1
2017年
特征选择是机器学习中重要的数据预处理步骤,它从原始特征集合中,选择一个重要的子集,以改进学习系统的性能或降低学习系统的计算复杂度,对学习系统的性能有重要的影响.针对离散值特征选择问题,提出一种基于遗传算法的特征选择方法.该方法利用遗传算法搜索最优或次优特征子集.具体地,利用二进制数对问题的解编码,利用不一致性度量作为适应度函数.实验结果显示本文提出的特征选择方法是行之有效的.提出的方法具有如下三个特点:1)简单且易于实现;2)测试精度较高;3)可解释性强.
翟俊海刘博张素芳
关键词:数据预处理遗传算法
随机权分布对极限学习机性能影响的实验研究被引量:6
2016年
极限学习机是一种训练单隐含层前馈神经网络的算法,它随机初始化输入层的权值和隐含层结点的偏置,用分析的方法确定输出层的权值。极限学习机具有学习速度快、泛化能力强的特点。很多研究都用服从[-1,1]区间均匀分布的随机数初始化输入层权值和隐含层结点的偏置,但没有对这种随机初始化合理性的研究。用实验的方法对这一问题进行了研究,分别研究了随机权服从均匀分布、高斯分布和指数分布对极限学习机性能的影响。研究发现随机权的分布对极限学习机的性能的确有影响,对于不同的问题或不同的数据集,服从[-1,1]区间均匀分布的随机权不一定是最优的选择。研究结论对从事极限学习机研究的人员具有一定的借鉴作用。
翟俊海臧立光张素芳
关键词:极限学习机均匀分布高斯分布
相容粗糙模糊集模型被引量:5
2014年
在粗糙模糊集模型中,被逼近的目标概念是一个模糊集,使用的知识是等价关系,即描述对象的属性是离散值的。但在很多实际应用中,描述对象的属性是实数值的。针对这一问题,将粗糙模糊集模型中的等价关系推广为相容关系,提出了相容粗糙模糊集模型。当相容关系退化为等价关系时,相容粗糙模糊集模型即为粗糙模糊集模型。相容粗糙模糊集模型扩展了粗糙模糊集的应用范围。
翟俊海张垚王熙照
关键词:粗糙集模糊集粗糙模糊集相容粗糙集
在线序列主动学习方法被引量:1
2017年
现实世界中存在着大量无类标的数据,如各种医疗图像数据、网页数据等。在大数据时代,这种情况更加突出。标注这些无类标的数据需要付出巨大的代价。主动学习是解决这一问题的有效手段,也是近几年机器学习和数据挖掘领域中的一个研究热点。提出了一种基于在线序列极限学习机的主动学习算法,该算法利用在线序列极限学习机增量学习的特点,可显著提高学习系统的效率。另外,该算法用样例熵作为启发式度量无类标样例的重要性,用K-近邻分类器作为Oracle标注选出的无类标样例的类别。实验结果显示,提出的算法具有学习速度快、标注准确的特点。
翟俊海臧立光张素芳
关键词:极限学习机K-近邻
软组合概率神经网络分类器人脸识别方法被引量:4
2015年
概率神经网络分类器具有学习速度快、易于实现的特点,而且其输出是后验概率,使得分类器的软组合变得容易。利用概率神经网络的这些特点,提出了软组合概率神经网络分类器人脸识别方法,该方法包括3步:(1)对人脸图像做不完全小波包分解;(2)用包含低频成分的小波子空间图像训练概率神经网络分类器;(3)用模糊积分组合训练好的分类器。将该方法与3种基于矩阵子空间的人脸识别方法在JAFFE、YALE、ORL和FERET 4个人脸数据库上进行了实验比较,结果表明,提出的方法在识别精度和CPU时间两方面均优于其他3种方法。
翟俊海赵文秀
关键词:概率神经网络人脸识别模糊积分小波变换子空间
最小相关性最大依赖度属性约简被引量:11
2014年
在经典粗糙集中,基于重要度的决策表属性约简算法只考虑了决策属性与条件属性之间的依赖度,没有考虑约简中条件属性之间的相关性,由此求出的约简中可能依然包含冗余属性。针对这一问题,提出了一种改进算法,它利用最小相关性和最大依赖度准则求决策表属性约简。与基于重要度的决策表属性约简算法相比,本算法求出的约简包含的属性个数少、冗余小。实验结果显示,本算法优于基于重要度的决策表属性约简算法。
翟俊海万丽艳王熙照
关键词:粗糙集决策表属性约简
概率神经网络样例选择算法被引量:2
2015年
提出一种概率神经网络样例选择算法,它包括两个阶段,第一个阶段利用概率神经网络计算样例的不确定性,第二个阶段利用计算出的不确定性选择样例.与压缩近邻规则、编辑近邻规则、约简近邻规则和迭代过滤算法四种代表性的样例选择算法进行了实验比较,实验结果显示在能力保持框架下,该算法的性能优于这四种方法.本文提出的算法具有下列特点:(1)学习速度快;(2)没有分类器的限制;(3)具有好的泛化能力.
翟俊海苗青李塔王熙照
关键词:概率神经网络信息熵
基于哈希技术和MapReduce的大数据集K-近邻算法被引量:7
2017年
K-近邻是一种著名的分类算法。由于简单且易于实现,因此其被广泛应用于许多领域,如人脸识别、基因分类、决策支持等。然而,在大数据环境中,K-近邻算法变得非常低效,甚至不可行。针对这一问题,提出了一种基于哈希技术和MapReduce的大数据集K-近邻分类算法。为了验证算法的有效性,在4个大数据集上进行了实验,结果显示,在保持分类能力的前提下,所提算法可以大幅度地提高K-近邻算法的效率。
翟俊海张明阳王婷婷郝璞
关键词:K-近邻哈希技术大数据集
共2页<12>
聚类工具0