王添
- 作品数:2 被引量:6H指数:2
- 供职机构:昆明理工大学理学院更多>>
- 发文基金:云南省教育厅科学研究基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 海量数据下不完备信息系统的知识约简算法被引量:2
- 2015年
- 面向大规模的数据进行知识约简是近年来粗糙集理论研究的热点。传统不完备信息系统的知识约简是假设在初始时将所有需要处理的数据一次性地装入内存中,这明显不适合处理海量数据,更不适合处理含有缺失信息的海量数据。为此,深入剖析了带有缺失信息的数据特征,把缺失属性的值用该属性所有可能的取值表示,并结合知识约简算法中的可并行性,从属性(集)的可辨识性和不可辨识性出发,并在MapReduce框架下设计了可用来处理不完备信息系统的知识约简算法。实验结果表明,该算法是有效可行的,能够对不完备信息系统中的海量数据进行知识约简。
- 王添姜麟米允龙
- 关键词:海量数据云计算粗糙集不完备信息系统MAPREDUCE
- 大数据下不完备信息系统近似空间的并行算法被引量:4
- 2014年
- 上、下近似空间是粗糙理论的重要概念,解决上、下近似问题是海量数据挖掘的基础。经典的近似空间算法不适合处理海量数据,更不适合处理带缺失信息的海量数据问题。为此,通过深度分析带缺失信息的海量数据特征,结合MapReduce编程模型,提出了基于MapReduce框架下近似空间的并行算法,以处理带缺失信息的海量数据,实验结果表明了该并行算法的有效性。
- 姜麟米允龙王添
- 关键词:数据挖掘海量数据粗糙集不完备信息系统