您的位置: 专家智库 > >

娄圣金

作品数:3 被引量:6H指数:1
供职机构:太原科技大学计算机科学与技术学院更多>>
发文基金:山西省自然科学基金国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文

领域

  • 3篇自动化与计算...

主题

  • 2篇数据挖掘
  • 2篇搜索
  • 2篇权值
  • 2篇相似性搜索
  • 2篇离群数据
  • 2篇离群数据挖掘
  • 2篇剪枝
  • 1篇等式
  • 1篇信息熵
  • 1篇三角不等式
  • 1篇特征线
  • 1篇天体
  • 1篇天体光谱
  • 1篇剪枝技术
  • 1篇不等式
  • 1篇W
  • 1篇P

机构

  • 3篇太原科技大学

作者

  • 3篇娄圣金
  • 2篇张继福
  • 1篇刘爱琴
  • 1篇杨海峰

传媒

  • 1篇小型微型计算...
  • 1篇光谱学与光谱...

年份

  • 1篇2014
  • 2篇2013
3 条 记 录,以下是 1-3
排序方式:
一种基于属性权值和w_k-距离的天体光谱异常特征线挖掘方法被引量:1
2013年
采用信息熵思想,给出一种基于属性权值和wk-距离的异常天体光谱特征线挖掘方法,并开发了天体光谱异常特征线挖掘系统。首先采用信息熵思想计算天体光谱特征线属性权值,从而有效地刻画每条特征线的重要程度;其次采用邻域半径的剪枝技术,对海量天体光谱特征线数据集约简,删除不可能成为异常的数据对象,形成一个候选异常数据集;然后根据离候选异常数据中对象之间的偏差,计算wk-距离和,并选取wk-距离和较大的前TOP-NN个数据对象作为天文光谱异常特征线数据;最后采用SDSS恒星光谱特征线数据集,实验和系统运行结果验证了该方法的有效性和可行性。
娄圣金张继福杨海峰
关键词:天体光谱剪枝
一种基于p权值的离群数据挖掘算法被引量:5
2014年
传统的基于距离的离群数据挖掘方法计算量大,挖掘效率和精度较低.本文利用大多数据集的聚类性特征,采用p权值和剪枝技术,给出一种基于距离的离群数据挖掘算法.该算法首先采用基于三角不等式的剪枝技术,寻找出离群候选集,仅候选集驻内存;然后对候选集中的每个数据点,分两种情况:若近邻达不到k值,赋予一个相对较大权值,若达到k值,运用p权值方法,计算该数据对象与其k最近邻的距离和,和越大,则离群的可能性越大;将离群候选集中的每个数据点按权值大小排序,并确定是否为离群数据,从而较好地克服了离群检测中的掩盖和淹没现象;最后采用UCI数据,实验验证了该算法的有效性.
娄圣金张继福刘爱琴
关键词:离群数据挖掘相似性搜索三角不等式
基于距离和的离群数据挖掘算法及应用
随着信息技术特别是网络技术飞速发展,人们收集、存储、传输数据能力不断提高,形成了一种数据丰富而知识匮乏的局面,数据挖掘技术正是在这一背景下诞生的一门新学科,而离群数据挖掘是数据挖掘领域中重要的研究内容之一。本文从海量数据...
娄圣金
关键词:离群数据挖掘剪枝技术相似性搜索信息熵
文献传递
共1页<1>
聚类工具0