严太生
- 作品数:3 被引量:11H指数:2
- 供职机构:中国科学院国家天文台更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划中国科学院国家天文台青年人才基金更多>>
- 相关领域:天文地球自动化与计算机技术更多>>
- 聚类算法在天文学中的应用
- 随着大型光学望远镜的精度和深度不断提高,特别是巡天望远镜的发展,天文光学波段的数据急剧增加,成为探索各类天体和天文现象的物理本质的强有力武器。面对天文学“数据雪崩”和“信息爆炸”时代的到来,为了解决天文数据的复杂性、非线...
- 严太生
- 关键词:聚类算法天文学数据挖掘海量数据数据处理
- 文献传递
- 聚类算法在天文学中的应用被引量:4
- 2010年
- 聚类算法是数据挖掘中用来发现数据分布和隐含模式的一种重要算法,它把大量数据点的集合分成若于类,使得每个类中的数据最大程度地相似,而不同类中的数据最大程度地不同。尤其对于大样本,在多参量和类别未知的情况下,该方法更为简洁有效。为了更好地使用这些算法,对数据挖掘领域的聚类分析方法及代表算法进行了讨论,阐述了数据挖掘对聚类算法的典型要求,并基于这些要求对数据挖掘中常用的聚类算法作了概括,以便于人们更容易、更快速地选择一种适用于具体问题的聚类算法。综述了数据挖掘中聚类算法的分类和原理以及常用的聚类算法在天文学中的具体应用,分析了它们各自的性能,并指出了其今后的发展趋势。
- 严太生张彦霞赵永恒李冀
- 关键词:天文学聚类算法数据挖掘
- 基于自动聚类算法(AutoClass)的恒星/星系分类被引量:8
- 2009年
- 自动聚类算法(AutoClass)是一种非监督的能对复杂数据进行精确的自动聚类的有效分类方法,可以事先设定好类别数目让AutoClass自动寻找,在寻找结束后,能够得到每一条数据分别属于每一类别的几率,这样可以根据专业知识,选出比较好的分类效果.描述了使用AutoClass对SDSS DR6的恒星/星系测光数据进行分类,将868974条测光数据进行处理,通过去离群数据和自动聚类的方法,将最终的812613条数据分成两类,其中星系和恒星的数据分别是680361和126988条.对于去掉离群后的数据,星系和恒星的分类正确率分别达到99.51%和98.52%,表明AutoClass算法对去掉离群数据后的恒星/星系数据分类有很好的效率.因此,可以将该算法应用于天文中的其他分类问题,另外基于该算法的非监督性,可以帮助天文学家去掉离群数据或发现一些特殊天体.
- 严太生张彦霞赵永恒李冀
- 关键词:恒星星系数据分析