10.3964/j.issn.1000-0593(2016)08-2651-04
一种基于 Map/Reduce 分布式计算的恒星光谱分类方法
天体光谱中蕴含着非常丰富的天体物理信息,通过对光谱的分析,可以得到天体的物理信息、化学成分以及天体的大气参数等。随着 LAMOST 和 SDSS 等大规模巡天望远镜的实施,将会产生海量的光谱数据,尤其是 LAMOST 正式运行后,每个观测夜产生大约2~4万条光谱数据。如此海量的光谱数据对光谱的快速有效的处理提出了更高的要求。恒星光谱的自动分类是光谱处理的一项基本内容,该研究主要工作就是研究海量恒星光谱的自动分类技术。Lick 线指数是在天体光谱上定义的一组用以描述光谱中谱线强度的标准指数,代表光谱的物理特性,以每个线指数最突出的吸收线命名,是一个相对较宽的光谱特征。研究了基于 Lick 线指数的贝叶斯光谱分类方法,对 F,G,K 三类恒星进行分类。首先,计算各类光谱的 Lick 线指数作为特征向量,然后利用贝叶斯分类算法对三类恒星进行分类。针对海量光谱的情况,基于 Hadoop 平台实现了 Lick 线指数的计算,以及利用贝叶斯决策进行光谱分类的方法。利用 Hadoop HDFS 高吞吐率和高容错性的特点,结合 Hadoop MapReduce 编程模型的并行优势,提高了对大规模光谱数据的分析和处理效率。该研究的创新点为:(1)以 Lick 线指数作为特征,基于贝叶斯算法实现恒星光谱分类;(2)基于 Hadoop MapReduce 分布式计算框架实现 Lick 线指数的并行计算以及贝叶斯分类过程的并行化。
Lick 线指数、恒星光谱分类、Hadoop
36
P145.4(天体物理学)
国家自然科学基金项目U1431102,11473019
2016-09-28(万方平台首次上网日期,不代表论文的发表时间)
共4页
2651-2654