天体光谱是天体发出的电磁辐射通过天文望远镜接收并经过光谱仪分光后呈现的不同波长(频率)的能量分布。天体的物质组成、发光原理和运动学等特性的不同会在其光谱上有所体现。随着光谱的数字化、计算机的广泛使用,世界上广泛采用计算机软件对光谱进行分类。使用最广泛的分类方法主要有模板匹配法、光谱映射法、线指数法和机器学习方法等。
光谱分类
通过研究光谱能量分布按照天体的不同性质进行分类的过程。
- 英文名称
- spectral classification
- 所属学科
- 天文学
模板匹配法是通过对类型未知的光谱和一组已知类型的光谱模板进行匹配,把此类型未知的光谱分类为最接近的模板的类型。在进行匹配时,可采用相关系数或者欧式距离等作为相似性度量的依据。使用的模板可以来自理论光谱,也可以来自实测光谱。模板匹配法的优势是通过模板来反映不同类型的差异,可以应对特征比较复杂的情况。在匹配时,可以在模板上卷积观测仪器轮廓以减少仪器导致的光谱与模板的差异,提高准确率。
光谱映射法是指通过一定映射关系,把光谱映射到特定空间的方法。一般情况下,此特定空间具有类型与坐标的对应关系。常用的方法如主成分分析(PCA)等,通过PCA对样本进行分解,利用前几个主成分系数能够近似重构光谱的特点,把光谱映射到低维空间进行分类。构建合理的映射函数是光谱降维再分类的重点。
线指数法是通过对光谱流量进行统计,根据统计值进行分类的方法。其中常用的统计特征包括:等值宽度(EW),半高全宽(FWHM)等。Lick指数、s-index等也经常作为分类的依据。根据不同需求,可以设计有针对性的指数来帮助光谱分类。比如为了M类型恒星分类,设计了η指数等。线指数的测量精度会受到光谱分辨率和信噪比的影响,从而影响分类准确率。
机器学习方法是让计算机通过训练学习光谱样本中的模式,从而得到分类的规律并建立模型,包括有监督学习和无监督学习方式。无监督学习是通过未知分类标签的光谱样本自身特征进行聚类,根据样本之间的某种相似性将样本划分为不同类别,常用方法有k均值、自组织映射等。有监督学习是通过用给定分类标签的光谱样本训练分类器,建立映射关系。常用算法有k近邻、神经网络、支持向量机、决策树等。随着深度学习的发展,深度神经网络也被应用于光谱分类,如一维卷积神经网络(CNN)等。