基于集成学习的M亚矮星搜索方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:fenghui111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
M亚矮星是一类低质量、低光度的贫金属性的恒星,被认为是银河系中的古老群体。M亚矮星的研究对于探索银河系的演化和组成至关重要。然而由于M亚矮星和M矮星有着相似的光谱形态,使得二者往往混淆在一起。近年来随着机器学习的发展,为M矮星和M亚矮星的分类提供了许多新的方法。本文重点采用基于决策树的集成学习算法构建了M矮星和M亚矮星的分类模型。集成学习不仅能产生最终的预测结果,还能有效评估区分二者的特征。另外实验结果表明本文在LAMOST数据集上构建的LightGBM模型可以有效区分M矮星光谱和M亚矮星光谱,算法准确率达到97.22%,并成功应用到了 SDSS数据集上。本文主要分为以下四个部分:(1)数据预处理数据预处理过程包括光谱数据的获取、插值、归一化和去除大气吸收线等操作,以及数据集的划分。(2)模型构建本实验中,利用LAMOSTDR4的光谱数据,分别构建了 SVM、随机森林、XGBoost、LightGBM训练模型,其中LightGBM分类效果最好,并且运行效率最高。本文的创新点之一就是将比较先进的集成学习算法LightGBM率先应用到M矮星和M亚矮星的分类问题当中,并且通过实验结果说明了这是一种行之有效的方法。(3)特征分析本文的第二个创新点就是对于M矮星和M亚矮星分类特征重要性的一个量化。通过对LightGBM模型评估的特征进行分析,本实验发现Ti05和CaH1、CaH2、CaH3对区分M矮星和M亚矮星十分重要,这和先前的研究相符。除此之外,本实验还发现对于重力比较敏感的吸收线(Na I和K I),和对于金属性比较敏感的原子线(Ca Ⅰ)同样对于二者的分类有着重要的影响。(4)搜索M亚矮星最后我们将构建的LightGBM模型应用于SDSS DR7的5306条M型光谱数据,并成功搜索到2538条M亚矮星光谱。本文的工作,对于从大型巡天项目中搜索M亚矮星提供了新的方法。
其他文献
该文以笔者的硕士毕业音乐会为主题,并从理论与实践相结合的层面进行阐述,围绕音乐会曲目选择、作品背景、舞台实践所展开。此次音乐会不仅是笔者在中国音乐学院学习数年的一次总结,同时也是在学术理论研究上的一次检测。本场音乐会分为上下半场,上半场为中国作品,包含了中国艺术歌曲、古曲、改编歌曲、创作歌曲,下半场为外国作品,包含了法国艺术歌曲、美国现代艺术歌曲、咏叹调、歌剧片段。笔者对音乐会中所有曲目进行分析与
随着传统化石能源的过度消耗以及能源消费导致的环境问题的产生,各国正在积极研究包括太阳能、风能、生物能等可再生能源在内的新能源技术,但新能源发电技术的间歇性、不确定性等特点给整个电力系统的优化和控制带来了困难和挑战。随着“互联网+”产业的兴起,由能源网络与互联网技术深入融合构成的新型“能源互联网”(Energy internet,EI)成为发展新能源的必然选择。现实的网络通信环境往往受到各种不确定因
股东是企业的所有者,重要股东尤其是控股股东的行为日益成为人们关注的重点。而股权质押作为上市公司股东融资的重要方式,在越来越受到股东青睐的同时,也成为了学者研究的热点。学者对控股股东股权质押的研究更多集中在经济后果层面,但在经济后果的研究当中关于控股股东股权质押对现金持有边际价值的影响尚是空白。当前中国A股市场上控股股东股权质押后,由于现金流权和控制权进一步分离,一方面控股股东为了避免因上市公司股价
湿天然气作为一种特殊的气液两相流,广泛存在于石油天然气领域。随着石油与天然气行业的发展和高储量天然气田的开发,人们对湿天然气的测量越来越重视。当湿天然气两相流流过孔板时,由于少量液相的存在导致压差值比等量的气相单独流过时增大,产生“虚高”现象。现存的流量预测虚高模型普遍存在两方面问题,一方面对孔板内湿天然气的流动特性依然没有充分理解;另一方面,这些虚高模型在实际生产高压工况下的适用性未得到验证。计
全球气候变化背景下河口海岸地区风、浪特征与趋势变化是一个具有重要应用背景的科学问题。气候变化是海洋与大气科学研究的重点之一,海表面风速以及包括有效波高等在内的各种海浪要素对气候变化都具有重要的影响与反映,其与发生在海气界面和海洋上混合层的能量交换存在密切的关系。已有的风、浪变化研究既有着眼于全球的分布变化,也有着眼于中国近海局地变化。长江口地处东海之滨,受季风和台风影响,波浪作用强烈。作为河口海岸
随着我国基础设施建设不断加强以及城镇化进程的加快,非道路移动机械用柴油机使用数量不断增加。相对于道路用柴油机而言,非道路移动机械用柴油机排放指标相对落后,由此带来的污染物排放影响巨大。因此针对非道路移动机械用柴油机的污染防治和减排工作亟待展开。本文针对一款R4105ZD非道路移动机械用柴油机燃烧系统进行了优化研究。原机采用电控单体泵燃油系统,台架测试结果表明:在不加装后处理系统时,排放结果可满足第
受人类活动影响,全球气候变化巨大,洪涝、干旱、海平面上升等问题严重威胁到人类未来的发展。许多气象灾害的发生都与水有着密切联系,而地下水作为陆地水资源的重要组成部分,其水量和水质的变化会对人们生产、生活产生显著影响,调查地下水储量可以提高人们对于区域地下水现状以及相关影响因素的认识,及时采取措施引导地下水的使用往可持续方向发展。常规的地下水储量数据获取方式具有成本高、局限多、不直观等缺点,重力恢复与
黄海是我国重要的高生产力陆架浅海,沿海经济发展迅速,受人类活动影响严重。近岸海域营养物质的研究不仅是海洋生物健康发展的基础,同时也为减轻水环境压力,制定生态管理与环境保护策略提供必要信息。近年来,频繁的人类活动致使海洋环境问题逐渐突出,富营养化频繁发生。随着人为添加N、P营养盐的富集,以及众多筑坝等水利设施建设,边缘海Si正逐渐成为生物限制性营养物质,以Si为必需营养盐的硅藻等浮游植物在种群竞争中
突扩结构在能源动力、化工、环保等领域有着广泛的应用,随着我国大部分陆上油田已进入开发中后期,注水开发使得地面集输系统和长距离管网中油水两相流普遍存在。由此,探究突扩管内两相流流动特性的问题对于合理选择油品输送方式、泵送效率等倍受重视,两相流流经突扩管以后的流动稳定性以及压降变化也十分关键。本文基于流体力学基本原理和流体运动基本控制方程,结合相关的油水两相流理论知识,运用CFD软件FLUENT对油-
振荡浮子式波能装置由于结构简单、制造维护成本低、效率较高等优点,是目前国内外波浪能研发的热点。本课题的浮体链轮波能装置隶属振荡浮子式波能装置,具有极端环境下生存能力强、波能采集成本低的优势,且具有单程波能采集特征。现有振荡浮子式波能装置水动力性能的计算方法,都是针对具有双程采集特征的波能装置,难以满足浮体链轮波能装置的特征要求。为此,本文针对具有单程波能采集特征的浮体链轮波能装置的水动力性能进行了