去年 12 月,谷歌的神经网络技术通过分析 NASA 开普勒望远镜的数据,从已知的行星系统中发现了两颗系外行星。

而近日,谷歌开源了“猎星代码”,任何人只要下载代码和数据,就能在自己的计算机上运行,像天文爱好者一样发现新的行星!(附下载地址:https://github.com/tensorflow/models/tree/master/research/astronet)

谷歌 AI 神助攻!开源“猎星代码”普通人坐电脑前就能发现新行星-黑科技

我们先来回顾下整个事件:

去年 12 月,NASA 宣布了一个重大新闻:即通过分析开普勒太空望远镜的观测数据发现,在距离地球 2545 光年的开普勒-90 星系中,又发现了第八颗行星!命名为——开普勒-90i。

最重要的是,这颗名为开普勒-90i 的行星是天文研究第一次使用了人工智能技术发现的。

谷歌 AI 神助攻!开源“猎星代码”普通人坐电脑前就能发现新行星-黑科技

NASA 的科学家通过使用 Google 机器学习技术来对开普勒数据进行分析,效率和准确性上也远远超过传统的分析方法。

这架望远镜于 2009 年 3 月 6 日在美国佛罗里达州被发射升空,它直径约 2.7 米,长约 4.7 米,是世界上首个用于探测太阳系外类地行星的飞行器。

在“服役”的这些年里,开普勒在太阳系发现的候选行星已经将近 5000 颗,其中 2500 多颗已经被确定为真正的行星。这些星球中,大约 50 颗被认为是类似地球大小的宜居行星,其中超过 30 颗已获得确认。

由于开普勒太空望远镜收集了大量的数据,观察了大约 20 万颗恒星,每 30 分钟拍摄一张照片,创造了约 140 亿个数据点。这 140 亿个数据点可以转化为约 2 万亿个可能的行星轨道。

谷歌 AI 神助攻!开源“猎星代码”普通人坐电脑前就能发现新行星-黑科技

对于这些数据,科学家们过去主要通过自动化软件或人工的方式找到那些信号强的行星——即便如此,这也是一个非常浩大的工程量,耗时且耗费人力。

此外,与恒星相比,太阳系外的行星不但体型小而且不发光,探寻难度非常大。
在数据太多无法用人力处理的情况下,机器学习的好处就凸显了出来。

Google AI 高级软件工程师 Christopher Shallue 与德州大学奥斯汀分校的天体物理学家 Andrew Vanderburg,就曾在新闻发布会上解释他们是如何训练人工智能程序来识别遥远恒星周围的行星的,“谷歌使用的工具实际上与识别照片中猫和狗的工具是类似的”。

谷歌 AI 神助攻!开源“猎星代码”普通人坐电脑前就能发现新行星-黑科技

大体过程和原理如下:

1.首先,开普勒太空望远镜探测行星的方法为“凌日法”,就像动图中,如果一颗行星从母恒星前方横越时,恒星的视觉亮度会略微下降。

图中,这种呈 U 形的明暗信号变化模式通过白色的线条来表示,而蓝色的点状分布,则是 NASA 在分析这些光变曲线后,得出的“开普勒天体”的数据。

谷歌 AI 神助攻!开源“猎星代码”普通人坐电脑前就能发现新行星-黑科技

2.科学家们使用超过 15000 个标记的开普勒信号的数据集,创建了一个 TensorFlow 模型来区分行星与非行星。

谷歌 AI 神助攻!开源“猎星代码”普通人坐电脑前就能发现新行星-黑科技

3.再让人工智能系统来学习开普勒太空望远镜收集的光线信号,以识别外系行星。

谷歌 AI 神助攻!开源“猎星代码”普通人坐电脑前就能发现新行星-黑科技

Google 团队使用了其中一半的数据用作训练,其中有 3500 个信号经过验证为行星或行星候选者。该网络的输入是同一个光曲线的两个独立视图:一个宽视图,允许模型检查光曲线上其他地方的信号(例如,双星会引起次级信号);一个是放大视图,使模型能够仔细检查信号的形状(例如将“U形”信号和“V形”信号区分开来)。

当完成模型训练后,Google 团队的研究人员用它研究了光曲线的的特征,以检验模型的输出是否与我们的期望相符。

谷歌 AI 神助攻!开源“猎星代码”普通人坐电脑前就能发现新行星-黑科技

方法很简单,就是系统地掩盖输入光曲线的某一个小区域,来检测模型输出的变化。结果显示,如果掩盖那些对判断信号特别重要的区域,模型输出也会相应的改变;但如果掩盖的是不重要的区域,则不会产生显著的影响。

经过以上的验证后,研究人员对模型的预测能力就充满了信心。他们选择了 670 颗恒星,期望能在它们的光曲线中搜索到新的系外行星。之所以挑选这 670 颗恒星,是因为我们已知这些恒星有多个轨道行星,研究人员们相信这些恒星中应该还拥有一些尚未被发现的行星。

感兴趣的朋友何不下载代码探索一番,说不定下一颗闻名世界行星就是从你的电脑里被发现的。