吉林省科学技术协会主办
吉ICP备案号18002506号
吉公网安备 22010402000667号
来源:科技日报
2019-06-05 16:10:34
寻找暗物质,机器比人的眼神好。近期《计算天体物理学和宇宙学》发表的一篇论文显示,美国劳伦兹伯克利国家实验室(以下简称“伯克利实验室”)等机构共同研制的深度学习AI框架,能够探寻宇宙里暗物质的迹象。
近几年,人工智能越来越多应用于天文学研究。深度学习需要海量数据,而天文学正是AI大显身手的领域。机器可以替人类从茫茫大海里捞针,捕捉到新的恒星、新的地外行星甚至暗物质。
辨认“引力透镜”,AI立功了
寻找“引力透镜”是研究暗物质分布的基本方法。巨大质量的物体会像透镜一样扭曲路过的光线,找出这种扭曲就能捕捉到不发光的质量物。
论文显示,伯克利实验室建立的深度学习AI框架CosmoGAN,可以分析引力透镜与暗物质的关联。它可以创建高保真、弱引力透镜收敛图。
曾几何时,寻找“引力透镜”所需的模拟和数据处理很麻烦。20名科学家花费了好几个月的时间只能查看一小块空间图像。物理模拟需要数十亿个计算小时,占用数兆字节的磁盘空间。
神经网络的进步提供了机会。伯克利实验室领导的团队引入一种“生成性对抗网络(GANs)”。研究者穆斯塔法说:“也有别的深度学习方法可以从许多图像中得到收敛图,但与竞争方法相比,GANs生成非常高分辨率的图像,同时仍有神经网络的高效率。”
现在,天文学家可以用CosmoGAN分析大得多的天区,速度也更快。
CosmoGAN不是唯一取得进展的天文学深度学习神经网络。比如多伦多大学利用深度学习技术解析月球陨石坑的卫星图像,P8超级计算机的神经网络在仅仅几个小时内发现6000个新的陨石坑,是过去几十年中人类发现陨石坑数量的2倍。伊利诺伊大学厄巴纳-香槟分校利用深度学习来探测和分析黑洞碰撞的引力波。AI在天文学遍地开花。
数据太多,没机器玩不转
过去几年里,天文领域的大多数方向都在尝试使用人工智能。考虑到天文学要处理的数据之多,这是一个很自然的思路。让机器练习去分析蛛丝马迹,不如此,未来的天文学将无法运转。
不久前举办的2019年GPU技术大会吸引了全世界的人工智能学者。大会请来加州大学圣克鲁兹分校的天文学家布兰特·罗伯特森演讲,他指出:“天文学正在一场新的数据革命的风口”。罗伯特森认为,新一代天文仪器必须配合由深度学习驱动的新一代软件。
比如预计在3年后运行的大口径全天巡视望远镜(LSST)。它巡视南天那一半宇宙中的370亿个星系,生成一部时长十年的不间断视频。LSST配备的是32亿像素的相机,每晚产生25TB的数据,相当于现在先进天文望远镜一生贡献的所有数据。
再比如平方公里阵列射电望远镜(SKA)。它遍布全球,一部分天线在非洲南部8国部署,还有100多万天线位于澳大利亚和新西兰。它的原始数据每天达到5千个PB,处理后也有50个PB左右。
“暗能量巡天”编制几亿个星系的星图;“盖亚”卫星测绘银河系数十亿恒星;“兹威基”项目每小时能够扫描3750平方度的天区。在中国,FAST每天的数据量将达150TB;郭守敬望远镜观测了901万条光谱,是世界上最大的天体光谱库……
捕捉人类看不出的模式
数据越来越多,科学家试图聚合它们。但在GPU大会上,罗伯特森说,未来几个大型天文望远镜一起产生大量数据,聚合之后复杂到人类无法直接利用。而加州大学圣克鲁斯分校的科学家试图解决这个问题。计算机科学系一名博士生创建的Morpheus深度学习框架,可以基于望远镜的原始数据,逐像素地分类天体。
加州大学圣克鲁兹分校的科学家们还用AI更好地研究星系的形成。在他们2019年初发表的一项研究中,科学家用计算机模拟的星系训练计算机,让它学习星系演化的三个关键阶段。后来计算机分析来自哈勃太空望远镜的星系图像,表现出奇好。
人工智能应用于人脸识别,在海量数据训练后,可以根据一张照片,认出这个人化妆和年老时候的样子。而宇宙中很多图像也可用同样的方法来归类。
“深度学习可以寻找模式,机器能看到非常复杂的模式,而人类看不到。”参与研究的科学家大卫·库说,“我们希望进一步测试这种方法。在概念验证研究中,机器似乎成功地在数据中找到了模拟中确定的星系演化的不同阶段。”
帮天文学家找到另一个太阳系
2018年底的一篇报道显示,谷歌人工智能发力,从开普勒系外行星观测数据库里找到了新的行星。行星是很难寻找的。位于太空的开普勒卫星观察145000颗类似太阳的恒星,从恒星亮度微弱变化来发现行星。记录4年的数据中,包括大约35000个疑似的行星记录。天文学家用机器结合人眼来识别,但最暗最弱的信号常被忽略。
在谷歌AI的帮助下,我们发现了开普勒90i和开普勒80g两颗新行星。也让开普勒90被确认为第一个至少拥有8颗行星的外星系。
神经网络和机器学习处理了140亿个数据点,之后成功筛选出了候选者。
NASA和谷歌说,未来新技术将找到更多系外行星。NASA还表示不用担心天文学家失业。NASA的科学家杰西·道特森解释表示,数据提供给神经网络之前,需要天文学家进行分类,以便人工智能可以从中学习分析出新的信息。
道特森说:“AI以后绝对会和天文学家一起工作,成为必不可少的工具。”
当然,机器学习也带来“黑盒子”风险:我们得到了答案,但我们不知道机器为何如此判断,或许答案是错的。机器也会犯错。天文学家将继续训练和适应它。
延伸阅读
专家点评
深度学习还不具备“物理直觉”
确实,现在人工智能已经深入到了天文天体物理学的各个分支领域。目前,美国劳伦兹伯克利国家实验室利用深度学习,能够快速根据宇宙三维密度分布,判断暗物质、暗能量等宇宙学基本常数,他们发现应用人工智能之后,统计量误差比先前应用传统统计学办法小不少。此外,我们也利用深度学习在极低信噪比的光谱中寻找宇宙早期的氢、碳元素,发现比传统方法也要好用。
同时,天文学家们也在应用深度学习,帮助我们判断天体的三维位置、远近,进而勾勒出三维空间的大尺度结构。人们发现深度学习在对数据信息的挖掘方面,可能强于我们之前所用的传统方法。人工智能也被谷歌公司应用到探测系外行星的领域,并成功探测到了几个系外行星……可以说,人工智能如今在天体物理的前沿领域被广泛应用。
但从物理学家的角度看,基于深度学习的人工智能也许也有其局限性。这种局限性在于它只能基于数据、在已经被定义得非常明确的特定领域内发挥作用。只能在物理学家的指导下,把统计量的误差棒做得更小,估计某个量更精准,而目前尚无法指导我们发现数据背后的新物理规律。也不具备人类才有的,基于美、对称和简洁的“物理直觉”。
举一个最简单的例子,比如说开普勒基于第谷的观测数据,可以发现开普勒第三定律,而目前再好的机器学习、人工智能算法可能也很难基于相同数据,重复这个发现。
所以说我认为深度学习在天文中应用的本质,目前还局限在做更好的统计和拟合这个方面。
责任编辑:孙楚一