Nature重磅:终于,科学家打开“AI黑盒”,发现了化学新知识

来源:科普中国-前沿科技

2024-09-18 11:12:08

前言

今年 3 月,世界气象组织发布了《2023年全球气候状况》报告。随后,古特雷斯称,地球正处于崩溃的边缘,化石燃料的污染让气候混乱达到了“爆表”的水平。

面对全球自然环境恶化的挑战,发展可再生清洁能源已成为最重要的解决方案之一。

作为新一代的光伏技术,有机太阳能电池(Organic solar cells,OSCs)凭借质轻、透明、柔性、成本低等优点受到了广泛关注,在光伏建筑一体化、可穿戴柔性电子器件和物联网设备等领域具有十分广阔的应用前景。

然而,自 1980 年代以来,提高有机太阳能电池的光稳定性一直是一个难题,这也是阻碍其商业化的重要原因之一。

人工智能(AI)技术有望被用来提高有机太阳能电池的光稳定性。然而,由于 AI 是一个黑盒,其是如何做出决策的,一直无法解释。

而且,在分子科学前沿,利用 AI 产生对化学知识的基本理解,与 AI 引导的优化策略得出实际结果,两者同等重要。

为此,来自伊利诺伊大学厄巴纳-香槟分校和多伦多大学的研究团队打开了 AI 黑盒,为提高光伏电池的稳定性做出了进一步的贡献。

他们将闭环实验与基于物理的特征选择和监督学习相结合,提出了一种名为“闭环迁移”(closed-loop transfer,CLT)的新方法,旨在从闭环优化过程中提取和验证物理洞察,并指导化学发现。

据介绍,CLT可以帮助研究人员快速识别影响目标函数的关键物理特征,从而更好地理解化学现象背后的原理。并且,CLT 可以指导实验设计,避免不必要的实验尝试,从而提高实验效率。此外,CLT还帮助研究人员发现新的化学知识,并为材料设计和药物发现等领域提供新的思路。

相关研究论文以“Closed-loop transfer enables artificial intelligence to yield chemical knowledge”为题,已发表在权威期刊 Nature 上。

论文通讯作者之一 Jackson 教授表示:“AI 工具具有惊人的力量。但是如果你试图打开引擎盖了解它们在做什么,通常你得不到任何有用的信息。AI 可以帮助我们优化一个分子,但它不能告诉我们为什么那是最佳选择——哪些是重要的性质、结构和功能。”

研究结果表明,产生的新型光捕获分子比原来稳定四倍,同时还提供了关于它们为何稳定的至关重要的新见解——这是一个阻碍材料开发的化学问题。通过这一过程,他们确定了是什么赋予了这些分子更大的光稳定性。他们将 AI 黑箱变成了一个透明的玻璃球。

Burke 教授表示:“模块化化学方法与闭环实验完美互补。AI 算法请求具有最大化学习潜力的新数据,自动化分子合成平台可以非常快速地生成新的所需化合物。然后对这些化合物进行测试,数据返回到模型中,模型变得更加智能——一次又一次。到目前为止,我们主要关注结构。我们的自动化模块化合成现在已升级到探索功能的领域。”

打开 AI 黑盒

AI 黑盒指的是内部工作原理对用户不可见的 AI 系统。你可以向它们提供输入并获得输出,但是你不能检查产生输出的系统代码或逻辑。

在许多情况下,我们需要警惕黑箱机器学习算法和模型。假设一个 ML 模型对你的健康状况做出了诊断,我们应该知道模型是如何做出决定的。

而在本研究的领域,了解有哪些决定性因素影响了光稳定性也是非常重要的。科研人员理解分子光稳定性的关注点主要集中在最低激发三重态(T1)的能量学及其与键离解能的关系上,而最近的研究表明,对于有限的化学类别,存在更高的能量三重态(Tn,n>1),但仍然缺乏一般性的设计原则。

研究团队提出的 CLT 方法有望打开 AI 黑盒,超越传统分析光稳定性的方法,取得突破。为了实现这一愿景,在 AI 能够产生可解释的假设并增强科研人员对光稳定性和分子功能的基本理解之前,需要从闭环策略中提取知识的新方法。CLT 可以在广谱的化学空间中优化分子功能,并给出化学知识。

CLT 由三个阶段组成:(1)机器学习驱动的假设生成;(2)实验测试;(3)物理驱动的发现。这三个阶段相互迭代,成为闭环,进而发生循环。这种迭代循环对于有效探索化学空间、识别影响分子特征的关键决定因素至关重要。

1.jpg

图|CLT 范式。第一阶段(机器学习驱动的假设生成,绿色轨道)描述了基于 BO 的合成和表征回合,并同步使用基于物理特征的可解释机器学习。通过机器学习出现基于物理的假设后,第二阶段(假设测试,橙色轨道)实验性地测试该假设,如果得到验证,将产生新知识,这些知识在第三阶段(物理驱动的发现,红色轨道)中被用于分子优化。

在这项研究中,团队通过 CLT 的整个过程,打开了 AI 黑盒。AI 在闭环优化和知识提取方面发挥了关键作用。

例如,AI 通过 GRYFFIN 算法进行贝叶斯优化,指导合成和表征过程,以寻找具有更高光稳定性的分子。BO 算法平衡了探索和利用,确保了化学空间的多样性和高效搜索。

其次,AI 训练可解释的 ML 模型,利用基于物理的分子特征来预测光稳定性。这些模型不仅识别了高光稳定性的化合物,还阐明了分子光稳定性的设计规则。

此外,AI 还通过物理建模和特征选择,发现了高能三重态态密度 (TDOS) 与分子光稳定性之间的强相关性,这为后续的假设验证提供了基础。

AI 驱动科学新发现

总之,闭环实验,通过使用基于物理特征的可解释的 ML 模型进行了增强,阐明了有关分子光稳定性的基本化学知识,同时针对高功能分子目标进行了优化。人机交互、AI 引导的活动产生了本文的假设(30 个分子),其显著效率得益于 AI 引导的探索和利用的平衡与可解释的基于物理的建模的结合。

此外,研究团队也在进一步证明 CLT 广泛适用于其他前沿应用和研究领域,特别是难以先验预测的低数据状态和多维分子特性。有理由相信,CLT 将成为在假设驱动的发现研究中利用 BO 优势的手册,并通过基于物理的见解得到加强。

科学研究是一个循环往复的过程,需要研究者不断地提出假设,进而进行检验。在这一连串的探索中,研究者承担着大量的实验操作和数据收集任务。在此过程中,AI 是一个不可或缺的助手,它能在多个环节扮演重要角色。

如今,AI for Science 已成为热议的话题。AI 已在众多领域展现出其强大实力,涵盖了生物制药、新材料研发、前沿物理研究、气候预测、地球模拟和天文探索等多个领域。特别是在化学领域,AI 的应用更是广泛。

2018 年 3 月,一项发表在 Nature 杂志上的研究展示了 AI 在化学合成中的巨大潜力。研究团队整理了过去几十年间发表的 1250 多万个化学反应,并利用深度神经网络和蒙特卡洛树算法,成功规划出新的化学合成路线。这一方法使得设计分子合成路线的时间缩短至仅需 5 秒。

2020 年,麻省理工学院(MIT)在国际顶尖学术期刊《细胞》杂志刊登了一篇突破性的研究成果,研究人员利用深度学习系统,发现了一种强大的新型抗生素化合物。他们通过计算机深度学习系统建立的模型,可以在几天内筛选超过 1 亿个化合物,从而挑选出不同于现有药物杀死细菌机制的潜在抗生素。

今年 2 月,来自北卡罗来纳州立大学、伊士曼化工公司的研究团队开发了一种名为 Fast-Cat 的自动化实验室。通过结合 AI 和自动化技术,Fast-Cat 实现了催化反应的快速、高效和自动化,不仅可以完全自主连续运行高温、高压、气液反应,还能够分析每个反应的输出结果,在没有人工干预的情况下确定不同变量对每个实验结果的影响。它能够在短短 5 天内提供比传统方法 6 个月更多的信息,为化学研究和工业生产提供了全新的可能性。

此外,一个名为“RoboChem”的自主化学合成 AI 机器人,不仅在速度和准确性方面都优于人类化学家,同时还显示出了高度的独创性。RoboChem 是一个精确可靠的“AI 化学家”,不仅可以进行全天候的自主工作,快速、不知疲倦地提供实验结果,还可以迅速优化化学合成过程,进行各种反应,同时产生极少量的废物,有望大大加快用于制药和许多其他应用的分子的化学发现。

展望未来,我们有理由相信,随着 AI 技术的不断进步,它将为化学乃至整个科学领域带来更多创新与变革。

责任编辑:李娇

Baidu
map