均相金属催化剂的形态是反应性、效率和选择性的关键决定因素。然而,决定核性的因素(例如单体与二聚体)、有利的氧化态和催化剂的连接态常常几乎不被理解。如果不了解配体和催化剂形态之间的相关性,新催化剂的开发在很大程度上依赖于反复试验或高通量筛选工作。前一种方法往往会受到直觉的影响,而后一种方法取决于大量配体库的可用性或可访问性。任何进入未知配体空间的行为都会面临从巨大的结构可能性中进行选择的挑战。鉴于此,德国亚琛工业大学Franziska Schoenebeck教授报告了一个仅使用五个实验数据点的无监督机器学习工作流程。它利用通用参数数据库,并辅以特定问题的计算机数据采集和聚类。作者展示了这种策略对于识别钯 (Pd) 催化剂物种形成这一具有挑战性的问题的贡献,该算法从348个配体的总空间中预测并通过实验验证了许多膦配体(包括以前从未合成的配体),在更常见的Pd(0)和Pd(II)物种上得到双核Pd(I)复合物。在机器学习方法中,所谓的“监督”和“无监督”算法代表了最常见的学习形式。在监督学习中,模型使用由输入-输出对组成的数据进行训练。监督学习对回归和分类任务特别有用,并已成功应用于预测选择性,以及催化背景下的反应条件和产率。相比之下,无监督机器学习技术可用于识别数据集中的模式,而无需使用标记数据对算法进行训练(因此无需已知输出,例如实验)。 相关研究成果以“Accelerated dinuclear palladium catalyst identification through unsupervised machine learning”为题在线发表在Science。