材料表征,即通过各种物理、化学等测试方法,揭示和确定材料的结构特征,是科学家理解锂离子电池电极及其性能限制的基础方式。基于实验室的表征技术地进步,科学家们已经对电极的结构和功能关系产生了许多强有力的见解,但还有更多未知情况等待探索。该技术的进一步地改进,取决于对材料中复杂的物理异质性的更深入理解。
然而,表征技术的实际局限性,限制了科学家直接组合数据的能力。例如,某些表征技术会对材料造成破坏,因此无法对同一区域进行其他参数的分析。幸运的是,人工智能技术拥有巨大潜力,可以整合传统表征技术所收集的数据,从而构建具有代表性的 3D 多模式数据集。
从以上观点出发,美国国家可再生能源实验室(National Renewable Energy Laboratory,NREL)以及英国帝国理工学院(Imperial College London)的研究团队发表综述,概述了基于实验室的锂离子电极表征技术的最新进展。同时,他们也讨论了人工智能方法如何结合和增强这些技术,例如风格迁移、生成、超分辨率和多模态融合。
该综述以「Machine-Learning-Driven Advanced Characterization of Battery Electrodes」为题,于 2022 年 11 月 9 日发布在《ACS Energy Letters》。
「你无法衡量的东西,你便无法管理它。」这是一句管理学格言。这句格言同样适用于锂离子电池技术领域。锂离子电池的性能与许多材料特性有关,涉及空间和时间变化相关的化学、晶体学和形态学等。
自锂离子电池首次商业化以来,管理和调整这些特性从而获得良好的电池性能,已经使锂离子电池有了相当大的改进。通常,材料特性的确定,需要使用先进的表征技术来完成,但由于分析设备的实际限制,仍有很多参数无法测量。
在过去十年中,人工智能技术在增强、合并、预测、分类以及人工生成数据方面均取得了长足进步。与此同时,现在的材料表征设备比以前具有更高的分辨率、更短的数据采集时间以及简化的多模态数据处理路线。许多商业数据分析软件包已开始包含人工智能技术,例如,增强空间分辨率、跨多模态技术关联数据,以及识别和量化数据中的特征。并且,每年都会有应用 AI 进一步增强数据的新方法诞生。重要的是,现在通过使用人工智能技术,所生成数据集的细节超出了任何单一表征技术所能达到的范围,从而超越了设备限制。
尽管到目前为止,这些领域取得了不错的进展,但应用 AI 技术仍然可以进一步提高我们的表征能力,且潜力巨大。这可以使研究人员能够测量并管理电池材料众多传统技术无法获得的特性。
电极性能的重要特性
如今,锂离子电池中使用了各种各样的电极材料和电解质化学物质。为了方便讨论,综述主要关注具有石墨阳极、LiNixMnyCozO2(NMC)阴极、多孔聚合物隔膜和液体电解质的传统锂离子电池材料方面。
从数百微米到纳米的长度尺度,化学、晶体学和形态学特性决定了电池在其整个循环寿命期间的电化学性能。研究人员对这些结构和功能关系的理解,关系到如何定义操作限制和降解途径,也关系到如何提高电池性能。
跨长度尺度的表征和技术限制
跨长度尺度的形态学、晶体学和化学性质的表征,对于解释锂离子电极的结构和功能关系至关重要。获取这类信息的技术选择和顺序选择非常重要,但由于每种技术都有特定的优势和系统局限性,所以这一过程可能会很复杂。
虽然同步加速器技术的应用,在多长度尺度和多模态表征方面取得了巨大进步,但在这里,研究人员主要专注于学界应用更广泛、更容易获得的基于实验室的技术。
为了在电极的材料特性与其电化学性能之间建立直接联系,需要从同一材料样本中获取来自多种不同技术的数据信息。理想的表征工具应当可以提供一个高维数据集,数据集应包含跨越空间和时间长度尺度的形态学、化学和晶体学全部细节。
然而,由于存在系统限制,所以无法从同一样本中获取多模态细节。首先,许多技术都是破坏性的,因此本质上会阻止样品在不同的系统中成像以进行相关显微镜检查。另外,对于许多技术而言,样品制备是另一个相当大的挑战。锂离子电极样品通常对空气敏感,准备用于成像的样品,既繁琐又耗时。如果样品制备不达标,可能使该技术统计置信度极低,或者无法使用多种技术和长度尺度进行相关计量。
由于表征技术的局限性,使研究人员想到将多模态数据流混合到单个数据集中的方法;利用每种成像模式的优势来生成新的代表性数据集,其细节超出了单独使用每种技术的细节。虽然这些技术已被证明是有效的,但它们构建起来相当复杂,并且往往是专门为特定材料设计的,不利于普遍推广。
因此,研究人员将注意力转移到了新的机器学习(ML)技术,这些技术可以实现更广泛的应用,同时减少了对专家参与的依赖性。
实现下一代材料表征的机器学习方法
随着 ML 算法的快速发展,以及计算能力的不断提高,材料设计、发现、优化和表征方法正逐渐形成新范式。特别是针对基于图像任务的现有计算机视觉研究,其中许多技术可以应用于锂离子微结构数据集。
这些方法的核心一般是卷积神经网络(CNN),这一直是图像分类的关键,同时它们也构成了对象检测、图像增强和图像生成中众多开创性方法的基础。
虽然这些 ML 方法已经适当解决了一些表征技术的局限性,如增强分辨率和自动分割图像的结构特征,但其仍有进一步发展的巨大潜力。在多数情况下,当期已经建立的 ML 方法可以直接应用于材料表征分析。
分割(Segmentation)
分割(Segmentation),即为每个像素/体素分配一个相位标签的过程,是一个常见的材料科学任务示例,适当使用人工智能可以极大地提高它的完成度。
在材料科学中,执行定量表征或模拟之前,需要进行语义分割。“阈值化”是常见的分割方法,其中仅根据像素相对于固定截止值的灰度值将像素分配给类别。然而,阈值显示在不同材料之间的边界处具有高可变性和较差的性能,这会导致对电池电极微观结构图像的误导性分析,因此应避免使用。
而另一方面,从图像中量化多尺度形态特征对于创建电池材料的结构和功能关系极为重要。形态信息的量化几乎总是涉及灰度图像的分割。CNN 方法可以提高分割的准确性,从而提高量化的形态学特性,这有望显著提高科学家在该领域的表征能力。
风格迁移(Style transfer)
风格迁移(Style transfer)是另一种常见的 ML 技术,可应用于材料科学。此方法生成的数据集采用另一种数据集的外观或风格细节,同时保持原始数据的结构特征。比如,它可以修改艺术品,采用另一位画家的绘画风格。
如前所述,不同的成像技术提供不同的分辨率、保真度和信息。风格迁移可以将两种或多种捕获不同材料特性的互补技术的数据进行迁移,融合不同的成像技术,为多模态数据集提供超越传统实验室能力表征的途径。
修复(Inpainting)
图像缺失或损坏的区域可以使用称为修复(Inpainting)的技术来填充。深度卷积模型,特别是生成对抗网络(Generative Adversarial Networks,GANs)和自动编码器(Autoencoders),在修复方面非常成功。许多材料表征技术包含伪影或损坏的区域,需要这类技术的加持。
从广义上讲,材料科学中有两种修复方法。首先,使用经典的统计重建方法,例如基于样本的修复,其中最著名的例子是 PatchMatch 算法。其次,基于 ML 的方法开始出现,它们使用 GAN 和自动编码器来检测和修复受损区域。
值得注意的是,随机修复方法并不旨在准确地重建地面真值缺失数据。相反,丢失的数据被具有匹配边的统计相似的生成数据替换。修复可以将低质量数据集转换为高质量数据集,从而可以去除不需要的成像伪影,避免重复实验。
虽然这些 ML 技术已经存在,但进一步利用前沿 ML 研究来提高修复质量是可能的,并且需要做更多的工作将这些工具集成到现有的工作流程中,并使它们更广泛地为社区所用。
生成(Generation)
ML 数据生成(Generation)技术有很多种,但最广泛采用的两种是 GAN 和扩散模型(Diffusion Models)。这些方法可以应用于数据可用性有限的数据增强任务,这使它们成为材料科学中的强大工具。在材料科学中收集宏观均质材料的大视野图像,既费时又昂贵。科学家使用 GAN 在对相对较小的训练数据进行训练,然后生成大量任意体积的 3D 微结构(包括电池材料),从而可以生成物理范围超出实验室能力的数据集。
维度扩展(Dimensionality expansion)
近期,科学家已经开发出针对特定表征的定制解决方案。2D 图像通常可以提供比 3D CT 衍生图像更高的分辨率和更好的相位识别,同时通常更快更容易获得。然而,许多关键指标本质上是 3D 的。
维度扩展(Dimensionality expansion)是使用低维数据集生成高维版本的过程。这类方法使用同质 2D 微结构训练数据,来训练输出 3D 微结构的 GAN;从而可以非破坏性地生成 3D 数据集,为比较研究提供了可能。如果应用于无法进行 3D 模拟的 2D 成像技术,此方法还可以生成以前无法获得的 3D 数据集。
超分辨率(Super-resolution,SR)
超分辨率(Super-resolution,SR)方法,即从低分辨率图像生成高分辨率图像,深度学习是完成这一任务的最有效的方法之一。低分辨率数据更容易获得,高分辨率数据不易获取时,使用少量高分辨率数据训练超分辨率模型,可以提供收集具有代表性的高分辨率数据的捷径。
当不存在真实实验数据参考时,验证生成合成数据的方法具有挑战性,许多 ML 工具都存在这种问题。通过将训练期间未约束的各种微观结构指标与基本事实进行比较,来评估合成数据的质量,是一种有用的验证技术;这至少可以断言所生成的数据是否保留了数据集的一些隐式统计数据。所以,在开发这些技术时,必须首先在有基本事实的研究中探索验证,然后再扩展到没有基本事实参考的领域。
此外,随着新技术和方法的开发和调整以解决材料表征挑战,确定可以构建到 AI 算法中并由其强制执行的新假设非常重要。
优化和数据融合:展望人工智能和多模式表征的未来
ML 有可能克服现有表征技术的许多局限性,将人工智能和多模式表征结合起来可能会更加强大。
形态优化与制造参数关联
人工智能的一个强大的潜在应用是优化电极形态(微观结构、细观结构和电池几何形状),这将通过最大限度地减少各种电化学过程造成的损失,来提高能量密度和缩短充电时间。但这一过程应当考虑实际的物理限制,所以形态优化需要与相关制造参数相关联。
关联制造参数无形之中又提出了一个新挑战。解决这一问题的一种方法是使用基于物理的模拟来直接模拟制造过程。然而,这在计算方面非常昂贵,且极其复杂,除非使用高度简化的系统。虽然基于物理的模型不适用于优化复杂的制造条件和供应链,但它们在解释特定材料特性对电池性能的影响和优化方面,具有巨大的实用性。
ML 可以提供数据驱动的方法,避免直接模拟的成本和复杂性。特别是,条件 GAN 可以学习生成与一组指定参数相对应的样本族,在这种情况下,这些参数可以是“制造参数”。这意味着可以仅使用有关输入和结果输出的信息,来了解制造参数和微观结构特征之间的关系。
尽管条件 GAN 能够快速生成新颖的微观结构,但这确实涉及在参数空间中进行插值并生成之前未曾有过的示例。插值过程基于标签和数据之间的隐式关系,而不是基于物理的关系。这是基于 GAN 的方法的潜在弱点,必须小心验证任何插值结果。
此外,训练这样的条件 GAN 需要仔细收集具有固定制造参数的微观结构数据。这非常重要,数据中的任何问题都会反映在 GAN 的输出中。尽管 GAN 是非常有潜力的方法,但仍然需要探索用于高通量、数据驱动的制造参数优化的其他方法。
数据融合
除了优化之外,前文描述的 ML 方法的灵活运用,可以形成一种通过数据融合获取多模态数据集的新方法。作为示例工作流程,从高分辨率 SEM 图像开始,分割可以首先用于生成相图。然后可以应用维度扩展来生成大的 3D 体积。使用它作为基础体积,风格转移和超分辨率方法可用于将来自其他表征技术的特征投射到每个阶段。因此,结果数据集中的单个元素可能包含多种属性,包括化学、晶体学、电子、机械等等。
将多模式数据集融合到电池电极的统一表示中是一个非常有价值的应用前景,特别是用于表征和建模目的。这类方法可以轻松应对前文所述的各类挑战;同时,也可利用人工智能技术来改变电池材料设计和优化的历史范式。
端到端
神经网络不依赖于人类可读或人类可解释的数据集。如果将成像数据与其他数据流相结合,则可以构建更抽象的模型;这些模型使用电池从制造到报废过程中的端到端数据,可绕过模型中的假设和简化以及输出人类可读结果所带来的约束。这种深度设计方法将完全由数据驱动,可以帮助科学家发现新的对应关系并提出新问题。为了实现这一目标,需要为相关变量和数据的收集、组织、处理,进行大量思考和规划。
展望
锂离子电池的性能取决于多个长度尺度的大量组成元素的材料特性。这使得在锂离子电池材料的结构和功能之间建立定量联系的任务极具挑战性,需要多模态和多尺度数据集。想要在没有任何假设的情况下,对特定材料特性与电池性能的对应关系进行建模和量化,需要对所有影响材料特性的参数进行完整详细的空间描述,由于各种表征技术的系统限制,目前无法实现。
人工智能增强的表征可以弥合系统限制,同时可收集众多影响性能的材料特性信息。基于 CNN 的方法尤其可以生成比其他实验可实现的更高分辨率和更高维度的数据集。此外,来自所有表征技术的数据可用于生成电极微结构的统一代表性体积模型。这些统一的体积模型与电化学数据相结合,可以实现详细的多物理模拟和高通量优化。同样,这些方法也广泛适用于能源材料研究的其他领域。这些方法为材料表征提供了一种新的范例,而收集高质量的数据将对其成功至关重要。
论文链接:https://pubs.acs.org/doi/full/10.1021/acsenergylett.2c01996