国际核心期刊咨询网

当前位置:首页>>农业论文 > 正文

材料基因组技术在新能源材料领域应用进展

发布时间:2022-03-22

  摘 要:材料基因组融合了材料的高通量计算、高通量制备、高通量的检测及数据库系统,是材料研发的“范式革命”,以其深刻的科学内涵、重大的应用潜力,将加速新材料发现和应用。本文重点讨论材料基因组用于新能源材料的研发,来缩短新能源材料的“发现—研发—生产—应用”周期,介绍国际上代表性的 Materials Project 和 OQMD 两个材料基因组平台,及一些重要的材料基因组计算技术,如材料构象表征、高通量计算及筛选、机器学习、神经网络技术、优化算法和新型的高通量制备和表征技术等在新能源材料研发中的应用,并对下一步材料基因组的发展提出了展望,如通过发展高精度高通量计算、利用人工智能开发高通量实验系统和平台,产生材料大数据,并通过智能计算充分利用好材料大数据,打造计算与实验融合的材料基因组大数据人工智能系统,加速新能源材料的发现与应用。

材料基因组技术在新能源材料领域应用进展

  关键词:材料基因组;新能源材料;高通量计算;高通量实验

  材料是所有产业的基础和先导,材料从研发到投入市场的时间跨度极长,其关键在于长期以来材料研发过度依赖科学直觉与试错式的实验经验积累,且制备过程漫长和充满变数。变革材料的研究与开发方式,提高材料从发现到应用的速度成为世界各国共同的追求。2011 年 6 月美国启动“材料基因组计划”(Materials Genome Initiative,MGI),2014 年 12 月,美国总统直属的科学技术委员会颁布升级版《材料基因组计划战略规划》[1]。其核心内容是建立高通量材料计算方法、高通量材料实验方法和材料数据库,其一个重要改变是实施“新材料的发现从设计开始”,注重在原子与分子层面上认识、设计和计算新材料,并通过数据库收集已有材料的结构与性能的相关性,指导新材料的设计和开发。其目的和意义在于:① 通过高通量筛选新材料,加快材料的研发进程;② 转变新材料研发范式,节省人力、物力;③ 加快人类对材料本质与规律的认识,再通过所认识的材料本质与规律指导新材料的设计、制备与检测等研发,从而进一步认识材料的本质与规律;④ 建造可靠的材料基因组数据库(新材料大数据),实现资源共享,加速新材料的发现和应用。应该说,2016 年 5 月发表于 Nature 正刊一篇利用实验废弃数据,通过机器学习和数据挖掘指导材料成功发现的封面文章[4],是对材料基因组技术应用有效性的最好诠释[2]。

  缩短新材料的“发现—研发—生产—应用”周期,降低材料研发中的人力、物力成本是实施材料基因组计划的根本目的,也是中国实现新材料领域跨越式发展的内在需求,2016 年开始,我国首次将材料基因组工程与技术列入国家重点研发计划,其主要包括三个方面的研究:共性关键技术的研发、典型材料的应用和软、硬件平台建设。国内专家提出,中国版材料基因组计划必须围绕“加速应用” 来开展。选择能源与环境材料、海洋工程材料、军用材料和生物医学材料等事关国家安全、能源安全和人民健康福祉等国家急需,又有一定基础的关键材料进行示范,尽快取得成果,为进一步推广普及到整个材料领域积累经验[3]。其中,新能源材料领域有效利用材料基因组技术对指导、加速研发和应用意义重大。

  1 材料基因组技术发展应用现状

  目前较为著名的材料基因组大规模高通量计算平台和材料数据库有劳伦斯伯克利国家实验室(LBNL)与 MIT 联合的 Materials Project、Duke 的 Aflow.org 以及 Northwest 的 OQMD 等。

  1.1 Materials Project

  坐落于美国加利福利亚州硅谷北边 100 公里不到的伯克利出现了许多使用先进计算机技术来帮助材料研发生产的课题组、老师,得到了很多材料计算方法及研究成果。在这些课题组中,CEDER 课题组最具影响力。在 2017 年,由于他在应用计算材料设计及储能材料(主要是锂电池材料)与技术方面的研究,CEDER 当选为美国工程院院士。他同 PERSSON 课题组的 materialsproject.org 平台在世界范围内有很大影响,其对自身的定位就是成为材料研究领域的谷歌。Materials Project 包含了一个存储信息量很大(有近 6 万个晶体结构)的数据库,可以存储高通量材料性质计算的结果,例如各种计算信息,包括能带态密度信息,也包括电池材料的充放电曲线、相图等,所有材料计算的研究工作者可以在这个开发的平台上下载结构、搜索材料性质、查看材料相图、甚至可以利用这个网站的平台搜索未知的材料。此外这个网站还开放了数据库接口,利用这个数据库,大家可以使用写代码的方式,搜寻筛选材料。在这样的工作模式下,材料重复计算的次数被减少了,在做材料计算的时候,人为操作的次数变少,计算机智能化的判断设计变多了,材料计算速度得到了极大的提升。

  CEDER 等早期主要是利用蒙特卡洛方法[4-5]计算有固定晶体结构位点的金属合金氧化物材料,发表了许多使用计算研究金属合金氧化物中氧原子排布方式的文章[6-9]。接着,CEDER 等[10-14]做了许多关于锂电池材料的结构和相的研究,在这些研究工作中,他们使用了一种从冶金学计算蒙特卡洛方法发展而来的团簇展开方法:这种方法是使用部分已知的密度泛函计算结果,对体系的总能量进行拟合,然后再利用拟合的结果预测未知体系的总能的方法。该方法本身依赖于密度泛函理论计算,但又使用了一些统计的概念,加速了普通的密度泛函计算,也就是一个类似与现在材料基因组计算方法的工具。其核心是牺牲一部分精度,换取更快的计算速度,然后在更快的计算中进行材料的筛选。从 2003 年起,CEDER 等[15-17]陆续发表了一些含有“数据挖掘”、“高通量计算”等标题的论文。可以说这是最初的利用计算机技术来加速传统材料工业发展的材料基因组技术构想萌芽。就目前而言,该平台在发展材料基因组技术上相对领先,他们有成熟的材料数据库,有一些较为成熟的材料计算方法和材料筛选机理经验积累,有许多成熟的研究材料基因组的科研人员,也有在湾区硅谷旁全世界最先进的计算机思想的浸染,并且已经在新能源材料领域有了很多相关的运用材料基因组技术的成功案例[18-25]。但其离真正系统性指导实验,加速实验,还需要突破很多瓶颈。

  1.2 Wolverton(OQMD)

  美国西北大学材料与机械教授 CHRIS WOLVERTON 的研究组是一个具有交叉学科的研究组,其成员的背景非常多样,包括材料、物理、化学、机械工程和数学。他们研究的内容也非常广泛,包括电池材料、储氢材料、太阳能材料、热电材料和机器学习数据挖掘等。WOLVERTON 研究组的计算资源丰富,有 1008 个核的 Linux 机群,此外他们还与西北高性能计算系统合作,有大量机时可以使用。WOLVERTON 受到了 CEDER 的 Materials Project 启发,按照自己的思路于 2013 年建立了“开放量子材料数据库”(the open quantum materials database,OQMD)并免费在 http://oqmd.org 上公开 [26]。这是一个基于密度泛函理论(DFT)计算的材料的热力学和结构的数据库。这个数据库有友好的网络界面适合小规模访问,也提供 API 接口下载整个数据库。目前该数据库现在包含 471857 个条目,还包括一些全新的结构。OQMD 中除了给出材料的晶体结构、能量、空间群、形成能、数据来源、能带等性质之外,清楚的显示出材料的相图是该数据库的一大特色。

  此外,该研究组从数千个 DFT 计算的数据库(OQMD)中构建了机器学习的模型,利用模型可预测任意化合物的热力学稳定性,而不需其它的任何输入,而且比 DFT 计算的时间少了 6 个数量级。 WOLVERTON 等[27]使用该模型扫描了大约 160 万个新型三元化合物的候选组合,成功预测了 4500 种新型的稳定材料。同样利用机器学习的方法, WOLVERTON 课题组研究了氧化锆中掺杂剂稳定性的力量驱动机制问题,他们创建一个聚类排序建模(CRM)自动化方法,用于发现大型性质数据库中的强大化学描述符,并将 CRM 应用于氧化锆掺杂剂的稳定性研究。CRM 作为一种通用方法,在实验和计算数据两方面都可以进行操作,识别掺杂氧化物的电子结构特征,当掺入氧化物溶解在氧化锆中时能很好地预测氧化物的稳定性[26]。他们还利用一种被称为元素替换法的高通量计算方法,用 DFT 计算了 378 种 XYZ 型(X=Cr、Mn、Fe、Co、Ni、 Ru、Rh,Y=Ti、V、Cr、Mn、Fe、Ni,Z=Al、Ga、 In、Si、Ge、Sn、P、As、Sb)的 half-Heusler 合金的电子结构、磁性和结构稳定性。通过计算,得到了相图,预测了全新的热力学稳定相和几十个具有负的形成能的半导体、半金属和接近半金属[26]。应该说,该研究团队目前在数据库建设、材料基因组技术方法开发及应用领域均具有一定的领先优势。

  国内在该方面已经开展相关研究的科研单位与院校有上海材料基因工程研究院、中国科学院宁波材料基因研究院、北京大学深圳研究生院新材料学院、北京计算科学研究中心、电子科技大学等。但与美国等先进国家存在较大差距,比如缺乏独立自主研发的高通量材料计算程序、缺乏高通量材料检测设备和较为实用完备的材料基因数据库[28]。中国科学院物理研究所陈立泉院士团队在中国独立研究开发和编著了自动化高通量计算方法及软件平台,获得了著作权,通过超级计算机,能够对无机晶体学数据库中 30 万条数据中选择含锂材料,通过快速 “键价和”方法及高精度第一性原理分子动力学方法,计算材料的电子结构、三维离子导电通道、离子迁移活化能,从而建立电解质与电极材料的数据库。通过该数据库,进一步建立数据挖掘方法,有利于新的固体电解质材料的筛选,该高通量计算方法已经预测了一种硫化物电解质,并获得实验验证[29]。上海材料基因工程研究院在张统一院士的带领下,在数据库建设、集成计算与软件开发、结构与物性表征、服役与失效等基地建设方面进行了大量基础性工作。宁波材料基因工程研究院项晓东研究员(现为南方科技大学教授)发展了高通量组合材料实验及原位实时高通量组合材料实验技术,包括基于同步辐射大科学装置发展的普适性原位实时高通量材料成分/结构表征技术,该技术基于可调脉冲红外激光和同步辐射微束白光 X 射线,可探明涵盖时间、温度、环境气氛等工艺参数的材料结构-成分-工艺相关性。基于其它微区表征探针或谱学测试工具,还可发展一系列功能丰富的原位实时高通量表征技术,从而充分发挥高通量组合材料制备与表征技术作为“新材料搜索引擎”的潜力。2014 年其团队所开发的新一代组合材料芯片技术使材料的合成和筛选由“一锅一炒”变为“万锅同炒”,效率迅速提升 1000~100000 倍,从而把研发新材料的时间最短压缩至一周[30]。吉林大学马琰铭教授的团队[31-32]依据化学组分来开展物质结构预测的相关理论和模拟方法,并结合第一性原理计算和高压实验测量,探索高压等限域条件下物质的新奇物理与化学性质,设计并合成新型非常规高压相多功能材料,揭示结构与宏观性质之间的内在联系,为发展新的物理理论奠定知识储备。基于晶体对称性的分类检索思想,结合粒子群多目标优化算法,引入成键特征矩阵,研究组提出并发展了 CALYPSO(crystal structural analysis by particle swarm optimization)结构预测方法,在此基础上开发了拥有自主知识产权的 CALYPSO 结构预测程序。CALYPSO 软件包的输入量是化学组分和外界条件(如压力),通过结构演化和总能的计算来合理确定物质的结构,并可以根据需要进行功能材料(如超硬材料等)的结构设计。 CALYPSO 软件不仅可以开展三维晶体的结构研究,还可以开展二维层状材料和二维表面重构以及零维团簇的结构研究,未来还可以开展其它结构现象丰富的热点研究(如界面、过渡态、化学反应等)。

  相关知识推荐:核心期刊发表论文对字数要求严格吗

  此外在世界其它国家和地区,材料基因组研究也在蓬勃发展。针对在高通量计算中遇到的结构寻找高对称点和 K 点路径的问题,瑞士洛桑的科学家和日本东京大学的课题组[33]在 materialscloud.org 上发布了一个关于寻找结构对称性的软件,帮助了材料基因组的高通量计算的研究。在这个软件包中,该课题组对于结构的对称性、对称操作等性质进行了详细地分析,并且以代码的形式存在。此外,在 materialscloud.org 网站中,还有许多关于赝势的信息和下载的渠道。虽然这个网站没有直接的材料基因组的工作,但是这些基础的工作也为材料基因组的工作提供了很好的基础和平台,加速了材料基因组的研究。在新加坡,涌现出来了大批量的高通量实验制备的工作。例如对于锂电池材料的阳极材料,新加坡科技设计大学的课题组 [34] 使 用 MoSx (2体结构具有周期重复性,且晶体结构中原子有对称操作,使得晶体结构的表象的唯一性要求提高,直到最近,才不断有较成功的对晶体结构的表象技术被报道。SCHÜTT 等[42]利用对径向分布函数(pair radial distribution function)作为晶体结构表象,并把这种表象作为机器学习模型的输入,成功预测出大体系(约 100 原子)在费米能级处的能态密度。 FABER 等[43]则在考虑周期性的条件下用传统的库仑矩阵(coulomb matrix)作为晶体结构的表象,成功预测了材料的形成能。

  (2)高通量计算及筛选(high-throughput calculation and screening) 在近几十年随着密度泛函理论(density functional theory)的日渐成熟,科学家可以从量子力学角度出发精确有效地计算材料中原子间的电子相互作用,从而预测出材料的一系列性质,从理论上指导材料设计。伴随着强大的高性能并行计算能力以及高效率的算法,由高通量计算( high-throughput calculation )以及高通量筛选(high-throughput screening)驱动的材料大数据技术应运而生。通过高通量计算得到大量的材料性质,并从中高通量筛选出符合条件的材料,成为了材料科学家发现新材料的重要手段。CEDER 等[44]通过高通量计算数千种复合物的充放电电压和理论容量的关系,再进行电子迁移能力、稳定性和安全性等条件的筛选,成功预测了安全性和充放电电压的关系,并预测了理想的电池正极材料。CASTELLI 等[45]通过稳定性、能带位置以及禁带宽度等条件对具有立方钙钛矿结构的共含有 52 种金属元素的 5400 种半导体氧化物及氮氧化物进行高通量筛选,成功识别现有的10种理想的氧化物和5种理想的氮氧化物,并预测出 9 种未知的组合材料作为高效率光解水材料。MADSEN 等[46]通过高通量方法在无机晶体结构数据库(ICSD)中的 570 种含锑元素的复合物中自动搜索新型热电材料,发现具有津特尔(Zintl)相的 LiZnSb 是一种理想的 n 型热电材料。

  (3)机器学习(machine learning) 近年来人工智能被越来越多地应用在各种领域,以期发现运用传统手段无法发现的现象和规律。CEDER 等[23] 通过贝叶斯概率统计方法,以无机晶体结构数据库中的晶体结构数据作为训练集(training set),晶体构型和元素种类作为模型的输入(input),在耗费少量计算资源的情况下发现了 209 种新型三元氧化物。CORMA 等[47]运用支持向量机(Support Vector Machine)的方法,以沸石合成过程中的合成变量(synthesis variables)作为模型的参数(反应初始凝胶的浓度、反应过程、温度和时间等),准确地预测出合成产物的结构特性和热动力学性质。

  (4)神经网络(neural network) 神经网络技术是一种模仿动物大脑中神经元行为特征并进行分布式并行信息处理的算法数学模型,通过调整内部大量节点之间的(非)线性的关系,达到处理复杂联系的目的。在材料学领域,也有种种变量之间的复杂关系需要探寻,如晶体的构效关系,材料合成过程中反应变量与产物之间的关系等。MAYYAS 等[48] 运用前向传播(forward propagation)技术,以铜的质量百分比和碳化硅的体积比例作为模型的输入,密度、孔洞率和硬度作为模型的输出,根据铝铜基的碳化硅的结构特性成功预测了化合物的物理性质。MORADI 等[49]通过人工神经网络(artificial neural network)和多重线性回归模型(multiple linear regression model),以电解质浓度、温度和施加电压等反映参数作为模型的输入,成功预测了纳米介孔阳极氧化铝的介孔间距。SCHERAGA 等[50]通过人工神经网络技术,在考虑多体极化效应的基础上,产生了液态水的力场,经过蒙特卡洛模拟(Monte Carlo simulation),与实验值十分吻合。

  (5)优化算法(optimization algorithm) 优化算法也已成为材料学家在化学空间中搜索新型复合物进行材料发现与设计的一种重要技术方法。常见的优化算法如遗传算法(genetic algorithm)、进化算法(evolutionary algorithm)和粒子群算法(swarm particle algorithm)等均已被应用于寻找能量最低的稳定晶体结构。WANG 等[51]运用差分进化算法(differential evolutionary algorithm)寻找低能量的稳定团簇结构,在耗费少量计算资源的情况下成功发现数十种钴单质团簇和铅单质团簇。HO 等[52]利用自适应遗传算法(adaptive genetic algorithm)发现了硅酸镁在分解过程中的多种相,并通过实验验证了这一发现。MA 等[31]开发了基于粒子群算法寻找能量最低结构的结构搜索程序 CALYPSO,并成功预测了高压条件下二氧化硅和碳酸钙的稳定相。

  尽管目前各种方法或方法组合在新能源材料研究领域都有成功的应用案例,但还远未达到材料基因组计划提出的初衷,主要表现在:其一系统性不强,当然这与材料基因组技术尚处于发展的初步阶段,还不能实现工具、手段、方法、数据、平台等的高度集聚和系统应用有关。其二各项技术发展还有待加强。如:① 对于性能要求非单一的材料研发,我们还不能完全通过计算来评估性能要求复杂的体系的材料性能;对于锂电池,其性能需要在各个方面优秀(容量、充放电速度、稳定性等),我们依然不能利用材料基因组高通量计算直观预测什么样的材料能做出来性能好的电池;② 对于全新材料的研发,我们的目前材料搜索还是基于现有的晶体数据库,在现有已经可以制备的材料中寻找具有某些性能的材料,或者仅仅做一些类似于化学掺杂的工作,这样就很难有革命性的成果;尽管现在已经有了一些利用遗传算法搜索材料结构的计算软件,但这些软件会消耗大量的计算资源,并且不能稳定地保证有新的材料找到。目前尚没有利用这些软件进行高通量筛选的计算技术;③ 对于实验的计算模拟,我们还不能通过材料基因组技术来预测实验过程,目前我们还没有成熟的计算模拟实验的方法,更多还是利用计算模拟对实验结果解释验证,需要融合高通量计算与高通量实验,发挥材料基因组技术的系统优势。

  3 材料基因组技术在新能源材料领域应用进展个案介绍

  自 2011 年 12 月“香山科学会议”以来,我国就已开始重视材料科学系统工程的发展,并在 2016 年首次在十三五期间设立国家“材料基因工程关键技术与支撑平台”重点专项计划。其中,“基于材料基因组技术的全固态锂电池及关键材料研发”项目已于 2016 年 8 月获得正式立项。该项目由北京大学深圳研究生院潘锋教授为项目负责人,联合国内 11 家在材料计算领域和锂电池领域具有很好研究基础的单位共同参与研发[28]。作为项目牵头单位,北京大学深圳研究生院新材料学院在新能源材料基因组技术和应用领域取得了一定的积累,并形成了系统化的研发路线图(图 1),已建设“北大新材料”公共服务的材料大数据平台网站,以合作、开放、共享理念,打造新能源材料基因组公共信息和数据服务平台和新能源材料测试评价公共服务平台。利用这些技术与资源,该团队在新能源材料领域和材料基因组技术应用领域初步取得一系列的成果。——论文作者:林 海,郑家新,林 原,潘 锋

回到顶部