Omar M. Yaghi课题组,最新Nature Reviews Materials!
大语言模型(LLMs)诸如ChatGPT,DeepSeek等,作为生成式人工智能的一种,已在多个科学领域展现出巨大的潜力。近日, 加州大学伯克利分校的 Omar M. Yaghi 课题组发表了一篇题为 Large language models for reticular chemistry(大语言模型助力网状化学)的观点文章。该研究探讨了大语言模型在网状化学(Reticular Chemistry)中的应用前景,强调其在文献挖掘、MOF与COF材料设计、实验数据分析等方面的潜在变革作用。文章采用教程式(tutorial-style)的方式,帮助零基础的AI初学者快速学习核心概念,以及用具体案例帮助掌握大语言模型在这些化学与材料实验任务中的实际应用。图1:各类框架材料三十年以来文章与结构增长趋势体现了其结构的复杂多样性与数据量的庞大,侧面反映了该领域内数据挖掘的巨大需求与潜力。网状化学是通过强共价键连接分子单元以形成金属-有机框架(MOFs)、共价有机框架(COFs)等晶态扩展结构的科学。传统上,该领域依赖经验驱动的“合成-表征-应用”模式,但受限于试错法的低效率和可扩展性问题。LLMs 作为自然语言处理和知识整合工具,可帮助科学家从庞杂的文献中提取有价值的信息,预测合成路线,并自动解析实验数据,从而加速科学发现。 文章通过结合2023年以来该领域的相关工作,系统地教学如何将大语言模型用于日常科研与融入课题中。例如,(1)文献挖掘方面,LLMs 可自动提取 MOFs 和 COFs 的合成参数、拓扑结构等,提高实验方案制定效率。(2)在合成预测中,通过提示工程、工具增强和微调,LLMs 可优化材料合成预测,并结合计算模拟评估材料性能。(3)在自动化实验方面,LLMs 在智能实验室中可自主规划实验步骤,优化材料表征流程,提高研究效率。图3:大语言模型用于MOF的自动文献阅读与合成数据挖掘。文章同样指出,尽管 LLMs 具有广阔前景,但仍面临幻觉信息、计算成本高、化学数据库构建等挑战。研究者需进一步探索其在材料科学中的应用,以加速新材料的发现和优化。这一研究工作最近在线发表在国际学术期刊Nat. Rev. Mater.(DOI: 10.1038/s41578-025-00772-8)上,郑志凌博士为该论文的第一作者,Omar Yaghi教授为通讯作者。 Zheng, Z., Rampal, N., Inizan, T.J. et al. Large language models for reticular chemistry. Nat Rev Mater (2025). https://doi.org/10.1038/s41578-025-00772-8