Meta联合发布OMol25数据集与UMA模型,AI助力全球化学创新
5 月 16 日消息,Meta AI 公司于 5 月 14 日发布博文,发布了全新化学数据集 Open Molecules 2025(OMol25)以及通用原子模型 Universal Models for Atoms(UMA)。
OMol25 数据集:化学研究新利器
OMol25 是迄今为止规模最大的分子模拟数据集,由 Meta 与美国能源部劳伦斯伯克利国家实验室(Berkeley Lab)联合打造,该数据集包含超过 1 亿个 3D 分子快照,基于密度泛函理论(DFT)计算而成。
DFT 是一种强大的工具,能精确模拟原子间相互作用,帮助科学家预测每个原子的受力及系统能量,从而揭示分子运动和化学反应的规律。
传统的 DFT 计算需要巨大的计算资源,随着分子规模增大,计算需求呈指数级增长,使用最先进的计算设备,也难以模拟现实世界中复杂的分子系统。
基于 DFT 数据训练的机器学习原子间势(MLIPs)能以快 1 万倍的速度提供同等精度的预测,让科学家能在普通计算系统上模拟大型原子系统。OMol25 作为化学多样性最高的分子数据集,为训练 MLIPs 提供了前所未有的数据支持。
UMA 模型:通用预测工具问世
Meta 公司还推出 UMA,是一个基于过去五年 Meta FAIR 公开数据集构建的通用原子间势能模型群,覆盖分子、材料、触媒等化学领域,利用超过 50 亿个原子组成的 3D 结构作为训练数据。
UMA 分为 UMA-small 和 UMA-medium 两种规模,采用“Mixture of Linear Experts”创新架构,其中 UMA-medium 模型拥有 14 亿参数,但单结构计算仅用约 5000 万参数,加快推理速度。
UMA 模型无需微调,仅通过预训练即可应对多种化学任务,性能媲美甚至超越现有专用模型。研究表明,UMA 在分子特性预测、材料设计、触媒开发、能量存储及半导体制造等领域表现出色,高精度与快速计算能力为科学研究和工业应用开辟了新路径,推动跨领域技术革新。
【来源: IT之家 】