Montai Therapeutics 是一家由 Flagship Pioneering 创立的公司,通过与 NVIDIA 合作开发的多模态 AI 平台,在药物发现领域取得了重大进展。据 NVIDIA 技术博客 介绍,该创新平台使用 NVIDIA NIM 微服务来解决计算机辅助药物发现的复杂问题。
多模态数据在药物发现中的作用
药物发现的目的是开发能够有效针对疾病的新治疗剂,同时尽量减少对患者的副作用。使用多模态数据——如分子结构、细胞图像、序列和非结构化数据——在识别新颖且安全的药物候选物方面非常有价值。然而,创建多模态 AI 模型面临挑战,包括需要对齐多种数据类型并管理大量计算复杂性。确保这些模型有效地使用所有数据类型的信息而不引入偏差是一个重要的难题。
Montai 的创新方法
Montai Therapeutics 使用 NVIDIA BioNeMo 平台克服这些挑战。Montai 创新核心在于聚合并策划全球最大、完整注释的现代分子化学库。Anthromolecules 指的是经过严格审查的人类在食物、补品和草药中消费的生物活性分子的集合。与传统的合成组合化学库相比,这种多样化的化学来源提供了更大的化学结构多样性。
Anthromolecules 及其衍生物已被证明是各种疾病的 FDA 批准药物来源,但它们在系统药物开发方面仍未被充分利用。这种多样化化学的丰富拓扑结构提供了更广泛的向量来精确和选择性地作用于复杂生物学,有望为那些传统上难以开发药物的目标打开小分子药丸解决方案。
创建多模态 AI 平台
在最近的一次合作中,Montai 和 NVIDIA BioNeMo 解决方案团队开发了一种多模态模型,旨在通过现代分子源虚拟识别潜在的小分子药物。该模型建立在 AWS EC2 上,训练于多个大型生物数据集。它采用了 NVIDIA BioNeMo DiffDock NIM,一种用于盲分子对接姿态估计的最先进生成模型。BioNeMo DiffDock NIM 是 NVIDIA NIM 的一部分,这是一组易于使用的微服务,旨在加速生成式 AI 在云、数据中心和工作站中的部署。
此次合作在对比学习基础模型的背骨架上实现了显著的模型架构优化。初步结果令人鼓舞,该模型在分子功能预测方面显示出优于传统机器学习方法的性能。多模态模型统一了四种模态的信息:
- 化学结构
- 表型细胞数据
- 基因表达数据
- 关于生物途径的信息
这四种模态的综合使用产生了一种优于单一模态模型的模型,展示了对比学习和基础模型范式在 AI 药物发现领域的好处。
通过整合这些多样化的模态,该模型将有助于 Montai Therapeutics 更有效地通过其 CONECTA 平台识别有前景的药物开发领先化合物。这个创新的药物操作系统促进了从大量未开发的人类化学中可预测地发现变革性的小分子药物。
未来方向
目前,合作努力集中在结合第五种模态“对接指纹”,这来自 DiffDock 预测。NVIDIA BioNeMo 在扩展推理过程中的作用至关重要,能够更高效地计算。例如,在 8 个 NVIDIA A100 Tensor Core GPU 上,DiffDock 在 DUD-E 数据集上的处理速度达到每个配体 0.76 秒(40 个姿态每个配体)。
这些进展强调了在药物筛选中高效使用 GPU 的重要性,并突出了 NVIDIA NIM 和多模态 AI 模型的成功使用。Montai 和 NVIDIA 之间的合作代表了向更有效和更高效的药物发现过程前进的关键一步。
了解更多关于 NVIDIA BioNeMo 和 NVIDIA BioNeMo DiffDock NIM 的信息。
Image source: Shutterstock