麻省理工学院研究揭示AI在保护关键基础设施中的潜力

realtime news Aug 27, 2024 03:58 UTC 19:58

1 Min Read

根据麻省理工学院 (MIT) 的一项新研究，大型语言模型 (LLMs) 正成为保护可再生能源、医疗保健和交通等关键基础设施系统的重要工具。

该研究介绍了一种零样本LLM模型，用于检测复杂数据中的异常。通过利用AI驱动的诊断来监控和标记风力涡轮机、核磁共振成像 (MRI) 设备和铁路设备等设备的潜在问题，这种方法可以降低运营成本、提高可靠性、减少停机时间，并支持可持续的行业运营。

该研究的资深作者Kalyan Veeramachaneni表示，使用深度学习模型检测基础设施问题需要大量时间和资源来训练、微调和测试。机器学习模型的部署需要机器学习团队（负责训练）和操作团队（负责监控设备）之间的紧密合作。

“相比之下，LLM是即插即用的。我们不需要为每个新的数据流创建一个独立的模型。我们可以直接将LLM部署在流入的数据上，” Veeramachaneni说道。

研究人员开发了SigLLM，一个将时间序列数据转换为文本进行分析的框架。然后使用GPT-3.5 Turbo和Mistral LLM来检测模式异常并标记系统中可能表示潜在操作问题的异常。

团队在11个不同的数据集上评估了SigLLM的性能，这些数据集包含492个单变量时间序列和2,349个异常。多样化的数据来自包括NASA卫星和Yahoo流量在内的广泛应用，具有不同的信号长度和异常。

两块NVIDIA Titan RTX GPU和一块NVIDIA V100 Tensor Core GPU负责处理运行GPT-3.5 Turbo和Mistral进行零样本异常检测的计算需求。

图1：SigLLM框架中的异常检测方法发现原始信号和预测信号之间的差异，作为存在异常的标志

研究发现，LLM能够检测异常，与传统的检测方法不同，SigLLM利用了LLM在模式识别中的内在能力，无需广泛的训练。然而，专业的深度学习模型的性能比SigLLM高出大约30％。

“我们惊讶地发现，基于LLM的方法比某些基于深度学习的变压器方法表现更好，” Veeramachaneni指出，“不过，这些方法并不像当前最先进的模型，例如带回归的自编码器 (AER) 那样好。我们还有一些工作要做才能达到那个水平。”

该研究可能代表着在AI驱动的监控方面迈出了重要一步，具有高效异常检测的潜力，尤其是在进一步改进模型的情况下。

Veeramachaneni表示，一个主要的挑战是如何在保持LLM优势的同时，使方法具有足够的鲁棒性。团队还计划研究LLM如何在未进行微调的情况下有效预测异常，这将涉及用各种提示测试LLM。

研究中使用的数据集可在GitHub上公开获取。

在NVIDIA技术博客上阅读完整故事。

Read More