联邦学习在自动驾驶汽车(AVs)开发中被证明是一个游戏规则改变者,特别是在跨越不同国家的情境下。这种创新方法允许使用多样化的数据来源和条件,这对于改进自动驾驶技术至关重要。根据NVIDIA 技术博客,联邦学习使自动驾驶汽车能够利用本地收集的数据来协同训练算法,保持数据的去中心化,同时增强隐私和安全性。
增强隐私和遵守法规
与需要集中数据存储的传统机器学习方法不同,联邦学习确保敏感数据留在其原始国家。这种方法不仅增强了隐私,而且遵守了各种国际数据保护法规,如欧盟的 GDPR 和中国的 PIPL。通过最小化数据移动,联邦学习帮助自动驾驶汽车在获取集体学习过程的同时,遵守这些法规。
NVIDIA 联邦学习平台
NVIDIA 使用开源框架 NVIDIA FLARE 开发了一个自动驾驶汽车联邦学习平台。该平台通过整合多个国家的数据来训练全球模型,从而解决了传统集中数据处理的监管和物流挑战。
部署设置包括两个联邦学习客户端和一个中央服务器,FL 服务器托管在日本的 AWS 上。该系统与现有的自动驾驶汽车机器学习基础设施集成,促进无缝数据处理和模型训练。
动机和用例
NVIDIA 自动驾驶汽车团队在全球范围内运营,从各个地区收集数据以增强自动驾驶汽车能力。处理来自多个国家的数据的必要性源于需要解决某些地方可能不存在的罕见用例。该平台支持物体检测和标志识别等任务,能够开发出一个统一的全球模型,其性能等于或优于特定国家的独立模型。
挑战和解决方案
实施全球 AI 模型涉及若干挑战,包括 IT 设置、网络带宽和中断。NVIDIA 通过在 AWS 上托管 FL 服务器并优化模型传输过程来解决这些问题。团队还实施了解决网络中断的方案,以确保培训课程不被打断。
项目状态和未来展望
自部署以来,该平台上的数据科学家人数从两位增加到三十位。NVIDIA 已成功利用此平台训练并发布了众多自动驾驶车型,在道路标志识别等任务中表现出色。
这种联邦学习方法不仅在不移动数据的情况下增强了模型训练,还确保了法规遵从性和成本效益。NVIDIA 在开发此平台中的策略可以应用于其他行业,如医疗保健和金融,进一步扩大了联邦学习应用的范围。
Image source: Shutterstock