Sui 主网最近因技术故障经历了重大中断,导致网络操作停止数小时。根据 Sui 基金会的说法,此事件发生在 2024 年 11 月 21 日凌晨 1:15 至 3:45 之间,涉及一个崩溃循环影响了所有验证者,妨碍了任何交易处理。
了解事件
问题来自于拥塞控制代码中的一个错误,特别是assert!
语句,当估计执行成本为零时触发崩溃。此问题与TotalGasBudgetWithCap
模式有关,该模式在协议版本 63 中被短暂启用,并在版本 68 中重新引入。当网络接收到一个具有可变共享对象输入和零MoveCall
命令的交易时,此错误显现,导致所有验证者崩溃。
拥塞控制的角色
Sui 网络中的拥塞控制对于管理共享对象的交易率至关重要,确保网络不会过载。此系统最近进行了升级,以通过准确估算交易复杂性来增强共享对象的利用率。然而,此升级无意中引入了导致中断的错误。
解决方案和响应
在确认问题后,Sui 工程师迅速制定了一个修复方案。详细的修正代码在PR #20365中,分别在主网和测试网以版本 v1.37.4 和 v1.38.1 部署。快速部署得益于验证者社区的出色响应,使得网络在发布修复后 15 分钟内恢复运营。
教训和未来改进
此次事件强调了 Sui 的事件检测和响应机制的有效性。自动警报迅速通知了工程师,他们与验证者社区合作快速解决了问题。展望未来,Sui 计划增强其测试系统以防止类似错误,并简化其构建工作流程以减少事件响应时间。
有关更多详细信息,请访问 Sui 基金会。
Image source: Shutterstock