事件概述
2021年2月10日UTC时间5:37至7:36期间,OKX交易平台出现网站访问与交易功能异常。技术团队通过紧急排查发现,此次异常由流量过载和认证服务中断引起,影响了网页端、移动端及API接口的正常服务。
经过工程师团队的紧急处理,所有功能于UTC时间7:36全面恢复。以下为事件详细时间线:
- 5:37 UTC:系统首次检测到异常。网页端和移动端的市场信息与交易深度数据无法显示,API接口间歇性返回“服务器错误”及“无效授权”提示
- 5:40 UTC:工程师确认故障原因为流量过载导致的认证服务中断及内部服务调用超时,并立即启动紧急修复程序
- 7:36 UTC:所有交易功能及市场信息显示完全恢复正常
系统稳定性保障体系
OKX始终致力于为用户提供24小时不间断的交易服务,并通过多层次技术架构确保系统的高稳定性和流畅性。尽管高性能交易系统存在复杂性和不可预见的异常情况,我们仍从以下方面持续优化系统稳定性,最大限度降低服务中断概率:
工程质量保障与测试体系优化
所有新功能代码需在模拟交易环境中稳定运行一段时间后方可上线,通过强化质量管控和测试体系,提前发现并解决潜在问题。
架构升级与高可用部署
通过实现多地多服务器的高可用部署,显著降低因硬件和软件问题导致的停机时间。分布式架构确保单点故障不影响整体服务连续性。
无状态热升级机制
采用无状态热升级技术,最大限度地减少系统升级对用户交易过程的影响,实现平滑过渡与零感知更新。
实时信息获取渠道
为确保用户及时掌握平台动态,OKX提供多种信息发布渠道:
- 故障通知:一旦检测到系统异常,我们将立即在状态页面发布故障通知
- 升级公告:如有计划内系统升级,我们不仅会在状态页面发布公告,还会通过市场和社区渠道(API用户社区+常规用户社区)通知用户。API用户可通过订阅System/Status频道获取更新通知
常见问题
此次服务中断具体影响了哪些功能?
在此期间,网页端和移动端的市场信息展示、交易深度数据查询功能受限,API接口出现间歇性错误提示。核心交易功能也受到一定程度影响,但资金安全系统始终保持正常运作。
OKX如何预防类似事件再次发生?
我们通过三重保障机制提升系统稳定性:强化工程质量管控体系、实施多地多服务器高可用架构升级、采用无状态热升级技术。这些措施能显著降低因流量激增或系统升级导致的服务中断风险。
用户如何及时获得平台状态更新?
建议用户关注官方状态页面,该页面提供实时系统状态通报。API用户还可订阅系统状态频道获取即时通知,普通用户可通过社区渠道接收重要公告。
遇到系统异常时用户应该怎么做?
建议首先查看状态页面确认是否为已知问题。如遇交易问题,请避免频繁操作并保留相关截图,必要时联系客服团队提供详细信息以便快速定位问题。
通过持续的技术优化和透明的信息披露机制,我们致力于为用户提供更加稳定可靠的交易体验。每一次事件都是我们改进的动力,推动我们不断升级系统架构和服务质量。