2025年10月31日凌晨0时49分,上海市发生大面积的短时供电故障,导致我司(万申股份)服务的数十家机房市电瞬断。尽管市电供应很快恢复,但意外引发的物业大楼供水系统中断,对机房空调系统构成二次威胁。
故障发生时,部分机房的空调系统及依赖物业冷冻水的散热设施接入市电运行,导致机房温度持续上升,迅速突破28℃警戒线,环控平台发出高温警报,机柜散热效率急剧下降。

▲图为10月31日监控平台在市电中断后触发的温湿度告警,机房温度迅速飙升至30℃
面对这一突发紧急事件,万申运维支持团队迅速启动应急响应机制,组建3名现场工程师+3名远程工程师的“6人应急小组”配置,现场工程师第一时间前往不同区域的客户机房现场,其他工程师则提供远程支持,充分利用环控平台进行实时监控,确保对机房环境变化的精准掌握,实现“现场处置+远程支援”无缝衔接。

凌晨1时16分,现场工程师在接到指令后,携运维工具箱于30分钟内抵达客户机房,对UPS、空调告警迅速进行了应急处理。到达现场后,工程师密切关注UPS负载量及电池后备时间,确认电池续航能力,并严格遵守安全规程,避免手动切换至旁路供电模式,防止负载设备暴露于市电波动风险之下。所幸,万申为客户维保的UPS系统在此次事件中持续稳定运行,未出现服务中断。然而,部分机房的空调接入了市电,物业未及时恢复供电,导致空调停机。面对此类情况,工程师第一时间协调物业恢复供电,同时启用备用鼓风机增强空气流通,并谨慎打开机房门形成对流,紧急接入移动空调作为临时降温手段。
另一边,远程支持团队通过环控平台实时追踪温湿度、电压及报警状态变化,为现场人员提供数据支持。从凌晨1点到5点,他们在监控平台前连续4小时紧盯数据,确保每一条告警信息都及时反馈。

针对此次瞬间大批量故障的超极端情况的应急处理,充分展现了万申运维团队在突发情况下的快速响应能力和专业技术水平。“我们始终坚持客户至上,为客户提供稳定可靠的机房服务。”运维负责人表示,将继续优化应急响应机制,提升突发事件处置能力,为客户业务连续性提供坚实保障。
-------------------------------------------------------
转自 | “致达控股”公众号
编辑 | 上海万申信息产业股份有限公司