例行维护后引起的故障

类似的事情听过不是一次两次了,今天看到 robbin 在推上的留言。觉得很有意义,特别记录一下,时刻提醒自己。在日后架构设计和维护规范上应当通过合理的手段避免类似的事故发生。 robbin 原推如下: @robbinfan: 昨晚JE所在机房切换电源关机导致网站无法访问。早上恢复后因为数据库和缓存服务器都被清空,巨大流量(QPS将近400,并发连接到1000)直接冲击导致web服务被阻塞,现在正在逐步恢复中。