NTT立刻对事故原因进行了调查。根据5月16日发布会议上的消息,事故原因起始于设置在东京的藏前的一台路由器。具体情况是,15日晚,该路由器发生故障,于是工作人员用备用路由器将其换下。这一设备交换导致网络结构改变,因此网络上的其余4000多台路由器都会更新路由表。到这里为止都是正常的维护步骤。
但是,这一路由表的更新却因此了重大的后果——大规模路由更新导致路由器达到了其处理能力的上限,于是整个IP网络就瘫痪在来不及处理的拥塞之中了。NTT在发现这一问题之后立即通过重新启动路由器等方法进行恢复,终于在午夜1点半左右全部恢复。
为避免今后再次发生类似问题,NTT公司公布了如下对策:一是减少路由器的路由信息以求降低负载,把每台路由器管理的路由信息从1万5千条降低到1万3千条。此外,对于路由器软件版本较旧导致处理性能不佳的,通过更新软件版本提高处理能力。
NTT公司的副社长和高层官员在说明会上进行了谢罪。但是并不会因为本次事故对用户进行赔偿或退款,因为协议上规定的是24小时以上服务中断时返还费用。
***技术内容的BLOG已经转到CodeSoil,欢迎前来参观。