服务器宕机造成英国航空史上最严重的大混乱

简介:

英国国家航空服务公司(NATS)在去年12月份发生一起严重事故。由于其两条系统航班服务器通道均发生故障,导致数百架航班无法起飞。

服务器宕机造成英国航空史上最严重的大混乱

据一份内部报告显示,此次混乱共造成120架航班被取消,500架航班被耽搁了45分钟,总共影响约10000万名旅客。

据内部人员透露,此次事故的发生是一台运行航班数据处理系统的IBM S/390主机宕机造成的。内部报告显示,在14点44分,一台为航空指挥控制人员提供数据的计算机发生故障;14点45分,所有离开伦敦机场的航班被叫停;15点整,整个欧洲所有计划经过英国领空的航班被叫停。在当天的20点10分,系统才恢复正常。

所有伦敦区域的操控人员都有着一个唯一的身份标识--原子函数(Atomic Function),其确保航班服务器系统给每个工作站提供正确的信息和通信保障。但系统中某个潜在的漏洞导致原子函数的最大值被错误的设置成151,而正确的数字是193.

报告显示,航班服务器系统认为它有着比原子函数的最大值更大的上限,而这种情况是不允许出现的。当出现这种情况时,航班服务器系统就会自动关闭,以防止提供错误的数据给工作站。当这种情况传送到第二套运行观察模式的航班服务器系统时,触发了同样的错误。

NATS否认对其忽略IT系统投入的指控,该公司于2001年成为与英国政府公私合营伙伴关系的企业。

该起事故的最终报告将会在2015年2月14日前发布。

作者:Recco


来源:51CTO


相关文章
|
弹性计算 运维 安全
《幻兽帕鲁》服务器再次宕机?自建服务器教程来了
《幻兽帕鲁》服务器再次宕机?自建服务器教程来了,如何自建幻兽帕鲁服务器?基于阿里云服务器搭建幻兽帕鲁palworld服务器教程来了,一看就懂系列。本文是利用OOS中幻兽帕鲁扩展程序来一键部署幻兽帕鲁服务器,阿里云百科分享官方基于阿里云服务器快速创建幻兽帕鲁服务器教程
160 0
|
弹性计算 JSON 运维
阿里云ECS实例运维属性-如何控制实例的宕机表现
介绍如何通过运维属性指定阿里云ECS的宕机运维表现等
|
监控 Linux Shell
"揭秘!一键掌控Linux服务器健康的秘密武器——超实用系统检查脚本,让你的服务器稳如老狗,告别宕机烦恼!"
【8月更文挑战第14天】服务器宕机或资源耗尽会严重影响业务。为此,你需要一个Linux系统检查脚本来守护服务器健康。它可以自动检测潜在问题如磁盘满载、内存泄漏等,避免服务中断。脚本应包括磁盘空间、内存/CPU使用、系统时间准确性、关键服务状态及系统日志分析等检查项。通过编写并定期运行这样的脚本,可以显著提高服务器的稳定性和可靠性。
291 1
|
Prometheus 监控 Cloud Native
Java 服务挂掉,服务器异常宕机问题排查
Java 服务挂掉,服务器异常宕机问题排查
2727 1
|
安全 Java 数据中心
Confluence 数据中心和服务器中的严重漏洞 CVE-2023-22515
Confluence 的开发者 Atlassian 已承认此漏洞,并将其归类为损坏的访问控制问题。他们强调需要立即采取行动,并建议用户升级到最新版本以保护他们的系统。Atlassian 将该漏洞的严重级别评定为 Critical CVSS 10。
274 0
ECS服务保活和宕机启动
学习ECS服务保活、宕机启动的配置方法,并体验其实现效果。通过应用程序配置保活和宕机启动策略,可以确保关键服务在遇到各种问题时保持运行,从而为用户和企业提供稳定和可靠的服务。
关于服务器内存溢出导致宕机的总结
关于服务器内存溢出导致宕机的总结
222 0
Java 最常见的面试题:集群中有 3 台服务器,其中一个节点宕机,这个时候 zookeeper 还可以使用吗?
Java 最常见的面试题:集群中有 3 台服务器,其中一个节点宕机,这个时候 zookeeper 还可以使用吗?
|
前端开发 Java Linux
Java服务器宕机解决方法论(上)
Java服务器宕机解决方法论(上)
892 0
Java服务器宕机解决方法论(上)
|
云安全 弹性计算 前端开发

热门文章

最新文章