与大多数年份一样,2024年也发生了一系列IT灾难,其中一些在几天或几周内就被遗忘了,但另一些却产生了持久的影响,在一个案例中,损失高达数十亿美元。
对于本列表,我们主要忽略了数据泄露事件,对此类事件感兴趣的读者可以参考其他列表。我们已经发布了一份近期AI失败案例的列表,其中有几起就发生在过去一年。例如,快餐巨头麦当劳在6月弃用了一套基于AI的订餐系统,因为该系统不断错误地向顾客账单中添加食物。
IT灾难之母
7月中旬,网络安全供应商CrowdStrike的一个软件更新故障导致约850万台运行Windows的电脑崩溃至蓝屏死机,然后陷入重复的启动循环。陷入无尽启动循环的Windows电脑几乎毫无用处,只能用作门挡或镇纸。
医院、航班预订中心、应急响应中心和公共交通服务的Windows系统都受到了此次故障的影响。在初次报告24小时后,该故障仍导致数百个航班取消以及其他问题。据估计,此次中断造成的损失超过50亿美元。
CrowdStrike将此次故障归咎于其软件测试工具中的一个漏洞,该漏洞出现在7月19日发布给Windows系统的一个传感器配置更新中,该漏洞存在于一种名为Rapid Response Content的漏洞签名更新中,这种更新的测试严格程度低于CrowdStrike的其他一些更新。
此次故障的后续影响迅速且持续至今,该事件促使一些CIO重新考虑对云基础设施的依赖,也促使微软更加关注其他软件包的内核级访问权限。
与此同时,达美航空(Delta Airlines)对CrowdStrike和微软提起了一项5亿美元的诉讼,并重新考虑其对微软产品的使用。
数百万通话未接
虽然CrowdStrike的故障规模巨大,但在受影响数量上却被2月AT&T Mobility的服务中断事件所掩盖,该事件影响了美国1.25亿台移动设备。此次中断持续超过12小时,导致约9200万个通话无法完成,其中包括2.5万个911紧急通话,美国联邦通信委员会(FCC)表示。此次大规模中断的原因是设备配置错误。
AT&T用了近两个小时才回滚网络更改,但由于移动运营商的设备注册系统被大量重新注册请求淹没,全面服务的恢复至少用了12个小时,FCC称。
随后在6月,AT&T客户又报告了一次服务中断。据报道,6月4日下午1点(美国东部时间),服务中断的报告开始激增,然后在下午6点左右下降。纽约市、芝加哥、费城、达拉斯、匹兹堡和印第安纳波利斯周边地区显然受到了影响。
麦当劳的IT问题
除了那个认为顾客想要200多份麦乐鸡块的AI订餐系统外,麦当劳还遇到了更多IT问题。3月,一个影响信用卡订单(包括在线和自助终端支付)的大规模故障持续了约12个小时。
麦当劳在远东、欧洲、美国和澳大利亚的餐厅都报告了信用卡支付问题,问题归咎于令人畏惧的第三方配置更改,该公司的全球首席信息官没有提供详细信息,但指出此次中断与网络安全攻击无关。
第三方软件更新的危险
麦当劳并不是唯一一家遭受销售终端(POS)系统中断的公司。在英国,超市特易购(Tesco)和塞恩斯伯里(Sainsbury's)以及烘焙连锁店Greggs在麦当劳报告类似问题的同时,都遇到了由第三方运营的POS系统问题。在大多数情况下,问题在工作日内得到解决,但在此期间公司无法处理信用卡支付。
在某些情况下,受影响的公司报告称问题与软件更新有关,这引发了人们对第三方POS提供商可靠性的质疑。
聊天机器人失控
你会认为人们在同样的事情不断发生后应该会学到一些东西。2月,在社交媒体上出现有关其Copilot AI聊天机器人嘲讽考虑自杀的用户的报告后,微软对该聊天机器人展开了调查。微软发现,这些不良回应是提示注入攻击的结果,在这种攻击中,用户能够覆盖大型语言模型AI中的安全控制。微软表示,不良回应仅限于少数几个回复。
这不是微软第一个失控的聊天机器人。2023年初,与Bing捆绑在一起的一个AI聊天机器人开始向一些用户表达爱意,并侮辱其他用户,称他们丑陋并将他们比作希特勒。
早在2016年,微软在Twitter上放出的一个实验性AI聊天机器人Tay就表达了对种族灭绝和纳粹的支持。我们在这里感受到了一个趋势。
今年2月对Copilot的调查并不是微软AI助手遇到的唯一问题。11月,微软推出了新工具,以防止Copilot过度分享数据,如员工机密信息。
助学金闹剧
3月,美国教育部表示,发现数十万名大学生的助学金计算存在错误,导致助学金发放延迟。
教育部将问题归咎于为联邦政府工作的一家供应商错误地计算了助学金公式,影响了超过20万名学生。
这一计算错误发生在教育部对联邦学生资助免费申请(FAFSA)进行大修的同时,该申请用于确定学生是否符合联邦佩尔助学金(Pell Grant)和其他助学金的资格。
该供应商显然没有将一些资产(如投资)纳入一些学生的财务需求中,导致评分显示他们的财务需求比实际更高。
同时,教育部对FAFSA表格的大修也导致了助学金申请流程的延迟。虽然该表格通常在10月就可以填写,但直到12月底才准备好,教育部直到3月才开始处理表格并将其发送给各州和大学。在12月底至1月初期间,该表格只是零星可用。
教育部在处理表格时遇到了几个故障和漏洞,其中一个故障阻止了没有社会保险号的家长填写表格。
目前尚不清楚这些问题中有多少是纯粹的IT灾难,还是IT灾难与用户错误混合造成的,似乎两者兼而有之。
误伤友军
2月,中国PC制造商Acemagic承认出售的机器上安装了恶意软件。
这一承认是在YouTuber用户The Net Guy在测试Acemagic迷你PC时发现恶意软件后作出的,这些PC出厂时预装了Backdoor.Bladabindi恶意软件以及RedLine Stealer。
该公司在一份奇怪的解释中,将问题归咎于试图通过一些软件修改来缩短启动时间的开发人员。
真正的终结者
如你所料,英国邮局(Post Office)是一家政府运营的递送服务机构,其在2023年底至2024年初根据富士通(Fujitsu)构建的Horizon IT系统的建议解雇了700多名员工。事实证明,该IT系统错误地指控这些前员工从服务中盗窃资金,谎称他们控制的账户中资金缺失。
一些新闻报道称,早在1999年安装的Horizon系统并未与其邮局监管者共享已知错误的文档。此外,邮局员工多年来一直抱怨资金缺失的错误报告。
2023年,邮局曾试图摆脱Horizon并迁移到云端,但这一努力未能成功,还花费了3100万英镑。1月下旬,富士通被暂停参与英国政府合同的竞标。