这被视为一次重大的全球IT系统崩溃事件,对各行业企业产生了广泛影响。其源头来自网络安全服务提供商 CrowdStrike。

这被视为一次重大的全球IT系统崩溃事件,对各行业企业产生了广泛影响。其源头来自网络安全服务提供商 CrowdStrike。

ถือเป็นเหตุการณ์ ระบบไอทีล่ม ครั้งใหญ่ของโลก ส่งผลกระทบเป็นวงกว้างในภาคธุรกิจต่างๆ โดยมีต้นเหตุมาจาก คราวด์สไตรก์ (CrowdStrike) ผู้ให้บริการระบบรักษาความปลอดภัย ทางไซเบอร์

这被视为一次重大的全球IT系统崩溃事件,对各行业企业产生了广泛影响。起因是网络安全服务提供商CrowdStrike在对其Falcon Sensor软件进行内容更新时出现故障,导致使用Windows操作系统的用户遭遇蓝屏现象,即所谓的“蓝屏死机”(Blue Screen of Death, BSoD)。

这一事件对“数字化时代”意味着什么,一个高度依赖信息技术运行的社会和企业该如何应对?《新闻报》就此采访了网络安全专家Dr. Pirinya Homnark,E-Sis Professional Center有限公司的首席执行官,也是国家网络安全委员会的资深顾问。

自Y2K以来最严重的冲击
Dr. Pirinya Homnark指出,这是自2000年千禧虫问题(Y2K)以来最剧烈的事件。尽管软件病毒更新或补丁导致的蓝屏现象并不新鲜,但近期由于Windows 10和11系统表现良好,许多人可能已经忘记这类事件可能发生。如今,我们的世界不仅仅有独立的计算机,还有云中的Windows实例,这些实例一旦复制成千上万份,任何运行在云中的Windows实例在更新后出现问题,都可能导致整个云服务重启并显示蓝屏,使相关计算机无法正常运作。

实时业务遭受重创
Dr. Pirinya进一步表示,此次事件中受影响最大的是实时运营的业务,尤其是CrowdStrike的客户,包括银行、航空公司、医院等大型机构,它们需要不间断地为客户提供服务。虽然客户没有直接因为电脑崩溃而未获得服务,但对公司的损害可能远不止于此,只是非实时业务的影响不那么明显。因此,这次事件提醒我们,在IT系统崩溃时,必须考虑业务连续性,仅关注网络安全已不够,因为安全问题涉及黑客攻击,而购买了网络保险也仅在被攻击时赔付。但这次是系统更新自身出错,损失该由谁来承担?

损失估计达数十亿,影响超1000万台电脑
公司首席执行官还观察到,令人深思的是,像CrowdStrike这样的国际IT巨头以及美国上市公司微软,为何会让此类事件发生?在软件更新发布前是否未进行充分测试?每个公司都有自己的实验室,拥有所有版本的Windows进行测试,为何还会发生这种错误?

过去,第三方需自行测试产品,通过在系统上安装Windows进行验证,但今后,鉴于微软可能会要求再次进行内部测试以双重确认软件不会影响其自身产品,这表明微软也因此次非自家系统或产品的问题而受损。

个人估计,企业所受损失可能超过千亿泰铢,受影响的电脑数量超过1000万台。至于谁来承担责任,CrowdStrike和微软似乎并未因这起意外事件向客户赔偿,称其为极端情况,是任何人都不想看到的。

建议不要设置自动更新所有设备
Dr. Pirinya还建议,让计算机系统自动进行所有更新可能导致全面系统故障。应采用部分或某些设备先行更新的策略,例如机场的10台计数器电脑用于办理登机手续,可先在5台上更新,若无问题再全面推广。遵循“网络弹性”原则,无论发生什么事件,系统都应能迅速恢复常态运行。

举例来说,如果电影票务系统故障,电影院仍可通过人工售票继续营业;高速公路电子收费系统不畅,可以现金支付。因此,必须事先规划,如系统更新前是否应先部分实施,以防止整个系统同时瘫痪且无备用方案可用的情况。

修复工作需逐台处理
最后,Dr. Pirinya表示,修复受影响的计算机主要靠设备所有者或企业自行处理,需要逐台删除特定文件,依据CrowdStrike的指南操作,这将产生额外成本,谁来承担呢?这是企业IT部门需要自己解决的问题,CrowdStrike可能不会提供上门服务,成本需由企业自行分担。

Jirawat Jarupan

**问题与答案**

1. **什么是“蓝屏死机”(BSoD)?**
– 答案:蓝屏死机(Blue Screen of Death, BSoD)是指Windows操作系统在遇到严重错误时,屏幕变成蓝色,并显示错误信息,导致系统停止响应,需要重启才能恢复。

2.. **这次全球IT系统崩溃的起因是什么?**
– 答案:起因是网络安全服务提供商CrowdStrike在更新其Falcon Sensor软件时发生故障,影响了使用Windows操作系统的用户,导致他们遇到蓝屏现象。

3. **这次事件与Y2K问题有何关联?**
– 答案:Dr. Pirinya Homnark指出,这是自2000年千禧虫问题(Y2K)以来对全球IT系统最严重的一次冲击,两者都是由技术问题引发的大规模系统故障。

4. **实时运营的业务如何受到这次事件的影响?**
– 答案:实时运营的业务,特别是CrowdStrike的客户如银行、航空公司、医院等,虽然客户可能未直接因电脑崩溃而未得到服务,但公司的声誉、运营效率和潜在经济损失巨大。

5. **为什么这次事件提醒企业要重视业务连续性计划?**
– 答案:因为仅关注网络安全已不足以应对所有风险,系统更新自身出错造成的损失同样巨大,企业需确保在IT系统遇到任何故障时,业务能够持续运行。

6. **预计这次事件造成的损失有多大,影响了多少台电脑?**
– 答案:据估计,企业所受损失可能超过千亿泰铢,受影响的电脑数量超过1000万台。

7. **CrowdStrike和微软是否对客户进行了赔偿?**
– 答案:CrowdStrike和微软没有因这次意外事件向客户赔偿,他们将其归咎于极端情况,表示这是任何人都不想看到的结果。

8. **Dr. Pirinya对于系统更新提出了什么建议?**
– 答案:他建议不要让所有设备自动更新,而应采取逐步更新策略,先在部分设备上测试更新,确保无误后再全面推广,以增强系统韧性。

9. **修复受影响的计算机需要怎么做?**
– 答案:修复工作需要设备所有者或企业逐台进行,包括删除特定文件并遵循CrowdStrike提供的指南,这会带来额外的成本负担。

10. **企业如何应对类似系统崩溃的意外事件?**
– 答案:企业应预先规划,比如实施部分更新策略,确保有备份方案可用,如人工替代方案,以及考虑如何分摊修复成本,提升自身的网络弹性和应急响应能力。

泰语原文链接:https://www.dailynews.co.th/news/3666334/