Awaria serwisu CrowdStrike, która miała miejsce w piątek, wstrząsnęła światem biznesu i wpłynęła na firmy na całym świecie.
Nieoczekiwane wydarzenie sparaliżowało wiele operacji, podkreślając kluczową rolę, jaką infrastruktura cyberbezpieczeństwa odgrywa w naszym połączonym cyfrowym życiu.
Podczas gdy organizacje gorączkowo starają się poradzić sobie ze skutkami tego zdarzenia, przyjrzyjmy się szczegółom tego dalekosiężnego incydentu.
Jak doszło do awarii CrowdStrike?
Awaria CrowdStrike wynika z problematyczna aktualizacja czujnika Falcon firmykluczowy element ich pakietu cyberbezpieczeństwa. Ta wadliwa aktualizacja spowodowała powszechne awarie systemu, szczególnie na komputerach z systemem Windows.
Problem objawia się jako Niebieski ekran śmierci (BSOD), uniemożliwiając prawidłowe uruchomienie komputerów i wpędzając je w pętlę odzyskiwania.
CrowdStrike, lider w dziedzinie ochrony punktów końcowych i wywiadu zagrożeń, szybko zauważył problem. Zgłosili, że otrzymali liczne alerty dotyczące Okna awarii hosta związanych z czujnikiem Falcon w wielu wersjach.
Ten firma zidentyfikowała już przyczynę źródłową i rozpoczął proces wycofywania problematycznej aktualizacji na skalę globalną.
Wpływ obejmuje różne branże
Zasięg awarii CrowdStrike wykracza daleko poza pojedynczy sektor, dotykając firm w różne branże na całym świecie. Banki, linie lotnicze, nadawcy telewizyjni i supermarkety to tylko niektóre z wielu organizacji zmagających się ze skutkami tej technicznej wpadki.
W Australii gigant telekomunikacyjny Telstra zgłosiła zakłócenia w działaniu niektórych swoich systemów z powodu globalnych problemów mających wpływ na firmy CrowdStrike i Microsoft.
Jeśli masz problemy z nawiązaniem z nami kontaktu dziś po południu, jest to spowodowane globalnym problemem dotyczącym zarówno Microsoftu, jak i CrowdStrike.
Nie ma to wpływu na połączenia do naszych centrów telefonicznych Triple Zero ani do naszej sieci stacjonarnej i komórkowej.
— Telstra (@Telstra) 19 lipca 2024 r.
Po drugiej stronie oceanu, w Europie, gdy firmy zaczynały swój dzień pracy, problemy zaczęły się tam również pojawiać. Nadawca brytyjski Wiadomości Sky nie mogła emitować porannych serwisów informacyjnych i została zmuszona do przeprosin za przerwanie transmisji.
PILNE: Przedsiębiorstwa takie jak banki, linie lotnicze, firmy telekomunikacyjne, stacje telewizyjne i radiowe, a także supermarkety zostały wyłączone z użytku po masowej awarii zasilania na całym świecie.
Czytaj więcejhttps://t.co/JOhk3lwVq7
— Sky News (@SkyNews) 19 lipca 2024 r.
Branża lotnicza została szczególnie dotknięta awarią CrowdStrike. Ryanairjedna z największych linii lotniczych w Europie, ogłosiła, że ma problem z IT „strony trzeciej”, który wpływa na odloty. W Stanach Zjednoczonych Federal Aviation Administration poinformowała, że loty linii Delta, United i American Airlines zostały uziemione z powodu „problemu z komunikacją”. Nawet lotnisko w Berlinie ostrzegało podróżnych o potencjalnych opóźnieniach wynikających z problemów technicznych.
Jeśli masz dziś podróżować i jeszcze nie odprawiłeś się na lot, możesz to zrobić na lotnisku. Przepraszamy za wszelkie niedogodności spowodowane tą globalną awarią IT strony trzeciej.
— Ryanair (@Ryanair) 19 lipca 2024 r.
CrowdStrike przedstawia kroki pozwalające przezwyciężyć ten problem
Gdy zespoły IT na całym świecie stawiają czoła temu wyzwaniu, stają przed trudnym zadaniem. Awaria CrowdStrike spowodowała, że wiele organizacji ma znaczną część komputerów wyłączonych i zablokowanych w pętli rozruchowej. Niektóre firmy zgłaszają, że cała ich sieć jest wyłączona, podczas gdy inne radzą sobie z aż 70% ich laptopów jest bezużytecznych.
CrowdStrike ma pod warunkiem, że A obejście problemu dla dotkniętych maszynJednak jego wdrożenie na dużą skalę wiąże się z pewnymi przeszkodami.
Oto co powinieneś zrobić, jeśli awaria CrowdStrike dotknęła również Ciebie:
- Uruchom system Windows w trybie awaryjnym lub środowisku odzyskiwania systemu Windows
- Przejdź do katalogu C:WindowsSystem32driversCrowdStrike
- Znajdź plik odpowiadający „C-00000291*.sys”
- Usuń ten plik
- Uruchom hosta normalnie
Procedura ta może być szczególnie kłopotliwa w przypadku serwerów w chmurze lub zdalnie zainstalowanych laptopów z systemem Windows.
Chociaż CrowdStrike dokłada wszelkich starań, aby rozwiązać ten problem i udzielić pomocy poszkodowanym klientom, incydent ten rodzi pytania o potencjalne luki w zabezpieczeniach powszechnie stosowanych rozwiązań zabezpieczających.
Naprawiono odpowiednik globalnej awarii Microsoft
Podczas gdy awaria CrowdStrike nadal powoduje powszechne zakłócenia, Microsoftowi udało się rozwiązać poważną awarię usług w chmurze, która miała miejsce równolegle. Ten podwójny incydent uwypukla kruchość naszej infrastruktury cyfrowej i dalekosiężne konsekwencje, gdy krytyczne systemy zawodzą.
Awaria Microsoftu dotknęła przede wszystkim klientów w regionie Central US, powodując problemy z wieloma usługami Azure i pakietem aplikacji Microsoft 365. Użytkownicy doświadczyli awarii w operacjach zarządzania usługami, problemów z łącznością i ograniczonej dostępności różnych narzędzi opartych na chmurze.
Jedną z usług, których dotyczył ten problem, była popularna platforma komunikacyjna Teams, co jeszcze bardziej skomplikowało działalność biznesową wielu organizacji.
Odpowiedź Microsoftu na awarię była szybka. Firma szybko zidentyfikowała przyczynę i pracowała pilnie nad przywróceniem usług. W ciągu zaledwie kilku godzin ogłosili, że większość dotkniętych awarii usług została odzyskana.
Zauważyli jednak, że niewielka część usług może nadal odczuwać skutki zakłóceń, a niektórzy klienci w dotkniętym regionie mogą nadal mieć problemy.
Podkreśla ona również delikatną równowagę między terminowym publikowaniem aktualizacji chroniących przed nowymi zagrożeniami a zapewnieniem, że aktualizacje te nie spowodują nowych problemów.
Gdy kurz opadnie po awarii CrowdStrike, organizacje prawdopodobnie ponownie ocenią swoją zależność od rozwiązań jednopunktowych i rozważą dywersyfikację swoich strategii cyberbezpieczeństwa. Incydent ten stanowi cenne doświadczenie edukacyjne zarówno dla dostawców usług, jak i ich klientów, podkreślając potrzebę dokładnego testowania, protokołów szybkiego reagowania i jasnych kanałów komunikacji podczas takich kryzysów.
Źródło wyróżnionego obrazu: CrowdStrike