29 października 2025 r. firma Microsoft doświadczyła poważnej awarii platformy Azure, która rozpoczęła się około południa, zakłócając działanie usług, w tym Microsoft 365, Xbox i Minecraft. Problem wynikał z problemów z Azure Front Door, wpływających na dostępność i dostęp do Azure Portal, podczas gdy w ramach dochodzeń sprawdzano zaangażowanie systemu nazw domen. Awaria miała wpływ na konsumentów i firmy zależne od infrastruktury platformy Azure. Użytkownicy platformy Microsoft 365 zgłaszali problemy z pocztą e-mail, narzędziami do współpracy i aplikacjami zwiększającymi produktywność. Gracze Xbox napotkali problemy z logowaniem i przerwy w świadczeniu usług podczas sesji gier online. Serwery Minecrafta napotkały problemy z łącznością, wstrzymując rozgrywkę wieloosobową wielu użytkowników na całym świecie. Ucierpiała również działalność biznesowa, a wśród podmiotów dotkniętych tym problemem znalazły się linie lotnicze Alaska Airlines. Linia lotnicza zgłosiła zakłócenia w swoich systemach, które potencjalnie opóźniły obsługę klienta i procesy wewnętrzne zależne od aplikacji hostowanych na platformie Azure. Inne organizacje korzystające z platformy Azure do operacji w chmurze napotkały podobne wyzwania związane z dostępem do danych i uruchamianiem obciążeń. Firma Microsoft zidentyfikowała główną przyczynę w Azure Front Door, usłudze zarządzającej dystrybucją ruchu i równoważeniem obciążenia w globalnych centrach danych. Awaria tego komponentu doprowadziła do efektów kaskadowych, zmniejszając dostępność usług i komplikując logowanie do portalu dla administratorów i programistów. Równoległe sondy ujawniły komplikacje w systemie nazw domen, który rozpoznaje adresy internetowe i kieruje ruch do zasobów Azure. Moment zwiększył widoczność incydentu, który miał miejsce na kilka godzin przed publikacją kwartalnego raportu o zyskach Microsoftu. Ta bliskość podkreśliła duże uzależnienie ekosystemu Microsoftu od platformy Azure w zakresie stabilności operacyjnej i generowania przychodów. Liczba raportów o awariach na platformach monitorujących takich jak Downdetector wzrosła, a maksymalna liczba skarg użytkowników przypada na popołudnie. Tysiące wpisów dokumentuje problemy w usługach, których dotyczy problem, zapewniając wgląd w skalę zakłóceń w czasie rzeczywistym. Aby rozwiązać ten problem, firma Microsoft przekierowała ruch Azure Portal z dala od wadliwej konfiguracji Azure Front Door. Firma doradziła użytkownikom korzystanie z alternatywnych metod dostępu, w tym narzędzi programistycznych, takich jak skrypty PowerShell i interfejsy wiersza poleceń (CLI), które omijały internetowe punkty wejścia portalu i przywracały funkcjonalność wielu zadań. Wysiłki skupiały się na przywróceniu pełnej wydajności usług, a aktualizacje były przekazywane oficjalnymi kanałami, aby na bieżąco informować zainteresowane strony w trakcie procesu rozwiązywania problemów.





