A leállás magyar idő szerint este 20:46-kor kezdődött, amikor a Google mérnökei riasztást kaptak a felhasználói azonosítási és jogosultságkezelési rendszer (IAM) működési problémáiról. Ez a rendszer gyakorlatilag minden szolgáltatáshoz kulcsfontosságú: nélküle sem adatbázisokhoz, sem alkalmazásokhoz nem lehet biztonságosan hozzáférni.
A hiba láncreakciót indított el: több tucat Google Cloud-alapú szolgáltatás vált elérhetetlenné, köztük a Gmail, a Google Meet, a Drive, a Cloud Console, valamint a BigQuery és más adatplatformok. A zavar nem korlátozódott a Google saját rendszereire – számos, világszerte használt alkalmazás is leállt, mivel működésük szintén a Google Cloudra épül.
Kik voltak érintettek?
A probléma érintette a következő szolgáltatásokat és cégeket:
-
Spotify – szolgáltatáskimaradások
-
Discord, Snapchat, Twitch – megszakadt kommunikációs csatornák, szolgáltatáskimaradások
-
Replit, Cursor, Character.AI – fejlesztői és AI-alapú platformok részleges vagy teljes kiesése
-
Cloudflare – az internet „gerinchálózatát” biztosító szolgáltató néhány kulcsfontosságú szolgáltatása szintén érintett volt
A problémák különösen az us-central1 régióban (Iowa) mutatkoztak meg hosszan, ahol a helyreállítás még az esti órákban is zajlott.
Milyen hatással volt ez az üzleti világra?
A Google Cloud szolgáltatásainak kiesése nemcsak technológiai, hanem üzletmenet-folytonossági szempontból is komoly figyelmeztető jel. Világszerte vállalatok tízezrei építik alkalmazásaikat és rendszereiket a Google infrastruktúrájára. Egy ilyen hiba hatására:
-
az adatfolyamok megszakadnak,
-
az ügyfélkapcsolati rendszerek lebénulnak,
-
a belső munkafolyamatok leállnak,
-
az AI-megoldások és a valós idejű elemzések elérhetetlenné válnak.
A részvénypiacok is reagáltak: a Google anyavállalata, az Alphabet árfolyama kb. 1%-ot csökkent, míg más érintett partnerek, például a Cloudflare, közel 5%-ot estek a kereskedés végére.
Milyen tanulságokat érdemes levonni?
A Google szerint a hiba kiváltó oka egy jogosultságkezelési rendszerhibában keresendő, amely rendszerszintű kieséseket okozott. A vállalat teljes körű vizsgálatot ígért, és hamarosan részletes technikai jelentést tesz közzé.
Az incidens ugyanakkor rámutatott néhány kulcsfontosságú kockázatra és döntéshozatali pontra:
| Kockázati terület | Ajánlott intézkedés |
|---|---|
| Egy szolgáltatóra való támaszkodás | Multi-cloud stratégia bevezetése |
| Jogosultságkezelési hibák | Zero trust architektúra erősítése |
| Üzleti folytonosság hiánya | Redundáns rendszerek és failover tervek |
| SLA és támogatás hiányossága | Szolgáltatói szerződés újratárgyalása |