Google spiega la causa del down del 2 giugno

La causa del down di alcuni servizi di Google nella serata di domenica scorsa è stata spiegata dal colosso della ricerca.

Nella serata di domenica scorsa, alcuni servizi di Google hanno smesso di funzionare, creando il panico tra gli utenti. Il down è durato per qualche ora, poi il colosso della ricerca è riuscito a mettere le cose a posto. Ma, precisamente, cosa è successo? La società ha adesso specificato la causa del malfunzionamento, affermando che intende prevenire incidenti simili in futuro.

Google ha subito voluto scusarsi per l’intoppo che ha causato “prestazioni ridotte e tassi di errore elevati su diversi servizi”. Per quanto riguarda gli utenti, in molti hanno avuto problemi su YouTube, Gmail, Drive e altri prodotti, tra cui anche quelli di terze parti come iCloud di Apple e Snapchat, che dipendono da Google Cloud. Per fare una stima delle conseguenze, vengono riportate alcune percentuali: YouTube ha rilevato un calo del 10% delle visualizzazioni globali durante l’accaduto; Google Cloud Storage una riduzione del traffico del 30%; circa l’1% degli utenti Gmail attivi ha avuto problemi con il proprio account (sebbene si tratti di una piccola parte degli utenti, rappresenta comunque milioni di persone che non sono riuscite a ricevere o inviare e-mail).

Il down era dovuto a una “modifica della configurazione”, intesa per un “piccolo numero di server in una singola regione” ma  accidentalmente applicata a “un numero maggiore di server in diverse regioni limitrofe”. Nonostante il grattacapo sia stato rilevato “in pochi secondi”, la congestione della rete avrebbe ostacolato gli ingegneri che tentavano di ripristinare le configurazioni corrette.

Google sta ora lavorando per garantire che eventi simili non si ripetano più. Spiega dunque:

Con tutti i servizi ripristinati al normale funzionamento, i nostri team di ingegneri stanno conducendo una completa analisi per assicurarsi di comprendere tutti i fattori che contribuiscono alla perdita di capacità della rete e al lento ripristino. Avremo quindi uno sprint ingegneristico mirato al fine di garantire non solo la totale risoluzione del problema, ma anche la protezione da futuri down di origini simili.

Ti potrebbe interessare