Eclissi di Facebook

L'eclissi di Facebook è durata 2 ore e mezza: un errore in un sistema di gestione della cache ha costretto il gruppo a ripristinare il database spegnendo il network
L'eclissi di Facebook è durata 2 ore e mezza: un errore in un sistema di gestione della cache ha costretto il gruppo a ripristinare il database spegnendo il network

Facebook si è fermato per due volte in 48 ore. Un doppio incidente, una doppia debacle che il gruppo stesso non esita a definire come il più grave problema al sito in 4 anni di attività. Se la prima è stata una sosta temporanea di pochi minuti addebitata a cause esterne ed avvertita anche in Italia, la seconda è conseguenza di un blackout globale che ha interrotto le attività sul social network per circa 2 ore e mezza. La pubblica ammenda di Facebook porta ora alla luce le cause del problema.

L’utenza si è accorta del problema trovandosi davanti un sito incapace di rispondere a qualsivoglia interrogazione. “DNS Error” nel migliore dei casi, paginate in eterno caricamento in altre situazioni. L’eclissi di Facebook è stata accompagnata dalle richieste di soccorso di una moltitudine di utenti inconsapevoli di ciò che stava accadendo ed improvvisamente privati del loro network preferito. Quel che si dava per scontato fino a poche ore prima non lo era più ed il disagio è stato generale. Nel frattempo nelle server farm i lavori erano intensi: c’era da ripristinare un loop che aveva portato a terra i sistemi del gruppo e tutto ciò, lode alla sincerità dell’ammissione, per un errore di programmazione.

Robert Johnson, Software Engineering Facebook, è colui il quale ha avuto la responsabilità di spiegare la caduta sul blog ufficiale del gruppo. Secondo quanto indicato, il guaio è stato causato da un sistema di controllo automatico della cache, uno strumento utilizzato per sostituire eventuali errori prelevando materiale nuovo da una copia autentica. Quando lo strumento ha iniziato a far confusione in questo meccanismo, però, improvvisamente il database si è trovato seppellito dalle richieste ed il ciclo vizioso ha portato il sistema nel suo complesso alle estreme conseguenze.

Reset. Facebook è stato ripristinato eliminando del tutto l’automatismo di controllo: «cercheremo nuovi design per questo sistema di configurazione seguendo altri modelli». Il gruppo, il quale aveva introdotto l’argomento spiegando che una caduta simile non può che essere causata dal concatenarsi di più errori, chiude la parentesi portando le proprie scuse alla community, la quale per 2 ore e mezza non ha potuto far altro che guardare inerme all’eclissi di Facebook attendendo che sul social network tornasse la luce.

Ti consigliamo anche

Link copiato negli appunti