Google salva reCAPTCHA dagli hacker

reCAPTCHA, il sistema di sicurezza di Google, messo in ginocchio da tre hacker con lo strumento di analisi spettrografica Stiltwalker.
reCAPTCHA, il sistema di sicurezza di Google, messo in ginocchio da tre hacker con lo strumento di analisi spettrografica Stiltwalker.

reCAPTCHA, sistema di sicurezza utilizzato buona parte dei siti più importanti del Web in fase di registrazione, è stato violato da tre hacker grazie all’analisi spettrografica dei file audio riprodotti per gli ipovedenti. Google, che nel 2009 ha acquisito il progetto, è corsa immediatamente ai ripari sistemando la falla e garantendo così il corretto funzionamento.

Per chi non ne fosse a conoscenza, reCAPTCHA rappresenta l’evoluzione della tecnologia CAPTCHA, ovvero quel campo in cui all’utente viene chiesto di scrivere il testo visualizzato, al fine di verificare che dietro al monitor ci sia una persona in grado di interpretare le lettere e non un bot o un algoritmo di riconoscimento automatico. Chi ha problemi alla vista può in alternativa ascoltare le parole da digitare. Proprio l’analisi dell’audio riprodotto ha consentito di dar vita a Stiltwalker, uno strumento capace di identificare con il 99% di precisione i termini corretti.

Come ben visibile dall’immagine allegata, in corrispondenza delle parole “chiave” da inserire è stata rivelata una frequenza del tutto differente rispetto a quella del rumore di fondo inserito per confondere i sistemi automatici. Una leggerezza da parte degli sviluppatori, a cui il team di Mountain View ha posto rimedio immediatamente, ma a un prezzo. Da oggi, chi sceglie l’opzione audio per la compilazione di un reCAPTCHA, dovrà ascoltare un file da trenta secondi contenente ben dieci parole, contro una durata di otto secondi e le sei parole precedenti. Pericolo scampato, dunque.

Una curiosità: il progetto reCAPTCHA è nato per unire due esigenze: quella di verificare la presenza di un essere umano nell’interazione con i siti e il riconoscimento dei testi provenienti da libri antichi e talvolta rovinati. Buona parte delle parole utilizzate, infatti, arriva proprio dalla scansione di volumi dalle librerie di tutto il mondo, che i software OCR per il riconoscimento ottico dei caratteri non sono riusciti a decifrare per la conversione in formato digitale.

Ti consigliamo anche

Link copiato negli appunti