QR code per la pagina originale

Google, il sistema OCR riconosce più di 200 lingue

Attualmente sono oltre 200 le lingue di tutto il mondo riconosciute dalla tecnologia OCR sviluppata da Google e integrata anche nella piattaforma Drive.

,

Da lungo tempo Google è impegnata nell’opera di scansione e digitalizzazione di libri e testi, con l’obiettivo di creare un archivio online accessibile a chiunque, per promuovere e diffondere la cultura. Un progetto che è costato al gruppo di Mountain View anche qualche grattacapo, per presunte violazioni di copyright. Alla base dell’operazione c’è una complessa e avanzata tecnologia OCR (Optical Character Recognition), che oggi è in grado di riconoscere più di 200 lingue da tutto il mondo e oltre 25 sistemi di scrittura.

Ad annunciarlo è direttamente bigG, attraverso le pagine del blog ufficiale dedicato alla ricerca. Il sistema si basa sui modelli HMM (Hidden Markov Models) che considerano come input un intero blocco di testo identificato all’interno delle immagini, anziché provare a riconoscere ogni singola parola o frase. È un approccio del tutto simile a quello impiegato anche dai moderni assistenti virtuali, per interpretare correttamente i comandi vocali impartiti dagli utenti, cercando di comprenderne il contesto e la sintassi.

La tecnologia di Google ha compiuto nel corso degli anni enormi passi in avanti anche per quanto riguarda la riduzione del disturbo, causata ad esempio dalla presenza di pagine rovinate dal tempo. Questo permette, ad esempio, di dar vita ad applicazioni come quella che inquadrando un cartello stradale scritto in una lingua diversa dalla propria, mediante la fotocamera dello smartphone, lo traduce in tempo reale.

Google Drive: convertire un’immagine in testo

Il sistema OCR può essere sfruttato da qualsiasi utente, grazie all’integrazione con la piattaforma Google Drive. Per farlo è sufficiente caricare un’immagine qualsiasi (contenente del testo) all’interno del proprio spazio. Per il nostro test abbiamo utilizzato lo screenshot di un articolo pubblicato nei giorni scorsi su queste pagine. Il file utilizzato per l’upload è un JPG.

L'immagine di test caricata per mettere alla prova la tecnologa OCR di Google

L’immagine di test caricata per mettere alla prova la tecnologa OCR di Google

Dopo aver terminato il caricamento, è sufficiente fare click con il pulsante destro del mouse sull’immagine e poi selezionare la voce “Documenti Google” dal menu “Apri con”.

Con Google Drive, per convertire un'immagine in documento testuale sono sufficienti pochi click

Con Google Drive, per convertire un’immagine in documento testuale sono sufficienti pochi click

Pochi secondi e si vedrà comparire sul monitor quanto segue: un documento con l’immagine originale nella parte superiore e il testo generato automaticamente in quella inferiore. A questo punto è possibile modificarlo a piacimento, formattandolo come si desidera e correggendo gli errori rilevati.

Il documento generato dalla tecnologia OCR di Google partendo da un'immagine

Il documento generato dalla tecnologia OCR di Google partendo da un’immagine

Da segnalare che la procedura funziona senza alcun problema anche con l’applicazione Android di Google Drive.

Fonte: Google Research Blog • Notizie su: ,