Da PDF a Google Docs, passando per un OCR

Google ha introdotto una nuova funzione in dotazione standard al proprio Google Docs per permettere la conversione dei file PDF sfruttando un OCR e quindi abilitando l'editing ed il salvataggio del file in formato testuale
Google ha introdotto una nuova funzione in dotazione standard al proprio Google Docs per permettere la conversione dei file PDF sfruttando un OCR e quindi abilitando l'editing ed il salvataggio del file in formato testuale

Google ha introdotto in dotazione standard una nuova funzione all’interno di Google Docs. Il servizio consta di un convertitore automatico in grado di prelevare un file PDF e di archiviarlo su Google Docs come semplice file testuale risalendo all’origine del documento e permettendone l’editing.

Trattasi di una funzione che Google aveva introdotto ormai da mesi, ma in semplice applicazione sperimentale. Ora la conversione avviene invece su semplice richiesta, anche se al momento i problemi di funzionamento sembrano ancora essere elevanti. Semplicemente, Google non fa altro che applicare a Google Docs quella tecnologia OCR già adottata nel processo di scannerizzazione dei libri nelle biblioteche americane: il file viene analizzato dall’OCR, l’immagine diventa testo ed il testo diventa un file sul quale (tramite Google Docs) è possibile intervenire parola per parola, lettera per lettera. Per essere analizzato il file viene caricato direttamente dall’utente per l’archiviazione, ed è in questo passaggio che il sistema richiede la volontà all’utente relativa ad una eventuale conversione in formato modificabile.

PDF a Google Docs tramite OCR

Da PDF a Google Docs tramite OCR

Le prime prove sul campo indicano una fallacia dell’OCR strettamente dipendente dalla qualità del file PDF originale e dunque ogni valutazione va effettuata su singoli casi e sulle singole condizioni qualitative dei file. La qualità complessiva del servizio è comunque sufficiente e del tutto paragonabile ad altri software dedicati.

L’opzione “Convert text from PDF or image files to Google Docs documents” permette a Google di effettuare un’operazione a parte, per la quale viene richiesta specifica volontà: non viene pertanto salvata una copia del file caricato, ma soltanto abilitata la conversione per l’editing, il controllo e la fruizione su Google Docs. Il file caricato può essere al massimo di 10MB e con una risoluzione di 25 megapixel. Con tanto di avviso: «più è grande il file, più tempo ci impiegherà l’OCR».

Per una prova diretta del nuovo strumento è possibile collegarsi all’apposita url e caricare un file PDF a scelta.

Ti consigliamo anche

Link copiato negli appunti