QR code per la pagina originale

Gaudi, e ora YouTube riconosce le parole

Google ha da poco introdotto Gaudi, un nuovo sistema di riconoscimento vocale concepito per indicizzare il contenuto audio dei filmati caricati su YouTube. Una prima versione sperimentale della nuova funzione è già disponibile per le presidenziali USA

,

Non si arrestano le novità per YouTube. Dopo aver introdotto la possibilità di inserire testi aggiuntivi ai filmati e sottotitoli, Google ha da poco avviato la sperimentazione di un nuovo sistema per l’indicizzazione dei contenuti dei filmati presenti sul famoso portale di video sharing. L’innovativa funzione potrebbe rivelarsi uno strumento molto importante per portare ordine all’interno dello sterminato catalogo di YouTube, consentendo agli utenti una ricerca maggiormente mirata e coerente dei contenuti desiderati.

Elaborato dai Labs di Mountain View, la divisione della società che si occupa della progettazione e dello sviluppo di nuove soluzioni per il Web, Google Audi sfrutta un nuovo algoritmo di ricerca basato sul riconoscimento vocale. Il sistema utilizza l’audio dei filmati per identificare le parole in essi contenute, indicizzarle e renderle disponibili agli utenti che hanno così la possibilità di cercare all’interno di un filmato lo specifico passaggio desiderato. Nella barra di scorrimento del video compaiono uno o più segnalibri indicanti l’esatta posizione della parola cercata; spostando il proprio cursore sul segnalibro, appare la trascrizione della frase in cui compare la parola oggetto della ricerca.

La nuova funzione si adatta, naturalmente, a tutti quei filmati in cui la componente discorsiva è predominante e può dunque essere utile isolare singoli passaggi di un intero discorso. Non a caso, Google ha avviato una prima sperimentazione di Gaudi nella nuova sezione di YouTube dedicata alle elezioni presidenziali americane. Collegandosi all’area tematica “You Choose ’08” del famoso portale di video sharing, ogni utente ha la possibilità di sperimentare Gaudi su una selezione di filmati inerenti la campagna elettorale per la Casa Bianca. Il numero di video messi a disposizione è al momento molto basso, se commisurato all’intero catalogo di YouTube, ma è destinato ad aumentare sensibilmente nel corso delle prossime settimane, quando la corsa verso la presidenza degli USA diventerà più intensa e ricca di spunti e nuovi contenuti.

L’importante evento politico statunitense costituirà il banco di prova per la nuova tecnologia di riconoscimento vocale implementata da Google. La fase di test sul campo consentirà agli sviluppatori di Mountain View di raccogliere un’ampia mole di dati sull’andamento di Gaudi procedendo, se necessario, all’introduzione di correzioni o di nuove funzionalità per rendere maggiormente efficiente il suo sistema. Terminata la fase di sperimentazione, per il crawler di Gaudi si potrebbero aprire le porte dell’intero catalogo di YouTube. Una indicizzazione dell’audio dei filmati potrebbe costituire una nuova importante risorsa per gli utenti, che spesso non riescono a rintracciare il filmato desiderato a causa delle scarse informazioni inserite al momento dell’upload del nuovo video.

Il riconoscimento vocale potrebbe, infine, aprire nuove grandi opportunità per i diversamente abili. Il principale tallone d’Achille dei portali di video sharing è in genere la scarsa accessibilità dei contenuti, particolare che preclude la fruizione dei filmati da parte delle persone afflitte da problemi motori o cognitivi. In futuro Gaudi potrebbe procedere alla creazione in automatico dei sottotitoli dei filmati senza alcuna interazione da parte dell’utente o di chi ha caricato il video sul portale, con evidenti benefici per l’accessibilità dell’intero sistema.