QR code per la pagina originale

Tempo di sottotitoli automatici per YouTube

Il portale per la condivisione dei video ha introdotto un paio di novità tese a semplificare la gestione e la produzione dei sottotitoli. YouTube sfrutterà i sistemi di riconoscimento vocale per creare in automatico i sottotitoli e per l'auto timing

,

YouTube si arricchisce di un innovativo sistema per la gestione in automatico dei sottotitoli. La novità potrebbe consentire ai milioni di utenti affetti da problemi di udito che frequentano la Rete di utilizzare senza particolari limitazioni il celebre portale per la condivisione dei video. Il servizio da poco implementato mira a rendere semplice e intuitivo l’utilizzo dei sottotitoli, sfruttando un sistema per il riconoscimento vocale.

«Da quando abbiamo lanciato i sottotitoli nei nostri prodotti, siamo stati felici nel constatare un aumento dei video sottotitolati messi a disposizione tramite i nostri servizi e che ammontano ormai a diverse centinaia di migliaia. Ciò sembra suggerire come un numero crescente di persone stia maturando una consapevolezza sull’effettiva utilità dei sottotitoli. Come abbiamo spiegato in passato, i sottotitoli non aiutano solamente i sordi e le persone con problemi di udito, ma – grazie ai sistemi di traduzione automatica – consentono anche alle persone di tutto il mondo di accedere ai contenuti dei video in 51 lingue diverse. I sottotitoli possono inoltre migliorare la ricerca e consentire agli utenti di identificare il segmento di un filmato da loro desiderato» si legge in un post da poco pubblicato sul blog ufficiale di Google.

Considerata la mole di filmati caricati giornalmente, la media è di 20 ore di nuovi video al minuto, gli sviluppatori di YouTube hanno pensato di rendere la produzione dei sottotitoli più semplice e automatizzata per semplificare l’aggiunta dei testi ai filmati. Il sistema sfrutta le soluzioni per il riconoscimento vocale automatico messe in campo da Google in alcuni altri servizi, come Google Voice, per riconoscere le parole pronunciate nei video e trascriverle nei sottotitoli in sovrimpressione. Il software per il riconoscimento vocale è relativamente preciso, ma alcune variabili come rumori di sottofondo o sovrapposizioni delle voci possono talvolta causare la produzione di sottotitoli poco accurati, ma comunque in grado di fornire un’idea generale sul contenuto.

Oltre al sistema per il riconoscimento automatico delle parole pronunciate nei filmati di YouTube, Mountain View ha introdotto una nuova funzionalità per rendere più rapida e indolore la procedura di inserimento manuale dei sottotitoli. Per incorporare i testi da mostrare in sovrimpressione in genere occorre creare un file di testo contenente non solo i dialoghi, ma anche l’esatta indicazione temporale del momento in cui tali parole vengono pronunciate. Il sistema di auto-timing messo a punto dagli sviluppatori di YouTube consente di utilizzare file di testo senza indicazioni temporali. Una volta caricate le frasi da associare a un determinato video, il servizio inserisce automaticamente i sottotitoli nella giusta sequenza temporale seguendo il parlato del filmato. Tale caratteristica, che semplifica e rende l’operazione molto più veloce, dovrebbe incentivare l’inserimento dei sottotitoli da parte degli utenti.

Grazie a Google Translate, il sistema di traduzione automatica dei testi, i sottotitoli presenti nei video possono essere tradotti rendendo le nuove funzionalità utili per comprendere i contenuti di un filmato in una lingua diversa dalla propria. Le traduzioni non sono sempre precise, ma consentono comunque di comprendere il significato generale dei dialoghi e dei contenuti.

Le novità introdotte da YouTube sul fronte del riconoscimento vocale saranno inizialmente messe a disposizione per un numero limitato di video in lingua inglese. Tra i canali coinvolti spiccano, oltre agli spazi di Google e YouTube, il MIT, Yale, la UC Berkeley, la rete televisiva pubblica PBS e il National Geographic. Il sistema di timing automatico sarà messo a disposizione di tutti gli utenti, ma inizialmente supporterà la sola lingua inglese. Valutati i primi risultati, il team di sviluppo procederà a espandere il servizio includendo nuove lingue e nuove canali.