Google : riconoscimento vocale sempre più preciso

L'impiego dell'intelligenza artificiale e del machine learning ha contribuito a rendere il riconoscimento vocale di Google sempre più preciso nel tempo.
L'impiego dell'intelligenza artificiale e del machine learning ha contribuito a rendere il riconoscimento vocale di Google sempre più preciso nel tempo.

L’impiego dell’intelligenza artificiale per migliorare la qualità dei servizi offerti. Una strada percorsa dalla quasi totalità dei big del mondo tecnologico e Google non fa certo eccezione. In particolare, il gruppo di Mountain View sfrutta le potenzialità dell’IA e degli algoritmi di machine learning per le operazioni più svariate: ieri si è parlato dell’upsampling delle immagini, oggi di riconoscimento vocale.

A partire dal 2012, bigG adotta le reti neurali per offrire risultati sempre più precisi, indipendentemente dalla qualità del segnale audio fornito dall’utenza, ovvero anche in presenza di un corposo rumore di fondo o quando le parole vengono pronunciate in maniera poco chiara. Come è possibile? Grazie proprio all’ausilio di sistemi che sanno imparare (da qui, appunto, il termine “machine learning”) con il trascorrere del tempo, facendo esperienza. Secondo Jeff Dean di Google, intervenuto nei giorni scorsi sul palco dell’evento AI Frontiers Conference di Santa Clara (California), in quattro anni il margine di errore dello speech recognition di Mountain View è diminuito del 30% circa.

A beneficiarne sono ad esempio tecnologie come quella dell’assistente virtuale integrato nell’altoparlante Home, che consente di impartire comandi vocali con linguaggio naturale, semplicemente dialogando con l’intelligenza artificiale, per avviare la riproduzione dei contenuti multimediali, cercare informazioni online, ottenere indicazioni per la guida, consultare le previsioni meteo e molto altro ancora. Si pensi poi alle traduzioni: potendo contare su algoritmi sempre più precisi si possono abbattere le barriere linguistiche, anche quando ci si trova in un paese diverso dal proprio e la comunicazione verbale potrebbe rappresentare un problema.

Ciò nonostante, bigG non ha dichiarato a quanto ammonta la percentuale di potenziali sbagli commessi dalla propria tecnologia: l’ultimo a parlarne è stato il CEO Sundar Pichai nel 2015, indicando un 8% di margine d’errore. Per fare un paragone, il sistema messo a punto dalla divisione Research di Microsoft nel mese di settembre si fermava a quota 6,3%. Ovviamente, un valore inferiore corrisponde ad una precisione più elevata.

Ti consigliamo anche

Link copiato negli appunti