QR code per la pagina originale

Siri: ecco come l’assistente impara nuove lingue

Siri è l'assistente vocale più poliglotta, in grado di riconoscere 21 lingue e 36 caratterizzazioni regionali: ecco come funziona l'apprendimento.

,

Tra gli assistenti vocali disponibili sul mercato mobile, Siri è probabilmente la versione più poliglotta. La voce robotica di Cupertino, infatti, è in grado di parlare 21 lingue diverse, localizzate in 36 paesi del mondo. In che modo, tuttavia, il sistema riesce ad apprendere nuovi idiomi e, soprattutto, a distinguerne le varietà locali, quali accenti e dialetti? A spiegarlo, è un interessante intervento della compagnia californiana dalle pagine di Reuters.

Sebbene tutti i grandi player del mercato abbiano investito sugli assistenti vocali, basti pensare a Google, Amazon e Microsoft, Siri rimane non solo il capostipite, ma anche il servizio dalla più ampia conoscenza linguistica. Apple, infatti, non solo aggiunge di continuo nuove lingue al servizio, ma studia anche le varie diversità regionali, affinché il sistema possa comprendere un determinato accento o, ancora, distinguere tra inflessioni e modi di dire dialettali. Un impegno che richiede un grande sforzo al gruppo di Cupertino, così come conferma Alex Acero, a capo del team linguistico della mela morsicata:

La compagnia comincia a lavorare su un nuovo linguaggio invitando alcune persone a leggere dei passaggi, in una grande varietà di accenti e dialetti, che sono poi trascritti a mano affinché il computer possa contare su un’esatta rappresentazione del testo parlato. Apple registra anche una varietà di suoni fra le più svariate voci. A questo punto, viene costruito un modello di linguaggio che tenti di predire la sequenza di parole.

Non è però tutto, poiché Apple si avvale anche del suo grande bacino di utenti a livello internazionale. Quando un consumatore si avvale delle opzioni di dettatura, comunemente presenti sia in iOS che in OS X, il sistema operativo tiene traccia di alcuni piccoli frammenti del parlato e, dopo averli resi anonimi e irriconoscibili, affinché l’utente non possa essere identificato, li inoltra ai server Apple. Le registrazioni, complete di rumori ambientali o di vocalizzi, sono quindi ascoltate da un gruppo di specialisti e trascritte. Così facendo, Apple è in grado di dimezzare gli errori di comprensione rispetto ai competitor. Quando una nuova lingua viene resa disponibile per Siri, inoltre, ogni due settimane Cupertino garantisce degli aggiornamenti ai propri server, per renderne la comprensione e la risposta sempre più efficace.

Fonte: Reuters • Immagine: Soze Soze via Shutterstock • Notizie su: , ,