QR code per la pagina originale

L’IA che ricostruisce i volti solo dalla voce

Una nuova intelligenza artificiale è in grado di ricostruire l'aspetto di una persona analizzando solo una breve clip audio.

,

Proprio quando si pensa di aver visto tutto quello che può fare l’intelligenza artificiale, ecco una nuova ricerca che spiazza di nuovo. Alcuni scienziati della Carnegie Mellon University hanno creato una nuova intelligenza artificiale che ricostruisce il volto di una solo analizzando brevi porzioni della sua voce. I risultati chiaramente non sono perfetti, ma a quanto pare si avvicinano abbastanza alla realtà.

Un nuovo esempio di quanto l’IA possa diventare sofisticata, anche con dati piuttosto semplici.

IA

In un nuovo paper il team descrive come ha utilizzato una “generative adversarial network” per analizzare brevi clip vocali e “abbinare diverse caratteristiche biometriche di colui che parla“, ottenendo “corrispondenze accurate“, tramite l’algoritmo chiamato appunto Speech2Face. Si legge nel paper:

La voce di una persona è statisticamente correlata alla sua struttura facciale. Le relazioni dirette includono l’effetto dello scheletro, delle articolazioni sottostanti alla struttura del viso e il tessuto che lo ricopre, che governano le forme, le dimensioni e le proprietà acustiche del tratto vocale che produce la voce. Meno direttamente la stessa genetica, fisica e le influenze ambientali che concorrono nello sviluppo del viso influenzano anche la voce.

I ricercatori della Carnegie Mellon sulla pagina GitHub del progetto hanno dichiarato di procedere con molta cautela su questo progetto, riconoscendo che la tecnologia solleva preoccupanti domande sulla privacy e sulla discriminazione.

Sebbene si tratti di un’indagine puramente accademica, riteniamo che sia importante discutere esplicitamente nel documento riguardo una serie di considerazioni etiche dovute alla potenziale sensibilità delle informazioni facciali. Qualsiasi ulteriore indagine o uso pratico di questa tecnologia sarà attentamente testata per garantire che i dati di addestramento siano rappresentativi della popolazione di utenti prevista.

Insomma si ha paura più dei probabili “pregiudizi dell’IA” che dello strumento in sé.

Fonte: ARXIV • Immagine: guvendemir via iStock