Google: due database enormi per allenare l'IA

Il gruppo di Mountain View mette a disposizione di sviluppatori e ricercatori due enormi database utili per istruire i sistemi di intelligenza artificiale.
Il gruppo di Mountain View mette a disposizione di sviluppatori e ricercatori due enormi database utili per istruire i sistemi di intelligenza artificiale.

Le potenzialità dei sistemi di intelligenza artificiale e machine learning sono smisurate e nell’ultimo periodo sono stati molti gli esempi che lo hanno dimostrato. Chi sviluppa un software di questo tipo ha bisogno di partire da un algoritmo a cui far ingerire una considerevole mole di dati, che attraverso un procedimento di analisi istruiscono il codice in modo da renderlo autonomo, capace di riconoscere pattern di informazioni di ogni tipo: gli oggetti contenuti in una foto, i suoni di un comando vocale, il significato di un testo ecc.

Open Images Dataset

Per favorire la nascita di sistemi IA, Google annuncia oggi di aver messo a disposizione di chi sviluppa due enormi database. Il primo si chiama Open Images Dataset e, come ben comprensibile già dal nome, raccoglie un volume consistente di immagini, per la precisione nove milioni. Ogni elemento è stato etichettato con diversi tag da un software, poi la loro correttezza è stata controllata da personale in carne ed ossa. Secondo il gruppo di Mountain View, l’archivio è sufficiente per istruire una rete neurale da zero. È attraverso un approccio di questo tipo che sono nati, ad esempio, servizi come quello offerto dall’applicazione Prisma per l’editing fotografico.

Un esempio di immagini e tag contenuti nel database Open Images Dataset

Un esempio di immagini e tag contenuti nel database Open Images Dataset

YouTube-8M

Non è difficile immaginare che YouTube-8M sia l’equivalente per i video. Il database ne raccoglie circa otto milioni, per un tempo di riproduzione totale che supera le 500.000 ore.

I filmati raccolti e catalogati all'interno del database YouTube-8M

I filmati raccolti e catalogati all’interno del database YouTube-8M

Sta ora ai team di sviluppo e ai ricercatori sfruttare al meglio una tale mole di informazioni, dandola in pasto ai sistemi di machine learning per addestrarli e perfezionarne il funzionamento, offrendo poi software, app o servizi che possano risultare davvero smart, degni di essere etichettati come forme di intelligenza artificiale.

Ti consigliamo anche

Link copiato negli appunti