QR code per la pagina originale

Google: la tecnologia Cloud Vision API è open

Un'API da Google per mettere a disposizione degli sviluppatori la propria tecnologia di computer vision, dedicata all'analisi visuale delle immagini.

,

La tecnologia di computer vision su cui è basata la piattaforma Google Foto è ora a disposizione di tutti gli sviluppatori e le sue potenzialità potranno essere sfruttate all’interno di app o servizi di terze parti, grazie alla Cloud Vision API. Per chi non ne fosse a conoscenza, si tratta del sistema che, attraverso complessi algoritmi di machine learning, è in grado di analizzare un’immagine riconoscendo gli elementi al suo interno, un’espressione facciale, la razza di un animale fotografato e molto altro ancora.

L’implementazione è gratuita, almeno in un primo momento, anche se bigG ha annunciato per il futuro l’arrivo di una formula avanzata a pagamento che programmatori e software house potranno sfruttare a pagamento. Il tool consente di effettuare fino ad un massimo di sei analisi su una singola immagine, andando ad esempio a identificare la presenza di un logo, un paesaggio o del testo. È in grado di individuare il soggetto di una fotografia, sia che si tratti di una persona, un animale, un veicolo o un edificio, permettendo di estrarne di conseguenza metadati, informazioni e tag. Un approccio di questo tipo può tornare estremamente utile, ad esempio, se applicato a vasti archivi fotografici che necessitano di catalogazione.

La tecnologia è in grado di identificare i singoli elementi che compongono un'immagine

La tecnologia è in grado di identificare i singoli elementi che compongono un’immagine

Prevista la piena integrazione dei criteri che regolano il SafeSearch sul motore di ricerca. Sarà dunque possibile riconoscere in modo del tutto automatico la presenza di immagini con contenuti violenti o adatti ad un pubblico di soli adulti, così da bandirle a priori dalle applicazioni e dalle piattaforme per i più piccoli.

Un’operazione di questo tipo richiederebbe un’elevata potenza di calcolo se eseguita in locale, su un singolo computer. Ad occuparsene sarà però l’infrastruttura cloud di Google, sollevando così sviluppatori e utenti da questo peso. Tra le realtà che si sono già dimostrate interessate ad un’impiego dell’API figura anche l’azienda AeroSense, specializzata nella progettazione di droni. Altri possibili utilizzi riguardano social network, robotica e applicazioni legate all’intelligenza artificiale.

Un esempio degli elementi identificati in un'immagine dalla tecnologia

Un esempio degli elementi identificati in un’immagine dalla tecnologia

Fonte: Google, Vision API • Via: Google • Notizie su: ,
Commenta e partecipa alle discussioni