Google, l’intelligenza artificiale riesce a individuare le voci e volti nella folla

I ricercatori di Google hanno sviluppato un sistema di deep learning abilissimo: è in grado di isolare voci specifiche fra la folla incrociando il riconoscimento facciale

Per un essere umano non è molto difficile isolare la singola voce di un interlocutore in mezzo alla folla per comprenderne il messaggio, ma per un computer il compito può essere molto più arduo.

La prova può essere fatta facilmente: avete mai provato ad usare Siri o Alexa o Cortana o Google assistant durante una festa o in mezzo alla folla? I risultati non saranno stati di certo incoraggianti.

Ma forse a breve non no sarà più così: a quanto pare, Google ha sviluppato un sistema di machine learning che può recuperare le singole specifiche voci incrociando i dati con i movimenti facciali degli interlocutori durante la conversazione.

Gli sviluppatori di casa Google hanno progettato reti neurali per riconoscere gli individui che parlano in un contesto visivo e hanno poi ricreato alcuni modelli relativi ai rumori di sottofondo, in modo da insegnare all’intelligenza artificiale come isolare le voci e suddividerle in diverse tracce audio totalmente separate.

I risultati, testimoniati anche da una serie di video realizzati in svariate situazioni, sembrano sbalorditivi.

Anche quando le persone sono impegnate in una discussione in cui le parole si sovrappongono (un’animata discussione in un talk show), l’AI di Google è in grado di generare tracce audio molto pulite di una singola persona, semplicemente osservandone il volto.

 

Clicca qui per conoscere BIM voyager, il primo BIM Model viewer online italiano

 

 

 

 

Vuoi rimanere aggiornato su questo argomento e sulle principali novità legate al mondo dell'edilizia?

0 commenti

Lascia un Commento

Vuoi partecipare alla discussione?
Fornisci il tuo contributo!

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *