Newsletter Wineuropa

Tecnologia & Internet La divisione di Google al lavoro sui progetti di intelligenza artificiale ha creato un sistema in grado di parlare in modo simile agli esseri umani.

WaveNet: l’IA DeepMind parla come un essere umano

Lo stesso team già al lavoro sul sistema AlphaGo annuncia la creazione di una tecnologia in grado di simulare la voce di un essere umano. Un'intelligenza artificiale che sostanzialmente funge da sintetizzatore vocale e, basandosi sulle reti neurali, è in grado di creare suoni con una forma d'onda tanto articolata da risultare indistinguibili da quelli pronunciati da una persona in carne ed ossa.

Si chiama WaveNet ed è il nuovo progetto messo in campo da DeepMind, divisione di Alphabet (Google) specializzata in tutto ciò che riguarda l'IA. Gli attuali sistemi di questo tipo funzionano in due modi: o componenti frasi assemblando parole preventivamente registrate da un essere umano oppure sfruttando un software che genera un audio output basandosi su regole grammaticali e sintassi. In ogni caso, il risultato non è mai del tutto convincente e spesso si ha l'impressione di avere a che fare con una voce robotica. Si pensi ad esempio a quelle che annunciano i treni in arrivo in una stazione ferroviaria.

WaveNet funziona in maniera simile al primo metodo descritto, ma anziché mettere in fila brevissimi spezzoni audio preregistrati, cerca di imitare il comportamento di chi parla. Per rendere il tutto ancora più realistico e verosimile, il segnale audio generato può contenere accenti, interruzioni, respiri e persino assumere un tono piuttosto che un altro per far trapelare un'emozione. Nel caso in cui sia abbinato un video, l'IA è in grado di gestire il labiale.

Una tecnologia di questo tipo, un giorno, potrebbe essere impiegata all'interno dei prodotti e dei servizi a marchio Google, ad esempio per l'assistente Now o per quello virtuale integrato nel dispositivo Home per la casa, favorendo un'interazione vocale naturale. Lo stesso sistema, inoltre, è anche in grado di generare brani musicali simulando un musicista al pianoforte, sfruttando la stessa dinamica.

Una singola WaveNet può catturare le caratteristiche di molti diversi speaker mantenendone la fedeltà originale e scegliendo quella più adatta in base all'identità di chi parla.

di Cristiano Ghidotti.

Tratto da webnews.it

 

Inserita il : 15-09-2016 da wineuropa

Invia il tuo commento

Inserisci qua il tuo commento

Ti ricordiamo che se desideri vedere il tuo commento pubblicato devi firmarlo.
Se è la prima volta che inserisci un commento dovrai validare il tuo indirizzo di posta elettronica cliccando sul link che riceverai per e-mail.
Il tuo commento verrà pubblicato nello spazio "I vostri commenti". Grazie per la tua collaborazione.
Nome
E-mail   Visualizza
il tuo commento:
Consenso privacy Accetto NON accetto
Consenso Com. Comm. Accetto NON accetto
Digita i 6 caratteri dell'immagine

Attenzione: tutti i campi sono obbligatori.

Che Tempo Fara'