L'era della traduzione vocale artificiale è alle porte?

Share
Un tempo roba da fantascienza, la tecnologia che consente alle persone di parlare usando lingue diverse è ora qui. Ma quanto è efficace?

L'idea della traduzione vocale artificiale esiste da molto tempo: l'ha inventata il professor Waibel, insegnante di informatica alla Carnegie Mellon University di Pittsburgh e al Karlsruhe Institute of Technology, il quale propose il progetto al MIT [Massachusetts Institute of Technology] nel 1978. ”Douglas Adams in un certo senso lo ha inventato nello stesso periodo. La "Guida alla galassia di autostoppisti" presentava una forma di vita chiamata "Babel fish" che, quando collocata nell'orecchio, consentiva a un ascoltatore di comprendere qualsiasi linguaggio nell'universo. È arrivato a rappresentare uno di quei dispositivi che gli appassionati di tecnologia sognano, come i comunicatori vocali portatili e le TV abbastanza piatte da essere appese alle pareti.

Ad esempio, al Karlsruhe Institute of Technology Waibel e i suoi colleghi tengono già lezioni in tedesco che i loro studenti possono seguire in inglese tramite un traduttore elettronico. Il sistema genera testi che gli studenti possono leggere sui loro laptop o telefoni, quindi il processo è in qualche modo simile ai sottotitoli. Aiuta i docenti a parlare chiaramente, non dovendo sovrastare le chiacchiere di sottofondo e gli permette di non ripetere le stesse nozioni ogni anno.

Il primo sistema di traduzione vocale di Waibel, assemblato nel 1991, aveva un vocabolario di 500 parole, correva su grandi stazioni di lavoro e impiegava diversi minuti per elaborare ciò che udiva. Negli ultimi anni dispositivi che sembrano prototipi di Babel fish hanno iniziato ad apparire, cavalcando un'ondata di progresso nella traduzione artificiale e nel riconoscimento vocale nettamente superiori al prototipo di Waibel. Google ha incorporato una funzione di traduzione nei suoi auricolari Pixel, utilizzando Google Translate, che può anche fornire la traduzione vocale tramite la sua app per smartphone; Skype ha una funzione di traduttore che gestisce il parlato in 10 lingue; infine numerosi brand più piccoli, come Waverly Labs (una startup con base a Brooklyn) hanno sviluppato traduttori di auricolari.

I sistemi attualmente disponibili offrono la prova del concetto, ma in questa fase sembrano essere considerati novità accattivanti piuttosto che passi verso ciò che Waibel chiamava "rendere una società trasparente per il linguaggio". Uno dei principali sviluppi alla base della traduzione vocale artificiale è la moda che incoraggia le persone a parlare con i dispositivi tecnologici. "Siamo solo all'inizio del lavoro sul paradigma dei dispositivi abilitati alla voce", afferma Barak Turovsky, direttore del prodotto di Google Translate, "ma sta crescendo molto rapidamente e la traduzione sarà una delle parti chiave di questo viaggio". 

Google ritiene che il 50% dei contenuti di Internet sia in inglese, ma solo il 20% della popolazione mondiale parla la lingua."Se si osservano le aree in cui vi è molta crescita nell'uso di Internet, come i paesi asiatici, la maggior parte di loro non conosce affatto l'inglese", afferma Turovsky. "Quindi, a tale proposito, rompere le barriere linguistiche è un obiettivo importante per tutti, e ovviamente per Google. Ecco perché Google sta investendo così tante risorse nei sistemi di traduzione ". Recentemente ha infatti introdotto la modalità interprete per i suoi dispositivi domestici. Dicendo: "Ehi, Google, sii il mio interprete francese" si attiverà la traduzione vocale e, su display intelligenti, di testo. Puoi farlo già se hai l'app Translate sul tuo telefono, anche usando uno schermo e un altoparlante molto piccoli. 

Waverly Labs ha utilizzato la funzione chat-up come gancio per la sua iniziativa di finanziamento Indiegogo, con un video in cui il fondatore e CEO della società, Andrew Ochoa, racconta come ha avuto l'idea di un traduttore quando ha incontrato una donna francese in vacanza ma non ha potuto comunicare con lei molto bene. Il video mostra quello che avrebbe potuto essere l'incontro con una tale tecnologia a disposizione: una donna francese con cui va a prendere un caffè e a visitare la città mentre entrambi indossano un auricolare che traduce simultaneamente tutto ciò che dicono. Il risultato? $ 4,4 milioni - 30 volte l'obiettivo prestabilito.

Alcuni clienti hanno affermato che l'auricolare Pilot gli ha permesso di comunicare con suoceri, parenti addirittura coniugi senza ostacoli. Il CEO dell'azienda Ochoa riconosce che "la tecnologia deve migliorare un po' prima che sia possibile trovare il vero amore attraverso gli auricolari, ma non è un futuro così lontano". 

Attualmente è in cantiere un nuovo modello per applicazioni professionali, che comporta miglioramenti delle prestazioni nel riconoscimento vocale, nella precisione della traduzione e nel tempo necessario per fornire il discorso tradotto. "I professionisti sono meno propensi a essere pazienti in una conversazione", osserva Ochoa. La nuova versione presenterà anche miglioramenti del design a livello igienico, per superare la caratteristica meno accattivante: porre gli auricolari nelle orecchie. "Molti sono restii a condividere uno degli auricolari con uno sconosciuto", afferma Ochoa. Il problema sarebbe risolto se i traduttori diventassero sufficientemente diffusi da far sì che gli estranei avessero già i loro auricolari personali. Ciò dipenderà probabilmente non tanto dagli auricolari stessi, ma dalla prevalenza di dispositivi a comando vocale e traduzione artificiale in generale.

Waibel sottolinea anche il significato dell'Asia, rilevando che la traduzione vocale è davvero decollata in Giappone e Cina. C'è ancora molta strada da fare, però. La traduzione deve essere simultanea, come la voce del traduttore che parla al politico straniero in TV, piuttosto che in pacchetti che obbligano i relatori a mettere in pausa dopo alcune osservazioni e attendere che la traduzione venga recapitata. Deve funzionare offline, per le situazioni in cui l'accesso a Internet non è possibile - e per rispondere alle preoccupazioni sulla quantità di dati del parlato privato che si accumulano nel cloud, inviati ai server per l'elaborazione. I sistemi non solo devono far fronte a sfide fisiche come il rumore, suggerisce Waibel, ma dovranno anche essere socialmente consapevoli - conoscere le loro maniere e affrontare le persone in modo appropriato. I traduttori artificiali sensibili all'etichetta potrebbero alleviare le persone dalla necessità di essere consapevoli delle diverse norme culturali. Faciliterebbero l'interazione riducendo la comprensione. Allo stesso tempo, potrebbero aiutare a preservare le abitudini locali, rallentando la diffusione delle abitudini associate all'inglese internazionale.

Tuttavia, professori e altri professionisti non dedicheranno la propria conoscenza della lingua al software. Se la tecnologia si trasforma in una traduzione vocale artificiale continua e onnipresente - in breve, Babel fish - aggiungerà effettivamente valore alle abilità linguistiche. La traduzione automatica fornirà un prodotto efficiente ma incompleto: informazioni di base, pratiche e di basso prestigio che aiutano le persone ad acquistare o orientarsi. Se ciò possa aiutare le persone a condurre la propria vita familiare o le relazioni romantiche è discutibile, anche se una possibilità degna di nota è che potrebbe superare le barriere linguistiche che spesso sorgono tra le generazioni dopo la migrazione, lasciando i bambini e i loro nonni senza una lingua condivisa.

Qualunque sia il suo uso, tuttavia, non sarà mai buono come la comunicazione reale. Anche se la tecnologia di morphing vocale simula la voce di chi parla, i movimenti delle labbra non combaceranno e sembrerà come se fossero in un film doppiato. Il contrasto sottolineerà il valore delle lingue condivise e il valore di apprenderle. Fare lo sforzo di imparare la lingua di qualcuno è un segno di impegno e quindi di affidabilità. La condivisione di una lingua può anche promuovere un senso di appartenenza e comunità, come con gli scienziati internazionali che usano l'inglese come lingua franca, quando i loro predecessori usavano il latino. I commercianti immigrati che imparano la lingua dei loro clienti non stanno solo facilitando le vendite; stanno dimostrando che desiderano avvicinarsi alla comunità dei loro clienti e affermare educatamente un posto in essa. La persona che conosce una lingua avrà sempre il vantaggio su qualcuno che si affida a un dispositivo. Sebbene la necessità pratica di una lingua franca diminuirà, il valore sociale della condivisione persisterà. E il software non sostituirà mai la comprensione sottile ma vitale che deriva dalla conoscenza di una lingua. Quella conoscenza sarà sempre necessaria per scegliere le sfumature dal rumore.