Principale Innovazione Google AI ora consente agli utenti di tradurre istantaneamente il testo in 27 lingue con le fotocamere del telefono

Google AI ora consente agli utenti di tradurre istantaneamente il testo in 27 lingue con le fotocamere del telefono

Che Film Vedere?
 
(Gif: Google)

(Gif: Google)



Grazie all'intelligenza artificiale, viaggiare all'estero non è mai stato così semplice.

L'app Google Translate consente agli utenti di tradurre il testo all'istante. Nell'app, basta puntare la fotocamera sul testo che si desidera tradurre e lo vedrai trasformarsi nella lingua desiderata dal vivo, proprio davanti ai tuoi occhi, senza bisogno di connessione a Internet o dati del cellulare. Questa pratica funzione è disponibile da un po' di tempo, ma era compatibile solo con sette lingue. Adesso , grazie al machine learning, Google ha aggiornato l'app per tradurre istantaneamente 27 lingue.

Quindi la prossima volta che sei a Praga e non riesci a leggere un menu, ti copriamo le spalle, Otavio Good, ingegnere del software di Google, ha scritto sulla ricerca dell'azienda Blog .

Google ha anche usato l'intelligenza artificiale per dimezzare gli errori di riconoscimento vocale.

Ad oggi, oltre a tradurre tra inglese, francese, tedesco, italiano, portoghese, russo e spagnolo, è possibile tradurre in tempo reale anche le seguenti 20 lingue: bulgaro, catalano, croato, ceco, danese, olandese, filippino, finlandese, ungherese, indonesiano, lituano, norvegese, polacco, rumeno, slovacco, svedese, turco e ucraino. E se scegli di scattare una foto invece di guardare il testo tradotto dal vivo, sono supportate un totale di 37 lingue.

Quindi, come ha fatto Google ad aumentare il numero di lingue disponibili? Hanno prima acquisito Word Lens, in precedenza un'applicazione di traduzione in realtà aumentata, e hanno utilizzato l'apprendimento automatico e le reti neurali convoluzionali per migliorare le capacità dell'app. I progressi nel riconoscimento delle immagini sono stati fondamentali.

Cinque anni fa, se davi a un computer l'immagine di un gatto o di un cane, aveva difficoltà a dire quale fosse quale. Grazie alle reti neurali convoluzionali, i computer non solo sono in grado di distinguere tra cani e gatti, ma possono anche riconoscere diverse razze di cani, ha affermato Good. Sì, vanno bene per più di un semplice arte trippy —se stai traducendo un menu straniero o firmi con l'ultima versione dell'app Google Traduttore, ora stai utilizzando una rete neurale profonda.

Passo dopo passo

Primo , Translate deve eliminare il disordine sullo sfondo e individuare il testo. Quando individua macchie di pixel dello stesso colore, determina che sono lettere. E quando quei blob sono vicini l'uno all'altro, capisce che è una linea continua da leggere.

Il prossimo, l'app deve riconoscere cos'è ogni singola lettera. È qui che entra in gioco il deep learning.

Usiamo una rete neurale convoluzionale, addestrandola su lettere e non lettere in modo che possa imparare che aspetto hanno le diverse lettere, legge il post del blog.

I ricercatori hanno dovuto addestrare il software utilizzando non solo lettere dall'aspetto pulito, ma anche lettere sporche. Le lettere nel mondo reale sono segnate da riflessi, sporco, macchie e ogni tipo di stranezza, ha scritto Mr. Good. Quindi abbiamo costruito il nostro generatore di lettere per creare tutti i tipi di sporco falso per imitare in modo convincente il rumore del mondo reale: falsi riflessi, false macchie, false stranezze tutt'intorno. Alcuni dei

Alcune delle lettere sporche usate per l'addestramento. (Foto: Google)








Il terzo è cercare le lettere riconosciute in un dizionario per ottenere le traduzioni. E per un ulteriore tentativo di accuratezza, le ricerche nel dizionario sono approssimative nel caso in cui una S venga erroneamente interpretata come 5.

Infine, il testo tradotto viene riprodotto sopra l'originale nello stesso stile.

Possiamo farlo perché abbiamo già trovato e letto le lettere nell'immagine, quindi sappiamo esattamente dove si trovano. Possiamo guardare i colori che circondano le lettere e usarli per cancellare le lettere originali. E poi possiamo disegnare la traduzione in cima usando il colore di primo piano originale, si legge nel post del blog.

Per essere il più efficiente possibile e consentire di completare tutti questi passaggi in tempo reale senza una connessione Internet o dati, il team di Google ha sviluppato una rete neurale molto piccola con un limite superiore alla densità di informazioni che può gestire. Dal momento che stavano generando i propri dati di addestramento, era importante includere i dati giusti ma niente di più, in modo che la rete neurale non utilizzasse troppa densità di informazioni su cose non importanti. Un esempio potrebbe essere come deve riconoscere una lettera con una leggera rotazione, ma non troppo.

Alla fine, gli utenti rimangono con 20 lingue in più ma la stessa velocità elevata.

VEDERE ANCHE: Il team AI di Google ci ha fornito i dettagli sulla loro ricerca sull'apprendimento automatico

Articoli Che Potresti Piacerti :