Il capo del team vocale di Apple spiega come Siri impara nuove lingue

In che modo Siri impara esattamente una nuova lingua? Nell'intervista odierna con Reuters, il capo del team vocale di Apple Alex Acero ha offerto uno sguardo dietro le quinte di come Siri sta insegnando nuove lingue, un processo che prevede la scrittura di sceneggiature, l'acquisizione di voci in accenti e dialetti multipli e l'uso dell'apprendimento automatico e artificiale intelligenza per costruire ed evolvere nuovi modelli linguistici nel tempo. Il sistema richiede un team di persone incaricate di leggere passaggi di testo trascritto manualmente.

Prima di aggiornare effettivamente Siri, Apple implementa innanzitutto il supporto per la dettatura per una nuova lingua.

Attualmente Siri parla 21 lingue in 36 paesi. In confronto, Microsoft Cortana supporta otto lingue su misura per tredici paesi, Google Assistant parla quattro lingue mentre Amazon Alexa funziona solo in inglese e tedesco.

Insegnare a Siri una nuova lingua comporta i seguenti passi:

  • Le persone leggono passaggi personalizzati di testo in una gamma di accenti e dialetti
  • Le registrazioni sono trascritte a mano in modo che Siri sappia esattamente cosa dovrebbe imparare
  • Catturano anche suoni in una gamma di voci
  • Viene creato un nuovo modello linguistico che tenta di prevedere sequenze di parole

Apple implementa il supporto per la dettatura per la nuova lingua prima che venga aggiunto a Siri, ecco perché la funzione Diction supporta più lingue rispetto a Siri (il prossimo aggiornamento del software macOS Sierra 10.12.4, ad esempio, consentirà il supporto per la dettatura di Shanghainese, un dialetto cinese parlato solo in quella città).

La dettatura consente ad Apple di acquisire registrazioni audio anonime, complete di rumore di fondo e parole borbottate. L'audio viene trascritto manualmente dagli umani, un processo che Acero sostiene aiuta a dimezzare il tasso di errore di riconoscimento vocale.

È solo dopo che sono stati raccolti abbastanza dati che Apple commissiona a un attore di registrare voci per Siri. Quando un nuovo linguaggio Siri è pronto per la prima serata, viene rilasciato con le risposte a quali stime Apple saranno le domande più comuni.

Apple ha investito ingenti somme nell'intelligenza artificiale e nell'apprendimento automatico per aiutare i modelli linguistici a evolversi nel tempo mentre Siri apprende di più su ciò che gli utenti chiedono.

Aggiornano Siri ogni due settimane con ulteriori modifiche, ha affermato Acero.

Iscriviti a iDownloadBlog su YouTube

Un possibile problema con l'approccio di Apple, secondo Charles Jolley, creatore di un assistente intelligente di nome Ozlo, è che non puoi assumere abbastanza scrittori per inventare il sistema di cui avresti bisogno in ogni lingua.

Altri assistenti personali, tra cui Google Now e Microsoft Cortana, mitigano il problema del ridimensionamento sintetizzando le risposte, qualcosa in cui Siri non è molto bravo a.

Viv, una startup fondata dai creatori originali di Siri che Samsung ha acquisito l'anno scorso, sta lavorando proprio a questo. "L'unico modo per scavalcare le attuali versioni con funzionalità limitate è quello di aprire il sistema e lasciare che il mondo gli insegni."

Sebbene ora Siri parli più lingue rispetto ai suoi rivali (Google e Amazon hanno dichiarato che intendono portare più lingue ai rispettivi assistenti), l'utente rimane comunque con un'esperienza sub-par perché, come ho già detto, altri assistenti sono più bravi a capire il contesto e fornendo più risposte alla conversazione.

L'acquisizione da $ 200 milioni dell'azienda Cupertino della startup australiana di machine learning Turi nell'agosto 2016 dovrebbe aiutare a migliorare i modelli di lingua e conoscenza di Siri.

Si prevede che Apple presenterà funzionalità avanzate di Siri (che potrebbero essere o meno esclusive di iPhone 8) durante il suo pellegrinaggio annuale per sviluppatori che inizierà con un keynote il 5 giugno. I miglioramenti di Siri possono includere il supporto multilingue.

iOS 10 supporta la digitazione in due lingue senza la necessità di cambiare tastiera, quindi forse Siri capirà presto più lingue senza la necessità di sceglierne una manualmente Impostazioni → Siri → Lingua?

Un Siri multilingue dovrebbe funzionare anche su Apple TV.

Un'intervista di novembre 2015 con diversi project manager di Apple TV ha suggerito che inizialmente Apple limitava Siri sul set-top box a soli otto paesi a causa delle differenze nella pronuncia di nomi di attori, film e registi in varie lingue e dialetti.

Fonte: Reuters