Bloomberg migliaia di dipendenti Amazon stanno ascoltando le registrazioni vocali di Echo

Amazon ha migliaia di dipendenti che ascoltano le clip audio Echo come parte del miglioramento dell'apprendimento automatico di Alexa in modo che l'assistente personale possa rispondere meglio ai comandi vocali.

Queste persone stanno ascoltando ciò che alcuni proprietari di Alexa raccontano all'assistente, rivedendo, trascrivendo e annotando le registrazioni audio per aiutare a formare il modello di apprendimento automatico di Alexa.

Bloomberg ha la storia:

Il lavoro è per lo più banale. Un lavoratore di Boston ha dichiarato di aver estratto i dati vocali accumulati per espressioni specifiche come "Taylor Swift" e li ha annotati per indicare che il ricercatore intendeva l'artista musicale.

Fin qui tutto bene, ma ...

Di tanto in tanto gli ascoltatori raccolgono cose che probabilmente i proprietari di Echo preferirebbero rimanere privati: una donna che canta malamente fuori chiave nella doccia, diciamo, o un bambino che grida aiuto. I team utilizzano chat room interne per condividere file quando hanno bisogno di aiuto per analizzare una parola confusa o imbattersi in una registrazione divertente.

Condivido la registrazione audio di un cliente con un collega al fine di svolgere il lavoro. Ma condividere una clip audio con un collega solo perché l'utente potrebbe aver detto che qualcosa di divertente o stupido mi sembra totalmente sbagliato e poco professionale.

A volte sentono registrazioni che trovano sconvolgenti o forse criminali. Due dei lavoratori hanno dichiarato di aver raccolto quello che credono fosse un attacco sessuale. Quando accade qualcosa del genere, possono condividere l'esperienza nella chat room interna per alleviare lo stress.

Mentre Amazon ha in atto un processo che i suoi dipendenti devono seguire ogni volta che sentono qualcosa di angosciante, alcuni dipendenti sono stati respinti in termini incerti con la spiegazione che non era compito di Amazon interferire.

Per coloro che sono preoccupati per la privacy, il rapporto afferma che le persone di questo team stanno ascoltando solo alcune delle registrazioni vocali che sono state catturate nelle case e negli uffici dei proprietari di Echo.

Un portavoce di Amazon ha commentato:

Prendiamo sul serio la sicurezza e la privacy delle informazioni personali dei nostri clienti. Annotiamo solo un campione estremamente piccolo di registrazioni vocali di Alexa per migliorare l'esperienza del cliente.

Ad esempio, queste informazioni ci aiutano a formare i nostri sistemi di riconoscimento vocale e comprensione del linguaggio naturale, in modo che Alexa possa comprendere meglio le tue richieste e garantire che il servizio funzioni bene per tutti.

I file audio sono privati ​​di informazioni identificabili come il nome e l'indirizzo completo di un utente. Detto questo, Amazon avrebbe potuto essere più trasparente con la sua raccolta di dati:

Il processo di revisione vocale di Alexa, descritto da sette persone che hanno lavorato al programma, evidenzia il ruolo umano spesso trascurato nella formazione degli algoritmi software. Nel materiale di marketing Amazon afferma che Alexa "vive nel cloud e diventa sempre più intelligente". Ma come molti strumenti software creati per imparare dall'esperienza, gli umani stanno facendo parte dell'insegnamento.

Gli utenti possono regolare le impostazioni per impedire ad Amazon di utilizzare le proprie registrazioni vocali per migliorare Alexa.

Il gigante della vendita al dettaglio online riconosce che le richieste di Alexa vengono utilizzate "per addestrare i nostri sistemi di riconoscimento vocale e comprensione del linguaggio naturale", ma questo è sepolto in un elenco di domande frequenti sul loro sito Web. Non importa come lo guardi, il riconoscimento vocale contestuale è un dado difficile da decifrare, ma l'apprendimento automatico promette di essere la soluzione giusta. Il problema è che i modelli di apprendimento automatico devono essere addestrati.

Amazon ha team di persone che etichettano e classificano le query vocali di Alexa

Ad esempio, Apple ha addestrato Face ID con oltre un miliardo di fotografie dei volti delle persone. Per quanto riguarda il riconoscimento vocale, il raggiungimento di un'elevata precisione richiede grandi quantità di dati etichettati.

Ecco perché non è possibile avviare Siri in una nuova lingua senza disporre di dati sufficienti per addestrare i modelli acustici e tali dati devono provenire da persone reali che eseguono query vocali reali. L'unica differenza tra Amazon e Apple è che il primo ha umani che ascoltano alcune di quelle registrazioni mentre il secondo, presumibilmente, non lo fa.

Ora che sai che Amazon ha un team globale che ascolta le clip audio Alexa, hai più o meno probabilità di continuare a utilizzare i prodotti Echo?

Facci sapere lasciando un commento qui sotto.