Opinione impopolare Gli appaltatori Apple ascoltano un po 'di audio Siri per migliorare il servizio. Cos'altro è nuovo?

Il rapporto dello scorso fine settimana del quotidiano britannico The Guardian specificava che Apple assumeva appaltatori incaricati di ascoltare l'audio di Siri, spingendo i critici a prendere la storia come prova che l'impegno di Apple per la privacy non è altro che parlare di marketing.

Un estratto dal rapporto del Guardian:

Gli appaltatori di Apple ascoltano regolarmente informazioni mediche riservate, offerte di droga e registrazioni di coppie che fanno sesso, come parte del loro lavoro che fornisce controllo di qualità o "valutazione", l'assistente vocale Siri dell'azienda, il Guardian ha imparato.

Sebbene Apple non lo divulghi esplicitamente nella sua documentazione sulla privacy rivolta al consumatore, una piccola parte delle registrazioni Siri viene trasmessa agli appaltatori che lavorano per l'azienda in tutto il mondo.

Sei sicuro al cento per cento di questo? Perché ho appena esaminato le schermate sulla privacy di Apple sparse nei suoi sistemi operativi e di sicuro spiegano chiaramente che alcune registrazioni Siri potrebbero essere utilizzate per migliorare il servizio Siri. Inoltre, sono stato in grado di trovare il seguente estratto combinando rapidamente il contratto di licenza del software iOS di Apple:

Utilizzando Siri o Dictation, l'utente accetta e acconsente alla trasmissione, raccolta, manutenzione, elaborazione e utilizzo di queste informazioni di Apple e delle sue consociate e agenti, inclusi i dati vocali e i Dati dell'utente, per fornire e migliorare le funzionalità di Siri, Dettatura e dettatura in altri prodotti e servizi Apple.

L'intero passaggio è in grassetto e penso che sia abbastanza inequivocabile sulle intenzioni di Apple.

La "rivelazione" secondo cui la società sta vendendo i dati vocali raccolti dall'assistente personale Siri a terzi appaltatori incaricati di addestrare l'algoritmo Siri come parte del suo tentativo di migliorare il servizio Siri non è una novità se si è seguito tecnologia.

Anche il Guardian riconosce altrettanto:

Valutano le risposte su una varietà di fattori, incluso se l'attivazione dell'assistente vocale è stata intenzionale o accidentale, se la domanda era qualcosa su cui Siri avrebbe potuto essere d'aiuto e se la risposta di Siri era appropriata.

Questa non è la prima volta che le persone hanno "scoperto" che alcuni frammenti audio Siri vengono trasmessi a terzi. Nel 2015, un dipendente anonimo di una società chiamata Walk N'Talk Technologies ha scritto su Reddit che i dati vocali analizzati dalla società provenivano da assistenti personali come Siri e Cortana.

Apple ha rilasciato la seguente dichiarazione al Guardian e ad altri:

Una piccola parte delle richieste di Siri viene analizzata per migliorare Siri e la dettatura. Le richieste dell'utente non sono associate all'ID Apple dell'utente. Le risposte di Siri vengono analizzate in strutture sicure e tutti i revisori sono tenuti a rispettare i rigorosi requisiti di riservatezza di Apple.

Il punto cruciale della storia del Guardian proviene da un "informatore", fondamentalmente un datore di lavoro Apple che ha riferito di aver sentito alcune cose private durante attivazioni accidentali.

Ecco cosa ha detto il giornalista al giornale:

Ci sono stati innumerevoli casi di registrazioni che hanno caratterizzato discussioni private tra medici e pazienti, accordi commerciali, rapporti apparentemente criminali, incontri sessuali e così via. Queste registrazioni sono accompagnate da dati dell'utente che mostrano posizione, dettagli di contatto e dati dell'app.

Le registrazioni audio delle query degli utenti sfruttano i metadati come la posizione per comprendere meglio il contesto. La parte preoccupante è il fatto che gli appaltatori sono in grado di ascoltare le conversazioni private in primo luogo. Come riconosce il rapporto stesso, ciò è possibile perché un utente può invocare accidentalmente Siri senza accorgersene, a sua volta spingendo la registrazione audio di tutto ciò che viene pronunciato dopo la frase di riattivazione "Hey Siri" da caricare sul server, e certamente non perché Siri registra segretamente conversazioni senza il consenso dell'utente.

I miei sentimenti su questo non sono certamente gli stessi del resto di Internet.

Nessun assistente digitale può migliorare nel tempo in base al potere dell'intelligenza artificiale e dell'apprendimento automatico da soli. Questo perché il modello di apprendimento automatico utilizzato da un assistente deve essere prima addestrato dai redattori umani: non ci sono due modi per farlo.

Google Foto non sarebbe stato in grado di riconoscere i volti con incredibile precisione se la società non avesse addestrato l'algoritmo utilizzando foto di persone reali. Il Face ID di Apple non sarebbe stato possibile se il suo machine learning non fosse stato addestrato su più di un milione di fotografie di diversi volti umani. Anche qualcosa di “ordinario” come il riconoscimento vocale può essere drasticamente migliorato utilizzando un algoritmo di apprendimento automatico che utilizza dati addestrati.

La dura verità è che le macchine non possono (ancora) addestrare i modelli di apprendimento automatico di altre macchine con risultati soddisfacenti: questo è il lavoro che noi umani eccelliamo.

Tutti coloro che si occupano seriamente dell'intelligenza artificiale impiegano editor umani per addestrare i propri algoritmi di apprendimento automatico con l'obiettivo di migliorare il servizio. Questi dipendenti sono esposti a qualsiasi contenuto sia al centro dei loro sforzi, sia che si tratti di brevi frammenti audio acquisiti da altoparlanti intelligenti durante le interazioni vocali o di foto caricate da persone su un servizio di condivisione di foto o di elementi contrassegnati nel feed di un social media, si ottiene l'idea.

Alcune aziende prendono la privacy più seriamente di altre società. Alcune aziende potrebbero non essere così trasparenti in termini di come i loro redattori umani affrontano il compito attuale come altre. E, in definitiva, alcune aziende che non hanno un track record così efficace per proteggere la privacy degli utenti saranno probabilmente esaminate più dai media e dal pubblico rispetto ad altre,.

Ma non credo per un secondo che sia nell'interesse di qualsiasi azienda richiedere che i propri dipendenti ascoltino realmente le nostre conversazioni con un assistente digitale personale solo perché possono o perché sperano in qualche modo di ricavare informazioni fruibili da quei privati conversazioni - e cavarsela per molti, molti anni senza che nessuno se ne accorga o si lamenta di nulla. Questo non è proprio possibile nel mondo in rete di oggi.

Non fraintendetemi, apprezzo il duro lavoro investigativo svolto da parte dei giornalisti che riferiscono di queste cose perché danno ai crociati della privacy qualcosa su cui masticare. Ma non sto comprando per un secondo la loro conclusione sottilmente velata o implicita che Big Tech non sta semplicemente impiegando redattori umani per addestrare Siri, Alexa e Google Assistant, ma anche per intercettare le nostre conversazioni per alcuni ancora da rivelare ma scopi sicuramente nefasti.

Sì, alcuni membri del personale Amazon che ascoltano le richieste di Alexa hanno effettivamente accesso agli indirizzi di casa degli utenti perché alcune richieste vocali includono la posizione. E sì, alcune registrazioni dell'Assistente Google recensite da umani possono potenzialmente includere conversazioni private perché i clienti sono liberi di dire qualsiasi cosa diavolo vogliono al loro assistente digitale.

È ciò che viene chiesto a questi dipendenti di fare con quelle registrazioni che conta alla fine della giornata. È il fatto che un maledetto editore umano possa abusare delle informazioni dei clienti privati ​​che dovrebbero preoccuparci, non il fatto che gli esseri umani stiano ascoltando selezioni audio in una struttura protetta lontana con l'obiettivo esplicito di migliorare il servizio.

Pensieri?