Condividi su:
Share on facebook
Share on twitter
Share on telegram
Share on whatsapp

Google: la grande azienda di profilazione di dati

1. Cos’è Google

Google e i nostri dati, due protagonisti del web che sono da anni sempre più legati. Si scrive Google, ma se dovessimo raccontare e descrivere tutto ciò che sta dietro l’azienda statunitense potremmo iniziare oggi e finire nel giro di qualche mese… Se poi vogliamo aggiungere tutto il rapporto che lega l’azienda fondata da Larry Page e Sergey Brin nel 1998 e i dati, ecco che tutto diventa più complesso ma anche estremamente sofisticato.

Inizialmente l’azienda nasce come un innovativo motore di ricerca. Passo dopo passo, giorno dopo giorno, è divenuta non solo uno dei pilastri del web ma un vero e proprio fulcro del mercato online dove ogni nostra attività in rete passa dall’azienda statunitense.

Ad oggi, Big G raccoglie un’enorme quantità di dati sugli utenti a scopi pubblicitari, anche più efficacemente dei social. È senz’altro curioso che ancora nessuno scandalo mediatico come quello di Cambridge Analytica abbia scosso l’opinione pubblica. Questo perchè, per nostra fortuna, Google gestisce con miglior trasparenza e sicurezza le nostre informazioni sensibili.

2. L’azienda

Ma facciamo un passo indietro. ProfilaMy è un blog che ha come obiettivo quello di aiutarti a comprendere tutto il tenebroso mondo di cui fa parte la profilazione, dal marketing pubblicitario online ai big data. Ma come posso spiegarti tutto questo senza darti le basi del castello che stiamo per costruire? Se pensi di conoscere bene la storia di Google puoi passare al prossimo paragrafo, altrimenti vediamola insieme.

2.1 Dagli inizi ad oggi

Io e Google abbiamo gli stessi anni. E’ stata fondata nel 1998 e questo significa solo una cosa: sono vecchio. In realtà la storia dell’azienda inizia a tutti gli effetti ancora prima, nel 1995 alla Stanford University. Larry Page stava valutando di iscriversi alla scuola di specializzazione di Stanford e Sergey Brin, uno studente, aveva ricevuto il compito di fargli visitare l’università. Nella loro camera i due studenti crearono un motore di ricerca che sfruttava i link per stabilire l’importanza di singole pagine nel World Wide Web. Il motore di ricerca si chiamava “Backrub“.

Sergey e Larry: The founders

Backrub fu ribattezzato subito dopo “Google” (per fortuna!). Il nome deriva da un gioco di parole basato sull’espressione matematica che rappresentava il numero 1 seguito da 100 zeri: Googol. I due studenti, non sapendo come si scriveva, hanno registrato il marchio esattamente come lo pronunciavano. Il nome rappresenta perfettamente la mission di Larry e Sergey: “organizzare le informazioni di tutto il mondo e renderle universalmente accessibili e utili”.

2.2 L’agoritmo Page Rank

Google, inteso nella sua parte più tradizionale, ovvero quella del motore di ricerca, non è certamente banale. È il risultato di un algoritmo (se non sai cosa significa, no panic, è spiegato nel dettaglio nel nostro profilario) con all’interno un sistema denominato Page Rank. ll Page Rank, come approfondiremo dopo, è un metodo per determinare “l’importanza” di una pagina web, che è la chiave di tutto quanto.

A differenza dei motori di ricerca esistenti, Google Page Rank ebbe quel qualcosa in più sin da subito. Gli altri motori, per indicizzare e posizionare i siti web nei loro database, si limitavano a contare le ricorrenze nel testo dei termini inseriti nella query a schermo dagli utenti. Il risultato è che ai primi posti della SERP (Search Engine Results Page) si posizionavano siti web non sempre pertinenti con le informazioni desiderate. L’idea di Sergey e Larry era innovativa perchè decisero di verificare e contare non solo le ripetizioni delle parole ma anche i link che provenivano da altri siti e che puntavano ad una determinata pagina. Il loro ragionamento era semplice:

“Se un certo sito è citato e consigliato da molti altri significa che ha dei contenuti interessanti e quindi è giusto farlo vedere prima di altri.”

Sergey Brin, Larry Page

Un altro fattore di cui l’algoritmo tiene conto è la “qualità” dei contenuti e anche dell’importanza dei siti da cui provengono i link. Ad esempio, se il sito di Facebook consiglia o cita Profilamy, lo stesso acquisterà valore agli occhi di Google. Avrà di conseguenza un PageRank più elevato rispetto ai concorrenti che magari hanno solo delle citazioni da siti di “basso livello”. 

2.2.1 La formula

Ovviamente, come tutte le ricette perfette, non è dato sapere tutti i fattori che entrano in gioco nel PageRank. D’altronde voi svelereste mai il vostro segreto aziendale? È come se il signor Ferrero domani mattina si alzasse e spoilerasse al mondo la ricetta originale per fare la Nutella. Un pezzo di ricetta è però sotto gli occhi di tutti. L’algoritmo completo per il calcolo del PageRank fa ricorso all’uso della teoria dei processi Markov ed è classificato nella vera categoria degli algoritmi di Link Analysis Ranking. Si basa su una formula che ti lascio qui di seguito (non spaventarti tra sommatorie e lettere strane, ti prego, nessuno ti chiederà mai di saperlo a memoria).

PR[A]={\frac  {1-d}{N}}+d\left(\sum _{{k=1}}^{n}{\frac  {PR[P_{k}]}{C[P_{k}]}}\right)

dove:

  • PR[A] è il valore di PageRank della pagina A che vogliamo calcolare.
  • N è il numero totale di pagine note.
  • n è il numero di pagine che contengono almeno un link verso A. Pk rappresenta ognuna di tali pagine.
  • PR[Pk] sono i valori di PageRank di ogni pagina Pk.
  • C[Pk] sono il numero complessivo di link contenuti nella pagina che offre il link.
  • d (damping factor) è un fattore deciso da Google e che nella documentazione originale assume valore 0,85. Può essere aggiustato da Google per decidere la percentuale di PageRank che deve transitare da una pagina all’altra e il valore di PageRank minimo attribuito ad ogni pagina in archivio.

Se ancora pensi di non averci capito niente, ti lascio anche un’immagine che riassume graficamente il funzionamento.

In questo modo Sergey e Larry riuscirono a far sì che Google venisse usato da tutti, senza nemmeno spendere un dollaro in pubblicità per migliorare la presenza del proprio motore di ricerca.

2.3 GooglePlex, la sede

Come tante aziende di successo americane (Apple, Amazon..) anche la sede di Google è partita da un garage. I due amici dopo aver sviluppato il motore di ricerca misero in piedi l’azienda. Ben presto si resero conto che il garage gli sarebbe stato sempre più stretto. A quel punto la decisione di trasferirsi fu inevitabile: gli uffici si spostarono nella sede attuale, chiamata anche “Googleplex“, a Mountain View, in California. 

GoglePlex, sede principale dell’azienda a Mountain View.

Per le multinazionali dell’hi-tech mondiale è ormai un must-have avere dei grandissimi quartieri generali, somiglianti per estensione e distribuzione agli edifici dei campus universitari. Delle vere e proprie città con tutti i servizi necessari. E Google in questo non fa assolutamente eccezione: Googleplex, sede centrale dell’azienda, si estende su una superficie di 110mila metri quadrati, con all’interno un parco pubblico di 20mila metri quadrati. Gli edifici sorgono nell’area che era originariamente occupata dall’azienda Silicon Graphics (SGI), che poi è stata totalmente riqualificata per dare vita a questo centro tecnologico. Prezzo di acquisto? 319 milioni di dollari.

Il centro è all’avanguardia anche in prospettiva futura. La società è infatti da sempre attenta alla sostenibilità ambientale. Big G ha dotato il Googleplex di fonti energetiche alternative che ne possano garantire l’autosufficienza energetica. In particolare, il tetto di 8 degli edifici principali è stato ricoperto di pannelli solari, capaci di generare 1,6 megawatt di energia. Inoltre, sono presenti anche 4 grandi Bloom energy server che sfruttano biogas e biodisel per generare 100 kilowatt ognuno.

2.4 Da dove arrivano i proventi di Google

Il successo di Google viene soprattutto grazie alla costruzione del motore di ricerca più potente del mondo e di averlo fatto dando forma e forza alla rete di Internet. L’azienda statunitense è cresciuta negli anni a braccetto con la rete, imparando ed acquisendo nozioni e informazioni che hanno poi trovato forma e operatività negli algoritmi matematici che hanno fatto evolvere il motore di ricerca. Uno dei problemi che inizialmente si presentarono a Larry e Sergey era come monetizzare i profitti del motore di ricerca.

Oggi però Google è molto più di un motore di ricerca, è un’azienda che offre servizi in quasi tutti i settori dell’IT. Negli anni Big G è riuscita ad espandersi anche nel mondo del Mobile grazie al progetto Android e alla filosofia e alla cultura aziendale. Il suo essere Open Source e disponibile è un punto di forza, anche se apparentemente, dal punto di vista del guadagno immediato potrebbe sembrare il contrario. In generale, il modello di Google è difficilmente replicabile ed unico nel settore.

2.4.1 La holding Alphabet

L’azienda fa oggi parte della Holding Alphabet che è quotata in borsa e racchiude al suo interno altri progetti e aziende di minor rilevanza che costituiscono il potenziale futuro del conglomerato e anche direttamente di Google. Ma perchè è stato necessario crearla nel 2015? Principalmente per due motivi: a) rendere più trasparenti le attività inerenti a Google, il marchio più conosciuto in assoluto del gruppo; b) concedere una maggiore autonomia alle società del gruppo che operano in settori diversi da quello dei servizi internet.

Curiosità: il dominio della holding Alphabet

2.4.2 I profitti nel dettaglio

Ad ogni modo, per noi questo passaggio è irrilevante, ma necessario per parlare correttamente dei provendi dell’azienda. Nel grafico qui sotto ti mostro da dove provengono i principali guadagni di Big G. Il dato, anche se non è proprio recente, mostra una prevalenza dei servizi pubblicitari, che a sua volta vengono suddivisi tra profitti interni (quelli legati alle pubblicità su Youtube, sul motore di ricerca, sul Play Store e su GMaps), e quelli legati ai servizi per i membri che utilizzano Google Ads per proporre pubblicità sul proprio sito.

Seguono poi in percentuale i proventi di altri serivizi Google (14.5%), come i progetti Google Home, o i ricavi derivanti dalle vendite del telefono proprietario Google Pixels, per fare degli esempi. Nel grafico poi troviamo la voce altro, dove sono incluse le altre società Alphabet e i progetti di ricerca come ad esempio quelli legati ai droni e alle auto autonome. Questa prevalenza dei servizi pubblicitari è legata all’uso delle grandi quantità di dati, che offrono un notevole vantaggio competitivo in quanto permettono di generare annunci mirati in base alle buyer personas create con la profilazione.

Profitti della holding Alphabet per settore e prodotti

Se vi state chiedendo invece come questi profitti sono suddivisi nel mondo, il grafico qui sotto rende bene l’idea. Google ha una presenza maggiore (in termini almeno di profitti) negli stati uniti, dove è stata fondata l’azienda. Il secondo mercato più grande è l’Europa, dove i suoi servizi generano il 33% dei ricavi ed infine in asia e in cina dove le percentuali sono del 15%. L’azienda è quindi presente in tutto il mondo e i servizi, come abbiamo già detto, coprono davvero moltissimi settori. Sarebbe quasi impossibile vedere ad oggi altre prospettive di crescita, ma proprio grazie ai dati e a una maggior capacità di profilazione, il futuro per Google si prospetta ancora roseo.

Profitti della holding Alphabet per regione del mondo

3. La profilazione di Google

Se quando navigate in rete usate Gmail, un telefono Android o se guardate video su YouTube, allora ci sono buone possibilità che Google sappia (quasi) tutto di voi. Le vostre abitudini, i vostri interessi e i vostri stati d’animo. Tutto qui? No… Se non usate questi servizi ma semplicemente navigate sul Web, vengono comunque registrate le vostre scelte e i siti che avete visitato. Questo anche se non usate il motore di ricerca dell’azienda di Mountain Veiw o se non avete un account. Ma come è possibile? Prima di addentrarci in tutto questo, ti proporrò questo simpatico scambio audio, che da l’idea del fenomeno che sto cercando di raccontare. Clicca play, ci risentiamo sotto.

Pronto? Pizzeria Google.

Google per decenni ha prodotto servizi e applicazioni utili permettendo al mondo di utilizzarle “gratis”; in cambio noi abbiamo fornito le nostre preferenze, i nostri interessi, le nostre abitudini e anche i nostri spostamenti. Paradossalmente il nostro desiderio di avere servizi migliori, di poter usufruire di un servizio su misura che a volte è anche in grado di intuire le nostre necessità, ha spinto verso queste grandi raccolte e accumuli di dati. È come entrare nel nostro bar preferito e vedersi chiedere “il solito?”. Si ok, sto chiaramente esagerando, ma rende bene il concetto.

3.1 La pervasività del sistema

Google è nato oltre 20 anni fa e da allora è divenuto parte integrante della vita di tutti noi anche nella quotidianità. Il sistema funziona perchè è pervasivo. Ho detto tutto e niente. In sostanza, se nessuno utilizzasse i servizi di Google, Google non esisterebbe. Oggi però l’azienda non è solo il motore di ricerca, è molto altro. Nel corso degli anni sono state più di 160 (cosaaaa? 160?!) le società acquisite da Google, oltre dieci solo negli ultimi due anni. E quanto cash ha speso? L’investimento economico è quantificabile in centinaia di miliardi di dollari. In questo modo l’azienda recupera più dati possibili ed è davvero difficile scampare alla profilazione e difendere la propria privacy.

3.2 Come difendersi

Cosa può essere utile fare se abbiamo l’intenzione di evitare di subire un’invasione digitale da parte di Google tramite i nostri apparecchi elettronici? Facciamo una premessa. Nei nostri articoli lo abbiamo sempre citato: anche contro questo problema abbiamo un’importante arma per difenderci da queste “invasioni”: il GDPR (Per i più curiosoni puoi trovare tutto il testo qui). Il regolamento ci aiuta nella protezione dei dati, ma attenzione: all’interno del regolamento, in particolare al Considerando 47, viene specificato che lo svolgimento di attività di marketing diretto rientra tra i legittimi interessi del titolare del trattamento.

Questo significa che Google può trattare i nostri dati personali per finalità di marketing senza chiedere il nostro preventivo consenso. In Italia però vige ancora la regola secondo cui per poter utilizzare i dati personali di un utente per inviargli comunicazioni commerciali o promozionali, il titolare del trattamento deve ottenere il consenso, libero ed informato, dell’interessato stesso.

Non c’è quindi una vera e propria strategia che permette a noi utenti di difenderci, ma è comunque possibile applicare delle accortezze che vedremo di seguito in questo articolo. In compenso noi europei possiamo comunque ritenerci soddisfatti. Grazie al Regolamento Europeo, siamo più tutelati rispetto ad altri paesi del mondo come ad esempio gli USA.

3.3 I “nostri” dati

La mole di dati di cui dispongono su ognuno di noi è davvero enorme. Vengono recuperati nelle maniere più differenti e racchiusi in un unico fulcro centrale. Il fatto che siano nelle mani di una sola azienda costituisce una minaccia reale per la privacy? La preoccupazione c’è ed è condivisa anche dall’European Data Protection Board (l’organo europeo istituzionale di riferimento).

Google, va detto, non è l’unica azienda che recupera e immagazzina i nostri dati. Questa è una tendenza comune delle Big Companies, che raccolgono i nostri dati per scopi prevalemntemente pubblicitari. In questa infografica qui sotto, possiamo notare quali dati vengono registrati dalle principali aziende tech. Come possiamo vedere, per Google, alcuni dati vengono recuperati direttamente con alcune applicazioni e servizi specifici come ad esempio Gmail o Google Calendar.

I dati che vengono registrati dalle Big Companies

3.4 Quali dati concediamo a Google?

Quando per le mille comodità offerte, registriamo un account a Google, come ad esempio abbiamo fatto noi del team con la mail info.profilamy@gmail.com, bisogna sottoscrivere ed accettare i termini di servizio. Questi non sono altro che uno speciale contratto che lega te e Google indissolubilmente (fino a che non deciderai in sostanza di rescindere il contratto). Il contratto che firmi senza troppi problemi lo puoi trovare qui. in sostanza viene detto che tutti i dati personali rimangono di proprietà della persona. Ma, e c’è un ma… utilizzando i servizi dell’azienda, la stessa può utilizzarli a vita per i propri scopi e per quelli delle cosiddette terze parti.

Adesso che abbiamo il nostro fantastico account la domanda successiva è: ma quali e quante informazioni concediamo a Google ogni giorno? In altre parole, cosa sa Google veramente di noi? L’azienda fornisce queste informazioni in un altro documento, che puoi trovare qui. In queste 30 pagine sono racchiuse tutte le informazioni di cui viene tenuta traccia, che in parte abbiamo riportato già prima nell’infografica. Non preoccuparti comunque, non dovrai leggerlo. Ti faro qui di seguito un veloce riassunto.

Oltre a nome e cognome, email, numero di telefono, indirizzo e paese, sesso e data di nascita, Google controlla le email che inviamo e riceviamo su Gmail (ma da un po’ di tempo non ne legge più il contenuto), i siti che visitiamo, i luoghi che abbiamo visitato e cercato su Google Maps, e molto altro ancora. Ultimi arrivati sono ad esempio gli assistenti vocali Google Home a cui è permesso registrare tutte le informazioni che noi chiediamo all’assistente tramite la voce.

3.5 Ma come possiamo scoprire che dati possiede effettivamente?

Tutti i dati che abbiamo elencato fin’ora sono tutti quelli che in linea teorica, l’azienda può acquisire dal momento che si accettano i termini e le condizioni d’uso del sistema. Va detto che ti basta fare un giro sulla pagina di impostazioni del tuo account per scoprire molte cose (belle e brutte). Da qui hai a disposizione un vero e proprio centro di controllo con cui puoi gestire le tue preferenze e scoprire cosa conosce di te il nostro Grande Fratello 2.0. Di seguito ti riporterò una serie di tipologie di dati, e grazie a Wired saprò anche dirti come puoi migliorare la tua privacy in semplici passi. Lo troverai dopo la scritta “ProfilaMy aiuta”.

3.5.1 Cosa Google pensa di te

Il sistema genera una buyer persona per ogni nostro account. Questo, ormai lo avrai capito, è possibile attraverso i dati. Ora puoi consultare su questa pagina cosa pensa di te Google, le tue preferenze. Ad esempio sa se sei fidanzato o no, o se ti piacciono i gatti più dei cani.

ProfilaMy aiuta: come puoi rimuovere il tracciamento di queste informazioni? Puoi farlo da qui.

3.5.2 I tuoi spostamenti

Google, grazie a Maps riesce a tracciare tutti i tuoi spostamenti, in qualsiasi momento. Ne aveva parlato anche @erikaconve nel suo articolo (puoi leggerlo qui). Se avete un cellulare Android molto probabilmente questo processo è addirittura automatico. Vuoi sapere la storia dei tuoi spostamenti? Scommeto che se io fossi Google saprei anche dove sei stato l’ultimo sabato sera di festa prima del COVID. Te lo ricordi? Prova a controllare qui se ti viene in mente.

3.5.3 La storia delle vostre ricerche

Banalmente tra tutti i dati che vengono immagazzinati non possono di certo mancare le nostre ricerche sul motore di ricerca: la nostra cronologia. Non è però solo un semplice elenco dei siti che visitiamo ma bensì vengono salvate informazioni anche sui banner che clicchiamo e le nostre operazioni. Puoi trovare tutto questo qui.

3.5.4 Chi altro ha accesso ai vostri dati

Quante volte ti è capitato per risparmiare tempo di effettuare l’accesso tramite il servizio di autenticazione di Google? Queste applicazioni terze hanno accesso ai vostri dati per fornirvi il login ma allo stesso tempo avviene anche il processo inverso. Per scoprire a quali app hai dato l’autorizzazione puoi andare a questo link e verificare a chi hai fornito l’accesso.

ProfilaMy aiuta: allo stesso link, puoi anche rimuovere l’accesso ai dati in qualsiasi momento, clicca sull’app in oggetto a cui vuoi revocare i permessi e clicca sul bottone rimuovi accesso. A questo punto perderai il collegamento dell’app al tuo account Google.

3.6 Una spiacevole scoperta…

Tutto questo può sembrare davvero troppo, quasi paradossale. Nei giorni scorsi, mentre ricercavo informazioni per la scrittura di questo articolo, mi sono imbattuto in un video (su Youtube, guardacaso…) che mi ha lasciato estremamente perprlesso. Un ragazzo, Devon, ha provato a scaricare tutti i propri dati da Google (la cosa è possibile, ma ci torniamo tra un attimo). Il risultato: 155 GB di file e report giorno per giorno con immagini, file audio e tutto quanto abbiamo detto fino a poco fa. Guardare per credere, ti lascio qui sotto il video in lingua inglese. Tieni presente non è recente (risale al 2019), e alcune cose possono essere cambiate nel tempo a seguito di aggiornamenti. Ad esempio è stata risolta la questione che ogni singola immagine o file privato venisse mappato con un URL pubblico e quindi potenzialmente accessibile a chiunque.

L’incredibile scoperta di Devon Crawford

La parte più inquietante del video però è a parer mio il collegamento con le terze parti. Qui scopriamo che Google registra un po’ di tutto utilizzando dati provenienti anche da altri siti come gli acquisti Amazon con i relativi prezzi e informazioni sull’acquisto.

3.6.1 Backup dati e report mensili

Poco fa ti ho detto che ti avrei spiegato come scaricare i tuoi dati. È possibile infatti recuperarli tutti per averli sempre con te, o semplicemente per scoprire qualcosa in più, proprio come ha fatto Devon. Se vuoi scaricare i tuoi dati, puoi procedere a questo link. In alternativa, è anche possibile farsi inviare un report mensile contenente tutti i tuoi dati. In questo modo puoi monitorare costantemente la tua privacy e gestire al meglio i permessi e le tue informazioni. Puoi richiedere il report mensilmente dal link del download di poco fa.

3.7 E i servizi collegati?

Abbiamo già parlato nei paragrafi precedenti di come Google non sia solo il motore di ricerca, ma come l’azienda ormai abbia al proprio interno numerosissimi progetti, servizi e sistemi collegati ad esso. L’esempio più emblematico è Youtube, servizio di streaming video online acquistato negli anni dall’azienda di Larry Page e Sergey Brin. Tutti i dati che lasciamo sulla piattaforma, non sono slegati da quelli che lasciamo sul motore di ricerca. Bensì contribuiscono ad arricchire la banca dati formandone una ancora più enorme.

3.7.1 Google e Fitbit: anche i dati biometrici?

È di ormai un anno fa la notizia della fusione Google-Fitbit, ennesima “razzia” dell’azienda statunitense che a suon di milioni si è accaparrata anche quest’altra azienda in forte espansione. Questa fusione può sembrare come tutte le altre ma non è così. Se infatti google può recuperare tantissimi dati nelle forme più disparate, i dati biometrici e fisici non venivano ancora registrati da loro. Ora si teme che l’eventuale ulteriore combinazione e accumulo di dati personali sensibili riguardanti le persone in Europa da parte di una grande azienda tecnologica potrebbe comportare un elevato livello di rischio per i diritti fondamentali alla privacy e alla protezione dei dati personali.

3.7.2 La suite Google, gratuitamente per te

La suite Google, che da poco è stata rinominata come Google Workspace è uno spazio di lavoro in cui sono presenti programmi per risolvere praticamente tutte le nostre esigenze di lavoro online (e anche in condivizione, in team). Ma vi siete mai chiesti come è possibile che Google fornisca a tutti noi gratuitamente questi servizi mentre altre aziende come Microsoft fanno pagare il pacchetto Office a prezzi salati? Come è possibile che i vari Google Drive, Google Meet, Google Classroom, Google Calendar funzionino solo in cambio della creazione di un account? Sarebbe una follia per una qualsiasi azienda che ha scopi di lucro, ma non per Big G. Avendo già analizzato il modello di business, e avendo scoperto che tutta l’azienda ruota intorno ai dati, possiamo dedurre che in questo caso il vero bene messo in vendita siano i nostri dati. Tristan Harris, noto ex ingeniere Google lo sapeva bene, lui aveva messo in guardia un po’ tutti affermando

“Se non stai pagando per un prodotto, allora il prodotto sei tu”

Tristan Harris

Una frase che se analizzata eticamente, apre a scenari davvero molto vasti.

Tristan Harris: noi siamo il prodotto

Tornando a noi tutti questi servizi, collegati in un unica base centrale offrono dati come gli affluenti forniscono acqua ad un fiume principale.

3.8 I profili “ombra”

Bene, siamo spiati. Fine? Mi metto il cuore in pace? No, non è tutto… Google, come per altro Facebook, non si limita a profilare gli utenti che utilizzano i suoi servizi. L’azienda utilizza una serie di tecniche di raccolta dei dati per creare i cosiddetti profili “ombra” per gli utenti non registrati. Se quindi ti stavi chiedendo se basterebbe non avere un account Google per sfuggire a questo problema, ti stavi sbagliando. Ok, questo può avere dei vantaggi in quanto i dati raccolti non sono tanti quanto nel caso di un utente registrato, ma sono comunque abbastanza per avere informazioni utili in chiave pubblicitaria. Il vero punto di contatto tra tutte questi sistemi di profilazione di questo sistema perfetto è Google Analytics. Il servizio, che trovi spiegato brevemente qui, serve ad effettuare un’analisi del traffico Web. Il servizio si stima sia attivo su decine di milioni di siti Web. Inoltre è in grado di “seguire” i movimenti di un utente da sito a sito, determinando così un profilo con un buon livello di dettaglio di una persona che invece effettivamente non ha dato il consenso al tracciamento delle proprie attività online.

Dai basta non ne posso più, ora è finito?” No… prima di passare alle armi con cui Google riesce a recuperare tutti questi dati, devi sapere che vengono anche acquistate delle informazioni, in particolare sugli acquisti con carta di credito. Dove si trova questo mercato in cui reperire questi dati? Sicuramente non a quello del sabato del mio paese. I vari “data broker” recuperano, gestiscono e vendono queste informazioni tramite aziende specializzate nella raccolta e vendita di dati commerciali. Questi servono a raffinare ancora di più la profilazione e a fornire agli inserzionisti un riscontro sull’efficacia delle proprie campagne pubblicitarie. Praticamente un goal a porta vuota.

3.8.1 Un parallelismo per capirci meglio: lo share

Permettetemi questa digressione che forse vi può far capire quanto siano importanti questi ultimi dati per tutto il sistema di Google Analytics e più in generale di analisi dei dati legati alle inserzioni. In un commercio pubblicitario tradizionale, come ad esempio quello televisivo, l’inserzionista può comprare uno spazio pubblicitario e pensare che venga visto da x persone, più o meno quantificabile grazie ai servizi di share (se non sai di cosa si stratta l’ho spiegato meglio nell’infografica qui sotto). Oggi invece, online esiste totalmente un altro concetto di fare pubblicità, grazie a tutta questa mole di dati. È infatti possibile fornire all’inserzionista una serie di dati dettagliati che giustificano nel dettaglio l’investimento fatto, anche al termine della campagna valutando effettivamente quale è stata la percentuale di conversioni.

Lo share televisivo: di cosa si tratta?

4. Le armi di Google per la profilazione

Adesso che abbiamo scoperto quali sono i dati che l’azieda recupera a nostre spese, non posso esimermi dal raccontarvi come avviene la fase di recupero dei dati. In questa fase, il sistema si avvale, oltre ovviamente che del motore di ricerca, in cui vengono tracciate le nostre ricerche, attività e cookie vari, anche dei nostri dispositivi e servizi, con i quali interagiamo per ricercare informazioni. Infatti, il mondo di Google può contare nella sua scuderia anche diverse aziende, prodotti e servizi che sono sotto la direzione del colosso di Mountain View. Android è l’esempio maggiore: è il principale sistema operativo per dispositivi mobile ed è installato su circa il 72% dei dispositivi mobile (dati statscounter, segue iOS con il 27%). Di proprietà Google, esso è di conseguenza una fonte primaria per la profilazione degli utenti.

Come il sistema operativo per smartphone abbiamo altre “fonti”. Tra i servizi offerti sotto il controllo di Big G abbiamo:
– Il play store
– Google chromecast
– La suite Business (Google Workspace)
– Youtube
– Google Ads
– Google Meet
e molti altri…

Ma non voglio tediarti con questa lista infinita che conta centinaia di prodotti, ti lascio qui un link alla pagina Wikipedia che li raggruppa tutti. Tutti questi servizi e prodotti, coprono davvero ogni aspetto della nostra vita. Ultimi arrivati, sono i nuovissimi assistenti vocali che negli ultimi anni hanno preso piede sempre di più nel mercato non senza polemiche. Insomma, un’altra nuova fonte con la quale recuperare dati.

Ci stiamo muovendo in una direzione che porterà a scenari di controllo della popolazione tramite l’intelligenza artificiale e il machine learning. In questo scenario, le Big 5 (Amazon, Microsoft, Apple, Facebook e Google) ci seguiranno h24? Probabilmente è così, e io sto solo approfondendo il caso di Google, ma il fenomeno non risparmia gli altri colossi del settore.

4.1 Gli smartphone Android

Tu che tipo sei? Android o Iphone? Già questa domanda divide il mercato in due grandi macro aree, ed una di queste è di proprietà di Big G. Infatti, Google ha a disposizione un’arma efficacissima per ottenere una profilazione ancora più precisa dei suoi utenti: il sistema operativo Android. I numeri, anche per questo progetto sono enormi: due miliardi di telefoni Android attivi nel mondo. Il telefono che portiamo in tasca, in altre parole, è lo strumento perfetto per raccogliere ulteriori informazioni che Google non potrebbe ottenere dalle nostre attività Web. L’azienda può così conoscere con maggior precisione in nostri spostamenti, oppure la nostra attività fisica, anche senza un account Google.

In ogni caso, anche qui, è necessario fornire il consenso al trattamento, e lo facciamo in fase di inizializzazione dei nuovi telefoni. Ma attenzione, se non lo si da, non si può usare il telefono. È un po’ come comprare la macchina nuova ma non usarla mai e lasciarla in garage spenta. Insomma, diamo il consenso, e poi grazie anche alla presenza del Play Store (da dove scarichiamo app e giochi) è possibile per l’azienda tenere traccia anche delle aplicazioni che scarichiamo e dell’uso che ne facciamo. Anche in questo caso, per utilizzare al meglio lo store, è necessario un account. Strano vero? No. Insomma, Big G in questo modo ha il “vantaggio hardware” che gli consente di affinare la nostra buyer persona ancora di più, con il risultato di poterci collocare in un target pubblicitario più preciso ed efficace.

4.2 Gli assistenti vocali Google Home

Ne abbiamo già parlato insieme nell’articolo dedicato agli assistenti vocali (se te lo sei perso puoi trovarlo a questo link). Gli assistenti vocali, senza troppi giri di parole, recuperano una quantità enorme di nostre informazioni. Eppure, i dispositivi come Google Home o Amazon Echo (Alexa) sono considerati tra le più grandi innovazioni tech degli ultimi anni. Ciò che è necessario capire è se realmente questi dispositivi ci spiano in stle 1984 di George Orwell o si tratta solo di una preoccuazione collettiva infondata? Cerchiamo di scoprirlo e vediamo perchè secondo me possiamo considerarla un’arma per la profilazione.

Machine learning e intelligenza artificiale sono alla base di questi dispositivi di domotica, ma affermare che gli assistenti vocali siano in grado di analizzare il nostro linguaggio è, al momento, errato. Il linguaggio è qualcosa di organico, singolare e mutevole, frutto di momenti ed esperienze singolari. Se quindi è difficile affermare che questi dispositivi ci spiano, è altrettanto vero che i dati che recuperano non sono in discussione, ma cosa significa? In breve, intendo dire che è assolutamente reale ed affermato che questi dispositivi sono utilizzati per recuperare informazioni.

5. La gestione dei dati

La quantità di dati degli utenti Google che vengono gestiti è davvero enorme. Secondo le stime di CloudTweaks, Google gestisce 10 exabyte di dati, ovvero 10 miliardi di gigabyte. I dati che che gli inserzionisti AdSense possono gestire sono però limitati e controllati. È importante però notare, anche per sfatare un falso mito abbastanza comune, che né Google né Facebook vendono i dati degli utenti a società esterne. Google in particolare, li conserva e li gestisce internamente per alimentare la propria piattaforma pubblicitaria. Questo tipo di business è infatti notevolmente più profittevole. La gestione dei dati è quindi sicura, e almeno su questo possiamo dormire sonni tranquilli, anche se sicuramente, i più di voi che leggeranno questo articolo, preferirebbero che nemmeno venissero usati a scopi interni e pubblicitari.

Si lo so che sei rimasto al dato incredibile che ti ho mostrato nel paragrafo precedente… ti starai chiedendo quanti cavolo sono 10 Exabyte. Cerchiamo di capirlo insieme, nella tabella qui sotto ti ho riportato la tabella di riferimento dei multipli del byte, nel quale puoi vedere dove si colloca l’exabyte. Ora prova a immaginare, sapendo che una foto pesa in media 4 MB, quante foto possono essere immagazzinate in quel dato. In più, per convincerti che questo numero è enorme, puoi sempre pensare che fino al 2007 l’exabyte non è stato quasi mai impiegato in un contesto pratico; questo perché la mole di dati quantificata è impressionante. Per averne un’ulteriore idea, si può pensare, ad esempio, che la stima fatta per quantificare la somma di tutto il materiale stampabile del mondo è di “soli”  5 exabyte.

Capire i dati: la scala del Byte

5.1 Il confronto con facebook

Per renderci davvero conto di come Google infondo operi con apparente trasparenza, è utile fare un confronto con Facebook, almeno sotto questi aspetti di gestione dei dati degli utenti. Facebook, soprattutto nei primi anni, era un vero e proprio Far West della profilazione. Se è vero che Google raccoglie e incrocia molti più dati di Facebook, è pure vero che finora nessuno scandalo del genere “Cambridge Analytica” ha mai scosso il colosso di Mountain View. Se dovessi rendere conto ai complottisti, potrei anche citare i ricchi stipendi che l’azienda di Page e Brin paga ai lobbisti di stanza a Washington, ma non sarebbe una risposta sufficiente. La verità è che Google, rispetto a Facebook, ha sempre trattato i dati degli utenti con meno leggerezza e maggior lungimiranza.

I dati sono al centro delle strategie di marketing della maggior parte delle aziende tech del nuovo millennio. Nonostante questo, a qualche anno di distanza da quando l’opinione pubblica si è accanita contro Facebook e lo scandalo Cambridge Analytica di cui ci ha anche parlato @martinapappalardo in un articolo (lo trovi qui), il colosso di Mountain View rimane in disparte. Per onore di cronaca, anche in quel periodo l’azienda rimase a guardare, non senza però preoccupazione per gli sviluppi di una situazione che li riguardava e ancora oggi li riguarda molto da vicino.

5.1.1 Un controllo dei dati più preciso

Rispetto a Facebook, va detto, è molto più facile controllare questa raccolta di dati in maniera granulare. Google ha un’interfaccia dedicata, abbastanza semplice da navigare, che puoi trovare tra le impostazioni del tuo account, in cui si possono controllare le tipologie di raccolta dati, attivando o disattivando la raccolta di alcune tipologie di dati a proprio piacimento. Anche il profilo pubblicitario dell’utente, che Google calcola unendo tutti i dati di cui abbiamo parlato fin qui, si può gestire da una pagina dedicata alle cosiddette “attività”.

Grazie a questa migliore gestione dei dati, ha evitato scandali eclatanti e le polemiche sul rispetto della privacy degli utenti non hanno praticamente mai toccato Google. Ma l’azienda detiene il 40% del mercato della pubbliità online negli Stati Uniti, rispetto al 20% del social network di Mark Zuckerberg, e quindi sotto questo aspetto saranno sempre legate indissolubilmente e qualsiasi regolamentazione scaturita dagli errori di Facebook finirà per colpire anche il fatturato di Big G. È come quando tuo fratello ti trascina in un litigio con i genitori, alla fine verrete puniti entrambi anche se uno dei due non ha fatto nulla. Con questo esempio chiedo scusa a tutti i figli unici come me, mi perdonerete: infondo non vi sto rubando dati…

5.2 Google, allora sei sano?

Se l’azienda di Zuckerberg è stata più volte al centro della polemica, Google ha sempre dribblato brillantemente questi scandali, dimostrando solidità. Ok, non è praticamente mai stata coinvolta in scandali legati alla privacy degli utenti, ma le controversie in ambito privacy per l’azienda sono molte. Ad esempio, alcune funzionalità dei software Google addirittura presentano dei problemi che non sono tutelati dalle varie e diverse leggi nazionali sulla privacy. Ad esempio:

  • Google Analytics mette a disposizione degli iscritti statistiche sulla navigazione come i link aperti, le parole chiave ricercate e il tempo di permanenza in ogni pagina.
  • Google Earth e Google Maps sono stati accusati di gravi violazioni della privacy per l’eccessiva risoluzione delle immagini, spinta ad un livello di dettaglio tale da rendere riconoscibili le persone, gli interni degli abitati e zone protette da segreto militare e divieto di ripresa, tra cui la celebre Area 51.

Per quanto riguarda la gestione dei dati europei, l’azienda ha deciso di trasferire la responsabilità dalla sede californiana a Google Irlanda. Questo a partire dal 22 gennaio 2019. La privacy degli utenti viene in questo modo regolata dalla direttiva GDPR, compresi le procedure e i diritti di accesso da parte delle autorità pubbliche ai profili personali degli utenti europei.

Ma anche se il Regolamento Europeo aiuta nella tutela dei dati, nel 2018 i titoli di giornale intitolavano gli articoli con forti provocazioni come: “Google è un Fratello più Grande di Facebook“. Segno di una preoccupazione generale per quanto le tecniche di profilazione dell’azienda possano risultate un problema etico.

6. Concludendo

Siamo arrivati alla fine di questo viaggio alla scoperta di Google e le sue controversie in materia di dati personali. Una cosa è certa: si sta scrivendo molto di privacy e di quanto aziende come Google e Facebook abbiano collezionato su di noi, anche su blog e testate non dedicate al tema come la nostra. Il punto è che non sembra possibile tornare indietro nel tempo. Per usufruire di questi servizi nel corso degli anni abbiamo “pagato” l’azienda con le informazioni che noi stessi abbiamo deciso di condividere.

Non c’è dubbio che il diritto alla privacy debba essere inalienabile, ma in fondo Google è pur sempre un azienda che fa business e non ha immagazzinato tutte queste informazioni all’oscuro da tutto e da tutti. Ha sempre agito con il permesso e il consenso degli utenti e soprattutto non agendo con leggerezza nella protezione dei dati. È assolutamente una banalità, e lo abbiamo già ribadito in questo approfondimento: nulla è veramente gratuito.

Ma è veramente una situazione così catastrofica come alcune volte si tende a credere? Io, in quest’analisi ho cercato di essere imparziale. Personalmente utilizzo da sempre i servizi di Google, cercando di stare attento ad eventuali problemi legati alla privacy. Credo però che in questi anni, sia inevitabile concedere alle aziende i nostri dati, anche in cambio a volte di un servizio migliore. I dati non sono in discussione per quanto mi riguarda, sono uno stumento centrale nel marketing, ma la sua manipolazione non è il primo pericolo derivante dalla rete, soprattutto se si guarda in prospettiva futura.


Fonti:

AgendaDigitale, 27 febbraio 2020, Privacy zero se Google si compra tutto: come difendersi

Cybersecurity365, 16 ottobre 2019, Assistenti vocali e privacy, il problema non sono i dati ma come vengono trattati: lo scenario

Corriere Comunicazioni, 12 aprile 2018, Scandalo dati, Google si salva dai riflettori privacy. Ma ancora per poco

Garante Privacy, Regolamento Generale Sulla Protezione Dei Dati – Regolamento (UE) 2016/679 del Parlamento europeo e del Consiglio del 27 aprile 2016, aggiornato alle rettifiche pubblicate sulla Gazzetta Ufficiale dell’Unione europea 127 del 23 maggio 2018

Fastweb, 21 dicembre 2014, Com’è fatto il Googleplex, la casa di Google

La Stampa, 8 maggio 2018, Google è un Fratello più Grande di Facebook, ecco cosa sa di noi

Google, About Google & Accont Google

Wired, 23 febbraio 2015, 6 link per conoscere quello che Google sa di voi

Immagine di copertina: Kai WenzelHire

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.

L'ARTICOLO TI E' PIACIUTO? SCOPRINE ALTRI

ASCOLTA I NOSTRI PODCAST

Leggi il nostro blog… anche quando non puoi leggerlo! Interviste, riflessioni e spunti a portata di stream.

Anche sui tuoi assistenti vocali.