Què fan amb les nostres dades?
Acadèmics i estudiosos de la gestió de dades es van reunir la setmana passada a Barcelona per analitzar l’ús de la informació que fan les empreses digitals
“Les dades són el nou petroli” és un dels mantres més repetits de la nostra societat digital, com volent donar a entendre que qui les trobi farà fortuna. Però igual que en el cas del petroli, l’explotació de les dades a gran escala està reservada a uns pocs actors, i aquests ja ocupen i defensen les seves posicions de privilegi. Gemma Galdón, investigadora d’Eticas Consulting, ho resumia fa uns dies a Barcelona assegurant que les dades només són negoci si n’acumules moltíssimes, i això només és a l’abast de gegants tecnològics com les operadores de telecomunicacions i les empreses d’internet. Per això els xicots de Silicon Valley han substituït els barons del petroli al capdavant de la llista d’empreses més valuoses, en una tendència que no s’atura: Francesca Bria, comissionada d’Innovació de l’Ajuntament de Barcelona, recorda que el creixement de les empreses de tecnologia nord-americanes des del mes de gener ha sigut superior a tot el PIB de Noruega (950.000 milions de dòlars). Fins i tot hi ha retroalimentació entre els rics d’abans i els d’ara: entre els 100.000 milions que gestiona el fons d’inversió Vision Fund promogut per l’empresa japonesa SoftBank -un 10% dels quals invertits en Uber- hi ha petrodòlars saudites i dels Emirats Àrabs.
Acadèmics i estudiosos de la gestió de dades es van reunir la setmana passada a Barcelona per analitzar l’ús de la informació que fan les empreses digitals. Ho van fer convocats pel Data Transparency Lab (DTL), una iniciativa dirigida per Ramon Sangüesa i impulsada per Telefónica, AT&T, Mozilla, el MIT i l’Inria francès que pretén aportar transparència a l’explotació de les dades personals dels ciutadans. Creat el 2014, el DTL concedeix cada any sis beques de 50.000 euros a grups internacionals de recerca seleccionats entre els gairebé 50 que hi presenten projectes. Els investigadors becats presenten els seus objectius i el fruit del seu treball en una conferència que el 2015 es va fer al MIT (Boston), el 2016 a la Universitat de Colúmbia (Nova York) i aquest any s’ha instal·lat a Barcelona com a seu permanent. Kim Faura, el director de Telefónica a Catalunya, reconeix que alguna cosa hi té a veure que l’operadora espanyola hagi aportat la meitat del milió d’euros que el DTL ha repartit fins ara. De fet, un dels aspectes interessants de la iniciativa és que la promoguin diverses operadores de telecomunicacions, un tipus d’empresa que acumula grans quantitats de dades sobre els seus milions de clients però que té molt limitada la seva explotació perquè està sotmesa a regulació. La mateixa Telefónica prepara una plataforma anomenada Aura per posar a disposició dels seus abonats les dades -trucades, geolocalització- que acumula sobre ells, i Orange participa a França en el programa MesInfos, que ofereix als consumidors un núvol personal on l’operadora va abocant el seu historial de consum, com també fan companyies de subministrament d’energia.
En canvi, les empreses d’internet no estan sotmeses encara a la mateixa regulació i vist el volum de negoci en joc, acaben perpetrant uns abusos amb les dades dels usuaris que la majoria només sospiten però els projectes del DTL posen en evidència. Per exemple, un dels escollits en aquesta edició és FA*IR, on participen la Universitat Tècnica de Berlín, la UPF de Barcelona i el centre tecnològic català Eurecat, que analitza el biaix de gènere en els algoritmes de les webs que fan servir les empreses per seleccionar personal. L’equip de la Northwestern de Chicago ha estudiat com Facebook creua la informació personal que els usuaris li donem, la que acumula amb l’ús que fem de la xarxa social i la que li proporcionen agregadors com Experian, Axciom i Datalogix, que inclou des d’afiliacions a partits polítics fins a matriculacions de vehicles, passant per expedients penals i targetes de fidelització de comerços, arribant a assignar-nos milers d’atributs en més de 700 categories per segmentar la publicitat que ens mostra, sense que nosaltres siguem conscients de com ens tenen classificats. De fet, els consumidors dels EUA poden consultar a la web AboutTheData.com quines dades té Axciom sobre ells, però no passa el mateix en altres països ni amb altres empreses.
La popularitat dels dispositius mòbils ens ha posat encara més al descobert de cara a les empreses que trafiquen amb la nostra activitat digital. Un equip de la Carlos III (Madrid) ha comparat el rastre físic que deixa el mateix usuari si el seu telèfon només conté la versió genèrica del sistema Android amb el que s’obté si inclou l’Android comercial de Google i les principals aplicacions de xarxes socials. La diferència és espectacular: amb el segon es pot deduir on viu, on treballa i on pren una cervesa cada divendres quan surt de la feina. A la Universitat de Berkeley han muntat una bateria de 40 telèfons per analitzar les 70.000 aplicacions Android més populars i han descobert, per exemple, que la de la cadena de farmàcies CVS envia la posició de l’usuari a 40 servidors diferents, o que més de la meitat dels 7.000 títols qualificats com a familiars transmeten sense cap motiu aparent alguna dada que permet identificar el dispositiu o l’usuari fins i tot abans de demanar permís per fer-ho. Els resultats es poden consultar a AppCensus.mobi.
Al Max Planck Institute de Munic han estudiat el biaix de les notícies que es publiquen a Facebook segons el perfil de l’usuari que les comparteix, i han descobert diferències notables entre mitjans segons l’edat, la raça, l’estat civil i l’origen geogràfic, mentre que el nivell d’educació i el gènere no sembla que hi afectin gaire. A la Stony Brook de Nova York han desenvolupat el PrivacyMeter ( http://bit.ly/PrivacyMeter ), un complement per al navegador Chrome que indica en temps real des de quants llocs ens estan rastrejant en cada pàgina web que visitem: he vist que la de l’ARA és més respectuosa que la d’altres diaris de Barcelona. Una altra iniciativa, aquesta d’investigadors d’Iowa i Califòrnia, ha estudiat l’ús creixent de bloquejadors d’anuncis que ja fan servir l’11% dels internautes, i que ha fet que el 30% de les webs més populars d’internet ja tinguin mecanismes que limiten l’accés dels usuaris proveïts de bloquejador. Per desempatar aquesta guerra, Brave proposa un navegador en què l’usuari diu quina quantitat mensual vol invertir llegint premsa digital i el software la distribueix entre les webs que visita més sovint.