El ‘bullshit’ en el temps de les megadades
Una de les conseqüències de viure en un món altíssimament quantificat és que qualsevol pot establir relacions espúries entre les dades. Un cas real: entre el 1997 i el 2007, la gràfica d'edat de les guanyadores de Miss America i la de morts per vapor d'aigua dibuixaven una corba sorprenentment similar. La intuïció ens diu que les dues coses no tenen res a veure (i, de fet, a partir del 2007 les línies se separen i corren per lliure). Però és un exemple, recollit al llibre Bullshit, de Carl T. Bergstrom i Jevin D. West, sobre com es manipula en l'era del big data. Un cas pioner, que va aparèixer l'any 1980 a la revista Nature, comparava la taxa de natalitat a Alemanya amb la presència de cigonyes: tots dos nivells anaven baixant sorprenentment al mateix ritme. L'elecció de la cigonya, esclar, no era casual. Buscava el cop d'efecte lúdic: no neixen nens perquè no hi ha cigonyes que els puguin portar a les llars.
Aquestes dues mostres es poden esbandir fàcilment com a bullshit, però vivim en uns temps que qualsevol desaprensiu pot traçar relacions de causa-efecte per poc que s'hi posi i brandant el poder esotèric d'un Excel. Una de les idees potents del llibre és que hi ha tants centenars de milers de sistemes de dades acumulats que, si et poses a comparar, segur que trobes dues gràfiques que se superposin, encara que una parli de la gimnàstica i l'altra de la magnèsia. Part de l'absurda teoria que les vacunes afavoreixen l'autisme té a veure amb aquesta capacitat de juxtaposar dades no relacionades. Al llarg dels anys ha augmentat la prevalença de l'autisme, sí. I també s'ha estès la vacuna triple vírica. Ara, també s'ha incrementat a un ritme similar la capacitat de memòria dels iPhone i a ningú se li acut culpar-los d'aquest trastorn, tot i que la relació és la mateixa que amb les vacunes. És a dir, zero.