Parte Ii
Il potere dei Big Data
Capitolo 2
Aveva ragione Freud?
Di recente ho sentito definire una persona che cammina per strada con il termine “penone”. Avete capito, sì? “Penone” anziché “pedone”. L’ho visto in un grande dataset di refusi che la gente fa. Una persona vede qualcuno che cammina e scrive la parola “pene”. Deve significare qualcosa, no?
Poco tempo fa ho saputo di un uomo che aveva sognato di mangiare una banana mentre percorreva l’altare per sposare sua moglie. L’ho visto in un grande dataset di sogni che la gente registra su una app. Un uomo immagina di sposare una donna mentre mangia un alimento dalla forma fallica. Anche questo deve significare qualcosa, no?
Aveva ragione Sigmund Freud? Fin da quando le sue teorie hanno attirato l’attenzione pubblica, la risposta più onesta a questa domanda dovrebbe essere una scrollata di spalle. È stato Karl Popper, il filosofo austro-britannico, a spiegare questo fatto nel modo più chiaro. Com’è noto, Popper ha affermato che le teorie di Freud non erano falsificabili. Non esisteva un modo per provare se fossero vere o false.
Freud potrebbe dire che la persona che ha scritto “penone” stava svelando un desiderio sessuale, forse represso. Quella persona potrebbe rispondere che non stava svelando nulla: che aveva fatto un refuso innocente, come “piedone”. Si tratterebbe di una situazione “lui dice/lui dice”. Freud potrebbe dire che il gentiluomo che ha sognato di mangiare una banana nel giorno del suo matrimonio stava pensando segretamente a un pene, svelando così il suo desiderio di sposare un uomo e non una donna. Il gentiluomo potrebbe replicare che gli è semplicemente successo di sognare una banana. Avrebbe potuto benissimo sognare di mangiare una mela mentre era diretto all’altare. Anche questa sarebbe una situazione “lui dice/lui dice”. Non esisteva un modo per mettere alla prova la teoria di Freud.
Non fino a ora, cioè.
La scienza dei dati rende molte parti di Freud falsificabili, perché mette alla prova molte delle sue celebri teorie. Cominciamo con i simboli fallici nei sogni. Usando un enorme dataset di sogni documentati, possiamo osservare subito con quale frequenza appaiono oggetti dalla forma fallica. Il cibo è un buon terreno su cui concentrare questa ricerca perché compare in molti sogni, e gli alimenti che hanno una forma fallica sono numerosi: banane, cetrioli, hot dog ecc. Possiamo quindi misurare i fattori che potrebbero farci sognare determinati cibi più spesso di altri: la frequenza con cui li mangiamo, quanto gustosi li trova la maggior parte delle persone, e sì, se hanno una qualità fallica.
Possiamo testare se due alimenti, altrettanto popolari, ma uno dei quali ha una forma fallica, compaiono nei sogni in quantità diverse. Se non è più probabile sognare cibi dalla forma fallica rispetto ad altri alimenti, allora i simboli fallici non sono un fattore importante nei nostri sogni. Grazie ai Big Data, è possibile falsificare questa parte della teoria di Freud.
Ho ricevuto dati da Shadow, un’app che chiede agli utenti di documentare i propri sogni. Ho codificato i cibi che comparivano in decine di migliaia di sogni.
Nel complesso, cos’è che ci fa sognare il cibo? L’indicatore principale è la frequenza con cui li consumiamo. La sostanza che sogniamo di più è l’acqua. Tra i primi venti cibi troviamo pollo, pane, sandwich e riso, tutti decisamente poco freudiani.
Il secondo indicatore della frequenza con cui un alimento compare nei sogni è quanto piace alla gente. I due cibi che sogniamo più spesso sono il cioccolato e la pizza, decisamente poco freudiani ma molto gustosi.
E allora che dire dei cibi dalla forma fallica? Si insinuano nei nostri sogni con frequenza inattesa? No.
Le banane sono il secondo frutto più comune a comparire nei sogni. Ma sono anche il secondo frutto più consumato. Pertanto non abbiamo bisogno di Freud per spiegare la frequenza con cui sogniamo le banane. I cetrioli sono il settimo ortaggio più comune che compare nei sogni. Sono anche il settimo ortaggio più consumato. Quindi, di nuovo, la forma non è necessaria per spiegarne la presenza nella nostra mente mentre dormiamo. Gli hot dog compaiono nei sogni con frequenza molto minore rispetto agli hamburger. Questo è vero anche dopo aver verificato che la gente mangia più hamburger che hot dog.
Nel complesso, utilizzando un’analisi della regressione (un metodo che consente ai sociologi di districare l’effetto di fattori molteplici) su tutta la frutta e tutti gli ortaggi, ho scoperto che il fatto che un alimento abbia una forma fallica non rendeva più probabile che comparisse nei sogni, non più di quanto ci si sarebbe aspettato in base alla sua popolarità. Questa teoria di Freud è falsificabile e, almeno secondo la mia rapida analisi dei dati, falsa.
Consideriamo adesso i lapsus freudiani. Il padre della psicoanalisi ipotizzò che usiamo i nostri errori – il modo in cui sbagliamo a dire o a scrivere qualcosa – per rivelare i nostri desideri subconsci, spesso sessuali. Possiamo usare i Big Data per testare tutto questo? Ecco un modo: vediamo se i nostri errori – i nostri lapsus – vanno in una direzione maliziosa. Se i nostri desideri sessuali sepolti si intrufolano nei nostri lapsus, dovrebbe esserci un numero sproporzionato di errori che comprendono parole come “pene”, “cazzo” e “sesso”.
Ecco perché ho studiato un dataset di oltre quarantamila errori di battitura raccolti dai ricercatori Microsoft. Del dataset facevano parte errori che la gente commette ma poi corregge immediatamente. In queste decine di migliaia di errori, molti individui ne hanno commessi di tipo sessuale. C’era il già citato “penone”. C’è stato anche qualcuno che ha digitato “sessura” invece di “fessura” e “cazzi” invece di “razzi”. Ma c’erano anche un sacco di lapsus innocenti. La gente ha scritto “pinestre” e “fegetali”, “pomeliggi” e “fridoriferi”.
Allora il numero dei lapsus sessuali era insolito?
Allo scopo di testare questo aspetto, ho usato per prima cosa il dataset di Microsoft per creare un modello della frequenza con cui le persone scambiano determinate lettere. Ho calcolato quanto spesso sostituiscono una t con una s, una g con una h. Poi ho creato un programma per il computer che commetteva errori come li commettono le persone. Potremmo chiamarlo il Bot degli errori. Il Bot degli errori ha rimpiazzato una t con una s con la stessa frequenza con cui lo avevano fatto gli esseri umani nella ricerca di Microsoft. E così via. Ho usato il programma con le stesse parole che le persone avevano sbagliato nella ricerca di Microsoft. In altri termini, il bot ha cercato di scrivere “pedone” e “razzi”, “finestre” e “frigoriferi”. Ma ha sostituito una r con una m con la stessa frequenza con cui lo fanno le persone e ha scritto, per esempio, “mazzi”. Ha scambiato una r con una c con la stessa frequenza con cui lo fanno gli esseri umani e ha scritto “cazzi”.
Quindi cosa capiamo confrontando il Bot degli errori con gli esseri umani, di regola disattenti? Dopo aver commesso qualche milione di errori, semplicemente sbagliando le lettere come fanno gli umani, il Bot degli errori ne ha fatti molti di natura freudiana. Ha scritto “sessante” al posto di “sestante”, “scopato” al posto di “scontato”, e molti altri errori simili. E – ecco il punto cruciale – il Bot degli errori, che ovviamente non ha un subconscio, aveva la stessa probabilità di commettere errori di natura sessuale rispetto alla gente vera. Con l’avvertimento, come amiamo dire noi sociologi, che occorrono ulteriori ricerche, ciò significa che per gli esseri umani non è probabile commettere più errori di stampo sessuale rispetto a quanti ce ne potremmo aspettare per caso.
In altri termini, perché la gente commetta errori come “penone”, “sessura” e “cazzi” non è necessario che ci sia un legame tra gli errori e ciò che è proibito, qualche teoria della mente in cui la gente rivela i suoi desideri segreti attraverso le proprie sviste. La spiegazione di questi lapsus è la frequenza normale con cui si scrivono refusi. La gente commette un sacco di errori. E se commetti un sacco di errori, a un certo punto cominci a dire cose come “scopato”, “sessante” e “penone”. Se una scimmia scrive abbastanza a lungo alla fine scriverà “essere o non essere”. Se una persona scrive abbastanza a lungo alla fine scriverà “penone”.
La teoria di Freud secondo cui gli errori rivelano i nostri desideri del subconscio, quindi, è falsificabile eccome, e secondo la mia analisi dei dati falsa.
I Big Data ci dicono che una banana è sempre solo una banana e che “penone” è solo un refuso di “pedone”.
E allora Freud ha completamente mancato il bersaglio in tutte le sue teorie? Non proprio. Quando sono riuscito ad accedere per la prima volta ai dati di PornHub, ho avuto una rivelazione che mi è sembrata in un certo senso freudiana. In realtà, si tratta di una delle scoperte più sorprendenti fatte durante le mie indagini sui dati: un numero scioccante di persone che visita siti porno mainstream cerca immagini di incesto.
Delle prime cento ricerche condotte da uomini su PornHub, uno dei siti porno più popolari, sedici sono di video a tema incesto. Un piccolo avvertimento: quello che segue è piuttosto crudo. Ci sono “fratello e sorella”, “matrigna si scopa il figlio”, “madre e figlio”, “madre si scopa il figlio” e “veri fratello e sorella”. La maggior parte delle ricerche di incesto fatte da maschi riguarda scene con madri e figli. E le donne? Nove delle prime cento ricerche condotte da donne su PornHub riguardano video a tema incesto e contengono immagini analoghe, anche se di solito è rovesciato il genere del genitore e del figlio. Quindi la maggior parte delle ricerche di incesto fatta da donne riguarda scene con padri e figlie.
Non è difficile rintracciare...