Sempre più spesso nel nostro periodo storico, veniamo costantemente sommersi da un numero smisurato di notizie di cui, un sotto insieme finito di esse, viene condiviso da politici, economisti, sociologi, storici o altri studiosi di scienze sociali e riguardano la sfera economica, politica, sociale e culturale dello spazio fisico che ci troviamo ad occupare quotidianamente. Il problema che possiamo mettere a comune denominatore risulta essere quello della difficoltà che intercorre fra gli individui nel percepire il processo di causalità e nel distinguere quest’ultimo da quello di correlazione. In questo breve articolo cercherò di spiegare perché correlazione non significa in alcun modo causalità, portando esempi pratici di come gli attori, politici in particolare, tendono a far leva su questa ingannevole fallacia interpretativa al fine di trarne profitto.
L’espressione latina «post hoc ergo propter hoc», la cui traduzione è «dopo ciò quindi a causa di ciò», riassume in maniera estremamente sintetica ed esaustiva la fallacia indagata in questo articolo, ovvero la difficoltà nello scindere due processi che sono profondamente differenti, causalità e correlazione. Ma spostandoci sul piano pratico, che cosa si intende in termini statistici per causalità e correlazione?
Che cosa intendiamo realmente con il termine correlazione?
Piccola premessa: al posto della parola “termine” utilizzeremo ciò che in statistica viene chiamato indice, mentre al posto di “fenomeni” utilizzeremo il termine variabili. In maniera piuttosto semplice possiamo allora sostenere che la correlazione è un indice che rappresenta la relazione fra due variabili. In generale, date due variabili quantitative X ed Y con X variabile indipendente e Y variabile dipendente, si dice che fra esse vi è relazione statistica se le variazioni (della distribuzione) di X aiutano, con più o meno successo, a spiegare o addirittura predire le variazioni di Y.
Per entrare ancora più nel dettaglio sarebbe necessario spiegare, ma non lo farò in questa occasione, le varie tecniche di regressione statistica con cui vengono studiate queste relazioni. Però, dato che l’obiettivo prefissato è quello di comprendere a livello teorico la differenza che intercorre fra i due indici menzionati, è necessario almeno fissare a mente che, in generale, trovare una qualche correlazione statistica non significa spiegare il fenomeno in termini di causa-effetto. Spiegare il fenomeno in termini di causa-effetto significa trovare la causa (o in genere “le cause”, soprattutto se si parla di fenomeni sociali) grazie alle quali quel determinato fenomeno si manifesta. Ciò però, soprattutto nel campo delle cosiddette social sciences (fra cui anche la sociologia) rientra nella sfera della quasi utopia. Proviamo a capire meglio con due brevi esempi.
Primo esempio di correlazione: la vendita di gelati aumenta il tasso di omicidi?
La figura qui accanto contiene un grafico che mostra una correlazione positiva fra il tasso di omicidi (variabile Y) e la vendita dei gelati (variabile X). Come si può osservare, i punti del grafico sono in una configurazione di relazione lineare diretta. Possiamo quindi concludere che il numero dei gelati venduti causa l’aumento del tasso di omicidi di un determinato paese? Chiaramente, utilizzando un po’ di buon senso, possiamo indagare più approfonditamente questa strana correlazione e concludere che essa sia abbastanza assurda. Possiamo quindi escludere che si tratti di un rapporto di causa-effetto. Allora per quale motivo osserviamo questa correlazione? Potremmo ipotizzare che, ad esempio, sia l’elevata temperatura di quel paese a causare l’alto tasso di crimini, generando allo stesso tempo questa bizzarra correlazione che non ha nulla di empiricamente dimostrabile; difatti, un ottimo articolo su Science conferma quanto appena detto.
Secondo esempio di correlazione: il calo della bolletta del gas è realmente dovuto alle misure del governo Meloni?
Giorgia Meloni, dopo le dichiarazioni rilasciate in un dialogo con Paolo Del Debbio, il 3 febbraio 2023 scrive su Twitter che il calo del 34,2% della bolletta del gas è un risultato raggiunto grazie alle concrete misure attuate dal Governo, attribuendosene quindi a pieno i meriti. Ora, il calo è realmente dovuto alle politiche attuate dal governo Meloni? No, si tratta infatti di una semplice correlazione statistica fra i due fenomeni, fra le due variabili, come l’esempio precedente ci aveva mostrato una correlazione fra le vendite del gelati e l’aumento del tasso di omicidi.
Come scrive l’Huffington Post è infatti calato il costo della materia prima acquistata dai fornitori sui mercati all’ingrosso per poi rivenderla ai clienti finali, sul quale tuttavia l’azione economica del Governo italiano non ha alcun rilievo. Per chi volesse approfondire le cause reali, lascio il link di questo articolo di Huffington Post. In conclusione, non sono state quindi le politiche attuate dal governo Meloni ad aver causato il calo delle bollette del gas e qui sta la differenza fondamentale fra un rapporto di causazione ed un rapporto di correlazione.
Conclusione
Risulta essere quindi molto importante distinguere questi due processi, soprattutto per chi si sta approcciando per le prime volte alla scienza in generale ed in questo caso specifico alla scienza sociale. Da un lato quindi la correlazione ci mostra il grado di associazione, di relazione fra due variabili ed è estremamente utile se ad esempio vogliamo capire se la distribuzione di una variabile Y è più o meno influenzata da quella di un’altra variabile X. D’altra parte, la correlazione, o meglio il rapporto di correlazione e i suoi indici, non ci dicono affatto se X sia o meno la causa, l’evento scatenatane di Y. Per stabile se fra X ed Y sussiste un rapporto di causalità si può operare, ad esempio, mediante una tecnica statistica chiamata studio controllato randomizzato, leggermente più complessa dei test di correlazione o di regressione, della quale potremmo parlare in un articolo dedicato.
Bibliografia
Laureato in Sociologia, attualmente sono studente doppiamente iscritto alla facoltà Sociologia e ricerca sociale (LM-88) e di Statistica (L-41), presso l’Università degli studi di Firenze. Mi piace raccontare la realtà sociale aiutandomi con i dati. Fra i miei attuali interessi di ricerca rientrano gli studi sociali quantitativi e scienza sociale computazionale.