Il solito problema delle fonti dei dati
Una storia dal baseball negli Stati Uniti e il potere dei contro-dati
In questo numero: dobbiamo chiederci perché le fonti ufficiali ci sembrano più affidabili e quali sono le conseguenze di questa percezione.
Ma, prima, dimmi: a questa newsletter manca una piccola sezione di link esterni con notizie e approfondimenti? La inserivo sempre nell’ultimo numero del mese, ma la programmazione, con l’arrivo dei guest writer, è un po’ cambiata. La aggiungo? A me piace quando la trovo nelle newsletter che leggo.
Ah: questo numero è sostenuto da Banca Etica che finalmente ammette “anche i nostri soldi sono sporchi”. Da correntista, sono scioccata. Però vale la pena leggere perché.
E ora, cominciamo.
Ho sempre avuto l’impressione che la mia insofferenza verso l’egemonia delle scienze pure e verso un modo freddo, quadrato, oggettivo e drastico di vedere il mondo avesse a che fare con il mio essere donna.
Streghe, Mona Chollet (Utet)
Le fonti ufficiali sono meglio delle fonti prodotte dalle comunità dal basso?
Nell’ultima settimana ho fatto due incontri in due università per parlare del mio libro e, anche se il pubblico era diverso, per età e formazione, in entrambe le occasioni sono emerse moltissime domande sul problema delle fonti. La prima arriva da un gruppo di ricercatori e ricercatrici del dipartimento di comunicazione all’Università Svizzera di Lugano:
come fai, da giornalista, a usare fonti non ufficiali e a garantire che si tratti di un’informazione rigorosa e “imparziale”? In questo periodo di scarsa fiducia da parte di lettori e lettrici per il giornalismo, usare dati che arrivano dalle comunità coinvolte nel fenomeno di cui parli non è controproducente?
E poi, all’ISIA di Roma, studenti del corso di Information Design mi hanno chiesto
visto che i dati discriminano, come si fa a fidarsi delle fonti ufficiali che li producono?
Intanto, partiamo dalle definizioni. Per fonti “ufficiali” si intendono gli istituti nazionali e internazionali di statistica, i ministeri, le organizzazioni internazionali, gli istituti di ricerca, chiunque abbia un ruolo riconosciuto a livello istituzionale e pubblico nella gestione dei dati che riguardano la popolazione e il territorio in cui abita.
Il problema è che siamo di nuovo qui a presupporre che esista un modo oggettivo - che sarebbe quello ufficiale, appunto - e uno soggettivo, quello delle comunità dal basso - di produrre dati e che il primo sia più “affidabile” e più neutrale del secondo.
In realtà, quando il metodo è condiviso e verificabile non è una questione di “ufficialità” a rendere alcuni dataset migliori di altri.
Il baseball negli USA: quando i dati storici ufficiali non includono una parte di atleti e performance sportive
Questa settimana negli Stati Uniti la Major League Baseball (MLB) ha annunciato di aver cominciato a integrare le statistiche delle “Negro Leagues” nei propri record ufficiali, riconoscendo finalmente i giocatori delle Negro Leagues come parte delle Major Leagues. Le NL sono leghe di baseball professionistiche statunitensi composte prevalentemente da giocatori neri e, in alcuni casi, latinx, attive dal 1920 fino all'integrazione del baseball negli anni '50, da cui rimasero separate a causa della segregazione razziale che impediva ai giocatori neri di partecipare alle Major Leagues (MLB).
Questo cambiamento avrà un impatto significativo, soprattutto sui record storici ufficiali: Josh Gibson, un leggendario giocatore delle Negro Leagues, sarà incluso tra i migliori battitori di tutti i tempi, potenzialmente dietro solo a Ty Cobb, definito uno dei più grandi giocatori con una media battuta di .366, che è ancora la più alta nella storia della MLB1. Questo riconoscimento arriva dopo decenni di ricerche e sforzi da parte di storici e appassionati per raccogliere e verificare i dati delle Negro Leagues. Il lavoro di ricercatori come Kevin Johnson e Gary Ashwill ha permesso la creazione del database Seamheads, che ha fornito la base per l'inclusione di queste statistiche nei record ufficiali della MLB. Questa integrazione non solo corregge una lunga ingiustizia storica, ma permette anche di avere una visione più completa e accurata della storia del baseball, scrivono sul New York Times (dove ti lascio approfondire se ti appassiona la storia dello sport2).
Quanto valgono i contro data?
Ne avevo già parlato, spiegando che in alcune situazioni non possiamo far altro che affidarci ai counter-data, ai dati alternativi al potere, anzi, dati che permettono una riappropriazione della narrazione. Il potere non produrrà mai quei dati, non avrà mai quella visione della realtà che hanno le comunità coinvolte.
Per la ricercatrice Seyi Olojo3 i counterdata includono:
la correzione dei dati rappresentativi in modo errato.
il controllo della raccolta e della produzione dei dati.
l'uso strategico dei dati per favorire l'emancipazione politica e sociale delle comunità.
Il modo in cui il governo italiano stima i dati sui femminicidi - usando questo termine solo nella relazione annuale di Istat e non nei report ufficiali settimanali del ministero dell’interno - non è errato, ma è definito dalla funzionalità e dal valore che le istituzioni attribuiscono questi dati, sicuramente diverso da movimenti come Non Una Di Meno, che mantiene invece un monitoraggio puntuale dove include anche il nome delle vittime di transcidi, lesbicidi e femminicidi.
Alle istituzioni, perché diventino più affidabili, cioè meritevoli della fiducia di chi lavora con i dati, ma anche di cittadini e cittadine, non dovremmo chiedere di colmare i gap, o almeno non tutti.
Dovremmo chiedere che le filiere della produzione dei dati che ci riguardano siano trasparenti, che i database pubblici e aperti siano funzionanti e aggiornati, e che attivistə, giornalistə e chi fa ricerca possa accedervi senza problemi e senza pagare una licenza.
A Lugano mi hanno anche chiesto:
cosa succede se il settore pubblico smette di produrre o rendere disponibili i dati e le uniche ad avere e garantire accesso al sapere sul comportamento umano saranno in futuro le grandi aziende tech?
Questa domanda vale un’altra puntata della newsletter, ma ancora una volta dimostra l’importanza e il valore dei contro-dati.
Questa newsletter è sostenuta da Banca Etica che finalmente ammette “anche i nostri soldi sono sporchi”.
È questo il concept volutamente provocatorio dell’ultima campagna pubblicitaria dell’unico istituto votato alla finanza etica che anche io ho scelto.
L’hai vista o sentita per radio?
Soldi sporchi ma della terra dei campi sottratti alle mafie, sporchi di pomodoro coltivato senza sfruttamento, della farina degli aiuti umanitari, di acqua di mare da cui le ong salvano chi scappa da fame e guerre.
Sporca anche tu i tuoi soldi con Banca Etica!
La dataviz della settimana
Quanto ci si mette a diventare cittadine e cittadini europei? Delle dataviz-videogame molto chiare di Civio, per giocare cliccare sull’immagine:
Le nuove date del tour
Milano, 11 giugno: tengo un workshop per le aziende del network Libellula, osserveremo i dati, vediamo insieme come possono ingannare fingendosi neutrali e come invece possiamo usarli per creare una cultura aziendale che rispetti e valorizzi ogni individuo.
Bologna, 15 giugno: dalle 9:20 alle 10 parlo al We Make Future Festival con uno speech su dati che discriminano nel contesto dei media.
Milano 15 giugno: alle 17 presento il libro al Wired Next Fest al Castello Sforzesco in dialogo con Riccardo Saporiti.
Roma, 18 giugno: discuto del presunto potere dei dati con Bruno Mastroianni e Massimo Cerofolini sulla terrazza del ITS Academy LazioDigital, alle 18:30. Sì, orario aperitivo, che potete prendere insieme a noi.
Ravenna, 25 giugno: alle 18:30 presento il libro nella rassegna Flaming Talks organizzata da Happy Minds.
Roma, 26 giugno: nella rassegna ReSprint al Teatro Elettra parlo con Giovanni Prattichizzo (Istat) proprio sul tema della divulgazione e la comunicazione statistica ai tempi della sfiducia.
Questa newsletter è stata mandata a 7607 persone, cresce grazie al passaparola e può pagare i contributi esterni grazie agli abbonamenti. Vuoi anche tu l’accesso a tutto l’archivio e sentirti parte della comunità? Pensa a un upgrade della tua iscrizione.
Io ti ringrazio per avermi letta, se vuoi portarmi nella tua azienda, libreria, biblioteca, scuola o circolo scrivimi a progetti@donatacolumbro.it. A mercoledì prossimo!
La media battuta o batting average è una misura statistica dell'efficacia di un battitore nel colpire la palla, calcolata dividendo il numero totale di valide (hit) per il numero totale di volte in cui il battitore ha avuto la possibilità di battere (at-bats). Un valore alto di media battuta nel baseball è solitamente considerato sopra .300. Questo indica che un giocatore ottiene una valida in almeno 30% delle sue apparizioni alla battuta.
Il pezzo del NYT per approfondire.