Non esce più l'acqua dal rubinetto, hai visto?
Dati cancellati, cos'è il bene pubblico, e quanto siamo abituati bene (o male)
In questo numero: l’acqua dai rubinetti di casa non scende più, i lampioni del quartiere sono spenti e nessuno ci ha avvertiti. Come facciamo? E che c’entra con i dati?
Nella sezione a pagamento: la dataviz di oggi è un gioiellino fatto a mano, scopriamo che tipo di scrittrice - o scrittore - è chatgpt, e il dataset è più frivolo del solito.
Dove ci vediamo in giro
Camerino, 13 febbraio: tengo un talk all’università di Camerino nell’ambito del programma “Le competenze trasversali nella scienza”. Tema, l’etica dei dati.
Santarcangelo di Romagna, 28 febbraio: alle 20:30 presento “Quando i dati discriminano” alla biblioteca comunale Baldini, per la rassegna “Letture Liminali”.
Lucca, 6 marzo: presentazione del libro nell’ambito della rassegna “Voci di Biblioteca”.
Online, 21 marzo: in pausa pranzo sono ospite dei Gender Lunch Seminar organizzati dall’università San Raffaele, parlo di femminismo dei dati.
Online, 22 marzo: tengo una lezione sugli algoritmi nel corso di Lucy sulla strategia digitale.
Napoli, 26 marzo: intervengo in una formazione per giornalisti con WeWorld dalle 9:00 alle 13:00, presso la Sala dei Baroni al Maschio Angioino di Napoli.
🗞️ [angolo SkyTg24] DeekSeek si è vantata di costare meno di ChatGpT, ma non è molto diversa da OpenAi nello sfruttamento di manodopera per l’etichettatura dei dati. Se ne è occupato Antonio Casilli (autore del libro “Gli schiavi del clic”), che ha pubblicato anche un policy paper in cui scrive che
In Cina alcune decisioni politiche recenti hanno incentivato la creazione di enormi centri di annotazione dei dati nelle città di “terzo livello”, centri urbani di medie dimensioni, con una popolazione tra 1 e 3 milioni di abitanti, con economie in crescita, ma meno sviluppate rispetto alle metropoli di primo e secondo livello, spesso caratterizzate da minori investimenti esteri e infrastrutture meno avanzate. La National Data Administration di Pechino ha annunciato un’espansione del settore dell’annotazione dati del 20% all’anno entro il 2027 con incentivi alle aziende per investire in queste città. Il risultato è la disponibilità di una manodopera a bassissimo costo, sovvenzionata dallo stato per garantire la competitività delle aziende cinesi nell’ambito dell’IA.
Sondaggino:
Sei tra le 10293 persone che leggono la newsletter. Nell’ultima puntata abbiamo parlato di gender gap nella chiesa cattolica, con un intervento della giornalista Elisa Belotti.
Fino a fine febbraio puoi abbonarti con un bello sconto, pensaci!
Intanto ti ricordo che se coinvolgermi in un evento puoi scrivere a contact-columbro@elastica.eu.
Per promuovere il prodotto della tua azienda, un evento o un corso in questi spazi scrivi a newsletter@tispiegoildato.it, rispondo io oppure Roberta. Qui tutte le condizioni.
“I dati pubblici sono essenziali per spiegare ciò che accade nel mondo. Quando cancelliamo questi dati, cancelliamo la nostra storia, le nostre priorità e la nostra apertura. Questi dati non sono essenziali solo per la ricerca medica, ma anche per pianificare l'assistenza ai veterani, prevenire la violenza domestica, fermare i crimini di odio e proteggere le nostre comunità più vulnerabili.”
―
, American InequalitySvegliarsi senza acqua potabile. Senza illuminazione pubblica. E senza dati.
Immagina di aprire il rubinetto di casa, un giorno, e non vedere scorrere l’acqua. Non è un problema delle tue tubature, succede a tutto il quartiere, a tutta la città. Improvvisamente qualcuno ha deciso che l’accesso all’acqua potabile non è un diritto dovuto. Bisogna richiederlo, in modo specifico, ogni giorno. In un’altra città l’amministrazione decide invece che l’acqua viene fornita solo il lunedì, il mercoledì e la domenica, gli altri giorni ci si arrangia, bisogna razionarla. Ma nessuno lo dice o lo scrive da qualche parte, le persone lo scoprono da sole, improvvisamente, e cercando informazioni sul sito dell’acquedotto pubblico o del comune è impossibile capire cosa sia successo e perché.
Negli stessi giorni, con l’arrivo del buio, non si accende nessun lampione pubblico. Da nessuna parte. Solo le strade che ne fanno richiesta con un modulo speciale ottengono la luce, ma anche qui non ci sono avvisi pubblici. I problemi si risolvono solo grazie al passaparola di persone più attente e competenti.
Se questo fosse uno scenario reale, non credo resteremmo a lamentarci sui social. Ci ritroveremmo tutti, spero, per strada a protestare, sotto il municipio, la circoscrizione, gli uffici pubblici. Senza acqua non si vive e senza illuminazione pubblica diventa pericoloso camminare sui marciapiedi. E, in fondo, le nostre tasse, non servono anche a questo? A pagare questi servizi?
E senza dati, si vive?
Mercoledì scorso ero nell’auditorium dell’Istituto Agnelli di Torino (qui il video integrale) a rispondere alle ottime domande del professore di lettere Alessandro Antonioli a partire dal mio libro “Quando i dati discriminano”, e siamo inevitabilmente finiti a parlare di quello che stava succedendo negli Stati Uniti al portale data.gov.
Migliaia di dataset spariti (cancellati? semplicemente resi inaccessibili?) e siti di agenzie federali posto sotto il controllo delle squadre di Elon Musk per cancellare termini “proibiti” in base al Project 2025, come gender, minoranze, persone incinte, persone trans, e molti altri.
Nella settimana di insediamento del nuovo presidente scrivevo per Sky che “Donald Trump potrebbe cancellare i dati sul cambiamento climatico” perché l’aveva già fatto nel precedente mandato. In effetti, qualche giorno dopo, è arrivata la conferma che migliaia di link alle pagine federali non erano più in funzione:
L’amministrazione ha imposto il bando di specifici termini nelle pubblicazioni scientifiche, obbligando i ricercatori affiliati a istituzioni governative, come il Cdc, a ritirare articoli già accettati o a rimuovere parole e concetti ritenuti “inadatti” o politicamente problematici [come “diverse” o underrepresented”, cioè diversi e sottorappresentati]. Non sono le riviste scientifiche a operare questa censura, ma gli stessi scienziati, costretti ad adeguarsi alle nuove direttive per evitare il blocco delle loro pubblicazioni.
Oggi il numero iniziale dei dataset sembra essere stato ripristinato, ma cosa è successo nel frattempo? Difficile saperlo con esattezza. Ci sono gruppi organizzati per salvare i dataset, lo fa da tempo Internet Archive con Endofterm Archive, ed è di pochi giorni fa l’annuncio del Library Innovation Lab di Harvard di aver creato un repository per salvare tutti i dataset di data.gov.
E in Italia? Se qualcuno cancellasse dataset pubblici, ce ne accorgeremmo?
L’ho chiesto al pubblico dell’istituto Agnelli, ma anche su Instagram, e la risposta è stata molto onesta:
Infatti succede di continuo. Per fare alcuni esempi, il portale soldipubblici.gov.it è andato offline improvvisamente.
Lo scorso mese è stata cambiata la frequenza di pubblicazione dei dati sugli omicidi volontari disaggregati per genere, da settimanale a mensile. L’avete letto da qualche parte? No. Sappiamo perché è stato fatto? No.
È anche stato completamente sospeso il rilascio dei dati di monitoraggio dei contagi di covid nel repository della Protezione Civile.
Il portale open data del Ministero del Lavoro non è più disponibile.
Ci sono spiegazioni? No, no e ancora no.
Come se qualcuno, improvvisamente, ci togliesse l’acqua dal rubinetto, o spegnesse l’illuminazione pubblica1.
I data-link e la dataviz della settimana
a cura di