I 10 errori più comuni nelle data viz dei miei studenti
Una lista, mentre correggo i project work.
In questo numero: ci sono errori di rappresentazione dei dati che si ripetono all’infinito. Almeno, questo è quello che noto negli esami dei miei studenti. Ne conosci altri?
⚠️ Ah, ricondivido questo appello, e ringrazio chi ha già compilato il form: conosci o fai parte di associazioni intitolate/fondate da persone vicine a una vittima di femminicidio? Se sì, compila questo form: vorrei capire quante sono in Italia, dove sono, che tipo di lavoro svolgono per la comunità.
🗞️ [angolo SkyTg24] In norvegese è “bare ja betyr ja” lo slogan che le associazioni femministe hanno portato avanti fino all’approvazione della riforma del codice penale: “solo sì significa sì”, e cioè solo un consenso attivo è prova che non vi è stato uno stupro.
Ampliare le definizioni, segnare un confine, è da qui che prende le basi un modello giuridico sempre più adottato in Europa, quello incentrato sul consenso. Dal 2017 a maggio 2023, il numero di giurisdizioni europee con leggi sullo stupro basate sul consenso è passato da 7 a 20, per cui i tradizionali modelli basati sulla coercizione, cioè che riconoscono lo stupro solo in presenza di minacce o violenza fisica, sono stati sempre più sostituiti da definizioni centrate sull’assenza di consenso. Funziona? Dipende. Il paese da cui possiamo trarre qualche lezione, guardando i dati, è la Svezia.
Sei tra le 12030 persone che leggono la newsletter. Nell’ultima puntata abbiamo parlato di di spazi urbani, con dati e storie sui bagni pubblici di Lisbona, grazie a un pezzo di
.Vuoi contribuire alla realizzazione di questa newsletter con un abbonamento a pagamento? Il tuo sostegno copre i costi dei contributi esterni che rendono sempre più ricchi questi spazi!
Intanto ti ricordo che se vuoi coinvolgermi in un evento puoi scrivere a contact-columbro@elastica.eu.
Per promuovere il prodotto della tua azienda, un evento o un corso in questi spazi scrivi a newsletter@tispiegoildato.it, rispondo io oppure Roberta.
Le prossime date dove possiamo incontrarci:
21 giugno, Milano: alle 10, al teatro Elfo Puccini per l’assemblea di Coop Lombardia parliamo di dati, parità e futuro, con Maura Latini, presidente di Coop Italia, e Sonia Blarasin, vice presidente Coop Lombardia.
21 giugno, Bergamo: dalle 18 alle 19:30 in occasione dell’evento Molte Fedi, la rassegna culturale delle Acli parlo con lavoratori e lavoratrici del sociale. Portando dati, ovviamente.
22 giugno, Bergamo: dalle 11 alle 12, alla Biblioteca Angelo Mai, un dialogo-podcast con Valentina Tomirotti sul tema “A misura di chi? La città del welfare”.
25 giugno, Milano: intervengo con piacere all’evento di MongoDB in tema di gender bias, discriminazioni e algoritmi.
25 giugno, Ravenna: alle 21 presentazione del libro alla Casa delle Donne.
17 luglio, Torino: presento il mio libro “Quando i dati discriminano”, presso la sede dell’associazione culturale Comala.
Data representation of any kind is a human act, full of human choices.
Jer Thorp, Living in Data: A Citizen's Guide to a Better Information Future (2021)
Una lista di 10 errori che trovo nei progetti di data viz dei miei studenti
Intanto, un ringraziamento: proprio a loro (o a voi se mi leggete), lə studenti che ho incontrato quest’anno nei corsi in cui ho avuto il privilegio di insegnare e con cui ho passato almeno 9 ore insieme. Dalla Scuola Holden alla IULM, dall’Università svizzera italiana alla Digital Academy di Will e Chora Media. Perché è vero che il successo di una lezione si deve metà a chi insegna e metà a chi è lì per apprendere, e stimola tutta la classe con domande e curiosità. Quest’anno ho avuto classi che mi hanno fatto tornare l’entusiasmo di preparare le slide e pensare attività pratiche sempre più coinvolgenti ma soprattutto utili per “sbattere la testa” in prima persona su dataset e strumenti per progettare grafici.
E quindi, per moltə di loro, è arrivato il momento dell’esame finale. E noto che nella restituzione dei project work certi errori si ripetono. Con alcunə studenti abbiamo già discusso dal vivo, e mi sono raccomandata che non uscissero dal mio corso con le idee confuse.
“Dove hai imparato a fare questi grafici orribili e sbagliati?” “Ho studiato con Columbro!”
Ecco, no :)
Intanto, le nozioni di BASE sulla materia si ritrovano in Ti Spiego il Dato, il LIBRO:




Vi ricordo anche che esiste uno sconto per comprarlo sullo store dell’editore (codice TSID15). Tutte le risposte si trovano lì, se avete perso qualche ora di lezione, o per muovere i primi passi nel mondo della data viz. Non c’è niente di nuovo nel modo in cui i grafici possono ingannare.
Ma di nuovo qualcosa c’è, ovviamente, e sono gli strumenti generativi di immagini. Che non vieto di usare: i grafici del project work possono essere disegnati a mano su un tovagliolo o realizzati con un software qualsiasi, ma devono essere
funzionali, veritieri, profondi, illuminanti, come insegna Alberto Cairo.
Eppure, noto che alcuni errori e disattenzioni ritornano, anno dopo anno.
Sui tovaglioli e nei grafici prodotti dall’IA.
Eccoli qui:
Pensare che un grafico valga più di mille parole, e quindi non usare lo spazio previsto per il titolo, per il sottotitolo e per una descrizione efficace. Sono elementi fondamentali di una data viz, e se mancano per me sono tutti punti in meno. Perché la rendono meno comprensibile. E quindi, non funzionale.
Dare per scontato che scrivendo la fonte nel testo del project work (o del report, o delle vostre slide), non serva aggiungerla nel grafico: non abbiamo più il controllo dei nostri contenuti, basta una foto dall’audience, una condivisione sui social e via, un grafico senza contesto e senza fonte può girare online con l’effetto di aggiungere rumore e disinformazione più che veicolare informazioni utili.
Non ragionare sui dati e su quale storia vogliamo raccontare prima di produrre il grafico. Spend time with data, trascorri tempo con i dati, raccomanda Giorgia Lupi nel suo manifesto di Data humanism: deve essere un mantra. Prima c’è l’analisi, poi il messaggio e/o la storia da raccontare, solo alla fine il grafico.
La conseguenza del numero 3 è che si scelgono grafici sbagliati. Esistono infinite guide, ne ha appena prodotta una anche Datawrapper, ma ci aiutano solo se abbiamo capito quali sono le caratteristiche dei nostri dati. Per esempio, se non c’è una linea temporale NON fare un grafico a linee, per favore.
E, non so come succeda, perché di horror chart ne faccio vedere parecchie, c’è chi si presenta con grafici a torta dove la somma degli spicchi è di gran lunga superiore o inferiore a 100.
I colori. Oh my. Qui usare un software come Datawrapper ci fa credere che i colori di default siano perfetti per la nostra rappresentazione. E invece. Meglio Flourish, che con i suoi grafici dai colori psichedelici almeno qualche dubbio ce lo fa venire. Anche i colori, come la scelta del tipo di visualizzazione, vanno pensati e scelti con cura. Nel dubbio: NESSUN COLORE. Ma elementi evidenziati con tratti o spessori diversi, che sono anche più accessibili in caso di disabilità visive.
Pensare un grafico interattivo per una pubblicazione statica. Non funziona, perché se si prevedono informazioni essenziali solo al passaggio del cursore del mouse, la viz non sarà leggibile.
Le mappe coropletiche senza mettere in proporzione la popolazione che abita sul territorio. Ma Trump non ci ha insegnato nulla?
La tentazione di CORRELARE tutto. Prof, vorrei fare una correlazione tra… NO. Parola vietata nei project work. Mi sa che quest’anno non sono stata abbastanza assertiva sul tema.
Non aiutare le persone a comprendere il grafico che abbiamo prodotto con attributi preattentivi, frecce, indicazioni, call to action. Noi sappiamo tutto di quei dati, di quella storia (forse, si spera), ma chi legge no. Piuttosto, dividiamo le informazioni in più grafici (usiamo i miei amati small multiple), non carichiamo il pubblico di elementi difficili da comprendere e senza una gerarchia.
Sì, ovviamente ne avrei altri 10 da aggiungere. Ma poi la mia fama di prof “buona” svanisce. Scrivili tu per me nei commenti. Quali altri errori di rappresentazione dei dati ti capita di vedere in giro? Quali sono i peggiori per te?
I data-link della settimana
a cura di
[datanotizia] “La rimozione di questi resti letali, esaminata in questo pezzo nel dettaglio per la prima volta, rappresenta una sfida enorme”, hanno scritto lɜ autorɜ di questo articolo interattivo pubblicato da Reuters e dedicato alle bombe inesplose nella striscia di Gaza. Secondo l’UN Mine Action Service, gli ordigni da disinnescare sarebbero circa il 5-10% del totale.
[dataset] Come stanno lɜ adolescentɜ di tutto il mondo? All’interno di Adolescent Atlas for Action trovi dataset, analisi e risorse che possono aiutarti a capirlo.
[datatool] Color Brewer ha più di vent’anni, ma è ancora uno degli strumenti migliori per trovare la combinazione di colori giusta per le tue dataviz.
Il dataprogetto del mese
Il Coordinamento per la difesa della sanità pubblica a Trieste è una piattaforma a cui aderiscono decine di associazioni locali e tutte le forze politiche di opposizione alla giunta comunale di centrodestra.
Per raccogliere le opinioni della cittadinanza sulle criticità del sistema sanitario locale, il Coordinamento ha progettato e diffuso un questionario online che è stato compilato da 2891 persone.
Di queste, il 75% ha dichiarato di aver percepito un peggioramento nell’organizzazione dei servizi sanitari pubblici della città negli ultimi cinque anni, mentre il 34% ha dichiarato di aver subito importanti disagi economici in seguito alle spese sanitarie sostenute. Puoi leggere il report completo qui.
Conosci altri progetti di raccolte dati dal basso? Puoi segnalarli compilando questo form (oppure puoi aiutarmi a condividerlo, se vuoi!).
La dataviz della settimana
Quali tipi di grafici possono aiutarci a visualizzare al meglio la complessità delle identità queer? È a partire da questa domanda che Fe Simeoni, information designer e ricercatorǝ dello Human Technologies Lab dell’università di Bolzano, ha dato vita al suo progetto di tesi “QQQ Querying the Quantification of the Queer”.
Dalla sua ricerca nascono Gender Diamond e Gender Flower, due visualizzazioni interattive che permettono all’utente di esplorare l’intersezione tra identità di genere e/o orientamento sessuale in maniera visiva.
Non solo: i nomi stessi dei due modelli (“diamante” e “fiore”) fanno riferimento a quanto siano importanti e preziose quelle che Simeoni chiama “sfumature del genere”.
Puoi testarli entrambi su questo sito oppure puoi scoprire di più sulla loro storia e su quella di altri tentativi di costruire dataviz queer in questo articolo di Nightingale.


Grazie di averci lette fino a qui, ci sentiamo mercoledì prossimo!