In questo numero: approfitto di non avere sponsor (che sarebbe penalizzato da tutti i link che sto per mettere) e anche delle vacanze imminenti per darvi una lista di fonti di ispirazione sui dati, nonché di banche dati vere e proprie in cui cercare dataset per produrre contenuti. In realtà sto facendo un favore alla Donata “prof” e salvo in un unico posto tutti i link sparsi tra Evernote, Notion e barra dei preferiti del browser.
Se invece vuoi qualcosa da leggere guarda gli ultimi due numeri, dove Serena Canu mi racconta del suo lavoro di data scientist umanista in biblioteca, o dove parlo di cose che non piacciono all’AI: i cimbali e le famiglie omogenitoriali.
*edit dell’11 aprile 2023: questo post sarà aggiornato periodicamente con nuove fonti originali e interessanti segnalate da voi o scovate da me mentre lavoro.
Per eccellere in ogni campo, secondo Jurij, bisogna essere in grado di reggere una tremenda dose di noia*.
Maria Sharapova, Inarrestabile
* Forse i progetti di data journalism e data storytelling sono al 90% noia (trova i dati, pulisci, analizza) e 10% creatività. Ma senza quel 90% non ci può essere il resto.
(Ah Jurij è il padre-allenatore della tennista Maria Sharapova e la citazione è tratta dalla sua biografia. Io resto #teamSerena sempre, ovviamente)
Fonti di dati (quelle non tradizionali)
Non vi metto Eurostat, Banca Mondiale, ecc (ovviamente dovete conoscerli) ma metto Istat perché vi consiglio soprattutto la newsletter e il calendario con l’uscita dei report.
Data Is Plural - la newsletter di Jeremy Singer-Vine (non è un errore, Singer-Vine pubblica settimanalmente dataset nuovi disponibili ovunque nel mondo).
Report di ONG come Save The Children, Action Aid, WeWorld, Greenpeace, Recommon, A buon diritto, Amnesty e mille altre, ma ho capito tenendo lezioni a studenti e stutendesse di vario grado che bisogna saper cercare. Se ti servono dei dati e hai la sensazione che qualcuno potrebbe averli pubblicati cercali prima in italiano, se non li trovi prova con l’inglese, cambia motore di ricerca, usa related: ecc e magari prova il motore di ricerca Google dedicato.
Our world in data, non è una fonte primaria ma i ricercatori di OWID rielaborano dati riguardo ai “problemi del mondo” e li rimettono a disposizione della comunità.
Il Pew Research Center fornisce dati su US ma esplorando il sito si possono trovare spunti sulle domande (sempre loro) da fare ai dati che ti interessano di più.
Kaggle, un sito dove si trovano dataset utili per fare esercitazioni nei corsi, ma a volte ci sono anche dataset che stai cercando… già puliti da qualcun altro :)
Books Ngram Viewer di Google, occorrenza delle parole nei libri presenti in Google Books.
La sezione strumenti dello European Journalism Network (ci sono dataset originali).
I dataset di ProPublica, testata statunitense che fa inchieste anche raccogliendo dati in crowdsourcing da lettori e lettrici.
Gli osservatori dal basso come Non una di meno, Obiezione respinta, Cittadini per l’Aria…
Una listona di fonti di dati dentro una listona di progetti interessanti di OSINT (open-source intelligence).
Natural Earth, un sito di dati geolocalizzati per creare mappe vettoriali su scala 1:10m, 1:50m, e 1:110m.
Blog e siti di progetti interessanti
Text as data & data in the text di Giorgio Comai, ricercatore dell’Osservatorio Balcani e Caucaso.
Dati bene comune, progetto portato avanti da onData, Transparency International e Action Aid per chiedere dati pubblici quando non ci sono.
Missing numbers, dati pubblici poco conosciuti in UK e dati mancanti.
Design for migration, raccolta di progetti di design che riguardano le migrazioni.
I progetti di data journalism candidati e premiati ai Sigma Awards.
Dataset cercati ma inesistenti (ok, poco utile ma stimolante, forse).
Disabled Data, di cui ho parlato diverse volte, porta l’attenzione sulla scarsità dei dati che riguardano le persone disabili in Italia e mette in ordine quelli che ci sono già.
Un portale di sorveglianza epidemiologica curata da Francesco Branda per seguire gli "hot health topics" degli ultimi anni sia a livello europeo che italiano.
Due bonus track su Telegram: il Data Book Club che abbiamo lanciato io e Elena Canovi e la DataViz + BujoChallenge di Alenka Gucek e Martina Zunica.
Me ne vuoi segnalare altri? Scrivimi rispondendo a questa email così li aggiungo alla versione web di questo numero.
La dataviz della settimana
Calmare i nervi quando i bambini si assentano troppo da scuola causa malattie… raccogliendo dati. Un progetto di Zach Rottman raccontato su Nightingale, il magazine della Data Visualization Society. Ci ha fatto anche un sito chiamato “il mio ragazzino è malato”, che aggiorna quotidianamente.
Questa newsletter arriva così tardi perché anche il mio ragazzino è malato? Sì.
Ci leggiamo mercoledì prossimo, più riposata, spero :)
Condividi questo numero con il comodo bottoncino giallo: