L’infodemia non dipende dalla tecnologia, ma dal contesto
Vi racconto una cosa successa a Ouagadougou nel 2013
In questo numero: liberarci dalla disinformazione è impossibile. Esisteva anche prima delle AI. Però, quando ci sono dei dati di mezzo, ci sono domande importanti che possiamo farci.
E poi: sono felice di presentarvi un nuovo sponsor, Clearbox AI. Le collaborazioni che mi permettono di imparare qualcosa sono tra le mie preferite. In questa newsletter, e per tutto il mese di aprile, con Clearbox AI andiamo alla scoperta dei dati sintetici. Possono mitigare i bias degli algoritmi? Permettono di rispettare la privacy? Perché devo interessarmene? Oltre ai contenuti in newsletter, abbiamo pensato a una diretta che faremo il 18 aprile alle 14 in cui intervisto Shalini Kurapati, ceo e co-founder di Clearbox AI. Sotto trovate il link per iscrivervi.
E ora, entriamo nel vivo.
Nell’idea di misurazione è implicito l’obiettivo dell’accuratezza: avvicinarsi alla verità riducendo al minimo l’errore.
Daniel Kahneman, Olivier Sibony, Cass R. Sunstein, Rumore (Utet 2021)
Nel febbraio del 2014 ero in Burkina Faso, tra la capitale Ouagadougou e Ouahigouya, più a nord, per l’ultimo dei miei viaggi (cinque in totale, dal 2004) nel paese dove a un certo punto ho persino immaginato di comprare un appezzamento di terra per costruirmi una casa e tornare da residente ufficiale (nello specifico a Dori, capitale del Sahel, dove nel 2009 avevo trascorso due mesi per scrivere la tesi di laurea).
In quell’ultimo viaggio, dove lavoravo a un progetto di formazione sul citizen journalism con le scuole, diverse persone mi hanno raccontato di un fatto incredibile successo l’anno precedente: nel 2013 si giocano in tutto il mondo le qualificazioni per il campionato dei mondiali di calcio maschile del 2014, ma il Burkina Faso rimane escluso dopo una sconfitta contro l’Algeria. Ma improvvisamente, una settimana dopo la partita, un sms fa impazzire i telefoni di tutta la capitale: la Federazione calcio burkinabé ottiene la riammissione grazie a un ricorso alla Fifa contro l’Algeria, accusata di aver schierato il giocatore Madjd Bougherra, contravvenendo a una presunta squalifica dell’atleta.
Grande soddisfazione nazionale! La gente lascia gli uffici, le scuole, le auto in strada e festeggia l’ammissione ai mondiali!
Peccato che la notizia viene smentita qualche ora dopo in televisione: il ricorso è stato respinto, ai mondiali parteciperà infatti la squadra dell’Algeria e non Les Étalons (gli stalloni), come viene chiamata la squadra nazionale del Burkina in onore del cavallo di Yennenga, leggendaria principessa considerata la madre dei mossi, la popolazione maggioritaria del paese.
Ma i burkinabé non ci credono, la bufala diventa la notizia e il fatto, reale, confermato, ufficializzato, una falsità diffusa dalle autorità per interrompere i festeggiamenti.
La situazione si calma dopo qualche giorno.
L’infodemia non dipende dalla tecnologia
Dopo la diffusione delle immagini di papa Francesco con il piumino, o di Donald Trump in arresto, sono settimane in cui ci preoccupiamo che lo sviluppo delle intelligenze artificiali generative possa aiutare la circolazione di notizie false, perché qualsiasi documentazione che prima aveva valenza di prova, di testimonianza, ora non lo ha più per il fatto di essere un certo tipo di contenuto (foto, video), ma deve essere, ancora più di prima, scrutato, valutato, passato sotto la lente di un fact checking sempre più avanzato anche in termini informatici.
Vi ricorda qualcosa? Come per i dati, non basta che qualcuno ce li metta sotto agli occhi perché possano costituire una prova di neutralità, o evidenza di un procedimento scientifico o dell’analisi di un fenomeno sociale. Come per i dati, dobbiamo contestualizzare:
come è stato prodotto questo contenuto?
da chi e perché?
chi ha interesse che venga diffusa disinformazione (o confusione) su questo tema?
Secondo le persone che mi hanno raccontato l’episodio dei mondiali in Burkina Faso le autorità governative a quell’epoca avevano tutto l’interesse a distrarre per qualche giorno la popolazione: nel febbraio 2011, anche sull’onda delle primavere arabe, i cittadini scendono in piazza per protestare contro la morte sospetta di uno studente per mano della polizia, e la crisi politica e sociale che si genera porta l’esercito a tentare di rovesciare il presidente Blaise Compaoré, al potere da più di 20 anni dopo un golpe e l’uccisione dell’eroe nazionale, il “Che Guevara africano”, Thomas Sankara (per cui è stato condannato solo nel 2022). Negli anni seguenti la stabilità politica del paese, molto più solido da questo punto di vista rispetto ai vicini Mali o Costa d’Avorio, vacilla. Nel 2014 la crisi esplode in manifestazioni di massa contro la decisione del presidente di cambiare la costituzione per restare al potere altri 15 anni: non più appoggiato neanche dall’esercito Compaoré si dimette a fine mese.
Ecco che il contesto dà alla storia dei mondiali una cornice interessante.
L’OMS ha usato per la prima volta nel 2020 la parola infodemia per segnalare il pericolo della diffusione di informazioni senza controllo, ma il suo significato, riportato da Treccani, ci torna utile in qualsiasi ambito:
Un’abbondanza di informazioni, alcune accurate e altre no, che rendono difficile per le persone trovare fonti affidabili quando ne hanno bisogno.
In quei giorni folli in Burkina Faso la speranza di aver ricevuto davvero una bella notizia in un periodo politico-sociale non proprio felice e, in più, l’inaffidabilità dei media ufficiali controllati dal governo, spiegano perché la diffusione di una notizia falsa, tramite quel mezzo di comunicazione in particolare, abbia funzionato bene. Un sms meritava più fiducia di un telegiornale.
Dati e disinformazione
Più accumulo esempi sulle notizie che contengono dati più è chiaro che conoscere il procedimento di come viene misurato e comunicato un fenomeno è fondamentale per smontare contenuti dis-informativi.
E chiedersi perché alcune notizie, alcuni contenuti, più di altri, siano controllati e verificati anche dalle piattaforme social, può aggiungere un altro tassello al puzzle di questa complessità che ormai abitiamo:
I problemi di disinformazione e incitamento all'odio sono avvertiti in tutto il mondo, ma le piattaforme non rispondono con urgenza ovunque. Le piattaforme sviluppano l'intelligenza artificiale per moderare i contenuti su larga scala, ma non li forniscono allo stesso modo in tutte le lingue. Ad esempio, sebbene il 90% degli utenti di Facebook viva al di fuori degli Stati Uniti, nel 2020 solo il 13% delle ore di moderazione è stato assegnato all'etichettatura e all'eliminazione della disinformazione in altri paesi.
(Fonte: l’Internet Health Report 2022 di Mozilla che ritroverete anche più sotto)
Questa newsletter è sostenuta da: Clearbox AI
Hai mai sentito parlare di dati sintetici? Sono dati generati attraverso modelli di intelligenza artificiale che mantengono le proprietà statistiche dei dati originali, risultando quindi realistici.
Gartner sostiene che, entro il 2030, i dati sintetici sostituiranno la maggior parte dei dati reali nei modelli di AI. Ma quali sono i vantaggi?
Preservano la privacy dei dati originali.
Mitigano bias e discriminazioni dei dati storici.
Fanno risparmiare la tua azienda.
Clearbox AI ha sviluppato una tecnologia che automatizza la creazione di dati sintetici e che può essere applicata a qualsiasi settore. Ti piacerebbe saperne di più? Partecipa con noi alla diretta Linkedin del 18 aprile, dove approfondiremo l’argomento con un’intervista di Donata alla CEO Shalini Kurapati: vieni e porta tutte le tue domande.
La dataviz della settimana
Questo cartogramma rappresenta l’uso di migliaia di dataset tra gli anni 2015-2020 con lo scopo di allenare programmi di apprendimento automatico.
I dati arrivano da questo paper, la mappa è stata “distorta” per arrivare a produrre un cartogramma, una rappresentazione geografica che cambia la geometria dei territori in base al dato che vuole rappresentare.
Come spiega il report di Mozilla da cui arriva l’immagine (ricchissimo di altri dati e viz):
Ciò non significa che i set di dati o i modelli di apprendimento automatico non vengano sviluppati nel resto del mondo. Lo sono!
Ma il discorso su come dovrebbe essere utilizzata l'intelligenza artificiale - e chi dovrebbe trarne vantaggio - è attualmente fortemente ponderato nei confronti di persone e istituzioni che esercitano già un enorme potere su Internet (e sul mondo).
In effetti, più della metà dei set di dati utilizzati per il benchmarking delle prestazioni dell'IA in oltre 26.000 documenti di ricerca provenivano da sole 12 istituzioni d'élite e società tecnologiche negli Stati Uniti, in Germania e a Hong Kong (Cina).
Su Rai Radio Uno per parlare di ChatGpt
e il blocco del garante.
Sono particolarmente orgogliosa di aver discusso su Sportello Italia insieme a Massimo Cerofolini e
della situazione di ChatGpt in Italia e dei rischi per i nostri dati rispetto all'uso dell AI.(Ad aprile sono stanziale, a maggio parto di nuovo per un tour in cui le ore di treno superano quelle di ufficio. Vuoi invitarmi nella tua città, azienda, libreria, biblioteca, scuola? Scrivimi!)
Grazie di aver letto fino a qui, ci leggiamo mercoledì prossimo!
Condividi questo numero con il comodo bottoncino giallo: