"Sono felice che l'IA abbia rubato i miei libri!"
Un punto di vista femminista sull'industria estrattiva delle intelligenze artificiali
In questo numero: adottare l’approccio del femminismo dei dati per discutere di intelligenza artificiale, di addestramento dei grandi modelli linguistici in questo caso, vuol dire lasciar perdere ogni pretesa di universalità e prendere una posizione situata, ma consapevole.
Un bel dialogo in cui la complessità è stato il filo conduttore delle domande che ho ricevuto (e spero anche le risposte che ho dato) è nella diretta dell’associazione Mensa Italia.
Dove ci vediamo in giro:
3-4 maggio, a Foligno: intervengo al convegno del Gruppo di Terapia Manuale dove il tema è “Umanizzare i dati evolve la fisioterapia muscoloscheletrica”. Iscrizioni aperte.
11 maggio, Roma: alla prima edizione del festival Semi di Reti presso Villetta Social LAB, nel quartiere Garbatella, un incontro su lavoro, gender gap e discriminazioni. Alle 17.
🗞️ [angolo SkyTg24] In Europa solo 13 paesi pubblicano i dati sulle vittime delle operazioni di polizia. L'Italia non è tra questi. La prima mappatura, con casi che partono dal 2000 a oggi, l’ha creata Luigi Mastrodonato, giornalista che si occupa da anni di questioni legate alle carceri e alle situazioni di fragilità nel nostro paese. La sua mappa, che ha chiamato “Malapolizia”, conta i decessi avvenuti dal 2000 al 2025 durante fermi e controlli delle forze dell’ordine, e per ora ne include 67. La maggioranza sono uomini, e circa la metà di origine straniera. Le donne sono solo due.
Ho iniziato a raccogliere queste storie cercando sui motori di ricerca, con parole chiave nella cronaca, tra battaglie legali e mobilitazioni sociali, e poi confrontandomi con i siti e i social di associazioni che se ne occupano, come Antigone, Osservatorio Repressione, Stefano Cucchi onlus e Acad, l’Associazione contro gli abusi in divisa.
Se hai l’abbonamento a Sky lo leggi integralmente qui. La mappa e le storie le trovi in chiaro su GMaps.
Sei tra le 11589 persone che leggono la newsletter. Nell’ultima puntata abbiamo intervistato Valentina La Morgia, ricercatrice Ispra e docente al corso di Scienze Naturali all’università di Torino.
Vuoi contribuire alla realizzazione di questa newsletter con un abbonamento a pagamento? Il tuo sostegno copre i costi dei contributi esterni che rendono sempre più ricchi questi spazi! E la sezione curata da Roberta qui sotto è ricchissima di link interessanti oggi.
Intanto ti ricordo che se vuoi coinvolgermi in un evento puoi scrivere a contact-columbro@elastica.eu.
Per promuovere il prodotto della tua azienda, un evento o un corso in questi spazi scrivi a newsletter@tispiegoildato.it, rispondo io oppure Roberta.
Quando i processi di matching dell’intelligenza artificiale sono nascosti e le persone sono inconsapevoli di come e perché ne traggano vantaggi o svantaggi, è necessaria una risposta politica collettiva, anche se questa diventa più difficile.
Kate Crawford, Né intelligente né artificiale: Il lato oscuro dell'IA (Il Mulino 2021)
Rendi visibile il lavoro. Anche dietro l’IA.
Quando il giornale statunitense The Atlantic ha denunciato che Meta aveva usato migliaia di libri piratati online della banca dati di LibGen per addestrare la sua intelligenza artificiale, mi è stato subito segnalato che c’era anche Quando i Dati Discriminano, dentro quel dataset. Sono andata a controllare, grazie al tool messo a disposizione proprio dall’Atlantic, e in effetti eccolo lì.
Meno male, ho risposto, almeno l’IA impara qualcosa di furbo.
Lo penso ancora oggi, e anzi, se non avessi trovato almeno uno dei miei titoli dentro LibGen mi sarei sentita “offesa”. Non merito di essere piratata? Sono davvero così poco interessante? Il problema è che fermarsi qui e inneggiare alla pirateria come strumento di diffusione del sapere non basta. E stabilire che il diritto d’autore e il copyright sono strumenti del potere dominante e non proteggono noi piccoli autori (chi scrive, chi disegna, chi produce video…) non basta. In questo dibattito secondo me è necessario assumere una posizione situata. Chi sono io, in quanto autrice, nei confronti di altre persone - ad esempio delle comunità marginalizzate - che di certi sapere sono sempre state espropriate, e chi sono di fronte all’azienda che preferisce usare libri piratati invece che fare accordi con le case editrici pagando un equo compenso. Un conto è finire su LibGen, un conto è che LibGen sia usato da una big tech. Certo, i libri sono lì, online, ma dare per scontato che questa sia l’unica cosa che può accadere, che sia l’unico modo e che non vada messo in discussione mi sembra problematico. Un conto è distribuire la conoscenza, un conto è appropriarsene per trarne profitto, quando a farlo è qualcuno che questo profitto e questo potere non lo redistribuisce. Mai. Anzi, sui contenuti che produciamo nei suoi spazi decide arbitrariamente, e in modo non trasparente, anche se sono “a favore della libertà di espressione”. Certo, abbiamo firmato un accordo chiamato “termini di servizio” per usarlo, ma siamo in due, loro le piattaforme e noi lə utenti, a farlo restare valido, e possiamo capire come esercitare il nostro potere. Per esempio, negando l’uso delle nostre interazioni per addestrare l’IA, quando possibile.
Oggi mi sembra difficile mantenere questo dibattito su un livello di complessità tale da poter riconoscere che esistono posizioni diverse a seconda di chi le esprime. Non si può rendere universale la propria opinione sul copyright e il diritto d’autore. Mi trovo ad abitare questa difficoltà, perché se da una parte credo nella circolazione delle idee anche senza attribuirne maternità e paternità, dall’altra mi interrogo se il principio “Rendi visibile il lavoro” dell’approccio femminista dei dati sia rispettato, per esempio chiedendo di adottare la licenza Creative Commons CC0 1.0 Universal, cioè quella che permette a chiunque di usare, modificare, distribuire e pubblicare l'opera senza chiedere permesso, anche per scopi commerciali.
Rinunciare a ogni diritto d’autore è la soluzione? Di nuovo, credo che il discorso qui non possa essere universale.
Penso alla sovranità dei dati, concetto indigeno che avevo approfondito due anni fa. E penso che “citare sia cura femminista”, come ha scritto
qualche giorno fa nelle sue storie di Instagram.Sono andata a cercare qual è quindi, questo punto di vista femminista sul diritto d’autore.
Anshul Dalmia, ricercatore al Centre for Constitutional Law per il think tank indiano Vidhi Centre For Legal Policy, ha scritto una “critica femminista al copyright” dove sostiene che “protegga un sapere già costruito in modo patriarcale”:
le norme sulla proprietà intellettuale si basano sulla valorizzazione di una produzione culturale storicamente dominata dagli uomini, escludendo o svalutando i contributi femminili. Il copyright, quindi, non è neutrale, ma nasce già all'interno di un sistema che marginalizza il lavoro delle donne.
Per il ricercatore il copyright ha privilegiato creazioni realizzate nella "sfera pubblica" maschile ed economicamente remunerative, lasciando fuori le produzioni femminili ritenute "private" o "di basso valore".
In più, le donne sono considerate meno "autrici": storicamente e ancora oggi, viene spesso negato alle donne il riconoscimento come autrici vere e proprie, perché il loro lavoro creativo è visto come un'attività di piacere o di consumo familiare, non come produzione culturale pienamente riconosciuta.
Qui penso di nuovo al settimo principio del data feminism, rendi visibile il lavoro: i software di intelligenza artificiale che utilizziamo, ma anche quelli che delle macchine a guida semi autonoma, non sarebbero stati possibili per esempio senza il lavoro di migliaia di donne precarie che hanno contribuito ad annotare ed etichettare i dati. O ancora, ricordiamo la storia decolonizzata della data visualization: elementi decorativi, o grafici veri e propri, quelli ricamati dalle donne del Punjub?
Per Dalmia la legge stessa contribuisce a perpetuare la marginalizzazione perché la struttura legislativa e la giurisprudenza, dominata da interpretazioni maschili, mantengono alte barriere all’accesso delle donne alla protezione del copyright.
Abolirlo dunque? Nel pezzo l’autore dice di no. Chiede di ripensarlo, per proteggere tutte le forme di creazione, indipendentemente dal genere, dallo spazio sociale di provenienza o dal tipo di attività.
E a proposito di femminismo dei dati, le autrici Lauren Klein e Catherine D’Ignazio nel 2024 hanno proposto un aggiornamento dei principi di data feminism applicati in modo specifico alla ricerca e allo sviluppo dell'intelligenza artificiale. L’approccio femminista rifiuta l'idea dell'IA come neutra o magica, ma anzi dimostra come i sistemi di intelligenza artificiale riproducano le stesse oppressioni del mondo reale. Allo stesso tempo denuncia la colonizzazione digitale: l'estrazione di dati e lavoro dal Sud globale a vantaggio delle Big Tech del Nord globale. Ai 7 principi ne aggiungono due: prestare attenzione alla sostenibilità ambientale, visto che l'addestramento consuma enormi risorse naturali (acqua, energia), con impatti sproporzionati sulle popolazioni del Sud globale. E indicano una nuova strada:
serve un nuovo modello di consenso sui dati, più ampio e collettivo, che contrasti l'attuale estrazione non consensuale di dati per addestrare modelli AI.
L’estrazione di conoscenza non può essere indiscriminata e non può non tenere conto di secoli di appropriazione ed estrazione dei saperi, che non ha mai - o raramente - riconosciuto la validità di posizioni come quelle indigene, o prodotte dalle donne.
Al tempo stesso, non è nemmeno al singolo utente che dobbiamo chiedere di cambiare le cose, smettendo di usare questi strumenti. La portata del sostegno che un assistente digitale può offrire a persone neurodivergenti o con disabilità, ma anche a persone che storicamente sono state ai margini della società o che si sono auto-limitate per non avere abbastanza risorse da mettere in campo in certi mestieri, non è da sottovalutare (penso all’ultima newsletter di
o di Barbara Pederzini). A livello personale posso chiedermi:usando le IA mi sto riappropriando di un potere che mi è stato sottratto o sto creando ulteriori ingiustizie e squilibri di potere?
È bello che le autrici concludano con una citazione della sociologa Ruha Benjamin che dice
"Craft the worlds you cannot live without, just as you dismantle the ones you cannot live within."
Costruisci i mondi di cui non puoi fare a meno, mentre smantelli quelli in cui non puoi vivere.
Questa sì, mi sembra una prospettiva da rendere universale.
I data-link della settimana
a cura di
[datanotizia] A inizio aprile il comune di Bologna, insieme alle associazioni Period Think Tank e Sex & the City, hanno pubblicato l’Atlante di genere per una città femminista, un volume che mira a mettere a sistema informazioni che solitamente risultano frammentate tra enti diversi, restituendo una guida ai servizi della città per donne e per tutte le soggettività di genere: puoi scaricarlo qui.
[dataset] Vuoi battere tuttɜ al totoPapa? Cristian Consonni ha estratto la tabella che contiene l'anagrafica dei cardinali pubblicata sul sito del Vaticano e ha confrontato i dati ufficiali con quelli disponibili su Wikidata: ecco il dataset con tutte le informazioni di cui hai bisogno (via
).[datatool] CARTO è una piattaforma open source per la scoperta, l'analisi e la visualizzazione (statica o interattiva) di dati geospaziali.
La dataviz della settimana
Ogni volta che vedo un paio di papaveri lungo i binari del treno o un campo intero dal finestrino della macchina mi torna in mente “Poppy Field” di Valentina D’Efilippo. Realizzata per commemorare i cento anni dall’inizio della prima guerra mondiale, la dataviz rappresenta tutte le guerre che si sono susseguite dal 1914 al 2014.
Come ha spiegato la designer in un post su LinkedIn
ogni papavero rappresenta un conflitto. Ogni stelo indica la durata della guerra, mentre la grandezza del fiore ne rappresenta le vittime. Il risultato? Un paesaggio inquietante in cui la bellezza è accompagnata dalla tragedia.
Se dovessi crearlo oggi, lo stelo della guerra in Palestina sarebbe molto più lungo, e altri conflitti popolerebbero la linea del tempo.
Oggi l’opera è esposta al museo etnografico di Vienna, il Weltmuseum Wien: qui sotto trovi la versione statica, mentre a questo link puoi esplorare la dataviz in maniera interattiva.
Grazie di averci lette fino a qui, ci sentiamo a maggio!
Grazie per questa puntata. C’è tantissimo su cui interrogarsi e riflettere. Rileggendola pensavo che in fondo forse quello che fa la differenza è (come sempre?) il perché delle cose. Quasi tutti i dibattiti intorno ai diritti della proprietà intellettuale sono nati fino a oggi in contesti o di business o di sistemi di produzione del sapere, dove gli obiettivi sono sempre stati orientati o al profitto, o allo status accademico, ai crediti e alla costruzione di una certa reputazione. Rimettere in discussione il perché del copyright quindi, piuttosto forse che il copyright stesso, mi sembra fondamentale, e mi pare fondamentale ad esempio provare a immaginare come cambierebbero le cose se la motivazione dietro tutto divenisse, non so, la tutela di comunità marginalizzate, o la promozione della salute e dei diritti delle donne? Così, due cose a caso. È sempre una questione di potere, sì.
Grazie per la citazione, io sono contro il copyright da molti anni perché non trovo giusto che la sua espressione naturale (le royalties) valga per l’autore dotato di potere contrattuale e non per tutti gli altri. È più facile da vedere per il cinema o la musica che per i libri, ma vale anche per i libri. Per le AI: il training per me rientra sempre nel fair use anche se chi lo fa è una corporation perché il vantaggio per tutti è incredibilmente superiore alla perdita di uno (non è che vendi meno libri se un’AI si addestra con il tuo). È la posizione esplicita del Giappone e spero diventi presto una posizione diffusa, perché una rete neurale non prende un contenuto per goderne o per usarlo, lo studia e lo trasforma in pattern.