Le grandi case editrici statunitensi sembrano pronte a collaborare per fornire i propri contenuti testuali come dati di addestramento per i modelli di intelligenza artificiale (IA).
La notizia è stata lanciata qualche settimana fa il Financial Times, fornendo nuovi sviluppi sulla battaglia, dai contorni sempre più epici, relativa alle presunte violazioni di copyright da parte dell’IA, che hanno messo in allerta content creators, produttori ed editori di tutto il globo.
L’invito alla contrattazione da parte dei colossi editoriali americani ha una valenza simbolica forte, oltre che determinare una posizione sullo scacchiere negoziale che dimostra il potenziale squilibrio di potere tra le aziende che addestrano i modelli di intelligenza artificiale e i creatori di contenuti, i cui dati costituiscono la base per l’addestramento di questi modelli.
Tra i modelli più diffusi ci sono ChatGPT di OpenAI e BARD di Google nel campo della creazione di contenuti testuali, e Midjourney, Stable Diffusion e Dall-E nel campo della generazione grafica.
Questi sistemi di intelligenza artificiale vengono sviluppati attraverso addestramenti effettuati su enormi quantità di dati, siano essi libri o immagini, la cui provenienza non è dichiarata e che plausibilmente potrebbero essere coperti da diritto d’autore.
Le prime battaglie legali: OpenAI sotto processo
Tanto è bastato per vedere già incardinati negli Stati Uniti i primi procedimenti giudiziari contro OpenAI, accusata di una gestione poco trasparente in fase di acquisizione e di utilizzo dei dati.
Timothy K.Giordano dello Studio Legale Clarkson, che ha intentato una massiva azione legale contro OpenAI, ha dichiarato che “Raccogliendo dati personali di milioni di persone e appropriandosene per sviluppare una tecnologia volatile e non testata, OpenAI ha messo tutti in una zona di rischio incalcolabile, ma inaccettabile secondo qualsiasi misura di responsabilità nella protezione e nell’uso dei dati”.
È innegabile che nessuna legislazione fosse preparata a fronteggiare un impatto di questa portata e a questa velocità.
L’AI Act europeo, uno dei primi provvedimenti strutturali a livello globale, ha legittimamente focalizzato le sue priorità sui principi generali e sui divieti d’uso, affrontando anche, in via subordinata, gli aspetti legati al copyright e all’addestramento dell’intelligenza artificiale, improntando la visione generale alla garanzia di una maggiore trasparenza da parte delle aziende sviluppatrici.
Il copyright ibrido
Tuttavia, il percorso verso una regolamentazione in grado di risolvere le problematiche emerse sembra ancora lontano, mentre la velocità con cui i sistemi di IA si diffondono nella vita quotidiana accelera esponenzialmente.
Negli Stati Uniti, i primi segnali di un cambio di paradigma è avvenuto per mezzo della primissima decisione deI copyright office sulla richiesta di deposito di un’opera creata dall’IA.
L’ufficio americano ha infatti introdotto una tutela parziale, un “Copyright Ibrido” capace di garantire una protezione autoriale in situazioni in cui la componente creativa dell’artista è predominante, pur se la creazione coinvolge l’uso di sistemi di intelligenza artificiale.
Questo modello di copyright mirerebbe, nell’attuale momento legislativo, a bilanciare la protezione dei diritti degli artisti con la necessità di promuovere l’innovazione nel campo dell’IA.
Il primo esempio storicamente rilevante di questo approccio è il riconoscimento del copyright del fumetto “Zarya of the Dawn” di Kristina Kashtanova, dove è stato riconosciuto il copyright sul concept e sulla sceneggiatura ma non sulle singole illustrazioni generate tramite l’app Midjourney.
Appare quindi plausibile prevedere che i primi orientamenti arrivino per vie parallele rispetto ai procedimenti legislativi ordinari, magari anche per mezzo delle spinte delle Authority nazionali, come avvenuto in Italia in tema di privacy.
Modelli di licenza, quali prospettive d’accordo per l’IA?
Nel frattempo, e per evitare di rimanere passivamente ad assistere alle evoluzioni normative e giurisprudenziali di questa nuova matrice tecnologica, le maggiori case editrici americane sono al lavoro per considerare l’idea di stipulare licenze di utilizzo per i contenuti coperti da copyright da parte di ChatGPT.
Pare per questo possibile immaginare dei macroscenari, o modelli di riferimento, con cui pare possibile stipulare un contratto di licenza per i contenuti.
Modello quantitativo
Un modello possibile per una tale licenza potrebbe essere quello già esistente nell’industria musicale, in cui stazioni radio, discoteche e servizi di streaming pagano le case discografiche ogni volta che un brano viene riprodotto.
Questo modello “quantitativo”, tuttavia, necessita di un elevato grado di trasparenza da parte delle aziende di AI riguardo all’utilizzo dei contenuti dei media, cosa che al momento non sta avvenendo.
Mathias Döpfner, editore, CEO e proprietario con il 22% del gruppo di media Axel Springer SE, oltre che presidente dell’Associazione federale degli editori digitali e degli editori di giornali, spingerebbe verso questo modello, considerandolo il meno imperfetto.
Licenza annuale illimitata
Lo stesso Döpfner, editore di Bild, il giornale tedesco recentemente al centro dell’attenzione per l’idea di sostituire 200 giornalisti con l’Intelligenza Artificiale, sostiene che un accordo annuale per l’uso illimitato dei contenuti di un’azienda di media sarebbe una “seconda opzione migliore”.
Un po’ come accade per i siti che offrono immagini in stock, questo modello avrebbe il pregio di offrire prevedibilità e stabilità, con le case editrici che potrebbero ricevere un pagamento fisso ogni anno, indipendentemente da quanto dati vengano utilizzati. Le aziende di AI beneficiano di un accesso illimitato ai contenuti, il che potrebbe favorire l’innovazione e lo sviluppo di nuovi prodotti e servizi.
Un accordo del genere potrebbe altresì risultare iniquo per le case editrici laddove i contenuti siano utilizzati, come pare stia accadendo, in modo intensivo, mentre le piccole testate locali e regionali potrebbero avere difficoltà a negoziare direttamente tali accordi e quindi a trarne beneficio.
Modello condivisione dei ricavi
Una terza opzione potrebbe essere quella di modello basato sulla condivisione dei ricavi.
In questo modello, i guadagni delle case editrici sarebbero direttamente collegati all’uso dei loro contenuti da parte delle aziende di AI.
Ciò potrebbe incoraggiare una collaborazione più stretta tra le case editrici e le aziende sviluppatrici, anche se stabilire una percentuale di condivisione dei ricavi equa potrebbe essere difficile.
Si potrebbe infatti prevedere che le case editrici cercheranno di negoziare un accordo ampio, comprendendo tutte le possibili forme di monetizzazione, mentre le aziende AI tenteranno di circoscrivere i ricavi alla sola vendita del prodotto o servizio specifico.
L’impegno richiesto per monitorare e verificare tali ricavi, e l’eventuale contenzioso in caso di disaccordo, potrebbe essere notevole.
Inoltre, la fattibilità di questo modello dipenderebbe fortemente dal successo finanziario delle aziende di AI: in assenza di profitti significativi, la condivisione dei ricavi potrebbe non fornire un ritorno finanziario sufficiente per le case editrici.
D’altro canto, un tale modello potrebbe disincentivare le aziende di AI dal fare un uso ampio dei contenuti, se ciò significa dover dividere una porzione maggiore dei loro ricavi.
Modello basato su licenza libera
Pur non riguardando nello specifico le case editrici, un modello plausibile di utilizzo potrebbe essere quello basato sulla licenza libera, cioè sull’utilizzo di contenuti per cui non occorre una specifica licenza, come ad esempio
Questo consentirebbe alle aziende di AI di utilizzare alcuni contenuti per l’addestramento senza dover pagare un canone di licenza.
Tale modello appare, almeno su larga scala, poco plausibile. Le case editrici, ad esempio, dovrebbero rinunciare a qualsiasi forma di compenso diretto per l’uso dei loro contenuti, potrebbero ridurre la loro capacità di investire nella creazione di nuovi contenuti, compromettendo la qualità e la sostenibilità a lungo termine della struttura aziendale (a meno che non si focalizzi il core business su altri aspetti economici).
Conclusioni
Nell’incertezza generale dovuta agli interessi economici in gioco, pare evidente che i prossimi mesi diventeranno essenziali per comprendere meglio dove si indirizzerà l’ago della bilancia. Così come il futuro degli editori e dei content creators in generale.