Dopo il New York Times, anche News Corp – Wall Street Journal e New York Post – decide di far causa alla startup di intelligenza artificiale Perplexity, accusandola di “freeride massiccio” (in sostanza, di rubare contenuti e ricavi) e chiede al tribunale di bloccare l’uso del suo materiale.
La News Corp, editrice del WSJ, accusa Perplexity di copiare contenuti di notizie protetti da copyright e di utilizzarli per generare risposte alle domande degli utenti, dirottando traffico che altrimenti andrebbe ai siti web degli editori.
Ma anche di pubblicare informazioni sbagliate – allucinazioni – nel citare articoli del Wall Street Journal, con un danno quindi all’immagine. Copyright violato ed errori sono anche gli assi portanti della causa del NyTimes a OpenAI.
“Questa causa è stata intentata per ottenere giustizia per il piano sfacciato di Perplexity di competere per i lettori sfruttando gratuitamente i preziosi contenuti che gli editori producono”, è il commento che accompagna la denuncia presentata a New York.
La causa di News Corp e Perplexity
A luglio scorso News Corp ha inviato una lettera a Perplexity, in cui lamentava l’uso non autorizzato delle sue opere protette da copyright e ipotizzava di discutere un accordo. Secondo la denuncia presentata dalla società editrice, Perplexity non ha dato alcun riscontro. I problemi legali non hanno tuttavia scoraggiato gli investitori: Perplexity è in trattative per raccogliere più di 500 milioni di dollari nella sua quarta raccolta di finanziamenti in un anno, con la società valutata 8 miliardi di dollari.
Secondo il direttore esecutivo di News Corp “Perplexity perpetra un abuso della proprietà intellettuale che danneggia giornalisti, scrittori, editori e News Corp” Quest’ultima afferma che Perplexity si può servire di parti o di interi articoli degli editori in risposta alle query degli utenti, in particolare tramite il suo servizio in abbonamento Perplexity Pro.
Un esempio: un articolo del New York Post sul primo viaggio di uno scrittore per vedere una partita di baseball decenni fa, è stato riprodotto da Perplexity per intero, ciò in risposta alla domanda dell’utente di fornire il testo completo. Inoltre, secondo la citazione, la startup può “avere allucinazioni”, riproducendo alla lettera alcuni contenuti di un articolo, per poi modificarli aggiungendo dettagli errati.
Viene segnalato il caso di un articolo del Wall Street Journal sugli USA che armano i jet F-16 diretti in Ucraina con armi avanzate: Perplexity ha inserito informazioni che non erano mai apparse nell’articolo.
L’editore chiede al tribunale di ordinare a Perplexity di smettere di utilizzare e copiare i suoi contenuti protetti da copyright senza autorizzazione, di distruggere tutti i database che contengono il suo materiale e di risarcire i danni fino a 150.000 dollari per ogni caso di violazione del copyright.
Le altre cause in corso
Sono tante le cause in corso, negli Usa e Regno Unito. La più famosa è del Times contro OpenAI (vedi sotto).
Altri esempi: l’amministratore delegato di Reach ha dichiarato che il più grande editore commerciale del Regno Unito non è impegnato in trattative attive con aziende di intelligenza artificiale e ha suggerito che altri editori dovrebbero astenersene per affrontare la questione con una posizione unitaria.
Ancora più intransigente il forum per genitori e casa editrice del Regno Unito Mumsnet, che ha avviato un’azione legale contro OpenAI per l’eliminazione del suo sito e dei suoi oltre sei miliardi di parole usati “presumibilmente” per l’addestramento di ChatGPT. Secondo la sua fondatrice, OpenAI differisce da Google nello scraping (rastrellamento) del web per scopi di ricerca perché c’è un “chiaro scambio di valore nel consentire a Google di accedere a quei dati, vale a dire il traffico di ricerca risultante… Gli LLM, invece, stanno costruendo modelli per fornire risposte a tutte le domande potenziali: la conseguenza è che gli utenti non avranno più bisogno di andare altrove per trovare altro. I Modelli sono quindi realizzati grazie a contenuti rastrellati proprio da quei siti web che sono pronti a sostituire”.
Il Centro per il giornalismo investigativo, organizzazione senza scopo di lucro, ha annunciato qualche mese addietro di aver intentato causa a New York contro OpenAI e il suo maggiore azionista, Microsoft, in quanto avevano utilizzato i suoi contenuti “senza permesso o senza offrire compenso” e le ha accusate di “pratiche di sfruttamento”. Secondo la CEO “Le aziende a scopo di lucro come OpenAI e Microsoft non possono semplicemente trattare il lavoro degli editori indipendenti e senza scopo di lucro come materia prima gratuita per i loro prodotti. Se questa pratica non verrà fermata, l’accesso del pubblico a informazioni veritiere sarà limitato a riassunti generati dall’intelligenza artificiale da un panorama di notizie in via di scomparsa”.
Altri ricorsi al tribunale, sempre contro OpenAI e Microsoft, da parte di Alden Global Capital, proprietaria di otto quotidiani degli USA, e di altri tre canali digitali (The Intercept, Raw Story e Alter Net).
Anche nel campo dell’IA generativa di immagini non mancano i problemi. Getty Images ha avviato un’azione legale contro Stability AI, nel Regno Unito, sostenendo che ha “copiato ed elaborato illegalmente” milioni delle sue immagini, protette da copyright, tramite il suo modello di conversione testo-immagine Stable Diffusion. La giudice che ha in mano la vertenza ha affermato che la richiesta di Getty ha una “reale prospettiva di successo” in relazione alla “funzione immagine-immagine” di Stable Diffusion che, secondo l’agenzia fotografica, consente agli utenti di realizzare “copie sostanzialmente identiche di opere protette da copyright”.
Cos’è il free rider
Il free rider è “colui che cerca di godere di un bene o servizio facendo sopportare ad altri il suo costo (Motterlini, & Guala, 2015)”, “l’agente economico che attua un comportamento opportunistico finalizzato a fruire pienamente di un bene (o servizio) prodotto collettivamente, senza contribuire in maniera efficiente alla sua costituzione (Vannini, 2012)”.
Il tema del free rider (o del free riding) è ampiamente analizzato nella letteratura economica. Il primo a riferirsi inconsapevolmente al concetto di free rider, in termini di comportamenti opportunistici in un determinato gruppo di riferimento, fu addirittura il filosofo greco Glaucone il quale, come riportato da Platone nel dialogo “Repubblica” (libro 2, 360b – c), sosteneva la correttezza di un atteggiamento di disobbedienza alle leggi fin quando fosse stato possibile evitarne le relative sanzioni.
Gli accordi editori e IA
Le cose sono andate diversamente tra News Corp e OpenAI.
Ad inizio 2024, infatti, le parti hanno stretto un accordo per circa 250 milioni di dollari in cinque anni con l’obiettivo di trarre profitto “da una tecnologia che promette di avere un profondo impatto sul settore dell’editoria giornalistica”.
Nell’accordo è incluso il compenso in denaro e crediti per l’uso, da parte dell’editore, della tecnologia OpenAI che, dal canto suo, utilizzerebbe i contenuti di News Corp, inclusi gli archivi, per rispondere alle domande degli utenti e addestrare la sua tecnologia. “Il patto riconosce che c’è un premio per il giornalismo di qualità”, ha dichiarato il CEO di News Corp. “L’era digitale è stata caratterizzata dal predominio dei distributori, spesso a spese dei creatori, e molte aziende di media sono state spazzate via da un’implacabile ondata tecnologica. Ora tocca a noi sfruttare al meglio questa provvidenziale opportunità”.
Subito dopo l’accordo con OpenAI, le azioni di News Corp sono aumentate del 7,1%.
News Corp è andata ad affiancarsi a tanti altri editori che hanno stretto partnership commerciali con OpenAI. Tra loro Axel Springer – società madre di Politico e Business Insider -, Associated Press, Le Monde, Financial Times, Reuters.
In Italia, Rcs (Corriere della Sera) e Gedi (Repubblica).
Il patto triennale con Axel Springer include l’uso dei suoi contenuti sia per il training (addestramento o formazione) che per la visualizzazione, così come l’accordo col Financial Times. Quello con l’Associated Press, invece, è più focalizzato sull’uso di archivi di testo per addestramento o formazione. Il contratto tra News Corp e OpenAI contiene un’importante clausola: i contenuti non saranno disponibili su ChatGPT subito dopo la pubblicazione.
Oltre a fornire contenuti, News Corp condividerà la competenza giornalistica con OpenAI. Fanno capo a News Corp diverse testate negli Stati Uniti, nel Regno Unito e in Australia: WSJ, Barron’s, MarketWatch, New York Post, Times of London, Sun e Australian. “Insieme, stiamo gettando le basi per un futuro in cui l’intelligenza artificiale rispetta, migliora e sostiene profondamente gli standard del giornalismo di livello mondiale”, ha affermato il direttore esecutivo di OpenAI.
Axel Springer ha anche annunciato un’espansione della partnership con Microsoft che comprende intelligenza artificiale, pubblicità, contenuti e cloud computing. Inoltre, le aziende collaboreranno per sviluppare nuove chat, basate sull’intelligenza artificiale, per informare gli utenti utilizzando il giornalismo di Axel Springer. Il suo a.d. ha sottolineato che “In questa nuova era dell’intelligenza artificiale, le partnership sono fondamentali per preservare e promuovere il giornalismo indipendente, garantendo al contempo un panorama mediatico fiorente.
Elenco degli accordi AI – editori
- Il colosso dei giornali e delle riviste Hearst ha concordato una “partnership sui contenuti” con OpenAI negli Stati Uniti (non nel R.U.). Nei contenuti utilizzati da Chat GPT appariranno citazioni appropriate e link diretti, garantendo trasparenza e facile accesso alle fonti originali.
- Financial Times, Reuters, Axel Springer, Hearst Mags e USA Today Network sono stati nominati partner editoriali di Copilot di Microsoft, che fornirà un riepilogo delle notizie e delle previsioni meteo utilizzando l’intelligenza artificiale Copilot Voice.
- Conde Nast, editore di Vogue, Wired, Vanity Fair e GQ, ha firmato una “partnership pluriennale” relativa alla visualizzazione dei suoi contenuti nei prodotti OpenAI. Il direttore generale di Condé Nast, parlando al Congresso USA, si è espresso apertamente sui rischi che l’intelligenza artificiale generativa pone alle aziende di informazione, affermando che molte di esse potrebbero chiudere i battenti prima che una qualsiasi controversia passi attraverso i tribunali. La soluzione? Azioni immediate per chiarire che i creatori di contenuti devono essere compensati per l’uso del loro lavoro nella formazione – addestramento. L’accordo consentirà a OpenAI di visualizzare i contenuti dei marchi Conde Nast nei suoi prodotti, tra cui ChatGPT e SearchGPT, il suo prototipo di motore di ricerca basato sull’intelligenza artificiale. OpenAI si è così espressa al riguardo: “Con l’introduzione del nostro prototipo SearchGPT, stiamo testando nuove funzionalità che rendono più veloce e intuitiva la ricerca di informazioni e le fonti di contenuti affidabili. Stiamo combinando i nostri modelli conversazionali con informazioni dal web per dare risposte rapide e tempestive con fonti chiare e pertinenti. SearchGPT offre collegamenti diretti alle notizie, consentendo agli utenti di esplorare facilmente contenuti più approfonditi direttamente dalla fonte. In futuro prevediamo di integrare le migliori di queste funzionalità direttamente in ChatGPT”.
- Financial Times, Axel Springer, The Atlantic e Fortune (oltre a Universal Music Group) hanno accettato di concedere in licenza i loro contenuti alla start-up di intelligenza artificiale generativa Prorata.ai., la quale afferma di aver creato un algoritmo in grado di calcolare quanto contenuto di vari editori viene utilizzato in una risposta per condividere i ricavi di conseguenza.
- Time, Der Spiegel, Fortune, Entrepreneur, The Texas Tribune e Automattic (quest’ultimo proprietario di WordPress.com), hanno sottoscritto un accordo di condivisione dei ricavi con Perplexity. Quando – a breve, sembra – Perplexity introdurrà la pubblicità tramite domande correlate sponsorizzate, gli editori registrati potranno condividere i ricavi generati dalle interazioni in cui viene fatto riferimento ai loro contenuti.
- Time ha firmato un “accordo pluriennale sui contenuti e una partnership strategica” con OpenAI, per cui ChatGPT avrà accesso all’archivio di Time, vecchio di 101 anni, e ai suoi report attuali, per fornire agli utenti risposte aggiornate (con una citazione e un collegamento al sito web). Time, a sua volta, avrà accesso alla tecnologia OpenAI per sviluppare i propri prodotti e fornire feedback all’azienda tecnologica sulla diffusione del giornalismo attraverso i suoi strumenti.
- Sempre con OpenAI, Vox Media ha firmato una “partnership strategica per contenuti e prodotti”: i suoi contenuti, tra cui giornalismo d’archivio, e i suoi marchi – Vox, The Verge, Eater, New York Magazine, The Cut, Vulture e SB Nation – saranno pubblicati su ChatGPT, mentre Vox Media potrà utilizzare la tecnologia di OpenAI per sviluppare prodotti rivolti al pubblico e interni. Il presidente e amministratore delegato di Vox Media ha affermato: “Questo accordo è in linea con i nostri obiettivi di sfruttare l’intelligenza artificiale generativa allo scopo di: innovare per il nostro pubblico e i nostri clienti; proteggere e accrescere il valore del nostro lavoro e della nostra proprietà intellettuale; aumentare la produttività e la visibilità; elevare il talento e la creatività dei nostri eccezionali giornalisti e creatori”.
- The Atlantic ha firmato una “partnership strategica per contenuti e prodotti” con OpenAI. I suoi articoli saranno reperibili all’interno di ChatGPT e degli altri prodotti, e i risultati forniranno riferimenti alla testata e link al suo sito web. Le aziende stanno collaborando anche su prodotti e tecnologia: al team di prodotto dell’Atlantic è stato concesso un “accesso privilegiato” alla tecnologia OpenAI per fornire feedback e contribuire a plasmare il futuro delle notizie in ChatGPT e in altri prodotti OpenAI.
- La World Association of News Publishers ha annunciato una partnership con OpenAI per Newsroom AI Catalyst, progetto per “aiutare le redazioni ad accelerare l’adozione e l’implementazione dell’intelligenza artificiale per aumentare l’efficienza e creare contenuti di qualità” in 128 redazioni in Europa, Estremo Oriente, America Latina e Asia meridionale, fornendo consulenza specialistica con finanziamenti e assistenza tecnica da parte di OpenAI.
- Il Financial Times è stato il primo grande giornale del Regno Unito ad annunciare un accordo con OpenAI. La partnership prevede contenuti giornalistici e notizie aggiornate provenienti dall’archivio del FT, il che significa che probabilmente fornirà assistenza sia per le query in tempo reale su ChatGPT sia per la sua formazione continua.
- OpenAI ha firmato accordi con Le Monde e l’editore spagnolo Prisa Media, che pubblica El País, Cinco Días, As ed El Huffpost. Gli utenti di ChatGPT potranno dunque trovare contenuti recenti di entrambi gli editori tramite “riassunti selezionati con riferimenti alle fonti e link agli articoli originali”, mentre i loro contenuti potranno contribuire all’addestramento dei modelli di OpenAI. Il direttore generale di Le Monde si è così espresso sull’accordo: “Collaborare con OpenAI garantisce che i nostri contenuti autorevoli possano essere accessibili e apprezzati da un pubblico più ampio e diversificato. La nostra partnership con OpenAI è una mossa strategica per garantire la diffusione di informazioni affidabili agli utenti dell’ intelligenza artificiale generativa, salvaguardando la nostra integrità giornalistica e i flussi di entrate”. Il presidente e amministratore delegato di Prisa Media ha aggiunto: “Unire le forze con OpenAI ci apre nuove strade per interagire con il nostro pubblico. Sfruttare le capacità di ChatGPT ci consente di presentare il nostro giornalismo approfondito e di qualità in modi nuovi, raggiungendo individui che cercano contenuti credibili e indipendenti. Si tratta di un passo decisivo verso il futuro dell’informazione, in cui tecnologia e competenza umana si fondono per arricchire l’esperienza del lettore”.
- L’accordo tra OpenAI e Associated Press consente alla prima di ottenere in licenza l’archivio dei contenuti dell’agenzia di stampa a partire dal 1985 per scopi di addestramento – formazione. L’agenzia ha rilevato di essere lieta del fatto che OpenAI riconosca che i contenuti di notizie imparziali e basate sui fatti sono essenziali e che rispetti il valore della sua proprietà intellettuale. AP supporta fermamente un quadro che garantirà la protezione della proprietà intellettuale e l’equa retribuzione per i giornalisti.
- la partnership tra Shutterstock e OpenAI consente a quest’ultima l’accesso a una vasta gamma di dati di formazione – addestramento, tra cui immagini, video, musica e metadati. Shutterstock può invece offrire le funzionalità di conversione da testo a immagine di DALL-E direttamente all’interno della sua piattaforma.
- Accordo Gedi-OpenAI: gli utenti di ChatGPT avranno accesso a citazioni, contenuti e link alle pubblicazioni di GEDI, tra cui La Repubblica e La Stampa.
- Accordo Rcs e OpenAi, non sui contenuti ma tecnologico: nasce un assistente virtuale basato su AI per Corriere della Sera.
- Tra gli accordi conclusi, al di fuori degli organi d’informazione, quello tra Google e la piattaforma di social media Reddit. Google utilizza i contenuti di Reddit, molto probabilmente anche quelli copiati all’interno dei post dagli utenti, per l’addestramento – formazione dei suoi strumenti di intelligenza artificiale.
Il nodo della questione
In generale, le aziende di intelligenza artificiale sono affamate di contenuti degli editori, che possono aiutarle a perfezionare i loro modelli e creare nuovi prodotti. Molti giornalisti, non a torto, sono preoccupati per l’impatto dell’IA sui posti di lavoro nelle redazioni. Molte delle diatribe tra OpenAI ed editori sono incentrate sull’uso futuro dei contenuti di notizie nelle risposte alle query. I colloqui avvengono nel mezzo della preoccupazione che gli strumenti di ricerca basati sull’intelligenza artificiale forniranno risposte complete, eliminando la necessità per l’utente di cliccare su un collegamento all’articolo – fonte e privando gli editori di traffico e ricavi pubblicitari.
OpenAI sta cercando di svolgere un ruolo chiave nel rispondere alle richieste di notizie degli utenti e starebbe pianificando di attribuire informazioni ai partner editoriali tramite una serie di link sotto un riepilogo che appare in risposta alle richieste. OpenAI avrebbe anche intenzione di integrare i risultati di ricerca con informazioni da Bing di Microsoft. Una futura versione di ChatGPT potrebbe visualizzare i loghi delle pubblicazioni il cui contenuto è presente nella risposta a una query dell’utente, nonché i link ai loro siti web.
In ogni caso, gli editori sono stanchi per il rapporto, da oltre un decennio, con i giganti della tecnologia – in particolare Facebook e Google – i cui pagamenti intermittenti e modifiche algoritmiche stanno danneggiando le aziende di media. le Big Tech si sono accaparrate di gran parte dei ricavi dalla pubblicità online, mentre molte testate di informazione hanno visto quelli da carta stampata diminuire in modo significativo. Molti editori stanno cercando di adottare una posizione più determinata sull’intelligenza artificiale, tenendo nel contempo presente che perdere potenziali entrate dalle licenze concesse alle aziende di IA generativa rappresenta un grosso rischio. Emblematica la posizione del CEO di Le Monde: “È nel mio interesse trovare accordi con tutti, altrimenti loro useranno i nostri contenuti in modo più o meno rigoroso e più o meno clandestino senza alcun beneficio per noi”.
Facendo una panoramica sulla situazione complessiva, salta agli occhi l’attivismo di OpenAI, che starebbe offrendo agli operatori dell’informazione tra 1 e 5 milioni di dollari all’anno per accordi d’accesso e utilizzo dei loro contenuti, protetti da copyright, per addestrare i suoi modelli. Nel frattempo, pare che Apple stia valutando accordi di intelligenza artificiale con Conde Nast, NBC News e IAC, proprietaria di People e Daily Beast, per concedere in licenza i loro archivi di contenuti.
Il quadro è dunque variegato, tra contrasti e patti di collaborazione. D’altra parte, entrambi i fronti hanno interesse a cooperare considerando anche, come abbiamo letto in un commento, che l’alternativa, la strada delle aule di giustizia, appare lunga e tortuosa.