Il confine tra utilizzo legittimo dei dati e violazione del diritto d’autore è sempre più sfumato. A rendere ancora più complesso questo scenario, l’introduzione di tecnologie come il data scraping e l‘intelligenza artificiale generativa.
Queste, pur rappresentando un’opportunità in termini di analisi di grandi quantità di dati e sviluppo di contenuti originali, sollevano questioni legali delicate.
Come si configura la responsabilità dell’uso dei dati? Qual è la funzione del disclaimer nelle trasmissioni televisive?
La Direttiva UE 2019/790 e il Decreto Legislativo 177 del 2021 offrono alcune risposte a queste domande, gettando le basi per un confronto cruciale sul delicato equilibrio tra innovazione tecnologica e tutela dei diritti d’autore
Data scraping e IA: l’altolà di Mediaset
Alcuni spettatori saranno rimasti sorpresi nel leggere all’interno di alcune trasmissioni televisive Mediaset la scritta: “È severamente vietato ogni utilizzo delle immagini trasmesse atto all’addestramento di sistemi di intelligenza artificiale generativa così come l’utilizzo di mezzi automatizzati di data scraping”.
Un anno fa, verosimilmente, la maggior parte degli spettatori non avrebbe probabilmente saputo tradurre in linguaggio comune un’affermazione del genere, carica di termini tecnici quali “data scraping“ e “intelligenza artificiale generativa“.
Cos’è il data scraping e quale funzione può avere un disclaimer
In merito alla questione giuridica dell’utilizzo delle immagini e dei dati nel contesto del data scraping e dell’Intelligenza Artificiale Generativa, il panorama legislativo italiano ed europeo necessita di un’analisi scrupolosa e puntuale.
La Direttiva UE 2019/790, recepita nell’ordinamento italiano tramite il Decreto Legislativo 177 del 2021, rappresenta il fulcro normativo da considerare in questo ambito. Per i produttori di contenuti, così come per i creator in ambito social, è quindi fondamentale comprendere le limitazioni e le opportunità offerte dalla normativa in vigore.
Viene considerato data scraping l’atto di estrarre in modo automatizzato informazioni da fonti disponibili online. Si tratta di una pratica diffusa e, in linea di principio, consentita ai sensi dell’articolo 4 della Direttiva UE il quale stabilisce che sono ammesse “le estrazioni effettuate da opere o altri materiali cui si abbia legalmente accesso ai fini dell’estrazione di testo e di dati”.
Data scraping e IA: interrogativi giuridici e conflitti d’interesse
L’avvento e la diffusione dell’intelligenza artificiale e delle pratiche di data training hanno posto in risalto la necessità di un’accurata disamina giuridica in relazione all’eccezione generale al diritto d’autore, delineata dall’articolo 4 della Direttiva Europea sul Diritto d’autore.
In particolare, si sollevano interrogativi giuridici significativi riguardo alla possibilità che i contenuti, la cui titolarità dei diritti è ben definita e assegnata, possano essere oggetto di utilizzo improprio da parte di entità terze, siano esse concorrenti o amatoriali, per finalità di addestramento di sistemi di generazione di contenuti artificiali.
In tale contesto, si registra una dicotomia evidente tra, da un lato, la preoccupazione dei titolari dei diritti d’autore, che vedono nella pratica dello scraping un potenziale rischio per la propria proprietà intellettuale, e, dall’altro, l’apprezzamento manifestato da alcune personalità pubbliche, come Gerry Scotti e Giacomo Poretti in Italia, nei confronti di contenuti generati artificialmente che impiegano i loro volti e voci con intenti umoristici o per scopi di intrattenimento.
In tale scenario, diviene fondamentale per i produttori di contenuti e i titolari dei diritti d’autore affrontare la complessità della normativa vigente, bilanciando la tutela della proprietà intellettuale con le dinamiche emergenti nell’era dell’intelligenza artificiale e della creazione di contenuti generativi.
Inoltre, è alquanto noto che i detentori esclusivi dei diritti economici alla base delle produzioni televisive possono avere interessi che non sempre coincidono con quelli dei fan e dei creator, oltre che dei protagonisti dei video stessi.
Questo tipo di conflitto di interessi è comune tra le fan base e le produzioni, ed è riscontrabile anche in Italia, dove un colosso della produzione di contenuti come Mediaset ha manifestato timori non solo per l’uso di tecniche automatizzate di data scraping ma anche per la possibilità che, in virtù dell’articolo 4 della direttiva sul copyright, tale attività possa essere considerata legittima.
La funzione del disclaimer nelle trasmissioni televisive
In realtà, l’art.4 al comma 3 prevede che “L’eccezione o la limitazione di cui al paragrafo 1 si applica a condizione che l’utilizzo delle opere e di altri materiali di cui a tale paragrafo non sia stato espressamente riservato dai titolari dei diritti in modo appropriato, ad esempio attraverso strumenti che consentano lettura automatizzata in caso di contenuti resi pubblicamente disponibili online.”
L’inclusione di un disclaimer sembrerebbe quindi essere uno strumento utilizzato con cautela per “riservare espressamente”, in qualità di detentori dei diritti, la possibilità di concedere automaticamente un permesso agli eventuali scraper.
La questione che sorge, considerando l’importanza degli interessi in gioco, è se questa interpretazione sia corretta o se possa essere considerata eccessivamente cautelativa. Nel mondo dell’intelligenza artificiale e del complesso panorama giuridico che ne deriva, nonostante le intenzioni globali, sembra opportuno considerare qualsiasi forma di tutela. Tuttavia, è possibile individuare nell’addestramento dei modelli di intelligenza artificiale un’eccezione alla norma?
Data mining Vs Machine Learning: implicazioni legali dello scraping
In questo contesto, risulta essenziale distinguere tra data mining e machine learning. Mentre il data mining si riferisce alla semplice raccolta di dati, il machine learning implica un processo più sofisticato in cui i dati vengono utilizzati per addestrare algoritmi.
Questa distinzione riveste importanza cruciale per comprendere le implicazioni legali dello scraping, poiché l’uso dei dati per creare o migliorare modelli di IA potrebbe implicare una zona grigia dal punto di vista del diritto d’autore e la finalità ultima potrebbe risultare, come spesso avviene in questo campo, dirimente ai sensi dell’integrazione o meno di una violazione di legge.
Il data mining consentirebbe quindi la raccolta di grandi volumi di dati da programmi televisivi, inclusi elementi visivi e audio.
Questi dati possono essere utilizzati per addestrare algoritmi di machine learning in vari contesti, come il riconoscimento facciale, la sintesi vocale o la creazione di contenuti generativi, oltre che per questioni tecniche di più variegata natura.
Utilizzando i dati estratti, i sistemi di IA potrebbero generare nuovi contenuti che, ad esempio, imitano lo stile, i dialoghi o le ambientazioni delle trasmissioni originali. Risulterebbe infatti alquanto plausibile analizzare trame, stili narrativi e dinamiche tra i personaggi per generare script per nuove serie o film. Questi nuovi contenuti, seppur originali nell’elaborazione, potrebbero presentare somiglianze significative con le opere originali da cui sono derivati, sollevando questioni di originalità e diritto d’autore.
Conclusioni
Nel contesto giuridico attuale, caratterizzato da una certa ambiguità normativa e da una rapidità senza precedenti nelle innovazioni tecnologiche, l’inserimento di un disclaimer nelle trasmissioni televisive assume un ruolo di particolare rilevanza.
Pur costituendo un elemento visivamente intrusivo all’interno del contenuto trasmesso e formalmente non acclaratamente necessario, tale avvertimento si configura come una misura di precauzione dissuasiva, volta a prevenire l’utilizzo non autorizzato dei contenuti, fungendo altresì da elemento proattivo per l’attivazione -ove occorra- delle disposizioni del terzo comma dell’articolo 4 della Direttiva Copyright.