Anche a livello governativo e, più in generale, in ambito pubblico-amministrativo risulta sempre più determinante un approccio data-driven – letteralmente “guidato dai dati” – in cui, cioè, un numero sempre maggiore di processi decisionali vengono basati sulle informazioni estraibili dai dati a disposizione.
In tale contesto, molte delle decisioni politiche vengono condivisibilmente argomentate sottolineandone la fondatezza statistica e l’origine empirica. Dare prova di ricorrere a dati e informazioni significative rafforza la stessa autorevolezza del decisore, nonché la condivisione da parte dell’opinione pubblica della decisione assunta.
Dati sintetici, la giusta sintesi tra innovazione e privacy: stato dell’arte e scenari
Si reputa rilevante evidenziare come un riconoscimento trasversale da parte della società civile di questo approccio “data-driven” permetta di attribuire ad essi un valore non solo concreto ma anche simbolico. La fiducia che essi sono in grado di suscitare testimonia un aspetto importante della società contemporanea e del valore dei dati per essa.
Molte opportunità, ma anche alcune questioni in materia di privacy e di etica, sorgono però in vista dell’utilizzo, anche nella PA, dei cosiddetti dati sintetici, ossia quei dati forniti da algoritmi di machine learning di tipo generativo che riproducono dataset del mondo reale. Su questo fronte, si possono prendere ad esempio alcuni modelli virtuosi già utilizzati nel settore privato.
Ma andiamo per gradi.
Un’adeguata gestione dei dati: focus sulla tutela dei dati dei cittadini
In questo contesto, è in atto a livello europeo e nazionale un grande lavoro finalizzato ad una loro adeguata gestione. Nella stessa pubblica amministrazione italiana si sta realizzando un grande processo di riorganizzazione e valorizzazione dei dati degli enti pubblici, nella prospettiva di beneficiare del patrimonio digitale a disposizione. Passaggio che risulta ancora più evidente se si fa riferimento al recente Piano Triennale (2021 – 2023) per l’Informatica nella Pubblica Amministrazione approvato dal Ministero per l’innovazione tecnologica e la transizione digitale.
Di certo, il primo passo da fare in questa prospettiva è quello di garantire la tutela dei dati che i cittadini italiani affidano alla pubblica amministrazione. È noto, nonché confermato dalla Polizia Postale, che in seguito ad attacchi da parte di hacker russi molti siti istituzionali sono stati violati o quantomeno resi inagibili, tra cui: i siti del Consiglio superiore della magistratura, dell’Agenzia delle dogane e del ministero degli Esteri, del ministero dell’Istruzione e del ministero dei Beni culturali ma anche i siti del Senato e dell’Istituto superiore di Sanità.
Si tratta di attacchi a un bene che trae valore dalla riservatezza e da una disponibilità che deve essere limitata a determinati soggetti. Le basi di dati rivestono un interesse nazionale e costituiscono l’ossatura di infrastrutture per il supporto e le interazioni tra le diverse componenti della pubblica amministrazione. Pertanto, alla luce dei recenti avvenimenti, diviene chiaro come un impiego virtuoso dei dati non possa fare a meno di una loro maggiore protezione.
Il ruolo cruciale dell’Agenzia per la Cybersicurezza Nazionale
In ciò svolgerà un ruolo cruciale l’Agenzia per la Cybersicurezza Nazionale, la quale ha recentemente pubblicato la “Strategia Nazionale di Cybersicurezza”. Alla luce dei mutamenti sul piano geopolitico, è diventato ancora più urgente implementare le iniziative in materia per proteggere le infrastrutture pubbliche anche nelle loro componenti immateriali.
Per semplificare le procedure burocratiche, le pubbliche amministrazioni devono necessariamente ricorrere ai dati dei cittadini e renderli disponibili per la vasta rete di enti pubblici. L’interoperabilità consente alle amministrazioni di realizzare in modo più efficiente e veloce procedimenti complessi, riducendo i costi e i tempi di gestione delle pratiche con un risparmio significativo anche in termini economici per l’amministrazione. I dati possono di certo contribuire in maniera trasversale al miglioramento del processo decisionale, individuando criticità e settori prioritari di intervento. Inoltre, sono di certo uno strumento utile per definire politiche mirate, in grado di efficientare la spesa pubblica e orientare gli investimenti su solide basi empiriche.
Verso l’uso di dati sintetici nella PA: limiti privacy e questioni etiche
Di certo, per una buona parte delle funzioni in cui è necessario impiegare una grande quantità di informazioni, anche in settori di massima rilevanza come la sanità, la ricerca o la lotta all’evasione fiscale, potrebbe essere utile sviluppare modelli e procedure attraverso dati sintetici. I dati sintetici sono forniti da algoritmi di machine learning di tipo generativo che riproducono dataset del mondo reale. Queste informazioni sono generate sulla base di dati riferiti a persone fisiche ma che per essere realizzati non necessitano di mantenere le informazioni primarie del dataset “di base” e vengono quindi “anonimizzati”. Pertanto, si tratta di dati affidabili ma che concorrono a superare limiti importanti legati alla privacy e a questioni di carattere etico, in ottica di innovazione e di implementazione degli algoritmi. Gli investimenti nel settore dei dati sintetici stanno crescendo rapidamente e si reputa utile valutare, ovviamente per un determinato numero di possibili utilizzi, il loro impiego anche nella pubblica amministrazione.
Gli esempi virtuosi nel settore privato
Ad esempio, un’azienda privata come American Express utilizza i dati sintetici per individuare transazioni fraudolente. Un tale procedimento potrebbe rappresentare un modello virtuoso per gli organi di vigilanza pubblica e per le forze di polizia competenti, migliorando anche il coordinamento degli sforzi del personale competente sulla base di previsioni e stime attendibili.
Esistono già soluzioni potenzialmente replicabili anche per il sistema sanitario. In ambito medico, spesso i dati dei pazienti risultano di particolare sensibilità e devono essere mantenuti riservati, nel rispetto della loro privacy. Ciò limita fortemente anche la disponibilità di informazioni impiegabili per la ricerca nel settore medico-sanitario. Esistono però già realtà private che in questo settore utilizzano dati sintetici per sviluppare strumenti diagnostici, monitorare malattie, individuare precocemente i fattori di rischio, il tutto con un significativo abbattimento dei costi.
Sono esempi che testimoniano una grande creatività del settore privato il quale può fungere da modello per il settore pubblico. Chiaramente i dati sintetici non sono una panacea, anche questo genere di strumenti presenta alcuni limiti. Tra questi, bisogna evidenziare che spesso infatti, i dataset di dati sintetici necessitano di integrazioni periodica di dati reali per determinate categorie, imponendo di fatto un utilizzo ibrido di tale risorsa.
Dati sintetici, una risorsa per enti di ricerca pubblici e comunità accademica
Nel riconoscimento della necessità di un approccio olistico alla transizione digitale, non bisogna dimenticare che i dati sintetici possono essere generati in grandi volumi e quindi potrebbero essere anche messi a disposizione di enti di ricerca pubblici e della comunità accademica, nonché dell’impresa nazionale, per lo sviluppo e l’addestramento di strumenti di intelligenza artificiale. Il pubblico considerato quale insieme di enti amministrativi, di ricerca, università, ospedali, autorità, ecc. può davvero generare, gestire e rendere interoperabili una quantità di dati straordinaria, con costi limitati, da reinvestire a beneficio della comunità.
Cosa si intende per società data driven
La nostra società è sempre più data-driven, in quanto un numero sempre maggiore di processi decisionali vengono basati sulle informazioni estraibili dai dati a disposizione. Questo è verificabile ad ogni livello della nostra società, non solo in ambito tecnico-scientifico, aziendale o in settori economici specifici come, ad esempio, quello pubblicitario.
Si tratta di un fenomeno strutturale e profondo che definisce anche il nostro vivere quotidiano rispondendo ad un bisogno di certezza e di affidabilità. I dati infatti appaiono come l’ultima frontiera di una storica ricerca di informazioni affidabili, nonché la bussola che consente di orientare le proprie decisioni, anche quotidiane.
Bisogna tenere conto che i dati sono informazioni che non offrono una verità oggettiva in sé ma elementi da interpretare, valutare e saper veicolare. Una base, per l’appunto, perché i dati, una volta riconosciuti nella loro veridicità e affidabilità, devono anche essere rielaborati e sistematizzati, ricorrendo a chiavi interpretative che siano in grado di metterli a frutto a beneficio della comunità.
L’obiettivo dovrebbe essere quello di realizzare un riciclo fondato sull’interoperabilità delle informazioni con un significativo abbattimento dei costi per tutte le infrastrutture pubbliche. La speranza è quella di veder realizzata la visione di una società non esattamente data-driven ma che governa i dati e prende decisioni anche con il contributo virtuoso di questo vero e proprio bene pubblico.
Conclusioni
In conclusione, appare quanto mai essenziale riflettere attentamente circa la natura delle informazioni cui si ricorre, considerando anche soluzioni alternative rispetto al semplice ricorso ai dati di persone fisiche, ovvero dei cittadini. Un impiego, anche parziale, dei dati sintetici o di percorsi ibridi può rendere informazioni personali sensibili: sicure, protette e anonimizzate nella giusta misura e rendere più semplice implementare percorsi di interoperabilità tra banche dati.
L’obiettivo dovrebbe essere dare vita ad un circolo virtuoso per il quale un bene pubblico torna, in una nuova forma, a beneficio della stessa comunità che lo ha prodotto.