Nell’ambito delle attività legate al riuso degli Open Data, in particolare per servirsene come volano per l’economia, c’è un forte nodo critico. Questo consiste nella difficoltà legata a produrre e rilasciare dati pubblici di qualità. Vediamo i problemi che ne conseguono.
Open Data, i diversi riutilizzi
Possiamo individuare essenzialmente due tipologie di riuso dei dati aperti. Da una parte abbiamo i cittadini: l’attivismo digitale e le comunità di “civic hacker” che utilizzando i dati, spesso in modo creativo, fanno si che l’informazione che ne viene generata abbia un impatto essenzialmente di tipo sociale. Attraverso i dati è possibile infatti intercettare criticità nelle policy della PA, ma anche individuare opportunità e buone pratiche per poter indirizzare le politiche pubbliche. È quindi un aspetto strettamente legato alla cittadinanza attiva e al rapporto tra cittadini e pubblica amministrazione, dove anche l’assenza di dati diventa motore di attivismo civico. Ricordiamo a questo proposito la campagna #datibenecomune dove ben 233 organizzazioni e oltre 50.000 cittadini hanno sottoscritto una petizione con cui vengono chiesti “dati pubblici, disaggregati, continuamente aggiornati, ben documentati e facilmente accessibili a ricercatori, decisori, media e cittadini” e in formato “machine-readable” sulla gestione della pandemia. E che ora si sta allargando anche sui dati per consentire il monitoraggio del PNRR. Gli Open Data che diventano così un elemento essenziale per stimolare un miglioramento dell’attività amministrativa e più in generale della democrazia, della trasparenza e della partecipazione.
C’è però un altro aspetto relativo ai dati aperti ed è quello più strettamente legato all’economia e al mercato. Si è sempre ritenuto infatti che i dati pubblici potessero essere un importante volano per lo sviluppo economico.. Viviamo nella società dell’informazione della conoscenza, dove i dati sono diventati oramai strategici non solo per ottimizzare processi esistenti, ma per consentire la creazione di servizi e prodotti totalmente nuovi e mai esistiti in precedenza. Possiamo automatizzare interi processi produttivi e tante attività che in passato venivano fatte manualmente ora possono essere affidate a sistemi basati sui dati e sull’intelligenza artificiale. Questo è qualcosa che sta già accadendo, ed è qualcosa che accade quando ci sono dati “di qualità”. E produrre e rilasciare dati pubblici di qualità è stata sin da subito una delle grandi criticità a cui tuttora non si è riusciti ancora a dare una risposta.
Dati pubblici di qualità: le difficoltà
Innanzitutto perché le pubbliche amministrazioni hanno da sempre avuto ampi margini di discrezionalità sugli open data. L’assenza di una vera governance sui dati ha portato le pubbliche amministrazioni che hanno voluto fare open data a farlo in modo autonomo e indipendente. Con il risultato che lo scenario che si è venuto via via a creare negli anni è fortemente frammentato e disomogeneo. Facciamo un esempio. Supponiamo di voler fornire servizi nel settore del turismo e di aver bisogno dei dati relativi alle strutture ricettive presenti in Italia.
L’elenco delle strutture ricettive è un dato che viene pubblicato da alcune regioni. Ma non da tutte. E mai nello stesso modo. L’assenza di standard di riferimento fa sì che diventa praticamente impossibile mettere insieme tra loro dati di due o più regioni diverse. A questo bisogna poi aggiungere che ci sono regioni in cui il dato è aggiornato in tempo reale, altre dove l’ultimo dato disponibile risale a qualche anno fa. Un dato di questo tipo si presta pertanto, quando va bene, ad un utilizzo strettamente locale. Ma non è esattamente quello che serve per un riuso di tipo “business“ dei dati, che invece dovrebbero essere rilasciati in modo omogeneo su tutto il territorio nazionale, prodotti secondo standard condivisi e aggiornati costantemente. Se si intende stimolare lo sfruttamento economico dei dati pubblici dovremmo partire da qui e renderci conto che chi riusa i dati dovrà essere messo nelle condizioni di poterli acquisire facilmente per poi integrarli con quelli in proprio possesso.
La normativa di riferimento
Situazioni come queste sono molto comuni quando si parla di dati aperti. L’assenza di una governance efficace e la mancanza di standard di riferimento hanno fatto sì che gli stessi dati rilasciati da soggetti diversi siano alla fine strutturati in modo molto diverso tra loro. Qualche tempo fa, commentando l’”Open Data Maturity Report” scrivevo che l’impatto degli Open Data in Italia ha riguardato essenzialmente la trasparenza, dove si è lavorato molto in termini di impianto normativo.
Il caso delle stazioni appaltanti
La legge 190 del 2012 sulla prevenzione e la repressione della corruzione e dell’illegalità nella Pubblica Amministrazione prevede che tutte le stazioni appaltanti pubblichino sul proprio sito web, nella sezione Amministrazione Trasparente una serie di informazioni sui contratti pubblici. Le stesse informazioni, una volta concluso l’anno solare, vanno comunicate ad ANAC, l’Autorità Nazionale Anticorruzione. Quello che accade è quindi che la stazione appaltante a conclusione dell’anno solare ripubblica tutte le informazioni già pubblicate di volta in volta durante l’anno, ma lo fa mettendole in un unico file xml secondo uno schema dati standard definito da ANAC. L’url del file verrà comunicato via PEC ad ANAC che andrà così a verificare la correttezza dell’indirizzo e del file xml dei contratti. Tutti i file xml sono pubblici e li trovate a questo indirizzo.
Ok, il processo di raccolta dati può sicuramente essere migliorato, ma quello che è importante è che alla fine tutte le stazioni appaltanti utilizzano uno stesso standard condiviso per produrre e rilasciare dati. L’esistenza di uno standard di riferimento consente così ad ANAC di automatizzare buona parte del processo di acquisizione dati e di costruire facilmente un’unica base dati nazionale degli appalti pubblici da utilizzare per le proprie attività di monitoraggio e che viene resa pubblica come open data.
Vi dico questo perché avere basi dati uniche nazionali, in questo caso un archivio unico con tutti i dati dei contratti di tutte le stazioni appaltanti aumenta a dismisura le potenzialità del dato e le opportunità di riuso. I dati ANAC hanno permesso ad esempio la realizzazione della piattaforma contrattipubblici.org, una piattaforma che fornisce servizi evoluti di business intelligence sui contratti pubblici. Gli stessi dati hanno consentito alla società civile di realizzare “Appalti Pop”, un progetto di onData APS che punta invece sulla trasparenza e prova ad assegnare delle “red flag” ai singoli contratti quando vengono individuate delle potenziali anomalie. Lo stesso progetto trasforma poi tutti i dati ANAC nello standard OCDS, consentendo così di armonizzare i dati a livello internazionale e di analizzare ad esempio i dati italiani con quelli di altri Paesi.
In Europa: la direttiva PSI
La direttiva europea 2019/1024, chiamata comunemente “direttiva PSI (Public Sector Information)” vuole definire uno scenario europeo di riferimento e dare indicazioni comuni a tutti gli Stati membri su quali dati pubblici valorizzare e come. Dati per la società civile, per la ricerca scientifica ma soprattutto dati per stimolare l’economia e il mercato. Il recepimento della direttiva da parte del governo è tutt’ora in corso anche se il ritardo accumulato ha fatto sì che al momento l’Italia sia sotto procedura di infrazione assieme ad altri 18 Paesi.
L’idea è quella di avere dati pubblici comuni a livello di Paesi membri. E’ questo il motivo per cui viene introdotto il concetto di “High Value Datasets”, ossia dataset che si ritiene possano essere un’importante risorsa per la crescita economica e la competitività del nostro sistema produttivo e di quello europeo. Vengono indicate sei macro aree (Dati geospaziali, Dati relativi all’osservazione della terra e all’ambiente, Dati meteorologici, Dati statistici, Dati relativi alle imprese e alla proprietà delle imprese, Dati relativi alla mobilità) senza però, va detto, andare nel dettaglio. (Nel dettaglio ci va uno studio della Commissione Europea rilasciato lo scorso anno dal titolo “Impact Assessment study on the list of High Value Datasets to be made available by the Member States under the Open Data Directive”)
Credo che questo sia un tema molto importante che sarà necessario approfondire e su cui sarà più che mai necessario mettere a punto una “governance” efficace. Perché al rilascio dati non saranno interessati soltanto gli enti pubblici, ma anche tutte le imprese pubbliche e soggetti privati “gestori di servizi di pubblico interesse”. Ad esempio tutte le aziende che forniscono servizi di trasporto pubblico nazionale o locale. La direttiva che diventa così un nuovo importante e necessario punto di riferimento per dare slancio a tutte le policy da adottare da oggi in poi sui dati pubblici.