I dati e, in particolare gli open data, sono stati e continuano a essere i protagonisti per la gestione dell’emergenza Covid-19 in Italia e nel mondo. E un po’ come il “covid working”, anche il “covid data” ha svelato di colpo come si possa fare open data in modo diverso e soprattutto in modo molto più efficace rispetto a quella che è sempre stata considerata una consuetudine.
Covid working e covid data
In ambito lavorativo, stiamo osservando come il remote working (o meglio il “covid working” che tanti di noi hanno adottato durante il lockdown come misura di emergenza) si stia veramente rivelando un’occasione preziosa, specie se si riuscirà a trasformarlo in vero smart working. È davanti agli occhi di tutti come abbia contribuito ad accrescere rapidamente in tanti lavoratori le necessarie competenze digitali e stia contribuendo a mettere finalmente in discussione, specie nella PA, l’idea molto fantozziana di “ufficio” come luogo in cui svolgere la prestazione lavorativa dopo aver smarcato il badge.
Cosa ancora più importante, sta dando quello stimolo necessario per organizzare il lavoro in modo diverso, definendo task e scandendo tempi ed obiettivi. Per provare a rendere più snella ed efficiente l’attività lavorativa nel suo complesso, riconoscere il merito di chi lavora, eliminare regole assurde e i tanti vincoli burocratici che sovrastano e spesso soffocano le attività degli enti pubblici. Ma sta anche aprendo una serie di questioni per ripensare ad esempio la mobilità urbana, l’economia e la vivibilità delle città, il consumo di energia, l’inquinamento, dando la possibilità di ripensare alla città come un posto in cui valga veramente la pena vivere. In altre parole, diventa sempre più evidente come il modello di vita e di lavoro che abbiamo fino ad ora accettato come inevitabile modello a cui fare riferimento non è affatto l’unico possibile.
È un po’ quello che sta accadendo nell’ambito degli open data.
Ho avuto modo di raccontare qui come grazie anche all’azione “dal basso” dell’associazione onData si sia arrivati ad avere accesso agli Open Data giornalieri sulla pandemia. Dati che hanno consentito non soltanto, come è giusto che fosse, la gestione dell’emergenza da parte del governo e delle amministrazioni locali, ma anche la possibilità a tutti, in Italia e nel mondo intero, di riusare quei dati per monitorare l’evoluzione della pandemia, fare analisi e previsioni, fare giornalismo e informazione, cosa che è effettivamente avvenuta.
L’essenza degli open data: il riuso
Fare open data in modo efficace vuol dire inevitabilmente fare riferimento a quella che, ricordiamo, è l’essenza degli open data, ossia il loro riuso. Gli open data acquistano infatti un senso nel momento in cui c’è il loro riuso.
Possiamo facilmente immaginare come open data pubblicati giornalmente dal Dipartimento della Protezione Civile abbiano avuto un riuso altissimo. Non solo perché erano dati di forte interesse collettivo, ma soprattutto perché frutto di un processo sistematico di raccolta e produzione dati che ha consentito di avere ogni giorno, poco dopo le ore 18, dati armonizzati su tutto il territorio nazionale a livello regionale e provinciale.
Credo che valga la pena spendere qualche parola in più su questo aspetto. La “copertura” del dato (ad esempio la disponibilità di avere gli stessi dati su tutto il territorio nazionale o anche su porzioni uniformi di territorio come la aree metropolitane, le città d’arte e così via) assieme alla pubblicazione certa e sistematica di dati aggiornati sono due fattori che non solo amplificano le potenzialità dei dati, ma ne rendono appetibile e interessante il riuso, soprattutto in chiave business. Questa è stata da sempre una debolezza degli Open Data. A parte la pubblica amministrazione centrale, che ha sicuramente in canna la possibilità di pubblicare dati con copertura nazionale, (va valutato poi a quale livello di dettaglio: più il dato è disaggregato e più le potenzialità di un riuso interessante e proficuo aumentano), gli enti locali, quando lo hanno fatto, hanno sempre pubblicato dati in modo indipendente e autonomo. Questo ha portato al fatto che nel migliore dei casi abbiamo “porzioni” di dati che diventa complicatissimo se non impossibile mettere assieme. Nel peggiore abbiamo dati solo per quel determinato ente locale.
Immaginate ad esempio di avere una provincia che pubblica un certo tipo di dato come open data. Se tutte le altre province non pubblicano lo stesso dato allo stesso modo e riferiti allo stesso periodo, non solo sarà impossibile ricostruire il dato per riportarlo ad una copertura nazionale, ma anche se il dato avesse delle potenzialità, resterebbero nella migliore delle ipotesi confinate ad un utilizzo strettamente locale. Troppo poco per sperare in un qualche riuso importante del dato da parte ad esempio del mercato. A questo va aggiunto l’altro aspetto di cui parlavo prima, ossia la necessità di avere una pubblicazione continua, certa e sistematica dei dati. Nell’era della data economy, chi investe sui dati deve poter essere certo che potrà accedere anche in futuro a quegli stessi dati sempre aggiornati.
Ma se ognuno fa un po’ come vuole, in assenza di una governance e aggiungerei anche di un Programma Open Data Nazionale, il riuso del dato diventa molto rischioso. Con l’effetto di limitare il riuso dei dati, proprio quello che invece gli open data dovrebbero invece favorire.
Bisognerebbe quindi agire in una logica di sistema per consentire, attraverso una governance chiara e mediante l’introduzione di standard condivisi, di passare dal locale al globale. È, se vogliamo, la logica che a livello europeo c’è dietro alla direttiva PSI e al concetto di High Value Dataset: avere la disponibilità dello stesso dato per tutti i Paesi membri UE.
Conclusioni
I dati Covid abbiamo detto sono il risultato di un processo continuo di raccolta, correzione, integrazione, validazione e pubblicazione. E il dipartimento della Protezione Civile diventa così a tutti gli effetti un “produttore” di dati piuttosto che soltanto un semplice “pubblicatore”. Va detto infatti che in dieci anni di open data è stata dedicata sempre molta più attenzione al “prodotto” che al “processo”. È stata in altre parole dedicata più attenzione alla forma che il dato doveva assumere che alla sostanza, ossia puntare a generare in modo continuo dati dalle elevate potenzialità di riuso.
Ovviamente tutto ciò, come spesso accade, era in qualche modo già nell’aria da tempo. Io stesso sono svariati anni che ne parlo proponendo questa visione e suggerendo questa modalità di approccio agli open data nelle varie occasioni pubbliche a cui ho l’onore e soprattutto il piacere di essere invitato.
Open data ad alte potenzialità di riuso necessitano non soltanto l’adozione di standard attraverso una adeguata governance, ma anche un elevato grado di automazione dei processi. Solo in questo caso infatti si potrà ottenere quella affidabilità nella produzione dati e quella continuità necessaria a fare investimenti sugli open data da parte del mercato e a sfruttare appieno tutte le potenzialità dei dati pubblici per ottimizzare l’azione delle PA, generare risparmi, introdurre nuovi servizi ai cittadini e alle stesse pubbliche amministrazioni.