La recente querelle tra Regione Lombardia e Ministero della Salute, rispetto alla “errata” attribuzione della zona rossa ha riportato al centro della scena un tema che saltuariamente balza agli onori della cronaca, spesso per l’onorevole impegno di singoli ricercatori o di organizzazioni indipendenti, più che per impegno istituzionale e politico.
Ovvero, quali dati conosciamo della pandemia? Quanti di questi dati sono pubblici? Sulla base di quali informazioni vengono prese le decisioni che riguardano le nostre libertà individuali? Una criticità che John Ioannidis aveva già individuato a marzo 2020 in un editoriale dal titolo molto provocatorio: “A fiasco in the making? As the coronavirus pandemic takes hold, we are making decisions without reliable data”.
Perché i dati sulla pandemia non sono pubblici
L’ordinanza 27 febbraio 2020 del Dipartimento della Protezione Civile istituisce il Sistema di Sorveglianza Epidemiologica del SARS-CoV-2 e affida (art. 1) all’Istituto Superiore di Sanità (ISS) la responsabilità di predisporre e gestire una specifica piattaforma dati, che Regioni e Province autonome sono tenute ad alimentare. La stessa ordinanza assegna allo stesso ISS la responsabilità della Sorveglianza Microbiologica (art. 2) e all’Istituto Spallanzani di Roma la sorveglianza delle caratteristiche cliniche dei casi nazionali attraverso apposito database, connesso con la piattaforma ISS. Rispetto alla condivisione dei dati (art. 4), viene garantita quella con i database dell’Organizzazione Mondiale della Sanità e dello European Center for Disease Prevention and Control.
L’accesso al database della sorveglianza integrata (epidemiologica, microbiologica e clinica) è riservato ai soli utenti autorizzati e i dati non sono pubblici, ad eccezione di alcuni resi recentemente open dall’ISS, senza tuttavia serie storiche. Dal 9 novembre 2020, l’ISS carica quotidianamente un file Excel con alcuni dati: tuttavia occorre essere molto tempestivi nell’effettuare il download quotidiano, perché lo storico non viene mantenuto. Di conseguenza, l’andamento dell’epidemia è noto dal report settimanale dell’ISS che riporta solo dati aggregati. Secondo quanto disposto dall’ordinanza della Protezione Civile del 4 agosto 2020, enti di particolare rilevanza scientifica e pubbliche amministrazioni possono richiedere i dati in forma aggregata o con modalità di pseudo-anonimizzazione con doppio codice random. Ovviamente, rimane valida anche la possibilità di inviare all’ISS istanze di accesso ai sensi della normativa sul Freedom of Information Act (FOIA).
Inoltre, i report del Monitoraggio della Cabina di Regia ai sensi del DM 30 aprile 2020, ovvero quelli utilizzati per l’assegnazione dei “colori” alle Regioni, secondo quando previsto dal DPCM 3 novembre 2020 sono stati pubblici dal n. 25 del 9 novembre, ma l’archivio storico non è mai stato reso disponibile.
I limiti degli open data disponibili ai ricercatori indipendenti
Di conseguenza, gli unici open data a disposizione dei ricercatori indipendenti sono quelli del bollettino giornaliero del Ministero della Salute, che tuttavia presentano numerosi limiti:
- Per le Province è disponibile solo il numero totale dei casi, mentre il dettaglio sullo stato clinico e il decorso è disponibile solo a livello Regionale. In altre parole, non è possibile effettuare alcuna analisi a livello di Provincia, né tantomeno di Comune, su nuovi casi, persone in isolamento domiciliare, ospedalizzati con sintomi, terapie intensive, guariti, deceduti, tamponi, casi testati, etc.
- Non esiste la possibilità di ricostruire i flussi relativi all’evoluzione clinica dei soggetti positivi: in particolare dei soggetti ospedalizzati e in terapia intensiva conosciamo solo i “saldi” ovvero il numero dei posti letto occupati, senza alcuna informazione che riflette il miglioramento o il peggioramento dei pazienti. Solo dal 4 dicembre 2020 è stato inserito il numero di ingressi giornalieri in terapia intensiva.
- Rispetto ai decessi non viene fornita alcuna informazione sul luogo dove questo è avvenuto (terapia intensiva, degenza ordinaria, RSA, domicilio, etc.), né alcun dettaglio regionale o provinciale per età e sesso, rendendo impossibile qualsiasi analisi sul tasso di mortalità in Italia, tra i più elevati del mondo.
Alla indisponibilità di open data si aggiunge il fatto che tutti i dati sulla pandemia sono forniti dal Ministero della salute con licenza Creative Commons 2.5, che permette di citarli o riprodurli, salvo che a fini commerciali, ma non di utilizzarli per opere derivate. Per questa ragione la Fondazione GIMBE, in occasione di diverse audizioni presso la Commissione Igiene e Sanità del Senato e Affari Sociali della Camera, ha chiesto sia di allineare le licenze a quelle previste dalla definizione di open data e alle indicazioni della direttiva europea PSI, sia di modificare la licenza Creative Commons (da 2.5 a 4.0) per i contenuti del portale Nuovo Coronavirus del Ministero della Salute, eliminando il divieto di distribuzione di opere derivate (da CC BY-NC-ND a CC).
Conclusioni
Tutto ciò documenta che nel nostro Paese, in particolare in sanità, non esiste la cultura del dato aperto e la pandemia ha messo in evidenza enormi criticità nel sistema di raccolta e accesso ai dati. Ecco perché la Fondazione GIMBE ha promosso, insieme ad oltre 160 organizzazioni, la campagna #datiBeneComune, sottoscritta finora da oltre 46.000 persone, per chiedere al Governo che tutti i dati su COVID-19 per monitorare il rischio epidemico vengano resi pubblicamente accessibili in formato in formato aperto, ben descritti e interoperabili (machine readable).
Dopo quasi un anno di pandemia deve essere pretesa la massima trasparenza: la popolazione non può essere chiamata a sottostare passivamente a continue nuove restrizioni, che rendono incerta la quotidianità e alimentano preoccupazioni sul futuro, senza essere correttamente informata sui dati su cui si basano le decisioni, visti anche i sempre più frequenti contrasti (e ricorsi) tra Governo e Regioni.