Di cosa parliamo, precisamente, quando parliamo di interoperabilità? Ne abbiamo scritto spesso (anche con un esempio di “non interoperabilità”), sottolineando come alla base vi sia il principio #onceonly – ovvero richiedere a cittadini, imprese e altre PA solo i dati che non si hanno già, evitando quindi ridondanze, autodichiarazioni, errori, ripetizioni, perdite di tempo. Ma ora vorremmo chiarire al meglio cosa sia l’interoperabilità, in modo da contribuire a una maggiore comprensione, affinché tutti possano spingere per ottenerla.
Il Catalogo Nazionale Dati
Partiamo da un evento molto recente, ovvero una notizia dell’ 8 luglio 2022: l’Istat, in collaborazione con il Dipartimento per la trasformazione digitale della Presidenza del Consiglio dei ministri, ha attivato il 30 giugno 2022 il Catalogo Nazionale Dati per l’interoperabilità semantica dei sistemi informativi delle pubbliche amministrazioni.
Dati pubblici aperti, verso standard comuni: i passi avanti dell’Italia
Il catalogo nazionale della semantica dei dati è stato costruito per la ricerca e il riuso di asset semantici, tra cui ontologie, schemi dati e vocabolari controllati per supportare lo sviluppo di API semanticamente e sintatticamente interoperabili.
Ma cosa sono le ontologie e i vocabolari controllati e perché sono così importanti? Non basta fare una API (application program interface) per essere interoperabili?
Cosa sono le ontologie
Definizione filosofica: Area della metafisica che studia come è realmente fatto l’universo che ci circonda attraverso lo studio dell’essere, le categorie fondamentali e le relazioni fra esse.
Definizione informatica: Tentativo di formulare uno schema concettuale esaustivo e rigoroso nell’ambito di un dominio dato.
Un’ontologia è costituita da:
- Classi: insiemi, collezioni o tipi di oggetti
- Attributi: proprietà, caratteristiche o parametri che gli oggetti possono avere e condividere (Literals)
- Relazioni: modi in cui gli oggetti possono essere messi in relazione gli uni con gli altri
- Individui: istanze del modello, sono gli elementi di base
Ad esempio, il cibo (classe superiore) è commestibile (attributo). La mela è un frutto (classe inferiore collegata con una relazione alla frutta che a sua volta con una relazione è collegata al cibo) e i frutti sono cibo. La mela eredita dal cibo la proprietà (tramite attributo) di essere commestibile. Le ontologie possono essere rappresentate tramite strutture gerarchiche.
Quindi l’ontologia cerca di descrivere il cibo (dominio) mediante relazioni (la mela è frutta e la frutta è cibo) e attributi (il cibo è commestibile) e individui (la mia mela). Questo serve ad avere una visione schematizzata, chiara e soprattutto condivisa di come è fatto un dominio (altrimenti ognuno si fa il suo modello e poi quando ci si parla “informaticamente” mediante API non ci si capisce).
La PA ha un suo “mondo delle ontologie” che si chiama ONTOPiA.
Quindi se parliamo di un dominio a livello informatico, la prima cosa da condividere è l’ontologia. Se non parliamo dello stesso dominio e non lo schematizziamo allo stesso modo, magari ci capiremo ma con tantissima fatica.
Volendo vedere l’esempio di una ontologia complessa applicata alla PA si può vedere l’ Ontologia del Parlamento Regionale Siciliano
Il vocabolario controllato
Il capitolo 2 del Piano Triennale definisce i vocabolari controllati e modelli dei dati come “un modo comune e condiviso per organizzare codici e nomenclature ricorrenti in maniera standardizzata e normalizzata (vocabolari controllati) e una concettualizzazione esaustiva e rigorosa nell’ambito di un dato dominio (ontologia o modello dei dati condiviso”)”.
Su tale tematica, AgID ha implementato il Sistema di registri INSPIRE Italia nato nell’ambito della strategia di coordinamento adottata congiuntamente dall’Agenzia per l’Italia Digitale, ISPRA e il Ministero dell’Ambiente per l’attuazione della Direttiva INSPIRE in Italia.
Quindi, ipotizzando che l’ontologia sia un modo di dire “parliamo del dominio del cibo tenendo conto di questa schematizzazione condivisa”, il vocabolario è il modo con cui ci accordiamo sui termini da usare e sul loro significato nel dominio del cibo.
Nella sua forma più semplice un vocabolario controllato è un sottoinsieme di un linguaggio che rappresenta un sapere specialistico, per esempio un elenco (indice) dei termini specifici di una disciplina (arte, medicina, economia, pa, ecc. )
Eccone un esempio:
Le API
Una volta definito il dominio di cui parlare e il vocabolario da usare allora è più semplice comunicare (mediante le API). Le API sono l’ultimo passaggio di un percorso di uniformità della comunicazione. Spesso si pensa sia il primo, ma se prima non ci si accorda sul dominio di cui parlare (medicina, geografia …) e non si usano termini condivisi (angiotac, tomografia per il dominio medico, isobare e isocore per il dominio geografico) diventa difficile volendo comunicare, scambiarsi informazioni utili e comprensibili.
Conclusioni
L’interoperabilità è il “next level” della PA: quando la PA riuscirà a scambiarsi i dati che ha in possesso sia internamente che verso l’esterno, creerà effettivamente un nuovo livello di interazione con il cittadino e le imprese e anche tra PA.
Esempio: immaginiamo che un servizio invece di chiederci per l’ennesima volta chi siamo (cosa che indispone da subito il fruitore del servizio) ci dica: “questi sono i tuoi dati, puoi confermare gentilmente per verificare non ci siano errori?”. Un bel cambiamento no?
I “preoccupati” dello statalismo dell’informazione saranno dubbiosi su questo sistema, del resto o “restiamo alla carta” o semplicemente evolviamo tendendo conto della privacy by design e della security by design, ovvero applicandole laddove serve e non come metodi per fermare i processi di cambiamento.
L’interoperabilità sarà sempre più fondamentale sia nel mondo reale che nel mondo digitale. E anche nel metaverso, dove il passaggio da più metaversi richiede proprio interoperabilità.
Per preservare la privacy in tutti questi ambiti comunicanti, a livello europeo si sta sempre più andando verso un wallet dei dati, che permetta ad ognuno di controllare chi chiede i propri dati, con chi condividerli, come vengono utilizzati e chissà, magari riceve una seppur piccola remunerazione per il loro utilizzo (in fondo ci sono le GAFAM che ci fanno miliardi con i nostri dati).
Senza però le autostrade dei dati (ontologie + vocabolari controllati) sarà difficile scambiarsi queste informazioni.