innovazione

Il Graph Database favorisce la nascita di unicorni: ecco le opportunità che l’Italia non coglie

I Graph Database possano diventare uno strumento potentissimo per creare nuovi prodotti e servizi. Ne è la prova il fatto che la maggior parte degli attuali unicorni usano anche o soprattutto questo strumento. In Italia, però, la situazione non è oncoraggiante. Facciamo il punto

Pubblicato il 02 Mar 2023

Yuri Simione

Sales Director, Ultipa, Inc.

Man,Using,Crm,Software,On,Laptop,With,Different,Graphs,And

C’è una forte relazione tra Graph Database e innovazione? La risposta è assolutamente sì. Tutte le applicazioni aziendali o rivolte al grande pubblico hanno sempre più bisogno di dati e quindi di database. I Graph Database stanno emergendo in questi ultimi anni poiché permettono non solo di modellare i dati in un modo più intuitivo ma perché permettono di estrarre maggiori informazioni e dare quindi più valore ai dati gestiti.

In molti scenari, i Graph Database permettono di ottenere delle risposte a interrogazioni, in pochissimi millisecondi laddove invece altri modelli di database rispondono in minuti, ore o non riescono a fornire alcuna risposta. Si aprono delle grandi opportunità perché è possibile creare applicazioni e servizi veramente innovativi in moltissime aree: dal commercio elettronico, alla ricerca di nuovi farmaci, dall’individuazione di frodi finanziarie, a nuovi servizi rivolti al cittadino. In tutto il mondo le più importanti aziende stanno investendo su questa tecnologia. Molte sono le nuove aziende nate e che forniscono nuovi servizi creati a partire da dati organizzati in Graph Database.

E in Italia? Come sempre l’Italia procede con più lentezza, per colpa della nostra ridotta capacità di innovare.

Graph database: perché sono sempre più necessari in azienda

Le caratteristiche dei Graph Database

Tra i tanti modelli di database, relazionale, document database, key-value e altri, i Graph Database hanno la caratteristica unica di poter essere spiegati ad una platea molto più vasta, anche non prettamente tecnica e che ne riesce a comprendere da subito molte delle sue potenzialità.

I Graph Database consentono di rappresentare i dati con grafi, cioè un insieme di nodi, connessi tra loro utilizzando archi: i nodi sono utilizzati per memorizzare i dati e gli archi le relazioni tra questi dati. Ad esempio, per memorizzare le informazioni relative alle quote detenute in ogni azienda, potremmo utilizzare un grafo e modellare:

  • l’insieme di tutte le persone fisiche e le società con dei nodi;
  • tracciare il fatto che una persona detiene una quota in una società con un arco.

In questo semplice modello un’arco connette i nodi A e B, se la persona, fisica o giuridica, che è rappresentata dal nodo A partecipa la società B.

I nodi e gli archi hanno degli attributi per catturare tutti i dati necessari per essere utilizzati dalle applicazioni. Nel nostro esempio il “nodo persona fisica”, avrà delle proprietà per tracciare il nome, il codice fiscale della persona a cui si riferisce. Il “nodo persona giuridica”, avrà altre proprietà, come la partita iva o codice fiscale, la tipologia (Srl, Spa, ecc) e altri. Anche gli archi generalmente hanno degli attributi. Ad esempio, l’arco che connette una persona con un’azienda potrebbe avere una proprietà per memorizzare il valore o la percentuale della quota detenuta dell’azienda. Nello stesso grafo potremmo poi aggiungere un arco tra una persona fisica e una persona giuridica con un arco di tipo “amministratore”, per tracciare il fatto che quella persona è l’amministratore della persona giuridica selezionata. Nulla di più semplice (e, vedremo, nulla di più potente). Talmente semplice da comprendere che i grafi sono utilizzati spesso per spiegare e comprendere facilmente relazioni che altrimenti sarebbero difficili da spiegare.

Un esempio da Report

Nella puntata del 27 aprile 2020, Report, la trasmissione di Raitre, ha presentato un servizio giornalistico per spiegare alcune presunte truffe legate alle mascherine chirurgiche monouso. Durante la trasmissione è stato utilizzato un semplice grafo per spiegare quali persone controllavano nello specifico una società. Questa informazione è stata spiegata a una platea vasta ed eterogenea, per età e formazione, il tutto con un’immagine visualizzata e spiegata in circa venti secondi. L’immagine di seguito è un fotogramma originale della trasmissione e in cui è presentato il grafo; per privacy abbiamo oscurato/modificato i nomi effettivi di aziende e persone. Abbiamo usato nomi di persone di fantasia e nomi di aziende fittizie, usati in film statunitensi per essere sicuri di non riferirci, pur non volendo, a persone o aziende esistenti: abbiamo chiesto un aiuto a chatGPT e quest’applicazione è stata perfetta per indicarci un paio di nomi di aziende fittizie e utilizzate in film famosi; abbiamo provato a farci indicare nomi di aziende italiane fittizie, usate nei film ma chatGPT con la stessa sicurezza, di cui ogni tanto è bene dubitare, ha fornito nomi di aziende che esistono nella realtà e anche molto conosciute!

Fotogramma originale della trasmissione Report del 27/04/2020. Per privacy Sono stati oscurati/modificati i nomi di persone e aziende.

Tornando al nostro grafo, Report ha evidenziato in maniera molto efficace la catena di controllo di una società: si evince chiaramente che i fratelli White tramite la Stark Industries controllano anche la Cyberdyne Systems. Inoltre, uno dei fratelli White, Chris, risulta anche essere l’amministratore di Cyberdyne Systems. È molto chiaro che la famiglia White è quella che riesce a dettare tutte le scelte aziendali di Cyberdyne Systems e che gli altri azionisti di questa società hanno poca o nessuna voce in capitolo. Report avrebbe potuto presentare gli stessi dati in un altro formato, ad esempio in forma tabellare, ma questa scelta sarebbe risultata poco efficace: le tabelle seguenti, pur contenendo meno informazioni del grafo, sono più difficili da interpretare, in quanto bisogna costruire mentalmente le relazioni di chi controlla cosa.

Le stesse informazioni presentate nel corso della trasmissione Report del 27/04/2020, presentate in un altro formato.

Nelle tabelle le relazioni sono presenti ma sono implicite. Nel grafo, al contrario, le relazioni sono esplicite e la maggior parte degli spettatori di Report arrivano alla stessa conclusione del giornalista che presenta il servizio, velocemente, in maniera intuitiva.

Questo esempio mette in evidenza un altro aspetto fondamentale dei grafi: navigando il grafo si ottengono nuove informazioni. Partendo dai nodi a destra, scopriamo che i fratelli White controllano Stark Industries. Proseguiamo la navigazione: Stark Industries ha la quota di maggioranza di Cyberdyne Systems ma allora i fratelli White, indirettamente controllano Cyberdyne. Se la catena di controllo fosse stata più articolata, con decine di aziende o persone e centinaia di relazioni, sarebbe stato molto più difficile individuare il titolare effettivo dell’azienda, ma navigando il grafo saremmo comunque riusciti a ottenere quest’informazione. Quello dell’esempio è un grafo semplicissimo ma di per sé già molto potente. Se aggiungessimo altri dati, ad esempio estrapolati da giornali, social network, altre banche dati, potremmo aggiungere nuove relazioni tra le persone o tra le persone e le aziende. Potremmo per esempio evidenziare un legame di amicizia, un legame lavorativo e “distillare” nuove informazioni e capire quali persone, nella pratica, esercitano il maggior controllo su un’azienda, al di là di quello che specificano le quote formalmente detenute.

Ora è molto più semplice comprendere cosa sono i Graph Database: una collezione di dati organizzati come grafi. I Graph Database in alcuni casi gestiscono poche migliaia di nodi e archi ma in alcuni casi possono essere caratterizzati anche da migliaia di miliardi di nodi e archi. Con i Graph Database, la navigazione del grafo a partire da un nodo richiede pochissimi millisecondi. Quello del titolare effettivo è un caso d’uso tipico dei graph database. In Italia Cerved utilizza il graph database Neo4j per implementare lo stesso caso d’uso. Ultipa, una startup americana che produce il graph database omonimo, per una delle dieci borse valori più grandi al mondo per capitalizzazione, ha realizzato un’applicazione che riesce a individuare il titolare effettivo di un’azienda, in pochissimi millisecondi, a partire da un grafo che gestisce i dati di circa trecento milioni di nodi che modellano le persone fisiche e giuridiche coinvolte.

Graph Database: uno strumento potentissimo per creare nuovi prodotti e servizi

Da questa prima introduzione possiamo comprendere come i Graph Database possano diventare uno strumento potentissimo per creare nuovi prodotti e servizi. Possiamo riassumere le caratteristiche sin qui viste dei Graph Database in questo modo:

  • sono semplici da modellare,
  • sono facilmente comprensibili a tutti i livelli aziendali,
  • le relazioni tra dati sono definite in maniera esplicita e rappresentano il valore più importante,
  • la navigazione del grafo permette di ottenere nuove informazioni,
  • In uno stesso grafo è possibile memorizzare i dati di tanti domini diversi, ottenendo una visione più centralizzata dei dati aziendali.

Graph Database e machine learning

In realtà i Graph Database sono molto più di questo: la teoria dei grafi, la disciplina della matematica che si occupa dello studio dei grafi, è nata quasi trecento anni fa e ha prodotto moltissimi studi e algoritmi che l’informatica ha capitalizzato ed esteso. Avrebbe senso introdurre i concetti di graph analytics e di come i Graph Database si sposino bene con il Machine Learning, abilitando l’Explainable AI (XAI), cioè l’Intelligenza Artificiale con la quale è possibile comprendere le decisioni o le previsioni effettuate dagli algoritmi di AI. L’XAI si contrappone alla maggior parte degli algoritmi e applicazioni di AI che forniscono risultati, spesso eccezionali ma che non sanno spiegare (come chatGPT, per esempio). Di seguito un esempio concreto di una non Explainable AI:

Un’interazione con ChatGPT che evidenzia come quest’applicazione non riesca a spiegare nel concreto il percorso che ha effettuato per fornire la risposta. L’informazione in questo caso è corretta, sebbene non riferita ad un anno preciso.

L’innovazione coi Graph Database

Le moderne applicazioni e i servizi erogati dalle aziende più importanti, fanno largo uso si di informazioni memorizzate in grafi: LinkedIn, Facebook, Amazon, Google, Apple, Netflix realizzano molti dei loro ricavi anche grazie a enormi collezioni di dati organizzati in grafi. In alcuni casi i dati organizzati in grafi rappresentano proprio la prima fonte di ricavi: pensiamo ad esempio a LinkedIn e Facebook: la rete di contatti cosa è se non un enorme grafo? In questi due casi parliamo di grafi enormi, più di novecento milioni di utenti registrati in LinkedIn e quasi tre miliardi in Facebook.

Probabilmente anche la maggior parte degli attuali unicorni (aziende non ancora quotate, con un valore superiore al miliardo di dollari) usano anche o soprattutto Graph Database. Pensando agli unicorni, i fatti ci dicono che la nostra (bassa) capacità di innovare non ha dato grandi frutti nel campo dell’alta tecnologia. CB Insight, la società di riferimento per recuperare informazioni sugli unicorni, ha censito a febbraio di quest’anno 1.204 aziende. Di queste, solo due risultano essere aziende italiane: Scalapay e Satispay. Quindi solo lo 0,16% degli unicorni sono italiani. Per il resto, nazioni che non ti aspetti sono riuscite ad emergere con idee, tecnologie innovative molto più dell’Italia. Un minor numero di unicorni significa molto probabilmente una più generale, minore, capacità di innovare.

La situazione in Italia

Lo sappiamo, nella nostra nazione, l’adozione delle innovazioni nell’ambito informatico è spesso rallentata rispetto ad altre nazioni europee e questo fatto sta emergendo anche rispetto all’utilizzo di Graph Database. Ci sono diversi fattori che contribuiscono a questo ritardo. Sicuramente la minore spesa in Ricerca e Sviluppo rispetto alle altre nazioni ma ci sono sicuramente tanti altri fattori noti che non hanno mai favorito l’innovazione.

Il fatto che il nostro paese sia tra quelli con il più basso tasso di investimenti in R&S conta moltissimo: solo l’1,47% del nostro PIL è destinato a questo scopo, contro una media del 2,3% dei paesi dell’UE. Molto meno rispetto a nazioni come il Belgio e la Svezia che dedicano il 3,5% del loro PIL in ricerca e sviluppo e del 3,2% dell’Austria ed il 3,1% della Germania. Ciò significa che le aziende italiane preferiscono, o meglio sono costrette, a mettere a disposizione meno risorse per l’innovazione e lo sviluppo di nuovi prodotti e servizi.

Il tema è sicuramente molto complesso e va ben oltre la spesa in ricerca e sviluppo, perché non si spiegherebbe come mai in Irlanda siano nati sei unicorni malgrado in questa nazione si spenda in ricerca e sviluppo, in percentuale, meno dell’Italia.

Sicuramente ci sono altri aspetti che contribuiscono a questo stato, come una minore spesa in formazione continua del personale, la mancanza di un ecosistema favorevole all’innovazione. Sappiamo poi bene quanto le barriere burocratiche e la non sufficiente attenzione delle istituzioni verso l’innovazione tecnologica siano un freno allo sviluppo delle aziende e dei nuovi prodotti e servizi. Le aziende dovrebbero collaborare con università, ricercatori e startup innovative per scoprire nuove opportunità e soluzioni tecnologiche. Anche per questo, è importante favorire la creazione di un ecosistema di startup innovative per incoraggiare l’adozione delle nuove tecnologie.

A mio avviso a mancare è anche una capacità di monitorare continuamente il mercato e le tendenze tecnologiche per individuare nuove opportunità e soluzioni innovative. Le aziende dovrebbero essere sempre alla ricerca di nuove tecnologie e soluzioni che possono migliorare la loro attività e aumentare la competitività.

Su questo punto, ritengo che in Italia, ci sia la tendenza ad adottare le tecnologie più innovative solo se forzati da specifiche esigenze o dal mercato, arrivando quasi sempre secondi.

Naturalmente tutte le motivazioni su indicate contribuiscono a questa tendenza ma il dato di fatto è che il mercato italiano che ruota intorno ai Graph Database procede molto più lentamente rispetto a quanto accade nelle altre nazioni europee. Guardando il mercato del lavoro, ad esempio, emerge infatti che in tutte le nazioni più importanti ci sia un’attenzione crescente verso la ricerca di risorse con competenze legate al mondo dei Graph Database e Knowledge Graph.

Il numero di annunci di lavoro per la selezione di esperti di Graph Database in nazioni come la Germania, Spagna, Svezia, Francia, Gran Bretagna aumenta costantemente. La ricerca degli stessi profili per il mercato italiano è praticamente ferma. Questo significa che c’è oggi un divario di competenze in ambito graph database. Questo è solo una faccia della medaglia. L’altra faccia della medaglia ci dice, cosa ben più importante, che stanno nascendo applicazioni e servizi innovativi che produrranno, per le rispettive nazioni, maggiori ricavi o un maggiore vantaggio competitivo rispetto all’Italia. Quando parliamo di nuovi servizi intendiamo anche quelli che possono portare alla creazione di grandissimo valore, che a volte si traduce in un nuovo unicorno. Alcune delle aziende che in Europa stanno selezionando esperti di graph database sono anche aziende private, industrie, che utilizzano i graph database per migliorare semplicemente la catena dei fornitori e ridurre gli impatti di problemi nella fornitura di un singolo componente, assemblato in un prodotto molto complesso. In questo caso i graph database forniscono un modo per ridurre i rischi di problemi derivanti dalla catena dei fornitori e la riduzione del rischio significa maggiore competitività, ad esempio in periodi di crisi.

Conclusioni

Il mio consiglio rivolto a amministratori di database, data scientist, data architect, è di sperimentare quanto prima l’utilizzo di un graph database: in rete sono disponibili software open source e istanze in cloud gratuite, perfette per poter iniziare a prendere confidenza con queste tecnologie. Inoltre non è difficile trovare tutorial, molti dei quali veramente ben realizzati.

Ai responsabili dei sistemi informativi e Chief Data Officer, consiglio di destinare quanto prima del budget da dedicare alla formazione delle risorse interne sugli stessi temi e a valutare l’introduzione dei graph database individuando uno dei tanti casi di uso che forniscono valore alle aziende, avviando il relativo studio e l’implementazione di un prototipo. Il ritorno di questo investimento, sono sicuro, sarà molto maggiore rispetto al ritorno di tanti altri investimenti in ricerca e sviluppo.

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

EU Stories - La coesione innova l'Italia

Tutti
Iniziative
Video
Analisi
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia

Articoli correlati

Articolo 1 di 2