Un’enorme quantità di dati a disposizione e sempre maggiori possibilità di analisi. E’ questa, da tempo ormai la sfida più significativa posta dallo sviluppo della tecnologia a molti campi del sapere, tra questi in particolare quello medico, clinico, scientifico. E’ anche una stimolante opportunità per le nuove generazioni: di fronte alle innumerevoli quantità di dati, di informazioni ‘grezze’, è sempre più necessaria una formazione adeguata per analizzare il dato, comprenderlo, pubblicarlo e renderlo utile e fruibile per l’intera comunità. Governare i Big Data è ormai una priorità e, quindi, dotarsi di nuove competenze di Data Science e di nuove strutture organizzative rappresenta una sfida non più rinviabile.
La Fondazione Policlinico Universitario “A. Gemelli”, struttura di assistenza, formazione e ricerca scientifica, da sempre persegue la valorizzazione dei dati generati e raccolti in ospedale. La disponibilità e gestione dei dati è un asset fondamentale sia nel processo di cura sia in quello di ricerca perché fornisce elementi e prove dell’efficacia dell’azione clinica e supporta in modo determinante l’attività di ricerca. Anche per questo i dati sono “tutelati” attraverso rigorosi processi di raccolta, conservazione e diffusione.
Primo passo di questo processo è stata la creazione di un catalogo di servizi di informazioni fruibili: sistema pubblico e pubblica amministrazione allargata, sistema delle imprese private di settore, attori interni impegnati nel campo della ricerca e sviluppo. Tutto ciò, naturalmente, rendicontando le attività attraverso un Data Committee con lo scopo di allineare le strategie di sviluppo della capacità informativa con la identità, l’etica e la missione della Fondazione.
Il Policlinico Gemelli ha adottato fin dal 2000 l’utilizzo della cartella clinica informatizzata, raccogliendo un enorme patrimonio di dati in formato elettronico “strutturato” (database, tabelle relazionali) e “non strutturato testuale” (referti, lettere di dimissione, diagnosi). Quotidianamente circa 100 Unità Operative Complesse e reparti producono enormi volumi giornalieri di dati ed informazioni registrati nei sistemi e nel datawarehouse aziendale.
Big Data significa elaborare i dati tramite strumenti di ricerca testuale (text search e mining), strumenti di analisi dei processi (process mining) per verificare episodi fuori range, e strumenti di clustering per determinare la probabilità che un paziente possa appartenere ad un percorso clinico assistenziale quando viene a contatto con la struttura ospedaliera: l’obiettivo generale è quello di sperimentare e sfruttare le ultime tecnologie (open source e proprietarie), e nel contempo acquisire conoscenza nella gestione e trattamento di questi nuovi strumenti.
Il primo macro obiettivo pragmatico è creare un motore che cerchi legami e similarità nei dati testuali (referti, diagnosi, lettere dimissione) per farli emergere aggregati, come prima non era possibile, cercando di creare un “google clinico” sui dati ed episodi interni. La seconda sfida è quella di supportare la fase di accettazione del paziente fornendo un sistema che suggerisca agli attori (presso il pronto soccorso o in fase ambulatoriale) la probabilità che un paziente possa appartenere ad un percorso clinico assistenziale e che possa imparare ad essere istruito in modo interattivo. Insieme a questi temi stiamo sviluppando, in gruppi di ricerca, algoritmi di learning, riguardo alcune tematiche oncologiche, per analizzare i processi e la loro aderenza o meno rispetto percorsi di cura. Tutto ciò passa attraverso una piattaforma di analytics che possa trasmettere in modo diretto ed efficace i dati di sintesi.
I benefici stanno già interessando le aree di ricerca, le relazioni esterne, i progetti legati alla data collaboration fino alle performance operative e legate alla migliore qualità dei processi. Il progetto della Fondazione Gemelli prevede una mappatura e revisione dei flussi dati aziendali, dei ruoli dei diversi attori e delle politiche di accesso ai dati, la certificazione della qualità delle informazioni utili ai processi critici (logistica, trasporti, spesa, rendicontazione) e lo sviluppo e l’incremento dei servizi e della loro qualità dei servizi tramite estensione delle informazioni utili alle varie utenze (clinica, cura, servizi amministrativi, territorio).
Temi e sfide nuovi, dunque, e innovativi che richiedono un approccio diverso, a partire dagli anni dell’Università. L’analisi e l’uso dei Big data prevede cambiamenti organizzativi e culturali, certamente anche economici e di diffusione e condivisione della potenzialità del dato che è il vero interesse tutelato della comunità professionale, scientifica e soprattutto dei pazienti.