La nostra capacità di curare le malattie si è a lungo basata sul concetto di cura della specifica patologia. I protocolli terapeutici sono stati definiti utilizzando un approccio meramente statistico per la misurazione dell’efficacia di una cura su ampie popolazioni di pazienti apparentemente affetti dallo stesso tipo di patologia. Tuttavia, l’efficacia di cura di un protocollo terapeutico è spesso lontana dal 100% di efficacia, con percentuali variabili di pazienti che non rispondono alla stessa cura a cui rispondono altri pazienti apparentemente affetti dalla stessa patologia.
La medicina di precisione
Tra i motivi di questa discrepanza, due sono particolarmente rilevanti:
- I limiti delle nostre conoscenze ci portano a considerare identiche patologie che invece lo sono solo in parte;
- gli individui non sono tutti identici e l’evoluzione di una specifica patologia, o la sua risposta ad una specifica terapia, sono grandemente influenzate da una variabilità individuale.
Se guardiamo ai tumori, ad esempio, cellule di patologie apparentemente identiche per classificazione, dimensioni e diffusione, possono differenziarsi per specifiche mutazioni di geni coinvolti nel controllo della crescita o della progressione della malattia. La conseguenza è che questi tumori, identici secondo le attuali capacità di caratterizzazione e classificazione, sono in realtà un po’ diversi, e possono sviluppare una maggiore o minore aggressività, o rispondere più o meno efficacemente a specifiche terapie. In aggiunta, stili di vita, fattori ambientali, storia clinica pregressa e variabilità genetica dei pazienti (solo per citarne alcuni), sono elementi che impattano sulla progressione di una malattia o sulla sua capacità di rispondere a specifiche terapie.
Il riconoscimento della rilevanza delle variabilità individuali nella predizione prognostica e della risposta terapeutica, e la consapevolezza che malattia e paziente sono un unico inscindibile, sono alla base della cosiddetta medicina di precisione o personalizzata.
L’intelligenza artificiale per la medicina personalizzata
La ricerca di parametri descrittivi di questa unicità, in grado cioè di predire al meglio le caratteristiche di una data malattia in un dato paziente, ha come conseguenza l’aumento impetuoso di dati, in gran parte acquisiti o immagazzinati in formato digitale. Basti pensare che, considerata la data-sfera globale, i dati sanitari mostrano il più alto tasso di crescita annuo (36%), rispetto ad altri ambiti delle attività umane come quello finanziario, industriale, o dei media e dell’intrattenimento. L’utilizzo di questa enorme mole di dati per personalizzare la cura del singolo paziente richiede tecniche di analisi sempre più sofisticate e l’intelligenza artificiale (AI) può rappresentare la risposta a questa esigenza.
Tuttavia, nonostante l’enorme mole di dati a disposizione e la possibilità di analizzarli mediante AI, i modelli AI attualmente disponibili per la pratica clinica quotidiana sono ancora pochissimi e in gran parte legati al mondo della diagnostica per immagini. Le motivazioni di questo ritardo sono molteplici, tra queste, solo per citarne alcune, la difficoltà di trovare un equilibrio tra utilizzo dei dati a scopo di ricerca e rispetto della privacy, la scarsa comunicazione tra esperti di AI e di area medica, la mancata comprensione che le strategie di sviluppo di modelli AI applicati a processi sviluppati dall’uomo (aerospaziale, automotive etc) non sono replicabili tout-court in ambito clinico, aspetti etici e legali ancora da comprendere e risolvere. Il risultato è visibile nel fallimento di molti consorzi internazionali nel portare a terra soluzioni pratiche.
Una piattaforma di interoperabilità in ambito oncologico basata su cloud
Da queste esigenze è nato l’accordo strategico tra Università Vita-Salute San Raffaele (UniSR), Ospedale San Raffaele (HSR) (istituzioni inserite nel Gruppo San Donato), e Microsoft (MSFT), per lo sviluppo di una piattaforma di interoperabilità in ambito oncologico (AI-HOPE, Artificial – Intelligence Oncology Patients Suite), basata su cloud, in grado di integrare progressivamente tutti i dati sanitari generati in HSR, per sviluppare modelli AI predittivi, al fine di guidare la personalizzazione delle cure in ambito oncologico. e in prospettiva anche verso altri ambiti (cardiovascolare, neurologico, metabolico).
Il progetto AI-SCoRE
L’iniziativa è nata per estendere a diversi campi della medicina e della ricerca clinica, una metodologia di collaborazione fra accademia e partner industriali tecnologici maturata durante le prime fasi della pandemia da SARS-Cov2, quando, partendo da una nostra idea, hanno sviluppato insieme a Microsoft e a due aziende partner (Porini srl e Orobix srl), il progetto AI-SCoRE (Artificial Intelligence – Sars Covid Risk Evaluation). AI-SCoRE è una piattaforma di apprendimento autonomo in grado di calcolare la probabilità di sviluppare le forme più gravi di COVID-19.
L’esigenza clinica alla base del progetto era quella di prevedere quali pazienti avrebbero sviluppato la forma più blanda e quali la forma più grave di malattia al momento della loro prima presentazione, allo scopo di poter gestire con maggiore efficienza le risorse sanitarie e con maggiore efficacia il singolo paziente, con domiciliazione delle cure per i pazienti a minor rischio e ricovero in ambienti sanitari ad intensità di cura crescente al crescere del rischio AI-SCoRE. Tale approccio può consentire di ridurre il numero dei ricoveri con maggiore attenzione ad altre patologie neglette nel corso della pandemia. Il modello, utilizzando tra l’altro dati automaticamente estratti da immagini radiologiche mediante un approccio di convolutional neural network, è in grado di prevedere rapidamente il rischio prognostico dei pazienti con ottima accuratezza, confermata in una validazione prospettica.
Nella attuale partnership con UniSR/HSR, Microsoft fornirà soluzioni AI ad hoc, supporto tecnico, conoscenza avanzata, supporto didattico e formativo per il personale dedicato di UniSR e HSR. La piattaforma è disegnata in modo che i dati del paziente non escano dal sistema informativo ospedaliero e tutte le operazioni AI siano eseguite su uno spazio cloud di sviluppo di proprietà di UniSR e HSR. Inoltre, utilizzando un approccio di apprendimento federato, potranno essere intrapresi studi multicentrici senza la necessità di un trasferimento effettivo di dati tra istituzioni diverse.
Per rendere la piattaforma operativa nel contesto dell’ospedale, sia per scopi di ricerca che di attività clinica, la sua realizzazione è stata accompagnata dallo sviluppo di quattro progetti che puntano a risolvere altrettante domande cliniche. Le varie fasi dei progetti prescelti (tumore al polmone, tumore al rene e successivamente diabete e diagnostica cardiovascolare), sono state mappate sull’architettura della piattaforma, così da mettere in evidenza ogni possibile problema tecnico da risolvere per la messa a terra della soluzione. Ad esempio, l’estrazione di dati clinici presenti nelle relazioni mediche archiviate come file di pdf è stata risolta implementando un sistema di text analytics for health in grado di estrarre, classificare e collegare diverse entities dai testi. Analogamente altre soluzioni sono state adottate per l’estrazione e la classificazione di dati di laboratorio, istopatologici, di imaging diagnostico, e nuove soluzioni saranno implementate per i dati di scienze omiche.
Gli strumenti utilizzati
La soluzione utilizza una combinazione dei seguenti strumenti: Microsoft Intelligent Data Platform, Azure Health Data Services, Azure Cognitive Services e Azure Machine Learning.
I servizi di intelligenza artificiale come Text Analytics for Health, che estrae ed etichetta informazioni mediche da testi non strutturati come annotazioni mediche, diagnosi e anamnesi nelle cartelle cliniche elettroniche, sono per noi acceleratori fantastici per assicurarci che tutti i dati rilevanti vengano acquisiti e sfruttati al meglio.
La piattaforma è facilmente accessibile da ricercatori e clinici del San Raffaelle attraverso un’interfaccia user-friendly che consentirà non solo la consultazione dei modelli sviluppati, ma anche il disegno di nuovi studi selezionando coorti di pazienti sulla base dei parametri necessari allo studio. Sistemi tipo ML automator integrati nella piattaforma consentiranno lo sviluppo automatico di modelli black-box utili a scopo di ricerca, mentre modelli glass(white)-box potranno rendere spiegabile ogni singola fase del processo decisionale del modello allo studioso. Inoltre, l’utilizzo della struttura federata, che consente l’addestramento di modelli predittivi senza l’effettivo trasferimento di dati presso la sede della piattaforma, è già in via di sperimentazione per il collegamento a banche dati esterne a UniSR/HSR. Al momento, i primi modelli generati su tumore al polmone e tumore al rene sembrano molto promettenti.
Conclusioni
Una realtà ospedaliera e universitaria di alto profilo, programmazione, partnership di alto profilo tecnologico, integrazione tra accademia e industria, il confronto e la collaborazione con l’autorità del garante della privacy, sono le componenti che consentiranno a questa esperienza di portare finalmente il mondo AI al letto del paziente. Questo modello potrà rappresentare una guida per ulteriori analoghe esperienze a livello nazionale, con lo scopo di rendere più efficiente l’utilizzo delle risorse a disposizione del sistema sanitario nazionale, riducendo la ridondanza di procedure diagnostiche e la percentuale di fallimenti terapeutici. Inoltre, i modelli generati saranno un utile strumento per lo sviluppo di nuove ricerche per la creazione di nuove procedure terapeutiche e diagnostiche.