Il costo medio della ricerca e dello sviluppo di un nuovo farmaco a scopo commerciale si avvicina oggi al miliardo di dollari. Quello dei nuovi farmaci, ed è la pandemia a ricordarcelo, è un business molto importante e redditizio.
L’innovazione tecnologica, spinta dall’artificial intelligence, può metterci in grado di portare farmaci salvavita sul mercato molto più velocemente di prima agendo su diversi piani. Ma perché ciò accada è necessario immagazzinare e trattare una grandissima quantità di dati. Si stima che i dati che riguardano la salute di un singolo individuo siano quantificabili in circa 300 GB.
Intelligenza artificiale, cosa può fare per la ricerca sanitaria
Per rendere quest’ordine di grandezza comprensibile possiamo dire che per raccogliere i dati sanitari di ogni individuo sarebbe necessario riempire completamente l’hard disk del nostro PC. Ma in aggiunta alla grande quantità di dati da immagazzinare fisicamente, che per un ospedale o per una singola sperimentazione sono già nell’ordine dei petabyte, va anche detto che oggi i processi di gestione dei dati correlati per soddisfare le esigenze della ricerca sanitaria e i requisiti dei regolatori sono molto onerosi e costosi. Per questo motivo l’intelligenza artificiale (AI) può semplificare compiti come il monitoraggio, la verifica e la protezione delle informazioni sanitarie personali, permettendo alle aziende farmaceutiche e ai centri di ricerca di concentrarsi sulla loro missione principale che è quella di trovare trattamenti innovativi ed efficaci per le malattie.
Una Sanità più equa, grazie ai dati: la nuova sfida per l’intelligenza artificiale (e la politica)
Sperimentazioni cliniche e privacy: il ruolo dell’AI
Man mano che le sperimentazioni cliniche diventano più elaborate e le leggi che circondano la privacy dei pazienti si complicano, l’AI diventa lo strumento migliore – e forse l’unico capace di avere delle ricadute concrete – per garantire che le informazioni chiave sulla salute dei pazienti siano protette, siano complete, conforme ai regolamenti e sicure.
È ipotizzabile che in futuro le aziende farmaceutiche dovranno ottenere consensi molto più specifici per i pazienti, i quali, ad esempio, potrebbero chiedere di limitare l’uso dei loro dati solo al periodo di sperimentazione.
L’AI può proteggere meglio le informazioni sanitarie personali, ma può anche dare garanzie sulla loro accuratezza e sulla loro qualità.
I maggiori problemi dell’utilizzo dei dati nel processo di creazione dei nuovi famaci stanno nei dati stessi. I dati raccolti nella fase sperimentale possono essere numeri cardinali, come valori dei test di laboratorio o dati dei sensori, possono essere dei dati che derivano da appunti o note dei medici, possono consistere nella raccolta dei monitoraggi quotidiani o dei dati di anamnesi. In aggiunta a questi, possono consistere in file derivati dalla diagnostica per immagini: TAC, Risonanze magnetiche, ecografie. Infine, possono includere sequenze genomiche non solo dei pazienti stessi, ma anche dei loro tessuti malati o dei virus che li hanno infettati.
Intelligenza Artificiale nelle sperimentazioni cliniche, è l’ora della regolamentazione
Come dicevamo prima un solo studio clinico può generare petabyte di dati e, ad oggi, il numero di studi clinici registrati nel database federale ClinicalTrials.gov, solo per gli Stati Uniti, si avvicina a 400.000. Per proteggerli e gestirli correttamente, l’AI deve essere in grado di identificarli e interpretarli tutti con precisione. L’intelligenza artificiale dispiega quindi una duplice capacità accelerativa dei processi perché da un lato facilita le sperimentazioni e dall’altro rende più semplice ed efficiente la gestione della grande quantità di dati necessari per raggiungere l’obiettivo della scoperta di un nuovo farmaco.
Perché l’AI ha fallito molte volte in campo sanitario e come evitare nuovi flop
L’origine di molti fallimenti dell’AI applicata in campo sanitario va ricercata nella qualità del dato che viene usato per addestrare gli algoritmi. Spesso con leggerezza si effettua il machine learning con dati non controllati, o non verificati, o di scarsa qualità. Un database di scarsa qualità è già il primo passo verso un fallimento certo. Lo studio della qualità dei dati e delle condizioni di errore diventa, quindi il prerequisito di ogni ulteriore elaborazione. Vengono spesso creati database “Frankenstein” che derivavano dall’aggregazione di basi di dati diverse, non omogenee e soprattutto costituite da dati raccolti con metodologie e strumenti diversi. Molti strumenti, inoltre, sono stati sviluppati da ricercatori di IA che mancavano delle competenze mediche per individuare difetti nei dati o da ricercatori medici che mancavano delle capacità matematiche per gestire i problemi della raccolta dei dati.
Ad esempio, durante la pandemia le informazioni sui pazienti covid, comprese le scansioni mediche venivano raccolte e condivise a partire dalla prassi quotidiana dei reparti cosa che, in alcuni momenti di picco dell’epidemia, diventava enormemente complessa da gestire. I ricercatori volevano acquisire velocemente dei dati, ma questo significava aggregare dati derivanti da osservazioni differenti o spesso dati provenienti da fonti sconosciute. Per fare un esempio si sono utilizzati involontariamente dei set di dati che contenevano scansioni polmonari di bambini che per addestrare l’AI a riconoscere il covid. Ma, l’algoritmo di Intelligenza artificiale imparava a identificare i bambini, non il covid!
Se vogliamo, quindi, evitare il fallimento dei modelli di AI dobbiamo cercare una solida metodologia di costruzione e di analisi dei dati e l’AI piò aiutarci anche in questo.
Conclusioni
In sintesi, il rapporto uscito su Technology Review Insights del MIT evidenzia come l’AI è potenzialmente in grado di accelerare lo sviluppo dei farmaci agendo su diversi piani fra loro complementari:
- gestendo grandi quantità di dati dalla ricerca e sviluppo fino agli studi clinici e migliorando la qualità dei dati e dei database;
- proteggendo la privacy dei pazienti e riducendo gli oneri normativi;
- collegando team e siti di sperimentazione distribuiti a livello globale;
- semplificando compiti di monitoraggio, auditing e protezione delle informazioni sanitarie personali.