Intelligenza artificiale, arma contro le epidemie: ecco come

L’affermazione che oggi l’IA è una potente arma contro il covid-19 è solo in parte vera e rischia di diventare controproducente, di portare a decisioni poco informate. La mission, piuttosto, è far sì che ora politica, imprese e sanità arrivino a fidarsi di questi strumenti in modo da accelerare la reazione alle epidemie

Ma quanto l’Intelligenza Artificiale ci può aiutare nell’affrontare l’attuale epidemia da Covid-19? La risposta può soprendere: poco, molto poco. A giudicare dallo stato dell’arte della scienza. Ma l’AI potrà essere un’arma a disposizione per le prossime epidemie che certo l’umanità dovrà (si teme sempre più spesso) affrontare.

Indice degli argomenti

Quando e da chi è stato intercettato il Covid-19

Un primo segnale di utilità dell’AI in questo campo arriva in realtà già nella lotta al Coronavirus. La prima a rendere noto il problema legato all’epidemia, fu proprio un’azienda canadese proprietaria di una piattaforma di Intelligenza Artificiale di monitoraggio della salute: era il 30 dicembre 2019.

Poco dopo mezzanotte, la piattaforma della società BlueDot ha compreso la problematica dall’analisi di un gruppo di casi di “polmonite insolita “, verificatesi in un mercato della città cinese, e l’ha segnalata.

L’azienda canadese, fondata da Kamran Khan, professore di medicina e salute pubblica presso l’Università di Toronto, è nata dopo l’esperienza del suo fondatore come epidemiologo e medico nel trattamento di pazienti a Toronto durante l’epidemia di sindrome respiratoria acuta grave (SARS) del 2003.

La società utilizza un algoritmo che analizza le notizie in diverse lingue, cerca e analizza in rete quelle sulle malattie degli animali e delle piante e i comunicati ufficiali per avvisare, in anticipo, i propri clienti in modo tale che possano evitare zone pericolose come stava, potenzialmente in quei giorni, diventando Wuhan.

In realtà, anche un servizio chiamato HealthMap, dell’ospedale pediatrico di Boston, aveva raccolto questi primi segnali, così come fece Metabiota, un’azienda (con sede a San Francisco) che dispone di una piattaforma che offre informazioni dettagliate per oltre 120 agenti patogeni distinti insieme a profilo, storia e statistiche aggiornate sulle malattie.

L’IA ci salverà dal coronavirus?

Tornando alla domanda iniziale, è certamente difficile rispondere, come è facile – invece – vedere che altri progetti in cui l’IA viene esplorata come strumento diagnostico o utilizzato per aiutare a trovare un vaccino sono ancora nelle loro fasi iniziali. Anche se avranno successo, ci vorrà del tempo – ragionevolmente diversi mesi – per mettere queste innovazioni nelle mani degli operatori sanitari che ne hanno e ne avranno bisogno.

L’affermazione che oggi l’IA è una nuova e potente arma contro le malattie è solo in parte vera e rischia di diventare controproducente: troppa fiducia nelle capacità dell’IA, a volte associata a qualcosa di magico e fantastico, potrebbe portare a decisioni poco informate.

Per essere chiari: non credo che l’IA ci salverà dal coronavirus o, almeno, non questa volta.

Ma, altrettanto chiaramente, è vero che ci sono tutte le possibilità che le ultime tecnologie informatiche giocheranno un ruolo più importante (e più utile) nelle future epidemie a patto di apportare grandi cambiamenti, anche non facili, su tre aree principali in cui l’IA può portare vantaggi:

previsione,
diagnosi
trattamento.

Previsioni (e cosa farne)

Aziende, come le già citate BlueDot e Metabiota, utilizzano algoritmi di elaborazione del linguaggio naturale (NLP) per monitorare i notiziari e i rapporti sanitari ufficiali in diverse lingue in tutto il mondo, alla ricerca di citazioni relative a malattie ad alto impatto (per fare un esempio: coronavirus, HIV, tubercolosi). I loro strumenti predittivi sono anche in grado di utilizzare, nei loro modelli di analisi, i dati relativi agli spostamenti e ai viaggi aerei per valutare il rischio che gli hub di transito possano ricevere, in arrivo o in partenza, persone infette o potenzialmente infette.

I risultati sono abbastanza precisi e, certamente, incoraggianti.

Per fare un esempio, uno degli ultimi rapporti pubblici di Metabiota, reso noto il 25 febbraio, prevedeva che il 3 marzo ci sarebbero stati 127.000 casi di Coronavirus in tutto il mondo. Pur avendo superato di diverse migliaia di unità, Mark Gallivan il direttore scientifico dell’azienda, afferma che questo è un margine di errore ben giustificabile per questo tipo di elaborazioni. Allo stesso modo aveva previsto in un elenco i paesi che avrebbero avuto maggiori probabilità di nuovi contagi, tra cui Cina, Italia, Iran e Stati Uniti.

Sappiamo tutti com’è andata effettivamente: questi sono tra i paesi più contagiati al momento.

Altre aziende, come Stratifyd – una società con sede a Charlotte, nella Carolina del Nord – si preoccupano di monitorare i social media: analizzando post di Facebook e Twitter effettua una relazione e un confronto con dati prelavati da fonti come il National Institutes of Health, l’Organizzazione mondiale per la salute degli animali e il database globale di identificatori microbici (che memorizza le informazioni sul sequenziamento del genoma).

Il lavoro di queste aziende è certamente impressionante e, anche grazie alla capacità di “ascoltare” su una gamma molto ampia di fonti, dimostra il grado di bontà che ha raggiunto l’apprendimento automatico negli ultimi anni.

Forse il vero problema resta cosa fare di queste analisi previsionali.

BlueDot ha individuato correttamente alcune città nel percorso del virus e ciò avrebbe potuto consentire alle autorità di prepararsi, allertare gli ospedali e mettere in atto misure di contenimento. Ma, con l’aumentare della scala dell’epidemia, le previsioni diventano meno dettagliate, meno specifiche.

È altrettanto vero che le analisi rilasciate Metabiota, sui paesi che sarebbero stati colpiti, erano corrette, ma che cosa fare con tali informazioni è certamente difficile per chi deve prendere decisioni che impattano sulla collettività.

Un ulteriore ragionamento va fatto sul grado di precisione che andrà diminuendo al progredire dell’epidemia:

dati affidabili, necessari agli algoritmi di IA per poter effettuare con precisione le analisi, sono ancora difficili da trovare sull’epidemia Covid-19 in corso;
c’è stata confusione, nel tempo, sui sintomi e su come avviene il contagio tra le persone;
nazioni differenti utilizzano modi differenti per registrare i dati (si pensi a chi classifica come deceduti per questo virus pazienti che sono mancati a causa del contagio e anche per altre patologie pregresse ma positivi al virus).

Da non dimenticare che, per poter ottenere il miglior risultato possibile di analisi e predizione, oltre ai dati, sarebbe necessario avere un quadro preciso di quanto sta accendo in questi giorni: chi lavora da casa, chi si era messo in quarantena autonomamente, chi si lava o non si lava le mani, e così via.

Ma se l’IA ha bisogno di molti più dati da fonti certe, qualificate e affidabili per essere utili in questi temi che ci toccano così da vicino in queste settimane, le strategie per riuscirci possono essere poco comprensibili alla maggior parte delle persone: per ottenere previsioni migliori dall’apprendimento automatico, dobbiamo avere e condividere più dati.

Il vantaggio, da non tralasciare, è che questa messa in comune può essere fatta in maniera anonima, facendo in modo che, partendo da specifici attributi (età, sesso, patologie pregresse), possa essere impossibile risalire all’identificazione di una persona fisica.

Apixio, un’altra azienda americana di analisi sanitarie tramite IA, ha annunciato di aver creato algoritmi in grado di estrarre informazioni dai registri medici dei pazienti e suggerisce che, per poter studiare fenomeni importanti come il Codiv-19, dovrebbero essere resi accessibili i registri medici provenienti da tutti gli Stati Uniti: questo potrebbe permettere di identificare automaticamente le persone più a rischio di infezione a causa di una condizione pregressa.

Le risorse disponibili, in questo modo, potrebbero così essere concentrate su quelle persone che ne hanno maggiormente bisogno.

I dati sanitari, inoltre, potrebbero e dovrebbero essere condivisi tra le nazioni, anche perché i contagi non seguono confini geopolitici. Si potrebbe arrivare a un accordo internazionale che permetta e consenta di rilasciare dati in tempo reale su diagnosi e ricoveri ospedalieri, che potrebbero poi essere inseriti in modelli di apprendimento automatico su scala globale per analisi di contagi e pandemie.

A oggi, possiamo solo sfruttare al massimo i dati che abbiamo.

Diagnosi precoce

Oltre a prevedere il decorso e l’evoluzione di un’epidemia, molti sperano che l’IA aiuti a identificare anche le persone che sono state contagiate. Su questo aspetto, queste tecnologie, hanno una comprovata esperienza: i modelli di apprendimento automatico per l’esame delle immagini mediche possono rilevare i primi segni di malattia che i medici “umani” potrebbero far fatica a evidenziare rapidamente (ci sono diversi esempi su malattie degli occhi, condizioni cardiache, cancro).

Il punto sostanziale è che i modelli sui cui si basano i complessi algoritmi di apprendimento automatico richiedono in genere molti dati da cui poter imparare.

Alcuni documenti sono stati pubblicati online nelle ultime settimane suggerendo che l’apprendimento automatico possa essere in grado di diagnosticare Covid-19 da scansioni del tessuto polmonare se addestrato per individuare segni rivelatori della malattia nelle immagini.

Oggi, a quanto pare, non è ancora chiaro se l’imaging sia la strada da percorrere, perché sembra che i segni fisici della malattia non appaiano immediatamente nelle scansioni ma solo dopo qualche tempo dall’insorgere dell’infezione, rendendolo non molto utile questa strada come diagnosi precoce.

Questo non vuol dire che non potranno essere costruiti strumenti di IA per rilevare le prime fasi della malattia nei futuri focolai: anche in questo caso, la condivisione di più dati sui pazienti aiuterà certamente, così come le tecniche di apprendimento automatico che consentono di realizzare modelli di analisi anche quando sono disponibili pochi dati.

Trattamento

I dati sono anche essenziali per permettere all’intelligenza artificiale di sviluppare trattamenti per la malattia. Una tecnica per identificare possibili candidati, a nuovi o differenti farmaci, è quella di utilizzare algoritmi di progettazione generativa, che producono un gran numero di potenziali risultati e così da poter essere vagliati per evidenziare quelli che vale la pena esaminare più da vicino. Questa tecnica, ad esempio, può essere utilizzata per cercare rapidamente tra milioni di strutture biologiche o molecolari, un’attività che richiederebbe uno sforzo, in termini di tempo e di risorse, molto grande se gestita solo da “umani”.

SRI International, azienda basata nella Silicon Valley in California, sta collaborando allo sviluppo di uno strumento di intelligenza artificiale in grado di utilizzare tecniche di apprendimento automatico (machine learning) e apprendimento profondo (deep learning) per individuare nuovi candidati per farmaci in modo che gli scienziati possano valutarne al meglio per l’efficacia.

Restando nella teoria, perché pur trattandosi di una possibilità resta – oggi – molto lontana, le elaborazioni di IA potrebbero essere utilizzate anche per prevedere il decorso del coronavirus, ad esempio eseguendo algoritmi di apprendimento senza supervisione per simulare tutti i possibili percorsi di evoluzione.

Resta, in ogni caso da sottolineare, che l’intelligenza artificiale non sarà in grado di prevedere i focolai di malattie da sola, indipendentemente dalla quantità di dati che si è in grado di ottenere ed elaborare.

La missione principale è fare in modo che i leader politici, le imprese e la sanità arrivi a fidarsi di questi strumenti in modo da cambiare in maniera radicale la velocità con cui possiamo reagire alle epidemie.

Per sfruttare al meglio l’intelligenza artificiale occorreranno molti dati, tempo e un coordinamento più proficuo tra i molti soggetti diversi.

Tutte cose, queste, che adesso sono (purtroppo) molto scarse.

Per tutti questi ragionamenti è fondamentale ragionare e discutere insieme, come aziende, organizzazioni non profit, governi, scienziati e medici, per portare le informazioni più ricche e le migliori tecnologie per far fronte alle sfide, come l’attuale Covid-19.

Proprio per accelerare sul tema di stretta attualità, in questi giorni, è stata annunciata una collaborazione tra diversi soggetti per creare il COVID-19 Open Research Dataset (CORD-19): oltre 29.000 articoli accademici per COVID-19 e la famiglia dei coronavirus.

La motivazione alla base dello sforzo del CORD-19 è quella di rendere la ricerca e le scoperte più efficienti e di accelerare i progressi verso soluzioni alla pandemia.

Il set di dati leggibile automaticamente è stato costruito con una collaborazione tra Microsoft, la National Library of Medicine (NLM), l’Allen Institute for AI, la Georgetown University, la Chan Zuckerberg Initiative, Kaggle e la White House Office of Science and Technology Policy (OSTP).

Al momento un grandioso lavoro tra diverse organizzazioni in cui competenza, passione, entusiasmo e creatività sono le fondamenta principali.