Intelligenza artificiale in Sanità: il vero rischio è non poterla usare, ora

Quello che sta emergendo in tutta evidenza in questi giorni, è che la prima cosa che si frappone all’uso dell’IA in sanità è, banalmente, la digitalizzazione ma anche la mancanza di competenze e risorse semantiche. È arrivato il momento di cambiare le cose, per non farci più trovare impreparati

L’Intelligenza Artificiale (IA) è anch’essa schierata nella lotta al coronavirus. In Cina ad esempio sta avendo un ruolo importante nello screening, nella diagnosi, nel contenimento del contagio e nello sviluppo di farmaci. Anche in Italia, averla come alleata a supporto della popolazione in questa complessa fase sarebbe di vitale importanza. Ma questo, nelle condizioni attuali, difficilmente può avvenire.

L’arretratezza dell’infrastruttura sia fisica sia logica della nostra informatica pubblica e i ritardi culturali e politici di istituzioni e amministrazioni non consentono oggi di fare ciò che sarebbe necessario.

Proviamo a esaminare lo stato dell’arte della sanità digitale e gli ostacoli che si frappongono a un utilizzo davvero efficace dell’intelligenza artificiale.

Indice degli argomenti

Tecnologie intelligenti e dotazione infrastrutturale

Il dispiegamento dell’IA incontra difficoltà che dipendono soprattutto da fattori organizzativi, politici e sociali. Di fatto, guardiamo all’IA per lo più nella prospettiva di una risposta a medio e lungo termine: nell’immediato ci servono tamponi, mascherine, ventilatori, oggetti fisici insomma.

Ciò che emerge con chiarezza in questi giorni, non solo in Italia, è che il dispiegamento di tecnologie intelligenti richiede infrastrutture adeguate, processi organizzativi, partecipazione sociale. Ciascuno di questi fattori si sta rivelando più critico di quanto potessimo percepire nella normalità. Ma la situazione che è sotto i nostri occhi in questi giorni ci offre anche chiare indicazioni su come lavorare sui fattori abilitanti di cui tecnologie intelligenti hanno bisogno. Così come l’error analysis consente di capire come migliorare una rete neurale nelle prime fasi di un progetto di IA, la cronaca di questi giorni ci dice qualcosa su quello che dovremo fare in futuro.

Dati sanitari e fattori di rischio, i freni all’uso dell’IA

Prendiamo ad esempio i dati sanitari. In questi giorni, una nutrita squadra di medici collocati presso l’Istituto Superiore di Sanità (ISS) sta ricevendo dagli ospedali di tutta Italia le cartelle relative ai decessi, per capire quali sono realmente collegati al coronavirus. Questi dati sono importanti non solo per le statistiche che servono a monitorare l’andamento dell’epidemia, ma anche per individuare meglio i principali fattori di rischio. Bene: i dati in questione giungono all’ISS nelle forme più varie, alcuni digitalizzati, altri no, e comunque strutturati (se sono strutturati) in modo assai eterogeneo. Ai medici dell’ISS non resta che leggerli come se fossero opere di narrativa vergate a mano ed estrapolarne il contenuto, una ad una, col puro esercizio del loro intelletto, come si sarebbe fatto nell’Ottocento. Qualcuno dirà che è un bene: nulla può ancora eguagliare la competenza umana quando si tratta di ragionare con conoscenze complesse come quelle della medicina. Tuttavia, quello che fanno i medici è un lavoro di classificazione che potrebbe verosimilmente essere automatizzato con buoni risultati, permettendo agli umani di focalizzarsi sui casi più difficili e al sistema sanitario di acquisire molte più informazioni di quelle che è umanamente possibile trattare nelle condizioni attuali.

La prima cosa che si frappone all’uso dell’IA è dunque, banalmente, la digitalizzazione, cioè una cosa che da alcune decadi si dice di voler fare ed è ormai peraltro alla portata di tutti. Perché ancora non si fa? Non certo per problemi tecnici, ma probabilmente per il fatto che si tratterebbe, per le singole strutture, di un onere, soprattutto organizzativo, i cui benefici si producono al livello del sistema generale, non di quello locale.

La digitalizzazione deve dunque diventare un adempimento sociale e come tale va imposta, al pari degli obblighi a cui la cittadinanza è chiamata nell’emergenza e non solo.

Ma collochiamoci nell’ipotesi in cui la cartella sanitaria sia digitalizzata e trasmessa in forma elettronica dalle singole strutture al Ministero. Queste cartelle servirebbero ancora a poco se non fossero redatte secondo uno standard. Il lavoro su questi standard è in corso su scala planetaria fin dal 1987, ed è condotto anche in Italia. Quanto all’adozione, però, siamo ancora nel buio. Oltre all’endemica inerzia infrastrutturale, qui l’ostacolo principale appare quello delle competenze diffuse necessarie per gestire la trasformazione digitale dei processi. Sull’analfabetismo funzionale s’è lanciato l’allarme già da molti anni, ma l’analfabetismo digitale nelle pubbliche amministrazioni è un pericolo che dobbiamo estirpare al più presto, perché può risultare letteralmente letale.

La semantica della sanità digitale

Supponiamo comunque, per fare un esempio, che i referti specialistici siano tutti codificati secondo lo standard hl7. Questo standard inquadra i dati generali e alla struttura in paragrafi del documento. La sostanza di ciò che viene refertato si trova in sezioni di testo libero, dove i medici descrivono, con la loro immensa e oscura terminologia, le fattispecie cliniche. Un sistema di IA che volesse fare classificazione dovrebbe andare a guardare lì dentro. Come?

Le tecniche di Natural Language Processing (NLP) che hanno negli ultimi anni consentito progressi notevoli in compiti di classificazione come quelli che sarebbero utili al lavoro sui documenti sanitari si basano su reti neurali addestrate con grandi basi di dati testuali. Ma le tecniche statistiche usate per costruire questi modelli funzionano bene per il linguaggio di tutti i giorni, dove la maggior parte delle cose si dice con una piccola parte del lessico. La ricerca mostra che la complessa e immensa terminologia della medicina va invece attinta da risorse semantiche, cioè vocabolari e ontologie. Dove si trovano queste risorse, e soprattutto: se ne trova qualcuna in italiano?

La più completa risorsa semantica per la medicina è SNOMED, sviluppata da un consorzio internazionale non profit, disponibile in molte lingue europee, comprese il danese e lo svedese, ma purtroppo non in italiano. Come accade che la lingua di una nazione importante come l’Italia non sia dotata di una risorsa strategica per uno dei suoi servizi essenziali, incardinato addirittura nella Costituzione? Non si tratta di un complotto ai nostri danni: è solo che nessuno da noi si è preso l’incarico di entrare nel consorzio e lavorare per la traduzione della risorsa. Chi avrebbe dovuto farlo? Non è chiaro neanche questo. La governance del digitale italiano fa acqua a partire dagli assetti istituzionali.

Abbiamo discusso molto, nel recente passato, dei pericoli dell’IA e dei preamboli etici all’uso delle tecnologie innovative. Discussioni giuste e doverose. Tuttavia, è arrivato il momento di rimboccarsi le maniche e fare quello che ancora non abbiamo fatto. Il più grande pericolo dell’IA, come si vede, è quello di non averla.