La popolazione del pianeta terra continua a crescere. Recentemente abbiamo superato gli otto miliardi di abitanti e la tendenza non appare rallentare.
Considerando che la popolazione non solo cresce, ma anche invecchia, l’assistenza medica rappresenta un’esigenza sempre più importante, che potrà portare a delle difficoltà in termini di allocazione delle risorse umane, tecnologiche ed energetiche.
Come noto, ci si aspetta che le applicazioni di intelligenza artificiale possano aiutare i medici a fornire una migliore assistenza ai pazienti, consentendo l’automazione di compiti ripetitivi, l’assegnazione di priorità ai casi più urgenti in maniera efficace, lo sviluppo di sistemi automatici per l’individuazione e la caratterizzazione di lesioni e quindi un grande supporto alla decisione, sia diagnostica che terapeutica.
Il supporto dell’IA alle decisioni diagnostiche e terapeutiche
Sappiamo però anche che, nonostante il grande entusiasmo suscitato dall’introduzione dell’intelligenza artificiale in medicina, e in particolare in diagnostica per immagini, un numero molto ridotto di prodotti sono utilizzati nella pratica clinica. Infatti, molte di queste applicazioni sono ancora a livello prototipale e non possono essere utilizzate al di fuori di programmi di validazione clinica.
Cosa deve avere un sistema di intelligenza artificiale per essere funzionale
In generale, possiamo affermare che un sistema di intelligenza artificiale per essere funzionale deve avere: un algoritmo efficace, grande capacità computazionale ed essere basato su dati affidabili. Questo ultimo punto rappresenta quello più critico, particolarmente nelle applicazioni medicali.
Sappiamo inoltre che le informazioni relative ai pazienti sono considerate dati sensibili e quindi non possono essere distribuite per scopi di ricerca senza il consenso informato e scritto dei pazienti stessi. Questo limita significativamente la quantità di dati disponibili per applicazioni di intelligenza artificiale, se confrontata con altri ambiti come, ad esempio, quelli industriali o commerciali.
L’Intelligenza Artificiale migliora la diagnostica per immagini: l’esperienza dell’Humanitas
Il transfer learning per l’interpretazione delle radiografie del torace
Uno dei metodi per incrementare la quantità di dati disponibili per l’allenamento dei sistemi di intelligenza artificiale è il cosiddetto “transfer learning”. Con questo termine si intende la condivisione di informazioni ricavate da gruppi di dati molto grandi per migliorare la capacità di identificazione di specifiche strutture in altri gruppi di dati, più limitati, utilizzando processi diversi. Questo approccio si è dimostrato molto utile per generalizzare un processo da un’applicazione a un’altra. Tuttavia, dobbiamo far notare che anche in questo campo la ricerca e ancora in fase di sviluppo.
Il nostro gruppo ha recentemente pubblicato un lavoro [1] nel quale è stato testato l’approccio di “transfer learning” per l’interpretazione delle radiografie del torace, probabilmente l’applicazione più frequente in ambito di diagnostica per immagini. Abbiamo due utilizzato due serie di dati: uno pubblico, denominato CheXpert [2], impiegato per allenare diversi modelli di classificazione e un gruppo di dati locali che è stato utilizzato per valutare la efficacia dell’approccio di transfer learning.
Per entrambi i dataset sono state utilizzate le immagini acquisite in proiezione antero-posteriore. I lettori sapranno che normalmente le radiografie del torace vengono acquisite sia in proiezione antero-posteriore che in proiezione laterale. In questo studio ci siamo comunque limitati alla valutazione di una sola delle immagini. Le radiografie sono state normalizzate e descritte in maniera analitica. Successivamente sono state analizzate dagli algoritmi di intelligenza artificiale.
Tre differenti approcci di transfer learning
In particolare, sono stati proposti tre differenti approcci di transfer learning, il primo consistente nella combinazione dei risultati del Convolutional Neurol Network (CNN), utilizzando una tecnica chiamata “staking”. Nel secondo sono stati utilizzati i CNN pre-allenati per allenare i classificatori. Per il terzo sono stati utilizzati i CNN allenati su CheXpert sui dati locali.
Per valutare le prestazioni dei classificatori è stata utilizzata la tecnica cosiddetta della Receiver Operator Curve.
Un altro dei problemi affrontati per la valutazione di questa tecnica è stato quello della possibilità di spiegare le decisioni dell’algoritmo. Infatti, molti di questi algoritmi sono considerati come delle scatole nere all’interno delle quali non è possibile capire i meccanismi che portano a una particolare decisione. Chiaramente, per costruire dei sistemi affidabili di intelligenza artificiale è necessario fornire all’utente i dettagli e le ragioni che fanno sì che un algoritmo di intelligenza artificiale prenda una certa decisione o suggerisca un certo approccio diagnostico. Questo è particolarmente vero in ambito medico, per ragioni di responsabilità del medico.
L’IA nella diagnostica per immagini: le opportunità del Piano strategico nazionale
La tecnica Grad-CAM
In questo particolare studio è stata utilizzata una tecnica chiamata Grad-CAM che consente di visualizzare con una mappa di colore quali sono le zone dell’immagine che portano ad una specifica predizione. L’utilizzazione di tecniche di spiegabili ha consentito anche di eliminare la presenza del cosiddetto fenomeno di Clever Hans, gli effetti legati alla creazione di scorciatoie e le alterazioni del set di dati.
Conclusioni
I risultati di questo studio possono essere considerati di valore per la comunità medica ma anche per la popolazione generale. Infatti, qualora questo approccio potesse essere utilizzato in altri ambiti, sempre relativi alla diagnostica per immagini, potrebbe aiutare a risolvere il problema della crescente richiesta di medici, soprattutto di coloro che si occupano di diagnostica per immagini. Il modello infatti ha ottenuto prestazioni considerevoli, identificando correttamente e classificando in maniera adeguata diverse caratteristiche presenti nelle immagini di radiografia del torace ed interpretando in maniera corretta le immagini, analogamente alla valutazione di radiologi esperti. Inoltre, questo approccio ha dimostrato la fattibilità dell’utilizzazione di algoritmi di intelligenza artificiale allenati su grandi set di dati e della loro applicazione in diverse nazioni ed ospedali. Chiaramente i prossimi passi richiederanno l’utilizzazione di modelli CNN più moderni e di differenti tipi di immagini. Sarà inoltre necessario validare questi modelli nella pratica clinica con studi prospettici.
Bibliografia
- Gozzi N, Giacomello E, Sollini M, Kirienko M, Ammirabile A, Lanzi P, Loiacono D, Chiti A. Image Embeddings Extracted from CNNs Outperform Other Transfer Learning Approaches in Classification of Chest Radiographs. Diagnostics (Basel). 2022 Aug 28;12(9):2084. doi: 10.3390/diagnostics12092084. PMID: 36140486; PMCID: PMC9497580.
- 2- Irvin, J.; Rajpurkar, P.; Ko, M.; Yu, Y.; Ciurea-Ilcus, S.; Chute, C.; Marklund, H.; Haghgoo, B.; Ball, R.; Shpanskaya, K.; et al. CheXpert: A large chest radiograph dataset with uncertainty labels and expert comparison. Proc. AAAI Conf. Artif. Intell. 2019, 33, 590-597