Algoritmi predittivi per gestire la dimissione dei pazienti affetti da ictus: gli studi

L’utilizzo dell’apprendimento automatico sembra essere la soluzione migliore per trattare il problema della previsione dell’esito terapeutico dei pazienti affetti da ictus, alla luce delle complesse variabili da analizzare. Vediamo i modelli più efficaci.

L’uso di algoritmi di apprendimento di cluster come il modello Growing Neural Gas (GNG) permette di identificare l’insieme di variabili cliniche da considerare per effettuare una buona previsione del risultato clinico del trattamento terapeutico post dimissione dei pazienti affetti da ictus. Lo ha dimostrato uno studio condotto in collaborazione con il Dipartimento di Neuroscienze Umane dell’Università di Roma La Sapienza, aprendo le porte a nuovi scenari in vista dei quali, in fase di dimissioni si potrà approntare un piano adeguato, non solo per ottenere il miglior recupero individuale, ma anche per ridurre il carico sociale e l’utilizzo delle risorse del sistema sanitario.

Indice degli argomenti

Ictus, dati allarmanti

Secondo il sito web del Ministero della Salute italiano, ogni anno si registrano circa 196.000 ictus in Italia, di cui il 20% è costituito da ricadute. L’ictus è il risultato della morte di cellule cerebrali causato da un’interruzione di apporto di sangue ossigenato dovuto all’occlusione e/o alla rottura delle arterie che riforniscono il cervello. Come conseguenza, le funzioni cerebrali controllate dalle zone interessate (movimento degli arti, linguaggio, vista, udito o altro) vengono danneggiate o perse (Donnan et al., 2008).

Circa il 10-20% delle persone con ictus muore entro un mese e un altro 10% entro il primo anno dopo l’evento. Solo il 25% dei sopravvissuti all’ictus riesce a recuperare completamente le funzioni perse, il 75% sopravvive con disabilità, la metà dei quali soffre di un deficit tale da perdere l’autosufficienza.

Per supportare la stesura del piano di dimissione, viene innanzitutto valutato l’outcome funzionale utilizzando la scala Rankin modificata (mRS) che misura il grado di disabilità o dipendenza nelle attività della vita quotidiana.

Più basso è il punteggio, maggiore è la probabilità di essere in grado di vivere a casa con un certo livello di autosufficienza dopo la dimissione dall’ospedale o da un reparto di assistenza a lungo termine (Saver et al., 2010) (Wilson et al., 2002).

L’uso degli algoritmi

Esiste una notevole quantità di letteratura sull’uso di algoritmi di apprendimento automatico basati sull’assimilazione dei dati dei casi clinici precedentemente trattati. L’accuratezza della previsione generalmente tende a aumentare nel tempo, man mano che nuovi dati diventano disponibili (Bishop, 2006). Tuttavia, non esiste un algoritmo in grado di fornire la migliore accuratezza predittiva per ogni categoria di problema. Gli algoritmi di apprendimento automatico possono essere suddivisi in supervisionati e non supervisionati. Nei supervisionati è richiesto un team di esperti umani per selezionare le risposte corrette che devono fornire i modelli di machine learning addestrati, mentre nei non addestrati l’apprendimento dei modelli di machine learning non richiede l’intervento di esperti umani (Alpaydin, 2020).

Nella categoria degli algoritmi non supervisionati, è possibile operare una ulteriore suddivisione tra modelli simbolici che cercano di raggiungere una rappresentazione formale della conoscenza (usando ad esempio rappresentazioni logiche, regole di inferenza o alberi decisionali) e modelli sub-simbolici in cui l’acquisizione la conoscenza è immagazzinata in rappresentazioni complesse come le reti neurali artificiali.

Gli algoritmi che effettuano la suddivisione dei casi in cluster (Van Hulle, 1989; Kohonen, 1988; Kohonen, 1989; Kohonen, 1990) sono particolari modelli subsimbolici non supervisionati. Una volta scelto un attributo di classe, come la durata della degenza ospedaliera o un outcome specifico, questi algoritmi sono in grado di raggruppare i casi clinici che si possono verificare in cluster, per esempio corrispondenti a ricoveri della stessa durata di degenza ospedaliera o con lo stesso esito.

I modelli

Anche se questi modelli non sono classificatori, dopo essere stati addestrati con una serie di casi clinici utilizzati come set di test, sono in grado di assegnare ogni nuovo caso al cluster corretto con una notevole accuratezza di previsione. Tra gli algoritmi di apprendimento dei cluster, le mappe autoorganizzanti di Kohonen (Kohonen, 1989) sono state ampiamente utilizzate nel settore sanitario, ma migliori risultati possono essere ottenuti utilizzando un algoritmo più adattivo come il Growing Neural Gas (GNG) di Fritzke (Fritzke, 1994). Il GNG è un modello di rete incrementale basato su una semplice regola di apprendimento hebbiano. Essendo in grado di identificare la dimensione della topologia dello spazio di ingresso, questo modello è in grado di identificare con esattezza le variabili da considerare nell’effettuare la previsione di un attributo di classe.

Ad esempio, se viene scelto come attributo di classe il punteggio mRS che quantifica l’esito della terapia, il modello GNG potrebbe prevedere che un individuo maschio di età compresa tra i 40 ei 65 anni, con una particolare forma di ictus diagnosticato e trattato con alcune terapie farmacologiche, al termine del ricovero ospedaliero, sarebbe in grado di raggiungere un punteggio mRS di 1. Questa previsione potrebbe essere effettuata dal modello senza prendere in considerazione ulteriori variabili che in questo caso sono giudicate irrilevanti dal modello previsionale addestrato come i fattori di rischio, i risultati di prove strumentali e di laboratorio ecc. In altri casi lo stesso modello potrebbe aver bisogno di un maggiore numero di variabili per poter effettuare una predizione accurata. Il modello GNG è già stato utilizzato con successo in ambiti simili, come la previsione della durata della degenza ospedaliera (Lella e Licata, 2017).

L’apprendimento automatico

L’apprendimento automatico sembra essere la soluzione migliore per trattare il problema della previsione dell’esito terapeutico dei pazienti affetti da ictus. Questo approccio si è rivelato particolarmente efficace in ambito clinico, soprattutto per prevedere l’esito terapeutico dei pazienti con ictus (Zdrodowska, 2019; Zdrodowska et al., 2018; Chen et al., 2017) (Alaiz-Moreton, 2018). I migliori risultati sono stati ottenuti attraverso l’uso dell’algoritmo Random Forest (Breiman, 2001; Alaiz-Moreton, 2018) (Tin Kam Ho, 1998; Tin Kam Ho, 1995), un ensemble model per la classificazione che opera mediante l’aggregazione di alberi decisionali. Ottimi risultati sono stati conseguiti anche con il modello PART, un algoritmo ad albero decisionale parziale che non ha bisogno di eseguire l’ottimizzazione globale come altri modelli simili basati su regole (Zdrodowska et al., 2018; Ali e Smith, 2006). In questo ambito sono stati utilizzati con successo anche altri modelli supervisionati come il Support Vector Machine (SVM) (Zdrodowska et al., 2018), un modello basato su un classificatore lineare binario non probabilistico (Ben Hur et al., 2001) (Cortes e Vapnik, 1995).

Lo studio

A fronte di questi risultati presentati in letteratura si è deciso, in collaborazione con il Dipartimento di Neuroscienze Umane dell’Università di Roma La Sapienza, di confrontare tali performance con quelle conseguibili tramite l’utilizzo di un modello GNG.

Lo studio ha coinvolto un sottoinsieme di 20.000 campioni tratto dalla sezione italiana del registro SITS (Safe Implementation of Treatments in Stroke website, 2020), un’iniziativa di monitoraggio indipendente e internazionale senza scopo di lucro, guidata dalla ricerca, su pazienti colpiti da ictus. Di questo archivio sono stati presi considerazione solo i dati che contenevano i campi dell’esito 24 ore dopo l’accesso del paziente all’ospedale (Global Outcome 24), l’mRS a 7 giorni (Rankin a 7 giorni), la mRS alla dimissione dall’ospedale (Rankin alla dimissione dall’ospedale) e mRS a 3 mesi (Rankin a 3 mesi). Queste tre variabili sono state scelte come attributi di classe per i test.

Una parte dei dati utilizzati era incompleta, ma non è stato necessario eseguire alcun tipo di pulizia sui dati grazie al data entering effettuato mediante una form online con campi ben codificati. I dati sono stati discretizzati e normalizzati prima di venire elaborati. I modelli predittivi presi in considerazione sono stati addestrati con 60% dei campioni e testati con il restante 40% dei campioni. È stata utilizzata la piattaforma Weka 3.8.4 per testare gli algoritmi PART, SVM e Random Forest, mentre una implementazione Java è stata utilizzata per testare il modello GNG. L’algoritmo di ottimizzazione minima sequenziale (Platt, 1998) è stato utilizzato per addestrare il modello SVM.

I migliori risultati sono stati raggiunti dal modello GNG seguito dal modello Random Forest. Una volta addestrato, è stato anche possibile utilizzare il modello GNG per identificare quali attributi non di classe sono legati a particolari valori della classe selezionata attributo. Ad esempio, è stato possibile identificare quali variabili cliniche sono legate al peggioramento dei pazienti durante le prime 24 ore di ricovero in ospedale.

Utilizzando l’algoritmo Girvan-Newman (Girvan e Newman, 2002) sono state individuate comunità di nodi a partire dalla porzione di modello addestrato di rete neurale auto-organizzante associate a un deterioramento dello stato del paziente. L’algoritmo di Girvan-Newman identifica le comunità di nodi eliminando le connessioni caratterizzate dal maggior numero di percorsi più brevi che collegano ogni coppia di nodi. Tale algoritmo permette di identificare con precisione i cluster individuati dal modello GNG, dal momento che l’evoluzione della topologia di nodi della GNG durante la fase di addestramento rientra nelle fattispecie evolutive studiate da Girvan e Newman e per le quali hanno sviluppato il relativo algoritmo.

I risultati ottenuti mostrano che la presenza di elevati valori di pressione sanguigna sistolica e diastolica, è un importante fattore di rischio correlato con il peggioramento dello stato del paziente che può anche portare alla morte. La sola presenza di ipertensione, tuttavia, non è sufficiente per valutare il rischio di peggioramento o di morte. Considerando ad esempio uno dei cluster individuati tra quelli correlati ai casi di morte, l’ipertensione è un fattore importante, ma esso deve anche essere accompagnato da altri fattori come la presenza di temperatura elevata, di iperlipidemia, sesso femminile, NIHSS4 = 2 ed un’età compresa tra i 65 e gli 80 anni.

Lo studio di un altro cluster ha rivelato come la presenza di un ictus antecedente verificatosi non più di tre mesi prima, accompagnato da iperlipidemia o da un edema cerebrale o da un basso livello di APTT, specialmente se il paziente è di sesso maschile, può essere considerato un quadro clinico abbastanza preoccupante, specie se l’età del paziente supera gli 80 anni.

Conclusioni

I risultati di questo studio suggeriscono che l’uso di algoritmi di apprendimento di cluster come il modello GNG permette di identificare l’insieme di variabili cliniche da considerare per effettuare una buona previsione del risultato clinico. Il modello GNG si è dimostrato particolarmente efficace nel predire l’outcome della terapia rispetto ad altri algoritmi non supervisionati. Il miglior risultato in termini di accuratezza predittiva raggiunta da questo modello è dovuto alla sua capacità di identificare esattamente la dimensione della topologia dello spazio di ingresso, il che lo rende anche particolarmente robusto al rumore ed alla mancanza di dati. Analizzando la configurazione finale della rete GNG addestrata, è stato anche possibile ottenere informazioni utili sui fattori maggiormente correlati a determinati risultati clinici.

Bibliografia

Alaiz-Moreton, H., Fernandez-Roblez L., Alfonso Cendon, J., Castejon-Limas, M., Sanchez Gonzalez L., Perez H., 2018. Data mining techniques for the estimation of variables in health-related noisy data. Advances in intelligent systems and computing, 649, 482-491.

Ali S., Smith K.A., 2006. On learning algorithm selection for classification. Applied Soft Computing, 6, 119-138.

Alpaydin E., 2020. Introduction to Machine Learning. 4th Edition. MIT Press.

Ben-Hur, A., Horn, D., Siegelmann, H.T., Vapnik, V.N., 2001. Support vector clustering. Journal of Machine Learning Research. 2, 125–137.

Bishop, C. M., 2006. Pattern Recognition and Machine Learning, Springer.

Breiman L., 2001. Random Forests. Machine Learning. 45(1), 5–32. doi:10.1023/A:1010933404324.

Chen Y.C., Suzuki T., Suzuki M., Takao H., Murayama Y., Ohwada H., 2017. Building a classifier of onset stroke prediction using random tree algorithm. International Journal of Machine Learning and Computing, 7(4), 61-66.

Cortes, C., Vapnik, V.N., 1995. Support-vector networks. Machine Learning. 20(3), 273–297. CiteSeerX10.1.1.15.9362. doi:10.1007/BF00994018.

Donnan, G.A., Fisher M., Macleod M., Davis S.M., 2008. Stroke. The Lancet. 371(9624), 1612–23.

Fritzke B., 1994. A Growing Neural Gas Network Learns Topologies. Part of: Advances in Neural Information Processing Systems 7, NIPS.

Girvan M., Newman M.E.J., 2002. Community structure in social and biological networks, Proc. Natl. Acad. Sci. USA 99, 7821–7826.

Kohonen T., 1988. An introduction to neural computing. Neural Networks, 1, 3-16.

Kohonen T., 1989. Self-Organization and Associative Memory, Berlin: Springer-Verlag.

Kohonen T., 1990. The Self Organizing Map. Proc of the IEEE, 78(9).

Lella L., Licata I., 2017. Prediction of Length of Hospital Stay using a Growing Neural Gas Model. In Proceedings of the 8th International Multi-Conference on Complexity, Informatics and Cybernetics (IMCIC 2017), 175-178.

Mess M., Klein J., Yperzeele L., Vanacker P., Cras P., 2016. Predicting discharge destination after stroke: A systematic review. Clin Neurol Neurosurg. 142(15- 21). doi:10.1016/j.clineuro.2016.01.004.

Pereira S., Foley N., Salter K., McClure J.A., Meyer M., Brown J., Speechley M., Teasell R., 2014. Discharge destination of individuals with severe stroke undergoing rehabilitation: a predictive model. Disabil Rehabil. 36(9), 727-731. doi:10.3109/09638288.2014.902510.

Platt,J., 1998. Sequential Minimal Optimization: A Fast Algorithm for Training Support Vector Machines. Technical Report MSR-TR-98-14.

Saver J.L., Filip B., Hamilton S., Yanes A., Craig S., Cho M., Conwit R., Starkman S., FAST-MAG Investigators and Coordinators, 2010. Improving the reliability of stroke disability grading in clinical trials and clinical practice: the Rankin Focused Assessment (RFA). Stroke. 41 (5): 992– doi:10.1161/STROKEAHA.109.571364. PMC 2930146. PMID 20360551

Safe Implementation of Treatments in Stroke website, 2020. https://sitsinternational.org, last accessed 2020/04/24.

Tin Kam Ho, 1998. The Random Subspace Method for Constructing Decision Forests. In IEEE Transactions on Pattern Analysis and Machine Intelligence, 20(8), 832–844, DOI:10.1109/34.709601.

Tin Kam Ho, 1995. Random Decision Forests. Proceedings of the 3rd International Conference on Document Analysis and Recognition, Montreal, QC, 278–282.

Van Hulle M. M., 1989. Self Organizing Maps. Handbook of Natural Computing, 585-622.

Wilson J. L., Hareendran A., Grant M., Baird T., Schulz U.G., Muir K.W., Bone I., 2002. Improving the Assessment of Outcomes in Stroke: Use of a Structured Interview to Assign Grades on the Modified Rankin Scale. Stroke. 33 (9): 2243–2246. doi:10.1161/01.STR.0000027437.22450.BD. PMID 12215594

Zdrodowska M., 2019. Attribute selection for stroke prediction. Sciendo. Doi 10.2478/ama-2019-0026.

Zdrodowska M., Dardzinska M, Chorazy M., Kulakowska A., 2018. Data Mining Techniques as a tool in neurological disorders diagnosis. Acta Mechanica et Automatica, 12(3), 217-220.