Con un elaborato pubblicato alcune settimane fa su Nature, la società britannica leader del settore dell’Intelligenza Artificiale DeepMind, di proprietà di Google, ha affermato di aver addestrato un sistema alimentato dall’Intelligenza Artificiale in modo tale da poter essere in grado di prevedere quali variazioni del DNA nel nostro genoma possono causare malattie. Previsioni, queste, che potrebbero accelerare la diagnosi di disturbi rari (ed eventualmente fornire indizi per lo sviluppo di farmaci).
Con quest’uscita mediatica che ha – al momento – del “fantascientifico”, l’azienda britannica controllata da Mountain View afferma di aver perfezionato un modello proteico (incapsulato nel suo neonato software “AlphaMissense”) in grado di prevedere quali errori ortografici presenti nel genoma umano possono essere “tranquillamente ignorati” e quali, invece, possono causare malattie. Nell’ambito del suo progetto, DeepMind ha dichiarato che sta rilasciando decine di milioni di previsioni generate dalla macchina. Tuttavia, Google non ha permesso il download diretto del modello, in quanto potenzialmente rischioso per la sicurezza dell’ecosistema mondiale se la tecnica dovesse essere applicata ad altre specie.
Gli obiettivi del progetto DeepMind
DeepMind ha dichiarato che i suoi risultati fanno parte di uno sforzo per scoprire la causa principale delle malattie, con il conseguente avvento di diagnosi più rapide idonee e a sviluppare trattamenti salvavita per un indeterminato numero di pazienti. Il progetto, durato tre anni, ha portato DeepMind a pubblicare le previsioni di ben settantuno milioni di possibili varianti. Ognuna di esse è una cosiddetta “mutazione missenso”, ove l’alterazione di una singola lettera del DNA modifica la proteina prodotta da un gene. L’obiettivo dello studio pubblicato su Nature è quello di fornire una modifica a una proteina; tuttavia, invece di puntare alla previsione della forma della proteina, lo scopo è quello di sapere se tale proteina è dannosa o meno per l’uomo. Il vero banco di prova dell’Intelligenza Artificiale “moderna” è se può aiutare le persone apportando nuove cure, cosa che non è ancora avvenuta. Ma alcuni farmaci progettati dall’Intelligenza Artificiale sono in fase di sperimentazione e gli sforzi per creare nuove proteine utili stanno probabilmente in dirittura d’arrivo per essere ripagati.
Focus sulle varianti di significato incerto
Il nuovo sforzo pionieristico di DeepMind, tuttavia, ha meno a che fare con i farmaci rispetto ai suoi precedenti studi (si pensi a quelli concernenti lo sviluppo e la scoperta di nuove proteine). Tuttavia, il nuovo studio britannico riguarda più il modo in cui i medici diagnosticano le malattie rare, soprattutto nei pazienti con sintomi sconosciuti, come un neonato con un’eruzione cutanea che non guarisce spontaneamente o un adulto che si sente improvvisamente più debole senza alcuna avvisaglia. Con l’avvento del sequenziamento genico, i medici possono ora decodificare i genomi delle persone e, quindi esaminare, i dati del DNA alla ricerca di possibili “colpevoli”. A volte la causa è chiara, come la mutazione che porta alla fibrosi cistica. Ma in circa il venticinque percento dei casi in cui viene effettuato un sequenziamento genico approfondito, gli scienziati troveranno un cambiamento sospetto del DNA i cui effetti non sono del tutto compresi. I ricercatori chiamano queste mutazioni misteriose varianti di significato incerto, le quali possono comparire anche in geni studiati in modo esaustivo come BRCA1, noto in presenza di rischio di cancro ereditario. DeepMind afferma che il suo nuovo prodotto AlphaMissense può aiutare nella ricerca di risposte utilizzando l’Intelligenza Artificiale per prevedere quali cambiamenti del DNA sono benigni e quali non lo sono affatto.
I limiti del progetto DeepMind
In genere, gli esperti non dichiarano una mutazione patogena fino a quando non dispongono di dati reali di pazienti, prove di modelli di ereditarietà nelle famiglie e test di laboratorio “alla mano”; informazioni che, peraltro, vengono condivise attraverso siti web pubblici come ClinVar. I modelli stanno migliorando ma, poiché “nessuno è perfetto”, non si riescono ancora a stabilire se si è in presenza di una mutazione patogena o meno. E questo è sempre un po’ il tallone di Achille di DeepMind, che pecca sempre di esagerazione con la sua “certezza medica” delle sue previsioni (soprattutto nella sua classificazione delle varianti benigne e patogene). DeepMind, inoltre, ha affermato che il suo nuovo modello si basa su AlphaFold, il precedente modello per la previsione delle forme delle proteine. Anche se, come abbiamo visto, AlphaMissense fa qualcosa di molto diverso, sfruttando le intuizioni acquisite sulla biologia proprio da AlphaFold. Essendo basato su quest’ultimo software, il nuovo modello della società britannica richiede relativamente meno tempo al computer per essere eseguito, con conseguente minor sprechi in materia di energia. In termini tecnici, il modello è pre-addestrato; successivamente viene adattato a un nuovo compito in un’ulteriore fase successiva.
Un progetto “aperto”, ma non troppo
DeepMind afferma di aver fornito libero accesso a tutte le sue previsioni per i geni umani, nonché di aver fornito libero accesso a tutti i dettagli necessari per replicare completamente il suo lavoro, compreso il codice del computer. Tuttavia, come anticipato, non sta rilasciando l’intero modello per il download immediato e l’utilizzo da parte di altri a causa di quello che definisce un rischio di “bio-sicurezza” se venisse applicato per analizzare i geni di specie diverse dall’uomo. Non è chiaro quali siano queste applicazioni non sicure, né di quali specie non umane si stia parlando in casa DeepMind. La società londinese ha tenuto a non rilasciare ulteriori dettagli. Ipotizzando, i rischi potrebbero includere l’uso dell’Intelligenza Artificiale per progettare batteri più pericolosi o creare armi biologiche. Tuttavia, tali restrizioni dovrebbero essere viste come uno sforzo trasparente per impedire ad altri di utilizzare rapidamente il modello per i propri scopi. La restrizione sull’uso del modello in esame limita principalmente la possibilità di fare previsioni su sequenze proteiche non umane.[1]
Note
[1] DeepMind is using AI to pinpoint the causes of genetic disease. MIT Technology Review. https://www.technologyreview.com/2023/09/19/1079871/deepmind-alphamissense-ai-pinpoint-causes-genetic-disease/