L’intelligenza artificiale ci ha fornito uno strumento in più per operare nel campo delle malattie da misfolding proteico, ma la creazione di farmaci efficaci è ancora lontana nel tempo.
Occhio dunque ai proclami propagandistici, ma senza neanche sottovalutare i progressi che si stanno facendo.
Il protein folding è il Sacro Graal della chimica
Le proteine sono composte da centinaia o migliaia di amminoacidi collegati in lunghe catene, che poi si ripiegano in forme tridimensionali. Le proteine sono fondamentali per la vita, e la comprensione della loro forma è vitale per lavorare con loro.
Il piegamento delle proteine (proteine folding), dunque, è sempre stato un problema considerato quasi irresolubile nella biologia e nella biochimica. Qualcuno (Chemestry World) si era addirittura spinto a consideralo il Sacro Graal della chimica.
Oggi, grazie all’intelligenza artificiale, si possono affrontare e risolvere i due problemi principali della biologia: quello della piegatura delle proteine e quello della costruzione ex novo delle proteine.
La svolta dell’algoritmo di deep learning AlphaFold
Il laboratorio di intelligenza artificiale DeepMind, di proprietà di Alphabet, ha colto di sorpresa il mondo nel 2020 quando ha annunciato AlphaFold, uno strumento di intelligenza artificiale che utilizza l’apprendimento profondo per risolvere questa “grande sfida” della biologia. Ultimamente DeepMind ha annunciato che AlphaFold è ora in grado di prevedere le forme che saranno assunte da tutte le proteine conosciute dalla scienza. Questi sviluppi, secondo alcuni, potrebbero far compiere un progresso all’umanità che può essere stimato in termini di tempo in due o tre decenni. Questo è un risultato che potenzialmente può costituire per la biologia e la biochimica una scoperta confrontabile con quella della penicillina e degli antibiotici potrebbe essere in grado di rivoluzionare molti ambiti connessi con la biologia e la biochimica. Infatti, il deep learning sta rendendo possibile la progettazione delle proteine, fornendo agli scienziati nuovi strumenti di ricerca.
Tradizionalmente i ricercatori ingegnerizzano le proteine modificando quelle presenti in natura, ma oggi si apre un intero nuovo mondo in cui è possibile progettare le proteine da zero. È iniziata l’epoca della biologia programmabile con tutta una serie di enormi potenzialità o opportunità, ma anche di rischi e problemi di natura etica.
La piegatura delle proteine con AlphaFold e le prospettive in termini di sviluppo di nuovi farmaci
Considerando il caso della piegatura delle proteine l’algoritmo di deep learning AlphaFold è in grado di prevedere in poche ore, partendo da un database di 170.000 strutture proteiche note, nuove strutture proteiche e la loro evoluzione a livello atomico con una precisione che oggi può essere raggiunta con sofisticate analisi cristallografiche. Fino ad oggi lo studio cristallografico di una proteina necessitava di molti anni di lavoro di un gruppo di ricercatori. Questa scoperta, realizzata attraverso la simulazione di modelli 3D delle proteine, apre straordinarie possibilità in termini di sviluppo di nuovi farmaci specifici per le singole patologie e anche di innovativi metodi per lo smaltimento dei rifiuti.
Il nuovo strumento ProteinMPNN
Il nuovo strumento ProteinMPNN, sviluppato da ricercatori dell’Università di Washington, aiuterà i ricercatori a risolvere il problema inverso. Se si ha già in mente una struttura proteica esatta, il sistema li aiuterà a trovare la sequenza di amminoacidi che si ripiega in quella forma. Il modello prende come input una struttura proteica e, in base alla sua architettura, predice nuove sequenze che si ripiegheranno secondo quello schema. Opzionalmente, è possibile eseguire AlphaFold sulla sequenza per verificare se le sequenze predette adottano la stessa architettura. Il sistema utilizza una rete neurale addestrata su un numero molto elevato di esempi di sequenze di amminoacidi che si ripiegano in strutture tridimensionali. L’apprendimento automatico renderà l’intero processo molto più rapido e semplice e consentirà ai ricercatori di creare proteine e strutture completamente nuove su scala molto più ampia. Gli algoritmi sono centinaia volte più veloci del miglior strumento precedente e richiedono un input minimo da parte dell’utente, abbassando potenzialmente le barriere di accesso alla progettazione di proteine.
I problemi dell’IA applicata alla previsione della struttura proteica
Ovviamente questi annunci, accanto ad una parte di verità, hanno anche un contenuto propagandistico. C’è un primo problema, se volete di natura epistemologica, che consiste nel dover accettare una previsione della struttura proteica senza aver a disposizione la verifica sperimentale. Possiamo, cioè, fidarci al 100% di quello che dice l’algoritmo anche in relazione al grado di accuratezza necessario. Sarebbe ipotizzabile provare a realizzare dei farmaci partendo da una simulazione del misfolding proteico?
Inoltre, ci troviamo di fronte ad una simulazione della struttura proteica, ma non siamo con questa metodologia in grado di dire nulla sulle regole che governano il piegamento delle proteine o dire qualcosa sulla sull’utilizzo concreto che la nuova proteina può avere. La realizzazione di farmaci specifici non può però, in linea di principio, essere basata solo sul modello di proteina piegata, perché la ricerca sta scoprendo che la forma delle proteine è solo un pezzo del ragionamento in quanto può portare a risultati non univoci perché proteine con strutture quasi uguali possono comportarsi chimicamente in maniera molto differente e strutture invece molto diverse possono comportarsi in maniera simile.
Conclusioni
Se, quindi questi risultati sono sicuramente interessanti e innovativi, tuttavia va ridimensionato il loro impatto sulla possibilità di produrre a breve dei farmaci specifici. In realtà questo è un passo in avanti significativo, ma probabilmente non così rivoluzionario come qualcuno potrebbe aver inteso. L’intelligenza artificiale ci aperto orizzonti nuovi, ma la strada da percorrere è ancora molta.