AlphaFold 3, da poco rilasciato da Google Deepmind, sembra avere tutte le carte in regola per rivoluzionare il campo della biologia computazionale: non solo offre significativi progressi nella predizione della struttura delle proteine, ma apre anche nuove frontiere’esplorazione di farmaci innovativi.
Tuttavia, AlphaFold 3 porta con sé una serie di sfide e interrogativi. Mentre la comunità scientifica si prepara ad affrontare i limiti del modello e le implicazioni dell’utilizzo dell’intelligenza artificiale in biologia, è fondamentale comprendere l’architettura evolutiva di AlphaFold 3 e l’impatto dei suoi miglioramenti rispetto alle versioni precedenti.
Piegamento delle proteine: i passi avanti grazie al deep learning
Il piegamento delle proteine (proteine folding) è sempre stato un problema considerato quasi irresolubile nella biologia e nella biochimica. Qualcuno (Chemestry World) si era addirittura spinto a consideralo il Sacro Graal della Chimica. Le proteine sono fondamentali per la vita e la comprensione della loro forma è vitale per lavorare con loro.
Questi sviluppi, secondo alcuni, potrebbero far compiere un progresso all’umanità che può essere stimato in termini di tempo in due o tre decenni. Questo è un risultato che potenzialmente può costituire per la biologia e la biochimica una scoperta confrontabile con quella della penicillina e degli antibiotici potrebbe essere in grado di rivoluzionare molti ambiti connessi con la biologia e la biochimica.
Infatti, il deep learning sta rendendo possibile la progettazione delle proteine, fornendo agli scienziati nuovi strumenti di ricerca. Tradizionalmente i ricercatori ingegnerizzano le proteine modificando quelle presenti in natura, ma oggi si apre un intero nuovo mondo in cui è possibile progettare le proteine da zero. È iniziata l’epoca della biologia programmabile con tutta una serie di enormi potenzialità o opportunità, ma anche di rischi e problemi di natura etica.
AlphaFold 3: il nuovo strumento di previsione biologica
Con il rilascio di AlphaFold 3, Google DeepMind ha fatto un grande passo avanti nel campo della biologia computazionale una versione migliorata del suo strumento di previsione biologica. Questa nuova versione estende la capacità del modello di prevedere le strutture non solo delle proteine, ma anche del DNA, del RNA e di altre molecole come i ligandi, che sono fondamentali per la scoperta di nuovi farmaci. La capacità di modellare una gamma così ampia di elementi della vita biologica promette di accelerare significativamente la ricerca scientifica, comprese le indagini su colture resilienti e nuovi vaccini.
Mentre il modello precedente, rilasciato nel 2020, aveva già impressionato la comunità di ricerca con la sua abilità nel prevedere le strutture delle proteine, l’esigenza di gestire più tipi di molecole era chiaramente presente. Ora, AlphaFold 3 risponde a questa esigenza con una rappresentazione più sfumata e dinamica delle interazioni molecolari rispetto a qualsiasi strumento disponibile precedentemente.
AlphaFold 3 e la scoperta di farmaci: un nuovo approccio
Uno dei principali vantaggi di AlphaFold 3 è il suo utilizzo nella scoperta di farmaci. La versione precedente era limitata alla conoscenza delle aminoacidi, ma AlphaFold 3 può prevedere dove un farmaco si lega a una proteina, ampliando enormemente le sue applicazioni.
Isomorphic Labs, uno spin-off di DeepMind dedicato alla scoperta di farmaci, sta utilizzando il modello per sviluppare nuovi trattamenti per le malattie, in collaborazione con aziende farmaceutiche. Questo rende il sistema molto più utile, particolarmente per la ricerca di farmaci nelle fasi iniziali. Nonostante le notevoli potenzialità, la precisione di AlphaFold 3 varia a seconda dell’interazione che viene modellata, con un’accuratezza che va dal 40% all’80%.
Questo significa che in alcuni casi, AlphaFold 3 serve solo come un punto di partenza prima di passare ad altri metodi. Per esempio, per le interazioni tra proteine e RNA, il modello è ancora molto impreciso.
Per gestire una gamma più ampia di input, sono stati necessari miglioramenti all’architettura sottostante di AlphaFold 3.
I metodi di diffusione, che alimentano generatori di immagini e video come DALL-E 2 e Sora, sono stati adottati per addestrare il modello a partire da un’immagine “rumorosa”, riducendo i disturbi progressivamente fino a ottenere una previsione accurata. Questo ha rappresentato un’evoluzione significativa rispetto al modello precedente, semplificando i legami tra diversi atomi.
Limiti e sfide di AlphaFold 3
Tuttavia, l’uso delle tecniche di diffusione presenta rischi, come la possibilità per il modello di “allucinare” strutture plausibili ma non realistiche. Questo rischio è stato ridotto aggiungendo più dati di addestramento nelle aree più inclini a queste allucinazioni, anche se il problema non è completamente eliminato. Inoltre, l’accesso a AlphaFold 3 è più limitato rispetto al suo predecessore. Mentre il codice di AlphaFold 2 era open-source, per la versione 3, non ci sono piani attuali per rilasciare il codice completo. Invece, è stata offerta un’interfaccia pubblica chiamata AlphaFold Server, che impone limitazioni sull’uso delle molecole e restringe l’utilizzo a scopi non commerciali. Questa scelta impone limitazioni significative, rendendo il principale vantaggio di AlphaFold 3, la sua capacità di prevedere interazioni proteina-piccole molecole, praticamente indisponibile per l’uso pubblico.
AlphaFold 3 è una testimonianza del rapido progresso nel campo dell’intelligenza artificiale applicata alla biologia. Con il suo potenziale di accelerare la ricerca e la scoperta di farmaci, rappresenta un passo avanti nel tentativo di comprendere e manipolare la complessità della vita a livello molecolare. Nonostante le sfide e le limitazioni, l’evoluzione di AlphaFold dimostra come strumenti avanzati di modellazione possano trasformare il campo della biologia, offrendo nuove opportunità per combattere malattie e migliorare la salute globale.
L’evoluzione dell’architettura di AlphaFold 3: miglioramenti e rischi
Solo il tempo dirà quali nuove scoperte AlphaFold 3 porterà, ma è chiaro che il suo impatto sarà profondo e duraturo. Ovviamente, bisogna tenere conto anche del rovescio della medaglia. C’è un primo problema, se volete di natura epistemologica, che consiste nel dover accettare una previsione della struttura proteica senza aver a disposizione la verifica sperimentale. Possiamo, cioè, fidarci al 100% di quello che dice l’algoritmo anche in relazione al grado di accuratezza necessario. Sarebbe ipotizzabile provare a realizzare dei farmaci partendo da una simulazione del misfolding proteico?
Inoltre, ci troviamo di fronte a una simulazione della struttura proteica, ma non siamo con questa metodologia in grado di dire nulla sulle regole che governano il piegamento delle proteine o dire qualcosa sulla sull’utilizzo concreto che la nuova proteina può avere. La realizzazione di farmaci specifici non può però, in linea di principio, essere basata solo sul modello di proteina piegata, perché la ricerca sta scoprendo che la forma delle proteine è solo un pezzo del ragionamento in quanto può portare a risultati non univoci perché proteine con strutture quasi uguali possono comportarsi chimicamente in maniera molto differente e strutture invece molto diverse possono comportarsi in maniera simile. Se, quindi questi risultati sono sicuramente interessanti e innovativi, tuttavia va ridimensionato il loro impatto sulla possibilità di produrre a breve dei farmaci specifici per le malattie da misfolding proteico.
Conclusioni
L’intelligenza artificiale ci ha fornito uno strumento in più per operare nel campo di queste malattie, ma la creazione di farmaci efficaci è ancora lontana nel tempo. In realtà questo è un passo in avanti significativo, ma probabilmente non così rivoluzionario come qualcuno potrebbe aver inteso. L’intelligenza artificiale ci aperto orizzonti nuovi, ma la strada da percorrere è ancora molta.