Si sente spesso affermare che l’informatica sta giocando un ruolo essenziale nello sviluppo rapido di un vaccino per il coronavirus umano (HCoV). Ma nonostante tutti gli osservatori concordino sul fatto che lo sviluppo tempestivo di un vaccino sia cruciale per alleviare l’impatto globale della malattia, molti sottolineano ostacoli da superare, tempi lunghi, costi degli investimenti. Ecco una panoramica dello status quo per capire perché la vaccinomica segni un cambiamento di paradigma verso una ricerca scientifica “on demand”. Già diventata priorità di organizzazioni internazionali e grandi enti filantropici come la Fondazione Bill Gates.
Vaccini: l’approccio tradizionale
Le tecniche di progetto in silico dei vaccini hanno segnato una profonda discontinuità con l’approccio tradizionale. Quest’ultimo inizia facendo esprimere l’antigene (il virus) in quantità sufficiente attraverso una coltura in provetta, cioè in vitro. Purtroppo, gli antigeni raccolti sul campo (anche se espressi in quantità sufficiente) possono non risultare poi buoni punti di partenza per il progetto di un vaccino; per questo ed altri motivi, il processo di sviluppo tradizionale richiede tempo. L’approccio basato sull’informatica promette di essere molto più rapido e di riuscire a sfruttare il tempo non illimitato che le tecniche di contenimento della diffusione del contagio basate su tracciamento e quarantena possono lasciare alla ricerca vaccinale.
Cominciamo con il ricordare che, come i virologi ci insegnano, il coronavirus umano (HCoV) appartiene alla famiglia dei virus che utilizzano un singolo filamento avvolto di RNA come materiale genetico. Si tratta del più grande genoma RNA virale noto, che comprende circa 30mila basi. Secondo la sierologia, che studia la modalità delle reazioni antigene-anticorpo, i coronavirus possono essere classificati in tre gruppi (I-III):
- i virus del gruppo I sono patogeni animali come il virus della diarrea epidemica suina e il virus infettivo felino della peritonite.
- I virus del gruppo II sono responsabili di infezioni negli animali domestici
- I virus del gruppo III sono responsabili dell’infezione nei polli e in varie specie avicole. Dal punto di vista immunologico, HCoV è vicino ai virus del gruppo I e del gruppo II. L’HCoV causa infezioni del tratto respiratorio superiore e in particolare la cosiddetta “polmonite atipica”, che può provocare un’insufficienza respiratoria acuta risultata letale in molti casi. Attualmente, non esiste alcun vaccino, ed a causa della diffusione pandemica della malattia, lo sviluppo di vaccini o farmaci antivirali è cruciale.
Come agisce la proteina “S”
Come abbiamo ricordato all’inizio, HCoV è un virus a RNA, che per moltiplicarsi si inserisce nel processo di trascrizione del materiale genetico dell’ospite. Questo inserimento va soggetto ad errori, ed introduce più frequentemente mutazioni nel materiale genetico del virus rispetto ai virus a DNA. Il genoma virale può essere visto come un piano costruttivo che codifica il progetto strutturale del virus; pertanto le mutazioni all’RNA modificano anche le proteine che l’RNA stesso codifica. Grazie alla tecnologia di sequenziazione del materiale genetico virale, oggi i ricercatori conoscono bene quali sono le principali proteine codificate nel genoma dei coronavirus.
Le proteine che contribuiscono alla struttura di tutti i coronavirus sono quattro: il picco o punta di lancia (S), l’inviluppo (E), la membrana (M) e il nucleocapside (N). Secondo la letteratura, le mutazioni genetiche si verificano principalmente nella codifica RNA della proteina S, che è fondamentale per la penetrazione del virus all’interno delle cellule dell’ospite. Queste mutazioni sono state indicate in letteratura come il meccanismo principale per il salto interspecifico del virus, che lo ha portato a diventare pericoloso per l’uomo. A parte il salto interspecifico, la variabilità della proteina S permette a HCoV di evadere con un certo successo le risposte immunitarie dell’ospite.
Nonostante questa variabilità, proprio le proteine S sono considerate da molti virologi quelle a maggior potenziale per la progettazione di un vaccino, a causa della loro capacità di indurre nel paziente vaccinato una risposta immunitaria più rapida e persistente rispetto a quella di altre proteine virali.
Parecchi degli sforzi di ricerca in corso verso un vaccino universale HCoV si sono quindi concentrati sulla proteina S come base per la individuazione di epitopi, ovvero pattern proteici che siano “invarianti”, non facilmente modificati dalle mutazioni dl genoma, e immunogeni neutralizzanti, cioè in grado di stimolare una risposta immunitaria che neutralizzi HCoV. Questi agenti immunogeni, una volta dimostrati non tossici per l’uomo, possono poi essere sintetizzati ed incorporati nei vaccini.
Il ruolo della vaccinomica
Per noi informatici, l’idea di base della vaccinomica è quindi semplice: usare algoritmi di pattern matching tridimensionale per progettare rapidamente in silico gli epitopi neutralizzanti da inserire nei vaccini. Questa strada è già stata seguita nella lotta al virus HIV; ad esempio, gli scienziati del progetto europeo EPI-VAC (compresi quelli del CNR italiano) hanno identificato proteine immunogene che causano la produzione di anticorpi neutralizzanti per l’immunodeficienza acquisita in vari modelli animali. Sebbene la progettazione di vaccini basati su epitopi sia una tecnica nota, nel caso specifico di HCoV non abbiamo ancora risultati efficaci. Il motivo sta nel tipo di risposta immunitaria che si intende stimolare, o meglio nel tipo di anticorpo che, una volta “addestrato” (cioè sagomato dal contatto con l’epitopo), dovrà diventare neutralizzante per quel particolare virus.
Tradizionalmente, i vaccini si basano soprattutto sull’addestramento delle cellule immunitarie di tipo B. Per il progetto di vaccini basati su epitopi, la ricerca si è orientata prevalentemente sulle cellule T (in particolare la cellula T-CD8). Il motivo di questa scelta è la persistenza nel tempo dell’immunizzazione. Con il tempo, qualsiasi antigene può essere “dimenticato” dal sistema immunitario; tuttavia, la risposta immunitaria dei linfociti T fornisce spesso un’immunità duratura.
Intuitivamente, quindi, ci sono tre criteri necessari ma non sufficienti perché un epitopo sia candidato a far parte di un vaccino: l’invarianza rispetto alle mutazioni del virus (ad esempio, perché presente in molti strain del virus raccolti sul campo): la capacità di sagomare efficacemente le cellule immunitarie: la persistenza della struttura dell’epitopo nella memoria del sistema immunitario a valle della somministrazione del vaccino, espressa come percentuale delle cellule immunitarie che risultano sagomate per neutralizzare il virus.
Matching fra epitopo e membrana della cellula
Per valutare informaticamente il primo e il terzo criterio, un candidato epitopo può essere rappresentato come una stringa monodimensionale (ad esempio KSSTGFVYF), ma per il secondo criterio, occorre una rappresentazione tridimensionale che permetta di quantificare l’adesività tra la struttura dell’epitopo e quella della membrana della cellula immunitaria prescelta per diventare neutralizzante. Semplificando, si può dire che tanto più “aderente” sarà questo matching, tanto più efficace sarà la neutralizzazione del virus. Si tratta quindi di un problema analogo a quello di cui abbiamo parlato in un articolo precedente a proposito dello sviluppo dei farmaci antivirali.
In letteratura sono già documentati candidati epitopi presi dalla proteina S e presenti in oltre il 65% delle proteine di picco sequenziate internazionalmente, che sono quindi buoni candidati per lo sviluppo del vaccino. Ovviamente questa percentuale deve essere rivalutata su base geografica, in modo da stimare la copertura di un possibile vaccino su una data popolazione.
Il fattore allergenicità
I tre criteri di cui abbiamo appena parlato sono necessari, ma non sufficienti per la selezione automatica di un epitopo. Infatti, la reazione del sistema immunitario stimolata dai vaccini è simile a una reazione “allergica” e può essere necessario escludere un (altrimenti buon) candidato epitopo a causa della sua eccessiva allergenicità.
Purtroppo, gli algoritmi per la previsione dell’allergenicità in silico sono ancora un argomento di ricerca. Oggi disponiamo solo di punteggi empirici (per fortuna facili da calcolare) che esprimono appunto la probabilità empirica che un candidato epitopo sia anche un allergene cross-reattivo, ovvero in grado di generare una risposta immunitaria multipla ad altri antigeni oltre che al virus. Secondo lo schema di valutazione FAO/OMS, un candidato epitopo è potenzialmente allergenico se presenta un’identità di almeno sei aminoacidi contigui o un’identità di sequenza > 35% su una finestra di 80 aminoacidi rispetto ad una libreria di allergeni noti. Tuttavia, la probabilità espressa da questi punteggi empirici va legata all’incidenza prevista della reazione allergenica nella popolazione, un compito non facile. Per questo motivo, la fase in silico della progettazione deve essere obbligatoriamente seguita da fasi in vitro e sul modello animale prima di arrivare alla sperimentazione umana.
“Il genio è uscito dalla lampada”
Secondo l’analisi di molti virologi, magistralmente espressa per il grande pubblico dalle recenti parole di Bill Gates, con HCoV “il genio è uscito dalla lampada”. La ricerca multidisciplinare rapida e urgente che la comunità scientifica sta cercando di mettere in atto per HCoV non è quindi un fatto eccezionale: si ripeterà, anche se non è facile dire con quale frequenza. Gli stessi scienziati e persino l’industria non sono abituati a lavorare in queste condizioni. I piani nazionali e internazionali di finanziamento e monitoraggio dell’attività di ricerca (come il Piano Nazionale per la Ricerca in corso di elaborazione in Italia), ed anche le principali università e i consorzi, si stanno adeguando per poter gestire la flessibilità richiesta dalla nascita improvvisa di aree di ricerca da cui può dipendere, letteralmente, il futuro dell’umanità.