Per gli addetti ai lavori, non è stata una sorpresa: il Nobel finalmente assegnato alla microbiologa francese Emmanuele Charpentier e alla chimica statunitense Jennifer Doudna per lo sviluppo della tecnica di editing genetico che usa la proteina batterica Cas9 (l’acronimo completo è CRISPR/Cas9) era atteso da vari anni. Le implicazioni etiche della tecnica e gli aspetti legali sulla priorità della scoperta e del brevetto hanno probabilmente rallentato la decisione per un Nobel che poteva anche suscitare polemiche e critiche, sebbene sembrasse ovvio assegnarlo ‘a tambur battente’. Come già accaduto nei decenni passati, ancora una volta i batteri ci hanno “regalato” nuova conoscenza genetica rivelandoci come siano sopravvissuti per miliardi di anni agli attacchi virali. L’enzima Cas9 è alla base di un meccanismo immunitario batterico totalmente nuovo e ha permesso di sviluppare uno strumento potentissimo per l’ingegneria molecolare dell’editing genetico.
Le cellule batteriche, ma anche quelle animali e vegetali, sono dei sacchetti pieni d’acqua e contengono milioni di molecole di vario tipo che interagiscono tra loro in modo molto specifico per produrre altre molecole più complesse, per degradarle in pezzi più piccoli da riutilizzare, per trasformare forme di energia da esterne a interne, per assorbire dall’esterno segnali e materiali ed emetterne altri. Durante lo scorso secolo abbiamo scoperto che un’importante classe di molecole, le proteine, è spesso in grado di continuare a funzionare anche quando separata dalla cellula viva, semplicemente in una provetta assieme a poche altre molecole. L’approccio riduzionista allo studio del fenomeno “vita” ci ha portato a smontare le varie componenti chimiche e biomolecolari e a scoprire che continuavano a muoversi “come la coda staccata di una lucertola”. E ci ha portato anche a scoprire il meccanismo del gene editing che funziona in provetta, oltre che nelle cellule vive.
Come siamo arrivati alla tecnica CRISPR/Cas9
Per giungere allo sviluppo della tecnica CRISPR/Cas9 sono state fondamentali molte scoperte e conoscenze acquisite dalla ricerca di base e vale la pena ricordarne brevemente alcune.
Negli anni Quaranta dello scorso secolo, Joshua Lederberg ed Edward Tatum (Yale UNiversity, USA; Nobel nel 1958) hanno scoperto che i batteri possono scambiarsi pezzi di DNA, un fenomeno detto di parasessualità perché aumenta la variabilità genetica. Vari geni possono essere trasferiti da batteri ad altri batteri nella forma di DNA circolare, il plasmide, in grado di replicarsi in modo autonomo rispetto al cromosoma principale del batterio. Questa scoperta può essere considerata il primo tassello del futuro puzzle della tecnologia del DNA ricombinante (anche detta ingegneria genetica alla base delle biotecnologie), un modo per ottenere batteri transgenici. Ma già nel 1928 il medico inglese Frederick Griffith aveva scoperto che i batteri della polmonite, gli pneumococchi, potevano essere trasformati geneticamente e resi “transgenici” grazie a una sostanza di natura chimica sconosciuta. Successivamente, nel 1944, Oswald Theodore Avery (Nobel sfiorato), Colin MacLeod e Maclyn McCarty (Rockefeller Institute, USA) avevano purificato chimicamente il DNA, dimostrando che corrispondeva alla sostanza che Griffith aveva misteriosamente chiamato principio trasformante (il termine principio si usava in genere in alchimia). Un secondo pezzo del puzzle è stato aggiunto nel 1953 con la scoperta del segreto della vita, la struttura della doppia elica del DNA, (Nobel a Francis Crick, James Watson e Maurice Wilkins nel 1962). La terza tessera del nascente puzzle è stata aggiunta negli anni Settanta con la scoperta degli enzimi di restrizione, proteine batteriche in grado di riconoscere brevi sequenze di DNA e di tagliarle, consentendo ai batteri di difendersi dai virus parassiti nemici tagliandone il DNA in tantissimi punti. Grazie a questa scoperta, nel 1978 fu conferito il Nobel per la Medicina a Werner Arber (Biozentrum di Basilea, Svizzera), Hamilton O. Smith e Daniel Nathans (Johns Hopkins University, USA). Gli enzimi di restrizione potevano anche essere usati come “forbici molecolari” per tagliare in provetta il DNA. Un quarto importante tassello è stato la scoperta delle DNA ligasi, enzimi in grado di riparare i tagli del DNA nei batteri e quindi di incollare pezzi di DNA anche in provetta. La scoperta fu realizzata da ben quattro gruppi guidati dai ricercatori – Gellert (Bethesda Labs, USA), Lehman (Stanford), Richardson (Bethesda Labs, USA) e Hurwitz (Albert Einstein College, NY, USA). Un quinto pezzo chiave del puzzle, una sorta di sintesi dei quattro precedenti, è stato lo sviluppo del clonaggio genico, articolato nell’isolamento di frammenti di DNA da una qualsiasi specie, nel taglio (con enzimi di restrizione) e nella loro fusione (con la ligasi) al DNA di plasmidi e poi nel trasferimento di queste molecole circolari plasmidiche di DNA chimerico in un batterio vivo, che diventa quindi OGM, geneticamente modificato. Il batterio produce una progenie di milioni di batteri tutti OGM e quindi replicatori del DNA plasmidico chimerico. Il clonaggio fu sviluppato nel 1973 da Robert B. Helling, presso la Stanford University (USA). Un altro fondamentale avanzamento nella costruzione del puzzle si è avuto con la scoperta di un metodo di sequenziamento dei frammenti di DNA clonati, cioè la determinazione della esatta successione delle migliaia di nucleotidi che compongono un gene. Questo metodo si basava ancora una volta sull’uso di un enzima batterico, la DNA polimerasi, e fu sviluppato da Frederick Sanger presso la Cambridge University (UK) nel 1977. Per inciso, nel 1980 a Sanger fu conferito il suo secondo Nobel per la chimica grazie a questa altra scoperta (unico ad aver ricevuto due Nobel in chimica).
Lo sviluppo delle tecnologie di sequenziamento del DNA
Tutte queste scoperte di microbiologia genetica, combinate alla chimica e alla biologia molecolare, hanno portato alla nascita della tecnologia del DNA ricombinante (DNA chimerico) e alla fondazione nel 1976 della Genetech, la prima azienda biotecnologica che produsse batteri transgenici contenenti un plasmide che esprimeva una proteina umana di grande interesse terapeutico, l’insulina, essenziale per i diabetici. Dopo la grande competizione tutta statunitense e durata 15 anni tra il laboratorio privato di Craig Venter e quello pubblico guidato prima da James Watson e poi da Francis Collins per sequenziare l’intero genoma umano, le tecnologie di sequenziamento del DNA si sono sviluppate enormemente, un po’ come quelle dei telefoni cellulari, diventando molto più potenti, rapide ed economiche. Il costo del sequenziamento di un genoma è passato da un miliardo di dollari ad appena mille dollari o anche meno. Inoltre, oggi il tempo di realizzazione di un progetto genoma è di pochi giorni ed è stato possibile sequenziare oltre 10.000 genomi di altrettanti singoli esseri umani e 120 genomi di altrettante specie di mammiferi, inclusi i nostri cugini primati.
Ci sono voluti 25 anni di ricerca di base prima che si riuscisse a capire che alcune sequenze ripetute (CRISPR) presenti nel genoma di vari batteri sono simili a sequenze virali e che servono come memoria in un sistema immunitario di nuovo tipo basato su un enzima batterico, la Cas9, in grado di tagliare il DNA, analogamente agli enzimi di restrizione, ma riconoscendo sequenze molto più specifiche perché più lunghe. Nessun finanziamento di ricerca applicata è stato alla base dello sviluppo della tecnica CRISPR/Cas9, ma solo finanziamenti per progetti scientifici di ricerca di base, finalizzati a comprendere fenomeni genetici naturali e soddisfare le curiosità degli scienziati.
A breve spiegheremo perché una maggior lunghezza di una sequenza nucleotidica riconosciuta conferisce una maggiore specificità nella ricerca del bersaglio da tagliare. La proteina Cas9 si lega a corte molecole di RNA a singolo filamento, dette RNA guida, che sono costituite da una sequenza costante importante per il legame alla proteina stessa e da una sequenza variabile di circa 20 nucleotidi che nel batterio è codificata dai geni CRISPR, di origine virale. Il DNA a doppia elica ha due filamenti complementari che si riconoscono in modo molto specifico anche dopo essere stati temporaneamente separati. Ciascuno dei due filamenti serve da stampo durante la duplicazione semiconservativa del DNA, ma anche durante il processo di trascrizione dei geni, quando viene polimerizzato un RNA complementare ad uno dei due filamenti del DNA. Quindi anche un filamento di RNA è in grado di appaiarsi con una sequenza complementare di DNA, ove presente. Ogni RNA messaggero sarebbe in grado, in via teorica, di riconoscere in modo molto specifico la sequenza di DNA che lo ha prodotto, perché ad essa complementare. E’ stato sorprendente scoprire che la proteina Cas9 usa molecole di RNA per cercare le sequenze di DNA complementari e tagliarle e ancor più sorprendente che può funzionare anche in cellule animali e vegetali, oltre che in quelle batteriche.
Il “lavoro” della proteina Cas9
Il 17 Agosto del 2012 le scienziate Doudna e Charpentier hanno pubblicato sulla rivista scientifica Science un articolo in cui hanno dimostrato che la proteina Cas9 purificata da batteri è in grado di funzionare anche in vitro (in provetta) tagliando una specifica sequenza di DNA la cui successione di basi era stata decisa da loro. La Cas9 è quindi un enzima di restrizione ri-programmabile a piacimento per tagliare qualsiasi sequenza di DNA, quindi potenzialmente qualsiasi gene di un genoma.
La proteina Cas9 nei batteri è una sorta di agente investigativo dotato anche di armi difensive. È come se fosse specializzata nella sorveglianza, avendo qualche nozione di matematica ed ovviamente di genetica: infatti, per svolgere questo lavoro sfrutta l’appaiamento delle coppie di basi delle due eliche del DNA. La Cas9 usa i corti pezzi di DNA virale che si ritrovano in un genoma batterico dopo un’infezione virale e che fungono da “memoria” dell’infezione virale. Questi pezzi sono trascritti dal batterio e vengono così trasformati in RNA guida che servono come una sorta di codice a barre per identificare i futuri virus invasori. L’identificazione del virus invasore avviene leggendo la sequenza del genoma virale e confrontandola con quella dell’RNA guida che il batterio si porta dietro nelle generazioni: una sorta di foto segnaletica o di impronta digitale per identificare il “criminale” che sta per uccidere il suo “padrone di casa”, il batterio. Dopo questo riconoscimento, la Cas9 taglia il DNA del virus, distruggendolo. Se la usiamo fuori dal suo contesto naturale, come hanno fatto le vincitrici del Nobel e poi altri loro colleghi, e la iniettiamo in cellule dotate di nucleo (eucariotiche) animali o vegetali, la Cas9 continua a fare il suo dovere di chiave-forbice del DNA in punti specifici: chiave, perché ha un RNA guida che apre il DNA solo in una sequenza specifica, forbice perché taglia solo dopo aver aperto, cioè aver riconosciuto il DNA. A differenza di quella procariotica, la cellula eucariotica può riparare il danno al DNA indotto dalla Cas9 (ad esempio agendo su un gene mutato da correggere), usando un secondo DNA di riferimento, magari artificiale esogeno, la cui sequenza corretta verrà ricopiata nel gene endogeno.
Ma come fa in dettaglio la Cas9 a trovare uno specifico gene in un DNA che ne contiene anche migliaia e tagliare solo e soltanto quello?
Noi sappiamo che il DNA a doppia elica è costituito da due filamenti di sequenze lineari di quattro nucleotidi (indicati con le lettere A, T, C e G) che si appaiano in modo complementare secondo le regole stereochimiche A:T (o T:A) e C:G (o G:C). Quindi alla sequenza TCCGGATAAT di un filamento corrisponde AGGCCTATTA del filamento complementare. Se lascio reagire in soluzione acquosa i due filamenti, essi preferiscono stare vicini ed appaiarsi in modo preciso secondo queste regole. Sono più stabili energeticamente. Se riscaldo la soluzione acquosa, i filamenti si separano, se la lascio raffreddare si appaiano di nuovo. L’appaiamento dei nucleotidi anche di corte sequenze di DNA sintetizzate chimicamente in vitro è chiamato ibridazione molecolare ed è un fenomeno che ricalca quanto succede anche nella cellula viva quando il DNA si denatura localmente per esprimere informazioni o per duplicarsi per poi ri-appaiarsi. La scoperta della ibridazione molecolare tra i filamenti del DNA in provetta (denaturazione e rinaturazione del DNA scoperte dal biologo polacco Julius Marmur nel 1962) è risultata utile ai genetisti che hanno sviluppato una serie di tecnologie per la ricerca, inclusa la rivoluzione del DNA ricombinante di cui vi ho parlato prima. Ad esempio, la ibridazione molecolare è utile
- per incollare pezzi di DNA in modo ordinato (tagliati in provetta in punti specifici da enzimi di restrizione, le proteine batteriche naturali già menzionate che, una volta purificate, funzionano anche in vitro, cioè in provetta),
- per localizzare specifici geni su cromosomi (ibridazione in situ) o per isolarli da tutto un genoma (ibridazione su librerie genomiche), per comprendere su quale dei cromosomi di cellule umane si trova uno specifico gene (ibridazione in situ),
- per determinare la sequenza del DNA,
- per amplificare sequenze di DNA o RNA specifiche mediante un’enzima, la DNA polimerasi estratta da un batterio termofilo e in grado di resistere a 100°C per ore (tecnica della PCR, usata ed esempio anche per rilevare la presenza di virus in tamponi naso-faringei o identificare un potenziale criminale sulla base di tracce biologiche lasciate sulla scena del delitto).
Anche le molecole di RNA messaggero (mRNA) che servono a produrre proteine sono complementari alla sequenza di uno dei due filamenti di DNA di uno specifico gene. Il messaggio informazionale presente nel gene che serve a produrre una specifica sequenza di aminoacidi, la proteina, viene ricopiato in mRNA dalla RNA polimerasi.
La natura combinatoriale ed informazionale del DNA
Dopo questa digressione sulla biologia molecolare dell’appaiamento, della complementarità del DNA e dell’RNA e della loro capacità di formare ibridi stabili anche in provetta, passiamo a descrivere la natura combinatoriale ed informazionale del DNA, che ci aiuterà a comprendere come la proteina Cas9 riesce a trovare il punto giusto per indurre il gene editing.
Utilizzando una metafora numerica, cercheremo di spiegare la specificità del sistema genetico “dando i numeri”: immaginiamo che io batta a caso sulla tastiera velocemente ed ottenga una sequenza casuale di cifre (0-9).
784378834219857329873892794875437839243765437867843167854361756437564378165783580431754318576543678543678054637805640
Scegliamo ora un numero a caso a due cifre, ad esempio 82:
Cerchiamolo nella successione casuale scritta sopra: lo troviamo due volte.
Ripetiamo questa operazione con un altro numero a due cifre, ad esempio 12. Questo non è presente nella nostra successione casuale .Invece 21 è presente una sola volta, così come 94. Mentre 49 non c’è.
Volendo fare una previsione, possiamo chiederci qual è la probabilità di trovare una sequenza di 4 numeri scelti a caso, ad esempio 2335, in una successione di cifre, questa volta infinita. Ogni posizione vale 1/10, cioè se estraggo un numero a caso da un “panariello” della tombola napoletana contenente solo dieci numeri (da 0 a 9) ho la probabilità di 1 su 10 di estrarre 0, così come di estrarre 1, 2 e così via. Se ributto dentro il numero estratto e ripeto l’estrazione ho esattamente le stesse probabilità. La matematica ci dice che la probabilità che esca la sequenza 2335 è pari al prodotto delle singole probabilità: 1/10 x 1/10 x 1/10 x 1/10 = 1/10.000. Quindi ci si aspetta che successione delle cifre 2335 sia estratta ogni 10.000 estrazioni di 4 numeri.
Allo stesso modo, possiamo chiederci qual è la probabilità di trovare la sequenza TCCGGATAAT di dieci nucleotidi in un genoma. Presupponendo che vi sia piena libertà di composizione della sequenza lineare, ciascuna lettera (A, T, G, C) in ogni posizione nella stringa di 10 ha probabilità di 1 su 4 (¼) e quindi, moltiplicando dieci volte questo numero, otteniamo 1/1.048.576. Se il genoma è lungo ad esempio 100 milioni di nucleotidi, potremmo trovare al suo interno circa 100 volte la stringa TCCGGATAAT. Nel genoma umano lungo oltre 3 miliardi di nucleotidi la troveremmo circa 3000 volte, in vari punti sui 23 cromosomi.
La Cas9 è in grado di tagliare il DNA solo in punti specifici che vengono riconosciuti grazie ad un “primer di 20 nucleotidi” fatto di RNA a singolo filamento (RNA guida) che si appaia con un solo gene presente in un punto specifico di un cromosoma, riconoscendolo tra le migliaia di geni presenti nel genoma.
La Cas9 e l’induzione di eventi di gene editing
L’enzima batterico è programmabile in vitro per colpire qualsiasi gene, perché può montare dentro di sé un RNA guida artificiale (prodotto mediante sintesi chimica) che abbia una qualsiasi sequenza genica scelta da noi sulla base delle sequenza dell’intero genoma della specie di interesse (anche umana). Dato che conosciamo il genoma umano, e tantissimi geni che se mutati causano malattie genetiche, possiamo programmare la Cas9 con RNA sintetici che siano complementari a uno dei geni di interesse e indurre eventi di gene editing. Il danno al DNA in un gene specifico, causato dalla Cas9 introdotta artificialmente nella cellula, può essere riparato in modo approssimativo e causare una perdita della funzione di quel gene. Questo aspetto è molto interessante per studiare funzioni genetiche in organismi modello (moscerini, topi, piante, etc.) in laboratorio. Ma ancora più interessante è la capacità delle cellule eucariotiche di riparare il danno al DNA iniettando un altro DNA molto simile (omologo) al gene colpito e che la cellula e i suoi enzimi di riparazione usano come riferimento. Quindi se io inietto all’interno di una cellula la Cas9 con un RNA guida che riconosce un gene mutato per l’emoglobina, importante trasportatore di ossigeno presente nei globuli rossi e quindi nel sangue, e inietto anche un corto segmento di DNA che contiene la versione funzionante dello stesso gene, la cellula riparerà il danno del gene mutato. Alcune cellule umane possono essere estratte dal corpo, curate geneticamente e re-introdotte nel corpo per fornire la funzione che mancava e curare la malattia. Questa terapia viene detta somatica perché riguarda le cellule del corpo non riproduttive e la cura genetica non viene trasmessa alla progenie.
Sfortunatamente la maggior parte delle malattie genetiche non può essere curata in questo modo. È necessario modificare i geni mutati quando il futuro essere umano è ancora ai suoi primordi, cioè quando è ancora costituito da una o poche cellule, dopo la fecondazione condotta in vitro. Solo così tutte le sue cellule avranno le due copie del gene editato e corretto nella sequenza funzionante detta dai genetisti “selvatica”.
Usando spermatozoi e cellule uovo (gameti) prelevati dai due genitori, è possibile osservare la fusione dei gameti aploidi, ciascuno con 23 cromosomi, e la formazione di una prima cellula diploide che contiene 46 cromosomi nel suo nucleo, tecnica nota come fecondazione in vitro. Ma questa prima cellula, un embrione ancora in embrione, potrebbe tragicamente avere due mutazioni di una seria malattia genetica di cui sono portatori i genitori. Attualmente è possibile sapere con la metodica della PCR e del sequenziamento se quella cellula si svilupperà in 9 mesi in un bimbo di miliardi di cellule, tutte con i due geni mutati e quindi sarà ad esempio anemico e vivrà grazie a trasfusioni solo fino ai 40 anni, oppure sarà cieco, o predisposto a forme gravi di infezioni virali. I genitori potrebbero decidere di non impiantare quella cellula fecondata in vitro e sceglierne una seconda che invece porti ad esempio almeno una copia del gene funzionante. Il bimbo in questo caso sarà solo portatore sano. Ma esiste una seconda possibilità: curare geneticamente la prima cellula fecondata affinché si sviluppi un embrione e nasca un bambino con le due copie del gene funzionanti, la cosiddetta terapia che include anche la linea cellulare germinale (cellule riproduttive). La modifica genetica in quella prima cellula verrà ereditata da tutte le successive cellule che si produrranno per divisione mitotica grazie alla fedele duplicazione del DNA. Il bimbo diverrà un adulto sano per quella malattia genetica e poi potrà essere un genitore e avere figli sani. In tal modo verrà interrotta la trasmissione della malattia genetica nella discendenza di quell’individuo.
I problemi etici, religiosi e legali della Cas9
Ma questa tecnologia può essere usata anche per conferire un vantaggio a individui sani, come alle gemelline cinesi editate Lulu e Nana che hanno il padre malato di HIV per proteggerle dalla infezione che eventualmente potrebbe avvenire nella madre durante il concepimento oppure durante la vita futura di ciascuna di loro, dato l’incremento annuo del 12-14% di infezioni da HIV in Cina. Potrebbe essere usata per rendere soldati più resistenti a malattie infettive (come suggerito da Putin), individui più abili in particolari attività cognitive di cui si conoscano varianti geniche positive, individui più forti, con ossa più resistenti e più longevi, per impedire l’insorgere della demenza senile, etc. etc.
Ecco, quindi, che la Cas9 suscita problemi etici, religiosi e anche legali. È eticamente accettabile che possa venire cambiata l’informazione genetica presente nel genoma umano in modo irreversibile per le generazioni future, al fine di curare malattie genetiche ereditarie? I cambiamenti genetici nelle sole cellule somatiche risultano più facilmente accettabili, anche da parte di commissioni di studio di varie estrazioni religiose.
Utilizzando la Cas9 si possono modificare tante altre specie, oltre quella umana, per tanti altri scopi. Le varie società europee saranno disposte a comprare e consumare mele o riso modificati geneticamente con la Cas9 ad esempio per resistere ai cambiamenti climatici o agli insetti dannosi usando meno pesticidi?
Conclusioni
Dato la diffusa e irrazionale paura del mais o della soia geneticamente modificati, è prevedibile che ci sarà resistenza.
Ma la cura con gene editing di malattie genetiche umane gravi avrà strada breve per farsi accettare dal vasto pubblico, specialmente se operata solo sulle cellule somatiche e non in quelle riproduttive e soprattutto se servirà a prevenire le diffusissime malattie cardiocircolatorie (modificando geni delle cellule del fegato), varie forme di tumore ereditario, reazioni avverse letali a farmaci o ad anestetici (modificando geni per allergie) o a infezioni virali come il covid-19 per la Sars-CoV-2. È necessario ed urgente, quindi, da una parte informare la società in modo capillare e scientificamente corretto della nuova tecnologia e delle sue applicazioni, aprire dibattiti pubblici con esperti di vari campi, inclusi quello bioetico, filosofico e religioso, dall’altra continuare a finanziare progetti ricerca di base di qualità. Bisognerà evitare di dare troppo spazio ai progetti che pretendono di essere applicativi a breve o a lunga scadenza, perché difficilmente portatori di nuove conoscenze e di un concreto ritorno utilitaristico-industriale ed economico, come ci hanno insegnato gli ultimi decenni di progetti finalizzati e questo ennesimo successo della ricerca di base: la CRISPR/Cas9.
Ringraziamenti e risorse per approfondimenti:
L’autore ringrazia i professori di Genetica Luciano Gaudio e Serena Aceto del medesimo Ateneo per le utili discussioni, i suggerimenti e l’editing del testo.
Per approfondire la disciplina della Genetica si può accedere anche gratuitamente al corso dell’autore su piattaforma EdX in collaborazione con FedericaX.