La possibile convergenza tra intelligenza artificiale, robotica e biologia sintetica promette sorprese, innovazioni e forse anche grandi rischi che occorre valutare per tempo.
Ma come si svilupperà questa sinergia tra mondi e tecnologie apparentemente distanti?
Partiamo da un aneddoto.
Biologia sintetica, programmare le cellule come un Pc: sviluppi allettanti e scenari distopici
Dal silicio al Dna-Recode: ecco il futuro della biologia sintetica
Juan Enriquez, esperto di bioeconomia, in uno dei suoi TED talk, descrive una scena chiave del film “Il Laureato” con Dustin Hoffman, che recita la parte del protagonista: siamo negli anni sessanta, la festa per il giovane laureato è in corso in una bella villa americana, e un ricco e affermato amico di famiglia lo prende sotto il braccio, lo porta nel giardino sui bordi di una piscina per dargli un consiglio segreto sull’avvenire del business nel mondo e gli dice, guardandolo dall’alto in basso, data la differenza di statura tra i due, una sola parola: “Plastica”. Ma, osserva Juan Enriquez, questa predizione era sbagliata poiché negli anni sessanta avrebbe dovuto dire “Silicio”. Infatti, in quegli anni i semiconduttori erano stati appena brevettati, e si avvicinava l’era dei microchip, nasceva la Intel e poco dopo la Apple in quella che sarebbe diventata poi la Silicon Valley. Enriquez ci racconta in questo suo TED del lontano 2015, di come, se la medesima scena del film fosse riproposta ai giorni nostri, la parola chiave da dire a un giovane laureato, avrebbe dovuto essere Lifecode (codice della vita, cioè DNA e codice genetico).
In effetti, considerando che dal 2012 siamo in grado di fare modifiche genetiche molto più precise e direttamente in vivo grazie alla CRISPR/Cas9, iniziando in qualche modo ad essere in grado di riprogrammare la vita, oggi l’espressione magica che descrive il futuro prossimo dovrebbe essere Dna-Recode (ricodifica del DNA), visto che la biologia sintetica sta aprendo la strada allo sviluppo ad esempio di nuovi tipi di batteri o di lieviti ricodificati nel loro DNA, quasi al punto di poterli considerare nuovi organismi. Inoltre, il silicio e il DNA sono stati fisicamente uniti in un unico dispositivo, pietra miliare della cosiddetta biologia sintetica.
Già a fine secolo scorso, è stato sviluppato un chip genetico dell’Affimetrix, un microchip con tanti piccoli pezzetti di DNA artificiale, ordinati in file e colonne, come in uno schema da battaglia navale. I piccoli filamenti di DNA artificiale hanno ciascuno una specifica sequenza e sono complementari a specifici geni umani (si appaiano a formare il DNA a doppia elica secondo le regole dette di Watson-Crick). Le ibridazioni in soluzione acquose con brevi segmenti di DNA naturali o artificiali permettono di condurre estese analisi genetiche su scala genomica in poche ore.
DNA, un piccolo ripasso
La vita cellulare è fatta da atomi e molecole (DNA, RNA, proteine, etc.) che rispondono alle leggi della fisica e della chimica. Pertanto, il loro comportamento e le loro mutue interazioni possono essere descritti, in via di principio, con espressioni matematiche e, per aspetti specifici (codice genetico, trascrizione, traduzione, duplicazione), con approcci tipici dell’informatica, secondo l’uso dell’analogia del mondo dei computer. Il DNA è la molecola chimica più complessa che sia mai stata descritta, se teniamo conto delle enormi dimensioni dei suoi filamenti formati da atomi covalentemente legati, della complementarità tra coppie di basi (monomeri) che genera l’associazione di due filamenti, della sua caratteristica struttura tridimensionale a doppia elica, e dei legami deboli tra le due eliche e dei legami forti tra i monomeri di ciascuno dei due filamenti. La sequenza delle basi nei filamenti del DNA costituisce l’informazione genetica che viene conservata e tramandata in maniera pressoché fedele, con l’eccezione di rare mutazioni, ad ogni duplicazione operata dalla cellula che lo contiene.
La magia della vita risiede anche nel fatto che possiamo estrarre il DNA, conservarlo in soluzioni acquose, separare le due eliche aumentando ad esempio la temperatura (denaturazione) ed osservare come il DNA si auto-organizza di nuovo nella doppia elica ordinata, quando la temperatura si abbassa (rinaturazione).
La sua struttura chimica tridimensionale prescinde dalle interazioni con altre biomolecole (ad esempio le proteine), dal luogo in cui naturalmente risiede, e dal tipo di cellula (sia essa batterio, cellula vegetale, fungina o animale). Inoltre, è sorprendente la combinatorialità del DNA (ogni posizione lungo ogni elica può essere una di 4 basi azotate, o nucleotidi) e la specificità di interazioni tra le due eliche (appaiamenti deboli tra A/T e tra C/G). La probabilità che un piccolo frammento di DNA artificiale di 20 nucleotidi con una sequenza causale dei quattro nucleotidi, sia complementare ad una specifica sequenza dell’intero genoma umano è dell’ordine di 1 su un trilione (uno su mille miliardi). Considerato che il genoma umano è lungo 3.5 miliardi di basi, questa probabilità è molto bassa (1/1000 circa) e quindi basta un frammento artificiale di DNA di 20 nucleotidi per identificare una specifica sequenza nel genoma ed eventualmente quindi una specifica funzione genica normale oppure mutata (cambiamento parziale della sequenza nucleotidica in quel punto).
La possibilità di condurre denaturazioni e rinaturazioni del DNA in vitro è una eccezionale caratteristica di questa molecola naturale, ed è alla base di quasi tutte le innovazioni tecnologiche in genetica degli ultimi decenni. Ecco quindi che abbiamo strumenti molecolari come brevi segmenti di DNA artificiale (sintetizzati chimicamente e contenenti specifiche sequenze da stabilire a priori, ad un costo di pochi euro), le loro ibridazioni in vitro su DNA naturale bersaglio, e le tecniche di fluorescenza per rilevare le avvenute interazioni, per sondare genomi e cercare malattie genetiche, studiare espressioni di geni, diagnosticare la presenza di sequenze virali, etc.
Che cos’è la biologia sintetica
La biologia sintetica è una branca della biologia che si dedica a smontare e rimontare i moduli molecolari base che compongono la vita cellulare. Essa mira a ottenere in vitro sistemi artificiali enzimatici oppure in vivo organismi viventi modificati in grado di svolgere ad esempio funzioni biochimiche per produrre specifiche molecole utili. Altro scopo può essere ad esempio ottenere regolazioni genetiche, affinchè il sistema cellulare riprogrammato risponda ad esempio a stimoli fisico-chimici esterni. La denominazione “biologia sintetica, usata per la prima volta oltre 100 anni fa, sta anche ad indicare un approccio per descrivere e riprodurre la vita in termini fisico-chimici. A partire dagli anni settanta-ottanta dello scorso secolo, dopo l’emergere delle tecnologie del DNA ricombinante, ha iniziato un’accelerazione che è diventata esponenziale nel nuovo millennio, anche grazie alle nuove tecnologie di sequenziamento genomico (DNA) e trascrittomico (RNA) (NGS – Next Generation Sequencing) e di sintesi chimica di brevi segmenti di DNA artificiale.
Un passo indietro…all’origine della vita sul nostro Pianeta
Ma cerchiamo di capire la mentalità di un moderno biologo sintetico e il modo in cui vede il fenomeno vita e ne sfrutta i meccanismi.
L’origine della vita sul nostro pianeta che risale ad almeno 3.8 bilioni di anni fa è dipesa dall’originarsi delle biomolecole informazionali, a stringa lineare di monomeri, quali l’RNA, il DNA e le proteine. Queste biomolecole sono essenzialmente costituite da soli 6 tipi di atomi (idrogeno, ossigeno, carbonio, azoto, zolfo e fosforo) che sono, non sorprendentemente, tra i più abbondanti nell’universo – molti scienziati ritengono, come il filosofo nolano del 500 Giordano Bruno, che vi sia vita, forse simile alla nostra, in altri pianeti.
Queste macromolecole biologiche sono entità informazionali, perchè contengono “informazione” nella specifica successione di monomeri. Anche nei software dei computer, l’informazione è codificata da stringhe lineari di 0 e di 1 del linguaggio macchina.
L’emergere di queste particolari sostanze chimiche lineari sta divenendo sempre meno un mistero. Esperimenti in vitro indicano che le prime molecole possano essere state gli RNA, perchè in grado di funzionare anche da catalizzatori e da enzimi. Gli RNA sono relativamente brevi molecole lineari a singolo filamento e sono in grado di prendere diversissime strutture tridimensionali, grazie ad appaiamenti specifici mediante legami deboli, tra segmenti distanti nella medesima molecola (interazioni intramolecolari). Anche le proteine realizzano interazioni intramolecolari tra aminoacidi distanti nella stringa, e prendendo una forma tridimensionale dettata da interazioni deboli e legami più forti (i ponti disolfuro realizzati da due aminoacidi di cisteine che contengono gli atomi di zolfo che formano questi legami). Come le nuvole possono formare infinite forme tra cui ad esempio quella di una mega-chiave inglese che al tramonto incastra la luna, anche gli RNA possono sbizzarrire la “loro fantasia molecolare. Ma a differenza delle nuvole che sono uniche e transitorie, specifiche forme di RNA possono essere ripetute: infatti gli RNA non solo hanno una loro specifica identità dettata dalla loro sequenza lineare di nucleotidi ma anche una forma tridimensionale dettata dalla sequenza primaria e quindi dagli appaiamenti tra G e C e tra U (che sostituisce T nell’RNA) e A di brevi regioni anche solo parzialmente complementari. Alcuni gruppi di RNA hanno specifiche sequenze e strutture tridimensionali tali che sono in grado di catalizzare la loro stessa sintesi (RNA autocatalitici), perchè in grado di formare network di interazioni tra loro che permettono la sintesi di ciascun elemento e che evolvono nel tempo secondo meccanismi darwiniani di mutazione casuale e selezione naturale.
Nobel per la CRISPR/Cas9: cos’è il gene editing, come ci siamo arrivati e dove ci porterà
La biologia sintetica e la ricerca sulle prime fasi della origine della vita pre-cellulare
La ricerca chimica si sta interessando da decenni in laboratorio a questi fenomeni per tentare di comprendere le prime fasi della origine della vita pre-cellulare, cioè dei meccanismi molecolari di sintesi, duplicazione ma anche variazione di molecole informazionali, Questa fase di pre-vita è stata dominata da primi eventi di sintesi pre-cellulare per poi divenire, con la comparsa delle cellule, sintesi biologica di unicellulari e pluricellulari, vera a propria.
L’interesse in questo campo della biologia sintetica non è solo dovuto al fatto che si propone di comprendere tra l’altro l’origine della vita, ma anche al crescente valore economico che stanno acquisendo le company che vi si dedicano. Nel 2020, hanno raggiunto un valore di 6 miliardi di dollari e nei prossimi 6 anni raggiungeranno i 28 miliardi. Lo scorso settembre la sola Ginko Bioworks, tra le prime top ten, è stata quotata in borsa con un valore stimato di ben 15 miliardi di dollari.
Ginko Bioworks e la ricerca su Sars-Cov-2
Volete un esempio recente molto calzante? È grazie al sequenziamento di un RNA lungo 30.000 nucleotidi, corrispondente al nuovo virus Sars-Cov-2 e la sua pubblicazione su internet ad inizio del 2020 che è stato possibile sviluppare in varie altre nazioni immediatamente test diagnostici molecolari basati su PCR. La PCR necessita di piccoli (segmenti di DNA circa 20 nt) a singolo filamento (detti primers), sintetizzati artificialmente e con specifica sequenza che riconosce quella del virus appaiandosi in modo reversibile con legami idrogeno secondo le regole dette di Watson-Crick.
La Ginko Bioworks promette di sviluppare soluzioni biologiche e/o biomolecolari per problemi tra i più disparati, dalla medicina alla cosmetica. Tra le varie attività, questa company di biologia sintetica sta anche monitorando il Sars-Cov-2 nella scuole statunitensi con una semplice strategia per ridurre i costi, il “pooling”: si raccolgono ad esempio 30 campioni d 30 studenti di una classe, si realizza un primo singolo test molecolare su un unico campione mescolato di tutta una classe, e, se risulta positivo, si ripete il test su ciascuno dei 30 campioni iniziali per identificare lo studente o gli studenti infetti. Si possono così ridurre i costi di almeno 7-8 volte. La Ginko Bioworks, ha una sua piattaforma automatizzata per il design e la realizzazione di organismi con nuovi abilità biosintetiche nella produzioni di nuove molecole e materiali. L’uso di database proprietari dii sequenze genetiche, proteiche e di relative funzioni svolte, di machine learning ed intelligenza artificiale, permette il design di nuovi moduli genetici e di nuove combinazioni di segmenti di biomolecole per raggiungere nuovi obiettivi, quali ad esempio di un nuovo pathway biochimico per la sintesi di prodotti innovativi, in medicina o in agricoltura e che siano commercialmente competitivi.
Biobits e i kit di genetica molecolare per le scuole
Nel mondo del “innovative education” la company Biobits ha realizzato kit scolastici economici di genetica molecolare grazie alla biologia sintetica, ad esempio per visualizzare le successioni temporali di reazioni di espressione genica (DNA>mRNA) e sintesi proteica (mRNA->proteina) grazie estratti cellulari liofilizzati in provetta e fluorescenze con verde per mRNA e rosso per proteina. A breve forse vedremo lo sviluppo di test per Covid e altri virus, basati su lecca lecca che cambiano colore.
Twist Bioscience
La Twist Bioscience ha sviluppato un metodo per sintetizzare molecole di DNA a singolo filamento direttamente su punti specifici ed ordinati di un microchip di silicio. Questo permette di miniaturizzare volumi di reazioni enzimatiche per la nuova sintesi di DNA, addensare su micro superficie molecole di DNA ad alta densità, velocizzare sintesi di geni, ed ad esempio fornire più potenti strumenti diagnostici, sviluppare nuovi fertilizzanti o pesticidi sostenibili per l’agricoltura (green chemistry), ma anche usare la combinatorialità del DNA e le sue stringhe come sistema di data storage alternativo alle memorie magnetiche ed ottiche (in binario 0 e 1) attualmente in uso (ad esempio la base azotata T è associata al codice 00, la A, 01, la C a 10 e la G a 11). Il DNA può divenire un deposito-memoria molto più stabile di altri materiali e relati meccanismi fisici, compatta la informazioni in modo incredibile (tutti i dati attuali internet in un volume pari ad una scatola di scarpe), basso consumo energetico per suo mantenimento, sistema di lettura universale e durevole, facile da riprodurre per renderlo ridondante. Dai reperti ossei paleontologici dell’Homo di Neanderthal di 40-60.000 anni fa sono state estratte molecole di DNA ancora integre che ne indicano la grande stabilità nel tempo. Già due anni un video della serie Biohackers di Netflix è stato codificato in DNA da ricercatori del ETH di Zurigo in collaborazione con Twist Bioscience.
—-
Si ringrazia l’amico e collega Prof. Luigi Vitagliano (CNR, Napoli; Università degli Studi del Sannio) per suggerimenti ed editing del testo. L’autore dichiara assenza di conflitto di interessi per le aziende citate nell’articolo.