Il tema del cloud è della massima importanza per università e centri di ricerca grandi e piccoli, ma anche per le grandi infrastrutture di ricerca di respiro europeo come quelle della roadmap ESFRI, e si interseca inestricabilmente con alcune iniziative di punta del prossimo programma quadro per la ricerca e lo sviluppo tecnologico, tra cui non possiamo non citare EOSC[1] e GAIA-X[2].
Data center pubblici e migrazione verso il cloud: luci ed ombre di una corsa a ostacoli
Soluzioni specifiche per il cloud della ricerca
Come sappiamo, oggi sono disponibili moltissime soluzioni cloud commerciali che promettono a organizzazioni grandi e piccole di risolvere se non tutti certamente molti dei loro problemi di calcolo e storage. Tuttavia, non è pensabile abdicare completamente a un tema così centrale per l’evoluzione della ricerca proprio nel momento in cui la scienza diventa sempre più basata su grandissime quantità di dati e gli algoritmi per l’estrazione di nuova conoscenza diventano via via più importanti. Per le applicazioni scientifiche sono spesso fondamentali architetture specializzate, che non si possono trovare già pronte sul mercato, e bisogna tener conto di dove vengono conservati i dati, come se ne protegge integrità e sicurezza, come e dove vengono effettuati i backup. Questi sono aspetti di cui si perde inevitabilmente il controllo nel momento in cui ci si rivolge a una soluzione di public cloud, spesso proposta come ‘chiavi in mano’. Come sappiamo molto bene per gli aspetti di networking, le esigenze degli utilizzatori delle reti della ricerca sono spesso diverse da quelle di chi usa soluzioni commerciali, occorre muoversi con soluzioni specifiche a problemi specifici.
Mi è capitato di sentirmi dire dal responsabile del calcolo di una delle infrastrutture di ricerca connesse a GARR che anche se Google o Amazon gli regalassero del calcolo non è detto che saprebbero bene che farci. Magari questa affermazione è un po’ eccessiva ma è vero che non tutto il calcolo è uguale: basti pensare alla crescita esponenziale della domanda di GPU in cloud registrata dal dipartimento computing e storage GARR nell’ultimo anno, legata all’affermarsi sempre più deciso di paradigmi come il machine learning.
Il nodo della data protection
Non solo, il tema della protezione dei dati risulta particolarmente rilevante per ambiti disciplinari come quello biomedico dove la riservatezza è un aspetto irrinunciabile con serie implicazioni etiche. I dati utili dal punto di vista del riuso in contesti di ricerca in questo settore sono spesso quelli pseudo-anonimizzati, ma va fatta estrema attenzione al fatto che non sia in alcun modo possibile risalire all’identità dei pazienti, cosa non sempre possibile a seconda di come è stato raccolto e organizzato il dato. Mi raccontavano giorni fa del problema di fare il backup sicuro di circa mezzo petabyte di dati clinici, in cui la chiave principale del database era il codice fiscale dei pazienti. Quando questa informazione è presente, bisogna blindarla, un’operazione di per sé non semplice ma che diventa a dir poco temeraria se si acquista una soluzione cloud di terze parti.
Creare soluzioni adeguate in collaborazione con la comunità
E infine, ultimo, ma forse più importante, aspetto da prendere in considerazione è il fatto che spesso le soluzioni adeguate, siano di architettura, di sicurezza, o relative ad altri aspetti, semplicemente non esistono ancora, e vanno create in collaborazione con la comunità. Noi reti della ricerca siamo abituate a questo modo di lavorare quando si parla di servizi di connettività ed è il momento che questa esperienza venga trasferita anche al settore cloud: per questo è così importante propugnare l’approccio di comunità, magari integrato ad altre soluzioni. Perché per fare questa attività di integrazione personalizzata e innovazione continua sono necessarie infrastrutture e soprattutto competenze, che la comunità delle reti della ricerca a livello europeo deve ampliare, se si vuole davvero guidare l’innovazione.
La nuova strategia Geant
La rete della ricerca europea GÉANT in questo contesto potrebbe giocare un ruolo cruciale, facendo convergere esperienze di successo come il cloud federato GARR o il cloud per la ricerca greca, offrendo occasioni di incontro e confronto e spazi per effettuare attività di ricerca e sviluppo.
Nella nuova strategia di GÉANT per i prossimi 5 anni, presentata nello scorso mese di marzo, sono bene evidenziati gli obiettivi principali per potenziare la ricerca e l’istruzione attraverso un ecosistema di infrastrutture innovative: la centralità della rete, la comunità, lo sviluppo e la sicurezza. Si tratta di antichi cavalli di battaglia di GÉANT e dei suoi principali stakeholder, le reti della ricerca nazionali, e certo si tratta di temi che non cessano di essere una priorità, tuttavia leggendo questo elenco non possiamo fare a meno di notare alcuni grandi assenti: uno di questi è senza dubbio il tema delle community cloud su cui in Italia, ma non solo, stiamo investendo molto sia come GARR sia come comunità della ricerca. In un contesto dove le reti sono sempre meno solo autostrade che trasportano dati, e sempre più infrastrutture complesse che integrano servizi a tutti livelli, non avere una strategia forte sul cloud può essere davvero molto pericoloso.
GÉANT, con il progetto OCRE, si è avvicinata al mondo cloud attraverso la definizione di contratti quadro con operatori commerciali vantaggiosi per le organizzazioni servite dalle reti della ricerca. Niente di male in questo, beninteso: ci sono casi in cui affidarsi a un provider commerciale selezionato può avere senso, ad esempio quando le nostre esigenze sono di tipo commodity o quando abbiamo necessità di assorbire in modo dinamico dei picchi di domanda di calcolo, sconfinando per così dire su risorse diverse dalle nostre. In questo caso, ben venga il lavoro di contrattazione e semplificazione fatto in questo progetto. Ma avere in casa le risorse (e soprattutto le competenze) cloud è di fondamentale importanza strategica e non deve essere considerato secondario rispetto al procurement, anzi possiamo sostenere che è vero il contrario.
Sarà quindi importante nei prossimi anni poter riprendere e ampliare questa strategia ed è sicuramente compito delle reti nazionali della ricerca come GARR portare l’attenzione su questi temi.