Il calcolo costituisce uno dei tre elementi della triade dell’Intelligenza Artificiale, insieme ad algoritmi e dati. Le grandi infrastrutture di calcolo, i supercomputer, sono diventate di fatto asset strategici per ciascun paese. Governare il supercalcolo per l’IA di frontiera può significare gestire la governance dell’IA.
Indice degli argomenti
La strategia europea per il supercalcolo: l’impresa comune EURO HPC JU
È tanto vero che tutto l’occidente è alle prese con il consolidamento o l’avanzamento della propria posizione di competitività nel contesto globale della potenza di calcolo. L’Europa, attraverso l’impresa comune EURO HPC JU (European High Performance Computing Joint Undertaking), ha individuato le prime 7 factory per l’intelligenza artificiale che saranno lanciate nel 2025. Il budget complessivo a favore di queste piattaforme è pari a 2,1 miliardi di euro. Sono coinvolti 15 Stati membri, tra cui l’Italia con il progetto IT4LIAAI factory, e due paesi partecipanti all’EURO HPC. L’obiettivo è quello di creare un “continente AI”, attraverso lo sviluppo del super calcolo funzionale ai sistemi di IA d’avanguardia, la produzione di microprocessori e la valorizzazione dei talenti. Questo risultato aggiorna la geografia dei supercomputer abilitati all’IA, guidata fino a oggi, in termini di exaflop, da El Capitan, Frontier e Aurora, tutti e tre costruiti da Hewlett Packard Enterprise (HPE), ed alloggiati negli Stati Uniti.
Infrastrutture di supercalcolo e competitività
Fatto salvo l’incipit, la sintesi rappresentata in questo articolo prova a dimostrare se e come la presenza di infrastrutture di supercalcolo si può tradurre in un vantaggio competitivo per il Paese ospitante.
Gli elementi a favore di una tesi positiva si possono riassumere nella capacità delle istituzioni e/o organizzazioni di incidere nei tempi e con i risultati, design-training-miglioramento-sviluppo di sistemi di IA avanzati, in materia di regolamentazione, allocazione delle risorse, e scelta dei guard-rail da adottare.
La conformità di calcolo di un supercomputer a una normativa è molto più semplice di quella di un chip per inferenza posizionato su un dispositivo mobile. Difatti l’accesso alla stessa infrastruttura o l’uso di dati pubblici per l’addestramento degli algoritmi, unitamente alla tracciabilità dei sistemi di IA, rientrano nelle facoltà del soggetto gestore che di fatto risponde a obblighi di legge.
Le aziende che possiedono la potenza di calcolo
Inoltre oggi la potenza del calcolo è posseduta da tre grandi organizzazioni private, principalmente Amazon (tramite Amazon Web Services), Microsoft (tramite Azure) e Google (tramite Google Cloud Platform). Il modello di business da loro adottato verso altri operatori come Hugging Face sono partnership di collaborazione.
Gli hyperscalers determinano quali set di servizi o di prodotti basati sull’IA arrivano alla fase di sviluppo. Non è utopico prevedere una compravendita calmierata dei diritti di accesso per startup, mondo accademico o altri operatori, un po’ sulla falsariga dei crediti di carbonio, oppure pensare a politiche di cooperazione multistato, Nord-Sud del Mondo, per consentire l’uso delle infrastrutture e lo scambio dei talenti tra più paesi.
Una catena del valore molto segmentata
Nel contenitore dell’antitesi va censita la difficoltà di gestire lo stock o comunque prevedere i flussi dei chip necessari per l’addestramento di grandi modelli di IA, soprattutto quelli di frontiera. Questa catena del valore è molto segmentata, dalla localizzazione delle materie prime, passando per il design e la produzione dei macchinari per la manifattura, alla produzione, il potere di approvvigionamento e utilizzo è concentrato su poche aziende, come NDIVIA per le GPU specializzate (unità di elaborazione grafica).
Difatti sia gli Stati Uniti che l’Europa si sono affrettati a pianificare risorse finanziarie, misure di sicurezza per l’approvvigionamento, un sistema di monitoraggio dell’uso e un meccanismo di risposta per anticipare l’adozione di misure emergenziali in caso di crisi.
Oltre al problema della anelasticità della fornitura dei chips, va introdotto il tema della scalabilità socio-economica dei modelli di IA e delle relative prestazioni, direttamente proporzionata se si è in presenza di grandi infrastrutture hardware – cluster di chip, rete ad alta banda, sistemi di raffreddamento – e ampie risorse di dati, asimmetrica rispetto invece alla distribuzione/diffusione dei modelli o di gestione a valle delle operazioni, per esempio nelle interazioni con chatbot o altri agenti.
Conclusioni
Gli investimenti nella capacità di supercalcolo per l’IA di una nazione, l’allocazione dei cluster o la gestione dei flussi dei dati, insieme alla destinazione d’uso dei supercomputer verso lo sviluppo dei modelli di frontiera dell’IA per usi socialmente condivisi, possono condurre o aiutare gli Stati a realizzare uno sviluppo tecnologico differenziale.
Simultaneamente la federazione di tutte le infrastrutture pubbliche in un’unica piattaforma, complementare, fino alla sua realizzazione, al CERN per l’IA, potrebbe impegnare reciprocamente i governi nella scelta della tipologia di applicazioni da realizzare e nelle relative tempistiche di avanzamento, trasformando ciascun modello di frontiera “benevolo” in bene pubblico.