Dal primo gennaio 2024 i servizi cloud di IBM fuori dagli USA sono aumentati di costo dal 9 al 25%, per tutto il 2023 e 2022 i costi dei servizi cloud degli altri Cloud Service Provider sono aumentati in modo consistente, anche a due cifre.
Aumento dei costi dei servizi cloud: una tendenza globale
Da una parte l’inflazione e dall’altra i costi dell’energia e della manodopera sono i primari driver che i cloud provider hanno addotto per giustificare l’aumento di costi. Anche le altre aziende di software per le aziende stanno rivedendo in aumento i loro prezzi, soprattutto dove vendono servizi di SAAS e PAAS e dove il cliente farebbe fatica a sostituire i servizi.
Salesforce e Service Now hanno cominciato la loro strategia di aumento di costo (fino al 60%) in parallelo all’introduzione di funzionalità di GenerativeAI: si aggiunge qualcosa al prodotto per poter giustificare un incremento di costo generalizzato.
Molte aziende nel corso degli ultimi anni si sono viste aumentare i costi del cloud e hanno dovuto rendersi conto che non sono più in grado di abbandonare dal loro fornitore, non importa quanto grandi sono i clienti in molti casi i fornitori sono infinitamente più forti di loro.
Il dibattito sui costi dell’IT
Si è aperto il dibattito a livello internazionale sul controllo dei costi IT ma se chi può avere le proprie infrastrutture può governare meglio la propria efficienza, per chi è legato ad un cloud provider la vita è più complicata. Un approccio è quello di rivedere periodicamente le risorse utilizzate con l’intento di ridurle, spegnere ciò che è possibile, rivedere i livelli di servizio in peggio cercando di non far esplodere i costi dell’IT, dopo anni che i CIO sono andati a proporre il cloud nei board aziendali per “ridurre i costi”.
I costi del cloud sono diventati negli ultimi anni una minaccia globale anche perché se da una parte è vero che i costi delle materie prime e del lavoro sono aumentati e questo ha impattato sui costi è anche vero che i profitti delle big tech sono ancora una volta aumentati e non in modo proporzionale a quelli delle “materie prime”, nei fatti hanno approfittato del momento per portare a casa ulteriori utili.
In Australia i costi del cloud IAAS sono aumentati del 24% e del PAAS del 22% ma le stesse dinamiche sono avvenute nel resto del mondo.
Le strategie delle Big Tech, una storia già vista
Questo incremento dei costi non lo abbiamo solo con i grandi cloud provider, si ripete a cascata anche nel mercato consumer con Netflix e gli altri servizi di streaming o con le applicazioni meno note che però aumentano i prezzi senza timore di perdere clienti.
Come spesso è accaduto dalla nascita della “new economy” (intorno al 2000) ad oggi, ci sono state aziende che disponendo di enormi capitali di rischio hanno potuto investire e andare in perdita per molti anni, far fuori la concorrenza e occupare il mercato per poi dettare le regole del gioco e fare i prezzi. La parola magica è stata “lock-in” ovvero la condizione nella quale il fornitore detta le condizioni al cliente perché quest’ultimo non può più fare a meno del fornitore.
Ormai qualsiasi applicazione è venduta in cloud, in molti casi non esiste più la versione on premises. I costi hardware continuano a scendere, gestire sistemi informativi continua a essere più semplice anche per la disponibilità di nuove tecnologie e di nuovi modelli organizzativi a servizi ma molte aziende sono ormai troppo dipendenti dal cloud.
Le strategie delle aziende: tra migrazioni e riconsiderazione dell’uso del cloud
Negli USA molte aziende stanno riconsiderando l’uso del cloud, anche affrontando complesse migrazioni per portare a casa le infrastrutture pur di non far dipendere il proprio business dai cloud provider o non dover spartire con loro una larga fetta di utili.
Nel frattempo, i grandi cloud provider hanno sempre di più internalizzato le loro infrastrutture, hanno le più grandi dorsali di internet in giro per il pianeta, grandi datacenter, perfino CPU e GPU costruite internamente, fino ad una organizzazione in grado di governare migliaia di server con una automazione spinta. Una situazione che ricorda a grandi linee quando come occidente abbiamo delegato al sud est asiatico il ruolo di “fabbriche del mondo” approfittando del costo basso della manodopera e oggi ci siamo resi conto che se c’è un’epidemia e mancano mascherine dobbiamo aspettare che ce le mandino dalla Cina, a caro prezzo.
L’arrivo della generative AI: verso una nuova fase per il cloud
Con l’arrivo della Generative AI si apre un’altra fase del mercato del cloud, questi modelli sono nati richiedendo enormi risorse per poter funzionare. OpenAI è di fatto diventata una sussidiaria di Microsoft perché senza quest’ultima non avrebbe potuto addestrare GPT3 e GPT4. Anche gli altri player stanno lavorando per offrire servizi cloud di GenerativeAI, Google ha presentato Gemini e Amazon “Q” e gli altri stanno arrivando. Solo Facebook ha scelto la strada di modelli open source, più piccoli ma che per moltissimi task riescono a competere con i grandi.
Molti degli aumenti dei prezzi cloud sono giustificati dall’inserimento di servizi GenerativeAI e le big tech stanno cercando in tutti i modi di bloccare il loro concorrente più temuto, il modello open source che quest’anno ha visto emergere modelli GenerativeAI sempre più leggeri e sempre più efficienti. Grazie alla ricerca di aziende come Mistral AI, spesso non USA, si è riusciti a ridurre la complessità dei modelli e ad aumentare la qualità del loro addestramento per arrivare a risultati simili senza utilizzare tutte le risorse.
L’11 dicembre scorso Mistral AI ha presentato la sua piattaforma per supportare gli sviluppatori e ha presentato gli ultimi benchmark con GPT 3.5 (la versione di OpenAI che ci ha stupito fino a qualche mese fa).
I dati parlano di modelli molto piccoli ( 7 miliardi di parametri) che superano GPT 3.5 che ne ha 175 miliardi.
Recentemente anche l’università Tsinghua di Pechino ha proposto nuovi modelli di addestramento che hanno consentito di raggiungere importanti risultati anche con modelli molto più piccoli di quelli adottati dai cloud provider.
Si apre dunque una partita dapprima per il controllo della GenerativeAI tra grandi cloud provider in grado di disporre di risorse economiche infinite e aziende (e stati) che vogliono stare sul mercato senza dipendere da esse. Per chi come me ogni giorno segue ciò che succede nel mondo AI e lavora su strumenti è un momento interessante, si trovano modelli sofisticatissimi di grandi cloud provider che con poche istruzioni semplici prendono allucinazioni o pubblicano le loro informazioni “segrete” o i dati sensibili anche di persone raccolti durante l’addestramento effettuato come pesca a strascico e modelli molto piccoli che stanno bene in un desktop e che per la gran parte dei casi sostituiscono benissimo ChatGPT.
Verso nuove architetture che potrebbero sostituire il “trasformer”
Il futuro prossimo vedrà probabilmente ricercatori presentare nuove architetture che potrebbero sostituire il “trasformer” rendendo ancora più efficienti questi modelli.
Mentre GPT4 ha 1750 miliardi di parametri e necessita di una infrastruttura imponente per operare sono già disponibili modelli open source che con 7 miliardi di parametri riescono tranquillamente a correggere un programma software o proporre un codice software sulla base di una descrizione in linguaggio naturale, a rispondere a domande o riassumere documenti e così via. Modelli che le aziende possono chiedere ai loro fornitori di migliorare secondo le proprie esigenze, adattare ai oro compiti specifici e farseli installare in azienda senza dover pagare per ogni chiamata con il rischio (quasi una sicurezza) che appena dipenderanno dal quel modello il cloud provider gli aumenti il costo della interrogazione drenando la gran parte dei guadagni di produttività che l’AI può portare in azienda e che anziché spartirsi tra personale e azienda vengono i cloud provider a pretenderne come rendita di posizione.
Le tattiche per chiudere il mercato dell’open source
Molti operatori affermano che le tattiche per chiudere il mercato dell’open source e dei modelli in locale sono già cominciate, per alcuni versi scimmiottano quelle che abbiamo visto negli ultimi venti anni e per altri apportano delle novità.
Una grande campagna sui pericoli dell’AI
La prima è quella di fare una grande campagna sui pericoli dell’AI, raccontare di una tecnologia futuribile che può scappare di mano all’uomo e che per questo bisogna mettere regole. Ci ha provato Elon Musk e alcuni suoi sodali appena ha scoperto che aveva perso terreno rispetto ai suoi concorrenti, l’obiettivo era una moratoria per qualche tempo (una sorta di safety car) per provare poi ad entrare in gara. Ma ci stanno provando tutte le big tech chiedendo ai governi di controllare e regolamentare, mettere vincoli, verifiche e test e quant’altro su questo settore.
E a fare queste regole saranno loro, seduti direttamente nei tavoli governativi o rappresentati da lobbisti o esperti a loro molto vicini. Un gioco utile a rendere molto costoso operare su questo mercato e di fatto mettere fuori tutte quelle realtà che stanno emergendo con un lavoro di ridisegno delle architetture e delle tecniche. I grandi che hanno fatto enormi investimenti rischiano di bruciare molti soldi se i nuovi entranti possono arrivare con modelli più agili e meno costosi.
La Francia, che grazie ad una politica industriale statale e ad un intervento pubblico, sta diventando uno degli hub internazionali che richiamano talenti e denaro da tutto il mondo ha lavorato per bloccare, insieme alla Germania e in parte l’Italia, l’AI Act proprio su questa regolamentazione stringente ma la battaglia non è affatto finita. Fino a quando l’AI Act arriverà ad essere recepito dagli stati ci sono ampi margini per dare interpretazioni in un senso o nell’altro.
Fare continui annunci futuristi sulle capacità dei grandi modelli
Un’altra forma di chiusura del mercato è quella di fare continuamente annunci futuristi sulle capacità dei grandi modelli. La politica degli annunci di sempre nuove funzionalità che mai venivano a terra l’abbiamo vista negli anni ’90 quando Microsoft ci ha costruito un modo per affermare Windows sui concorrenti. Annunciare il meglio frena i clienti dall’investire in nuovi player e attira investimenti dove i clienti pensano che avranno maggiori vantaggi in futuro, se fai entrare i clienti in ecosistemi abbastanza chiusi con la aspettativa che avranno vantaggi enormi dall’esserci e svantaggi dal non esserci ottieni da una parte il lock-in e dall’altro che gli altri concorrenti che non hanno alle spalle enormi investitori debbono mollare e magari venderti le attività.
Fino ad un po’ di anni fa le startup come OpenAI e Antrophic sarebbero state acquisite da qualche grande big tech. Ogni volta che emergeva un pericoloso concorrente non hanno badato a spese per acquisire e dominare, il caso Instagram per tutti ma non è il solo. Oggi acquisire sarebbe complicato, l’antitrust ha messo nel mirino questo tipo di comportamento e si procede con partnership strategiche. OpenAI nei fatti è un braccio operativo di Microsoft senza la quale non esisterebbe più, poche settimane fa ha rischiato di perdere tutto il suo personale in favore di Microsoft e solo il ritorno di Sam Altman ha rimesso le cose in carreggiata ma con una posizione di OpenAI molto ridimensionata nella sua autonomia, il board è composto per la gran parte da persone di fiducia di Microsoft. Antrophic ha stretto partnership forti con Amazon, anche qui accompagnate da capitali enormi che vuoi o non vuoi rischiano di condizionare pesantemente le scelte di queste aziende.
Campagne di comunicazione sui pericoli dei modelli open source
Infine, se si mette male, si può sempre far emergere una campagna di comunicazione nascosta sui pericoli dei modelli open source, ad esempio, per i ragazzi (magari perché potrebbe uscire qualche parolaccia, peraltro come ai grandi) o sostenendo che poiché c’è il pericolo cinese è necessario concentrare tutte le forze sui grandi per qualche ragione.
La GenerativeAI è anzitutto un grande business, una vera e propria miniera di soldi che è ancora agli inizi. Ci sono i rischi di qualsiasi tecnologia emergente ma il rischio più grande e più imminente è che finisca in poche mani, che si acquartieri presso le big tech che hanno l’oligopolio della tecnologia occidentale e che vediamo sempre più a fatica stare dietro al modello cinese guidato dallo stato e attento a cogliere le occasioni per raggiungere obiettivi sempre nuovi.
Conclusioni
Il modello del cloud, che non va demonizzato, comincia a presentare il conto in termini di costi, di dipendenza strategica e di condizionamento delle scelte tecnologie. Non è colpa della tecnologia cloud o di un’altra, che sono estremamente utili ma colpa del laissez- faire che dal 2008 ad oggi ha visto grazie al quantitative easing e ad enormi investimenti in borsa la nascita di big-tech sempre più grandi con budget che superano di gran lunga molti stati nazionali e con la possibilità di operare in perdita per molto tempo.
La concentrazione economica è nemica dell’innovazione, il pericolo più imminente è che possa appropriarsi anche del nuovo settore dell’AI e ne ha tutta la forza economia e politica per farlo. I governi dovrebbero dimostrare un sussulto che impedisca che si formi un oligopolio sia perché questo farebbe bene a tutta la società, in termini di benessere diffuso e in termini di capacità di rispondere alle sfide internazionali.