NVIDIA, colosso internazionale nel mercato dei microchip, si è affermata come leader indiscussa nel campo dell’Intelligenza Artificiale (IA), grazie a investimenti in ricerca che su base annuale sono sono aumentate del 25% tra gennaio 2024 e lo stesso mese dell’anno scorso e sono pari a circa un terzo della spesa dell’Italia[1].
La crescita esponenziale del mercato dell’IA, prevista per il 2027, conferma la validità della strategia adottata da NVIDIA e la sua capacità di innovazione continua nelle applicazioni dei processori IA.
Ma nonostante il suo trionfo, la sfida è tutto meno che conclusa: l’inferenza emerge come il nuovo campo di battaglia per i produttori di chip e numerose startup stanno cercando di sfidare NVIDIA nel mercato dei microchip per l’Intelligenza Artificiale. Un panorama in rapido mutamento, dove le dinamiche competitive sono altrettanto affascinanti quanto le tecnologie coinvolte.
“Correte!”, il mantra di Nvidia e la lentezza della politica industriale
“In 40 anni abbiamo creato il PC, internet, i dispositivi mobili, il cloud e ora l’intelligenza artificiale. E voi cosa creerete? – ha detto Jensen Huang, CEO di NVIDIA agli studenti di Taiwan a maggio 2013 – Qualunque cosa sia, inseguitela come abbiamo fatto noi. Correte. Non camminate. Ricordate: correte sia quando sarete a caccia di cibo, sia quando sarete prede”[2].
Apriamo e chiudiamo subito una parentesi importante. In queste frasi, ma è più giusto dire in tutto il discorso tenuto da Huang agli studenti, c’è la spiegazione del perché i Chips Act, varati negli Stati Uniti e in Europa, nella fase di carenza dei microchip, siano rimasti lettera morta. Gli strumenti di politica industriale si basano sull’idea che l’autorità pubblica possa “guidare” lo sviluppo delle tecnologie innovative con strumenti protezionistico-autarchici afflitti dai tempi della politica, dai ritardi della burocrazia, dalla discrezionalità delle autorizzazioni e dagli oneri dei controlli spesso inefficaci o inutili.
I protagonisti del mercato, come NVIDIA, si muovono invece in modo rapido, a costo di sacrifici e rinunzie e correndo rischi di fallimento superati con scelte coraggiose e non scontate. Per questo motivo sarebbe segno di serietà da parte della Commissione Europea realizzare una review sullo stato di attuazione, compresa l’analisi dell’impatto negativo della concorrenza condotta nei confronti delle politiche europee dai singoli stati membri con fondi propri. La norma va rivista e questa review potrebbe dare utili indicazioni in tal senso, facendo risparmiare non pochi fondi da destinare a formare competenze e risorse altamente qualificate che attirano gli investimenti privati necessari allo sviluppo delle nuove tecnologie.
Oggi NVIDIA supera 2 miliardi di dollari di valore in borsa. La straordinaria valutazione è sostenuta da performance che al quarto trimestre 2023 danno, per i ricavi, +22% sul trimestre precedente e + 265% sullo stesso periodo dell’anno precedente, con una crescita ancor più eclatante nell’area dei data center: + 27% e + 409% rispettivamente. I profitti per azione sono in aumento del 765%.
Le applicazioni dei processori NVIDIA nel mondo dell’IA
I suoi processori, nati per la grafica delle playstation, sono diventai essenziali per il calcolo veloce e per i bassi consumi richiesti dall’intelligenza artificiale “NVIDIA RTX entrato nel mercato 6 anni fa per essere usato da 100 milioni di giocatori e creativi, è ora la piattaforma PC per l’intelligenza artificiale generativa…Il calcolo accelerato e l’intelligenza artificiale generativa hanno raggiunto il punto di svolta, con una domanda che si impenna a livello mondiale, tra le aziende, le industrie, le nazioni” Ha dichiarato Jensen Huang.[3]
Google per Gemma, la piattaforma di intelligenza artificiale, Amazon per il cloud AWS, Amgen, azienda di biotecnologia, per avanzare nella ricerca di nuovi farmaci e per la medicina e diagnostica di precisione. NVIDIA NeMo Retriever, sta diffondendosi come strumento per affinare le applicazioni di LLM ai data base specifici di ciascuna azienda, nell’industria dell’auto, nella sanità, nelle telecomunicazioni, nella produzione di hardware generico e specializzato, come play station e data center.
Ma i processori non sono usati soltanto per il training dei sistemi di intelligenza artificiale generativa, ma, come abbiamo visto, per la applicazione agli ambienti specifici, e possono essere processori diversi.
Non necessariamente quelli di NVIDIA.
Il mercato si sta aprendo
Le previsioni di fine 2023 fatte da USB per il settore dell’intelligenza artificiale stimavano una crescita del mercato americano di dieci volte nei cinque anni dal 2022 al 2027, ossia ad un tasso composto di oltre il 60% all’anno. Ma all’inizio del 2024, alla luce delle dinamiche in atto, modificano le loro stime al rialzo, prevedendo un valore al 2027 di 420 miliardi di dollari con un tasso composto di crescita annuale del 72%. Ovvero una crescita di 15 volte in 5 anni. I produttori di chip e di GPU saranno quelli che avranno i primi vantaggi della crescita del mercato, poi verranno i servizi di inferencing, ossia l’analisi e interpretazione dei dati, del tipo dei Copilot di Microsoft. Più avanti ancora l’estensione delle applicazioni AI ai diversi settori comporterà un allargamento del mercato dei modelli. Esso oggi rappresenta meno di un decimo del mercato globale e potrebbe salire a superare la metà del valore del mercato totale nel 2027[4].
La Tavola 1 rappresenta le enormi differenze di importanza che oggi hanno i diversi settori, ma ci dice anche che la crescita prevista nel quinquennio influirà sulla loro importanza relativa in modo decisivo.
In particolare, cominciano a svilupparsi i settori applicativi, che affiancheranno la crescita poderosa dell’hardware (in particolare i chip), delle infrastrutture di calcolo e dei servizi cloud, settori oggi pressoché inesistenti.
Nella Tavola 2 si vedono i tassi di crescita composti dei diversi settori AI.
NVIDIA ha scelto di porsi al centro della transizione AI, puntando a fornire non solo il componente chiave, ossia il processore grafico, ma l’architettura dell’offerta integrata di hardware, software e il disegno integrato dell’architettura che meglio serve all’area applicativa specifica e allo specifico modello di business. È la strategia di chi, forte dello straordinario successo nei processori, ha capito che deve capitalizzare le competenze acquisite. NVIDIA sta cercando di occupare quelle colonne blu della tavola 1, che hanno oggi un valore praticamente nullo.
È una strategia aggressiva, ma che segna anche la preoccupazione di presidiare l’intera offerta di competenze necessarie al cliente per sfruttare l’intelligenza artificiale, cliente che sarà sempre più attento alle dispersioni e alle perdite dovute all’uso caotico o incompetente o inefficace dei nuovi strumenti (tavola 3) [5].
Si tratta di consolidare e difendere la posizione acquisita mentre si presidiano e si conquistano i nuovi rami del mercato. Se dovesse prevalere l’aspetto difensivo al di là degli intendimenti di Jensen Huang, l’attacco della concorrenza a NVIDIA diventerebbe più aggressivo e avrebbe maggiori probabilità di successo. Nel momento del trionfo, come spesso accade, i concorrenti si affacciano, e non sono solo i volti noti.
La competizione delle start up
I chip per l’attività inferenziale, rispetto a quelli più adatti per il training dei modelli LLM di intelligenza artificiale, hanno caratteristiche diverse: NVIDIA presidia entrambe le aree, ma potrebbe essere più esposta nell’area dell’inferenza, dove l’attenzione ai costi da parte delle aziende è più elevata e la necessità di usare processori ad elevate prestazioni e meno urgente. INTEL e anche AMD, leader nella produzione dei processori maggiormente usati nei data centers, ritengono che essi possano rivelarsi competitivi nell’inferenza.
Vivek Aira, analista di Bank of America, ritiene che il passaggio dall’addestramento dei modelli AI allo sviluppo delle capacità inferenziali, segni il transito verso l’applicazione, dove l’attenzione al costo degli investimenti diverrà stringente, anche per contenere l’esposizione che deriva dai “sunk cost” della fase precedente.[6] Secondo USB il 90% della domanda di chip all’inizio di quest’anno è dovuta all’attività di training e prevede anche che il 20% sarà assorbito dall’inferenza nell’anno che viene.
Ma vi sono nuove start up che si affacciano sul mercato.
Samba Nova, produce processori e software da utilizzare nell’inferenza e nel training, vede un’opportunità nella crescita attesa dell’attività inferenziale: “L’inferenza sta aumentando in modo esplosivo e le persone cominciano a capire che oltre l’80% del costo sarà dovuto proprio all’attività inferenziale” osserva Rodrigo Ling, amministratore delegato della start up.
Groq, fondata da un ingegnere di processori AI di Google, Jonathan Ross, ha pubblicato una demo sulla velocità dei propri processori inferenziali: passerà da 40.000 a un milione di chip, con prospettive a breve di riuscire ad incrementare entrambi gli obiettivi in modo significativo. Uno dei fattori di successo consiste nel consentire di risparmiare sul training, potendo svolgere parte del lavoro in fase inferenziale.[7] Anche le aziende big tech hanno lavorato per produrre chip specializzati in proprio, alla ricerca di soluzioni meno onerose per l’attività inferenziale.
Amazon ha dotato Alexa di un processore inferenziale di produzione interna. Elon Musk, Mark Zuckerberg, Larry Ellison, fanno la corte a Huang per avere i processori più potenti di NVIDIA, che scarseggiano. Spesso i processori come H100 si NVIDIA debbono essere prenotati e pagati in anticipo. Questo straordinario potere di mercato di NVIDIA deriva da una posizione di vantaggio tecnologico che consente di allargare i margini. Ma, come sappiamo, i margini elevati stimolano l’interesse e gli investimenti.
L’interesse di NVIDIA per le start up di conseguenza è crescente, anche solo per sottrarre opportunità alla concorrenza. Nonostante i colossali investimenti in ricerca, la via più semplice per fare innovazione è quella di comprarla: solo nel 2023 tra AI generativa, robotica, automazione e salute NVIDIA ha triplicato le attività dell’anno precedente con l’acquisizione di una quarantina di aziende[8].
Non sarà facile per un colosso, mantenere, come vorrebbe il fondatore, lo spirito della startup: cresce il peso degli investimenti effettuati, delle competenze acquisite, dei mercato in cui si è raggiunta ormai una presenza consolidata, tutti fattori inerziali che pesano in ogni azienda, anche la più innovativa.
Note
- ) Fonte: Istat e NVIDIA↑
- ) Corriere della Sera , Il ceo di Nvidia come Steve Jobs, il discorso di Jensen Huang ai laureandi di Taipei: «Correte. Non camminate», Login, 30 maggio 2023. ↑
- ) NVIDIA Announces Financial Results For Fourth Quarter And Fiscal 2024, NVIDIA, February 21, 2024. ↑
- ) UBS, US tech gains set to continue on stronger AI growth. Wealth Management, January 3, 2024. ↑
- ) NVIDIA, Deploying AI Models with Speed, Efficiency, and Versatility. Inference on NVIDIA’s AI Platform, Whitepaper, 2023. ↑
- ) Asa Fitch, How a Shifting AI Chip Market Will Shape Nvidia’s Future, The Wall Street Journal,Fabruary 25, 2024. ↑
- ) Asa Fitch, cit. ↑
- ) Asa Fitch, Nvidia’s Stunning Ascent Has Also Made It a Giant Target. The Wall Dstreet Journal, February 26, 2024. ↑