Il colosso dell’IT mondiale nVidia ha appena concluso il GTC 2025, la GPU Technology Conference, una fiera che ha visto 25.000 partecipanti affollarsi a San Jose in California per scoprire di persona le novità in materia di hardware e software e assistere al keynote del CEO Jensen Huang per capire le direzioni essenziali.
Sebbene GPU sia l’acronimo di Graphical Processing Unit, di grafica si parla poco o niente da quando l’AI è divenuta centrale nel dibattito IT e le GPU ormai sono acquisite largamente dai big per applicazioni di intelligenza artificiale generativa piuttosto che per fare il rendering di scene 3D.
Vediamo quali sono stati gli annunci e quali direzioni lasciano intravedere nell’immediato futuro.
Indice degli argomenti
Gli annunci Gtc 2025 Nvidia
Gli annunci principali sono stati:
Nuove architetture GPU: Sono state annunciate le architetture Blackwell Ultra, previste per la seconda metà del 2025, e Vera Rubin, attesa per la fine del 2026. Queste architetture sono disegnate esplicitamente avendo in mente i carichi computazionali di AI
NVIDIA Dynamo: Un software migliora il processo di inferenza nei modelli avanzati, assegnando dinamicamente le risorse GPU alle diverse fasi dell’inferenza e gestendo i dati in modo efficiente tra i diversi tipi di memoria. Si tratta di un software centrale per chi realizza le cosiddette AI Factories
Robotica avanzata: Nel campo della robotica, NVIDIA ha introdotto Isaac GR00T N1, un modello open-source progettato per assistere nello sviluppo di robot umanoidi. Inoltre, è stato presentato “Blue”, un robot sviluppato in collaborazione con Disney Research e Google DeepMind, che incorpora le ultime tecnologie robotiche e un nuovo motore fisico chiamato Newton.
Collaborazioni strategiche: NVIDIA ha annunciato una collaborazione con General Motors per integrare sistemi AI personalizzati nei veicoli a guida autonoma, sottolineando l’impegno dell’azienda nel settore automobilistico e la sua visione di un futuro in cui l’AI svolge un ruolo centrale nella mobilità.
Questi annunci vanno letti in continuità con alcuni annunci recenti, in particolare quelli delle nuove versioni della GPU per dispoitivi IoT, il Jetson Nano, e soprattutto il nuovo DIGITS, un sistema a relativamente basso costo (3000$) capace però di eseguire tutto il software rilevante per l’AI ed eseguire modelli fino a 200 miliardi di parametri.
Il software nVidia
nVidia ha dimostrato di riuscire a creare un connubio tra hardware e software che spesso i produttori di chip non riescono a supportare. Il dominio di nVidia è molto legato alla diffusione del codice scritto con la libreria CUDA lanciata nella seconda metà degli anni duemila, e che ha consentito ad un’ampia platea di sviluppatori di usare in modo efficace le funzioni di algebra lineare utili non solo per la grafica 3D ma anche in molti altri ambiti applicativi.
Nessun competitor, inclusi AMD e Intel, è poi riuscito a convincere gli sviluppatori a riscrivere i propri software in modo che vi fosse una sostanziale concorrenza sui chip. Non è un caso che i big stiano lavorando a chip propri per superare questa situazione e ridurre i costi di esercizio con acceleratori sempre più specializzati per le funzioni AI a cui nVidia ribatte con le nuove architetture.
Software come Dynamo vanno quindi seguiti con attenzione poiché potrebbero avviare un nuovo percorso in cui gli sviluppatori avvalendosi delle sue funzioni ottengano benefici continuando a consolidare l’ecosistema di software che necessiti dell’hardware nVidia per la sua esecuzione.
Verso una AI più distribuita
In dieci anni il costo di una GPU per un server è lievitato di circa sette volte, rendendo l’accesso a questi componenti sempre più difficile e concentrando le risorse di calcolo direttamente collegate all’AI nelle mani di sempre meno attori. Basti pensare che un server con GPU ne ospita spesso tra 8 e 16 portando il costo complessivo a centinaia di migliaia di euro per nodo. Anche il design dei server è cambiato, per assicurare che le varie GPU abbiano sufficiente capacità di comunicazione nVidia ha progettato un’interconnessione specifica chiamata nVlink che ha di fatto ingessato il design delle schede madri dei server fino al punto da avere un design sostanzialmente analogo con poche possibilità di personalizzazione con un prezzo sostanzialmente fisso e con una ridotta competizione.
Gli annunci di Jetson Nano e di DIGITS, sebbene antecedenti a GTC 25, vanno quindi letti in un contesto in cui nVidia si rende conto che rischia di perdere gli sviluppatori. Ormai è divenuto quasi impossibile sviluppare e testare grandi modelli di AI come gli LLM con centinaia di miliardi di parametri senza disporre di server molto costosi.
Ecco quindi che lo sviluppo di piattaforme più piccole e accessibili serve al colosso di San Jose per assicurare che il proprio software a supporto dell’AI (e che richiede l’hardware nVidia) possa essere installato nel contesto di robotica ed automazione, e che gli sviluppatori possano avere accesso a dispositivi a costi relativamente contenuti per poter fare ricerca e sviluppare nuovi modelli che possano essere eseguiti nel cloud.
È in questo contesto che va letto il crollo del titolo a seguito del rilascio a fine anno di DeepSeek R1 da parte della startup cinese: dal 2022 gli Stati Uniti hanno un embargo sui chip di ultima generazione per l’AI verso la Cina, e il fatto che i cinesi abbiano sviluppato un modello così capace senza, almeno sulla carta, poter disporre degli ultimi acceleratori pone non poche questioni e dubbi sull’effettivo contributo che i nuovi chip portino allo sviluppo.
Ma forse è in questo contesto che va letto la mossa in direzione della robotica: aprire nuove linee di sviluppo chip che riportino nVidia anche su un mercato più distribuito in cui non siano solo pochi attori a beneficiare dei chip, come testimonia l’accordo con General Motors.
Conclusioni
Oltre a continuare a supportare modelli di AI generativa giganti con il proprio hardware, nVidia sta cominciando a differenziare i propri sviluppi rivolgendo la propria attenzione anche a mercati come la robotica dove l’AI sta cominciando a far intravedere un futuro con robot umanoidi a costi accessibili che solo pochi anni fa sarebbero stati impensabili.