intelligenza artificiale

Ecco o3 e o4-mini: il ragionamento AI è migliore ed è per tutti



Indirizzo copiato

Arrivano o3 e o4-mini, i nuovi modelli della serie “o” di OpenAI. Ragionamento migliorato, accessibilità. Aiuteranno altre persone a sentire in modo diverso la conversazione con ChatGPT: non più un dialogo uomo-macchina, ma un confronto tra colleghi.

Pubblicato il 17 apr 2025

Andrea Benedetti

Senior Cloud Architect Data & AI, Microsoft



o3 o4-mini

Arrivano due nuovi attori di intelligenza artificiale sulla scena, o3 e o4-mini, i nuovi modelli della serie “o” di OpenAI. Il loro ruolo? Aiuteranno un mucchio altre persone a sentire in modo diverso la conversazione con ChatGPT: non più un dialogo uomo-macchina, ma un confronto tra colleghi.

Qualcuno già lo sente così. Quando chiede di analizzare uno schizzo fotografato al volo, oppure di scrivere lo script che pulisce un database e di inserirne il risultato in un foglio di calcolo.

Oppure quando si carica un file di un progetto di analytics contenente modello dati, logica di business, report — e si ricevono risposte come se fosse la cosa più naturale al mondo.

o3 e o4-mini: particolarità

Con i modelli o3 e o4 mini la vera sorpresa non sta nella risposta finale, ma nel modo in cui i modelli ci arrivano.
Durante il proprio flusso di pensiero, possono autonomamente attivare strumenti come la web search, una sessione Python, la rotazione di un’immagine o l’estrazione di testo da un PDF — senza che l’utente debba orchestrare nulla.

Questo uso strumentale del ragionamento diventa un moltiplicatore: trasforma il paradigma degli LLM da “ciò che so” a “ciò che so fare adesso”, adattando ogni passaggio al problema concreto.

Il risultato di questo approccio si riflette anche nelle analisi eseguite tramite diversi benchmark.

o3

o3 ha saturato la nuova SEAL (Systematic Evaluation of Artificial Learners) leaderboard, piazzandosi al primo posto in categorie chiave come HLE, Multichallenge a turni multipli, MASK (“onestà sotto pressione”) ed ENIGMA (risoluzione di puzzle).

Si tratta di prove che misurano non la memoria del dataset, ma la capacità di ragionare sotto vincoli. Con i test citati si misurano la capacità del modello di suddividere compiti complessi in sottotask e portarli a termine con un alto livello di astrazione (ad esempio: “Organizza una presentazione tecnica” prevede raccolta dati, generazione slide, creazione script di esposizione, ecc.); si simulano scenari interattivi e dinamici, dove il modello deve mantenere il contesto tra più turni, come in una conversazione o in un gioco a tappe; si misura quanto il modello mantiene accuratezza e veridicità anche in condizioni complesse o ambigue, dove potrebbe essere incentivato (implicitamente) a “indovinare” o rispondere con eccessiva sicurezza; si valutano le abilità logiche e deduttive del modello: risoluzione di enigmi, pattern recognition, ragionamenti a catena.

Ha anche superato le prestazioni umane medie sull’ARC AGI (AI Research Center AGI Benchmark), toccando l’87,5% contro l’85% stimato per i partecipanti umani.

Basato sull’ARC (Abstraction and Reasoning Corpus), propone problemi logici visivi in cui il modello deve capire la regola implicita dietro a una trasformazione e applicarla a nuovi casi.
Questo non significa che abbiamo raggiunto l’AGI (Artificial General Intelligence, ovvero Intelligenza Artificiale Generale), ma indica che la frontiera tra competenza specialistica e intelligenza artificiale si sta spostando più in fretta di quanto pensassimo solo un anno fa.

o4 mini

Anche o4 mini, pur avendo una potenza computazionale inferiore rispetto a o3, eredita molte delle stesse capacità chiave: reasoning multimodale, uso razionale degli strumenti, ragionamento in loop.
È pensato per essere più leggero, più efficiente e più economico, mantenendo performance di alto livello in contesti reali — ed è già disponibile all’interno del tier gratuito di ChatGPT.

Questo rende l’accesso all’IA avanzata ancora più inclusivo e diffuso, abbattendo ulteriormente le barriere all’adozione.
In molti scenari pratici, come la generazione di codice, l’analisi di dati visivi o l’assistenza nella scrittura, o4 mini si comporta in modo sorprendentemente vicino al fratello maggiore, dimostrando che intelligenza non significa necessariamente grandezza.

Molto interessante il fatto che entrambi i modelli “pensino” con le immagini.
Un diagramma, un grafico incollato in chat o la foto di un macchinario diventano variabili dentro al ciclo di ragionamento: il modello può misurare distanze in pixel, applicare filtri o ricampionare l’immagine con Python prima di rispondere.

Non si limita a descrivere ciò che vede — lo manipola per capirlo meglio.

Memoria a lungo termine in chatgpt

Un’altra novità è la memoria di lungo periodo integrata in ChatGPT.
o3 può riconoscere preferenze esplicite — il tono di voce che si ama nei testi, l’ambito in cui si lavora, i progetti in corso — e usarle per personalizzare le conversazioni e l’esperienza d’uso.
Si riduce così quel rituale (fastidioso) del “dover spiegare tutto da capo”, che rallentava la fluidità delle versioni precedenti.
La memoria resta sotto controllo dell’utente: può essere disattivata o cancellata in ogni momento, ma quando attiva rende l’interazione sorprendentemente naturale.

Il loop del ragionamento

OpenAI descrive o3 come “deep research lite”: possiamo affidargli un incarico, tornare dopo un po’ e trovare un lavoro completo, con fonti verificate e tabelle pronte per la revisione.

La novità più profonda, forse il vero passaggio chiave, è che il modello ragiona in loop:

  • se un’iterazione non basta, la riscrive;
  • se un dato appare dubbio, lo confronta con un’altra fonte;
  • se manca una visualizzazione, la genera.


È l’evoluzione concreta del concetto di agente IA: percepire, pianificare, agire, valutare, ripetere.

Nelle note tecniche, OpenAI insiste su due leve fondamentali:

  • lo scaling dell’inferenza, cioè più calcolo dedicato al ragionamento in tempo reale;
  • lo scaling del reinforcement learning, con più iterazioni di feedback umano che sollevano l’intera curva compute vs. intelligence.

I risultati di o3 e o4 mini dimostrano che le due scale non si escludono, ma si potenziano a vicenda — e lasciano intendere che c’è ancora margine di crescita.

I limiti dei modelli di ragionamento come o3 e o4 mini

Molti commentatori hanno salutato questi modelli come la “soluzione definitiva” alla matematica, per la loro scioltezza in algebra, calcolo e programmazione simbolica.
È vero: nei test interni risolvono Sudoku esperti e dimostrano teoremi di media difficoltà.
Ma non scrivono ancora articoli accademici complessi né vincono da soli le Olimpiadi Internazionali (anche se, forse, già ora potrebbero piazzarsi sul podio).
Il progresso è notevole, ma la strada è ancora aperta.

Si abbassa il costo

Dal punto di vista dello sviluppo, OpenAI ha già reso disponibili i modelli anche via API, permettendo a chi sviluppa di sperimentare l’integrazione di tool multipli in una singola chiamata.

Il costo d’ingresso per progetti AI diminuisce, mentre la qualità media delle risposte sale: un invito implicito a ripensare flussi di lavoro e prodotti digitali.
L’esperienza utente passa da “prompt → risposta” a “brief → processo completo”, con un modello che mostra come ragiona, non solo dice cosa pensa.

O3 e vicino all’AGI?

Interessante notare che, quando gli ingegneri di OpenAI hanno visto o3 all’opera, hanno ammesso di aver sentito, per la prima volta, la tentazione di usare la parola AGI.
Un segnale forte — non perché il traguardo sia già raggiunto, ma perché l’orizzonte appare meno nebuloso.
Se un modello può usare strumenti, ragionare su immagini, tenere memoria delle nostre preferenze e farlo in pochi secondi, allora il futuro non è più un concetto astratto: è un prototipo funzionante.

Grazie a trasparenza nel processo, governo del rischio e utilità concreta per le persone, l’IA è sempre più un partner capace di imparare, collaborare e apprendere.

EU Stories - La coesione innova l'Italia

Tutti
L'ANALISI
INIZIATIVE
PODCAST
Video&podcast
Analisi
VIDEO&PODCAST
Video & Podcast
Social
Iniziative
INNOVAZIONE
EU Stories | Dalla produzione industriale a fucina di innovazione: come il Polo universitario della Federico II a San Giovanni a Teduccio ha acceso il futuro
L'INIZIATIVA
DNSH e Climate proofing: da adempimento ad opportunità. Spunti e proposte dal FORUM PA CAMP Campania
INNOVAZIONE
EU Stories, il podcast | Laboratori Aperti: riqualificazione e innovazione in 10 città dell’Emilia-Romagna
Da OpenCoesione 3.0 a Cap4City: ecco i progetti finanziati dal CapCoe.  Il podcast “CapCoe. La coesione riparte dalle persone”
Capacità amministrativa e coesione: il binomio vincente per lo sviluppo dei territori
FORUM PA PLAY: come unire sostenibilità e investimenti pubblici. Speciale FORUM PA CAMP Campania
Scenari
Il quadro economico del Sud: tra segnali di crescita e nuove sfide
Sostenibilità
Lioni Borgo 4.0: un passo verso la città del futuro tra innovazione e sostenibilità
Podcast
Centro Servizi Territoriali: uno strumento per accompagnare gli enti nell’attuazione della politica di coesione. Il podcast “CapCoe. La coesione riparte dalle persone”
Podcast
EU Stories, il podcast | Politiche di coesione e comunicazione: una sinergia per il futuro
Opinioni
La comunicazione dei fondi europei da obbligo ad opportunità
eBook
L'analisi della S3 in Italia
Norme UE
European Accessibility Act: passi avanti verso un’Europa inclusiva
Agevolazioni
A febbraio l’apertura dello sportello Mini Contratti di Sviluppo
Quadri regolamentari
Nuovi Orientamenti sull’uso delle opzioni semplificate di costo
Coesione
Nuovo Bauhaus Europeo (NEB): i premi che celebrano innovazione e creatività
Dossier
Pubblicato il long form PO FESR 14-20 della Regione Sicilia
Iniziative
400 milioni per sostenere lo sviluppo delle tecnologie critiche nel Mezzogiorno
Formazione
“Gian Maria Volonté”: dalle aule al mondo del lavoro, focus sui tirocini della Scuola d’Arte Cinematografica
TRANSIZIONE ENERGETICA
Il ruolo del finanziamento BEI per lo sviluppo del fotovoltaico in Sicilia
Formazione
“Gian Maria Volonté”: dalla nascita ai progetti futuri, focus sulla Scuola d’Arte Cinematografica. Intervista al coordinatore Antonio Medici
MedTech
Dalla specializzazione intelligente di BionIT Labs una innovazione bionica per la disabilità
Finanza sostenibile
BEI e E-Distribuzione: investimenti per la sostenibilità energetica
Professioni
Servono competenze adeguate per gestire al meglio i fondi europei
Master
Come formare nuove professionalità per governare e gestire al meglio i fondi europei?
Programmazione UE
Assunzioni per le politiche di coesione: prossimi passi e aspettative dal concorso nazionale. Il podcast “CapCoe. La coesione riparte dalle persone”
innovazione sociale
Rigenerazione urbana: il quartiere diventa un hub dell’innovazione. La best practice di San Giovanni a Teduccio
Programmazione europ
Fondi Europei: la spinta dietro ai Tecnopoli dell’Emilia-Romagna. L’esempio del Tecnopolo di Modena
Interventi
Riccardo Monaco e le politiche di coesione per il Sud
Iniziative
Implementare correttamente i costi standard, l'esperienza AdG
Finanziamenti
Decarbonizzazione, 4,8 miliardi di euro per progetti cleantech
Formazione
Le politiche di Coesione UE, un corso gratuito online per professionisti e giornalisti
Interviste
L’ecosistema della ricerca e dell’innovazione dell’Emilia-Romagna
Interviste
La ricerca e l'innovazione in Campania: l'ecosistema digitale
Iniziative
Settimana europea delle regioni e città: un passo avanti verso la coesione
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
EuroPCom 2024: innovazione e strategia nella comunicazione pubblica europea
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia
INNOVAZIONE
EU Stories | Dalla produzione industriale a fucina di innovazione: come il Polo universitario della Federico II a San Giovanni a Teduccio ha acceso il futuro
L'INIZIATIVA
DNSH e Climate proofing: da adempimento ad opportunità. Spunti e proposte dal FORUM PA CAMP Campania
INNOVAZIONE
EU Stories, il podcast | Laboratori Aperti: riqualificazione e innovazione in 10 città dell’Emilia-Romagna
Da OpenCoesione 3.0 a Cap4City: ecco i progetti finanziati dal CapCoe.  Il podcast “CapCoe. La coesione riparte dalle persone”
Capacità amministrativa e coesione: il binomio vincente per lo sviluppo dei territori
FORUM PA PLAY: come unire sostenibilità e investimenti pubblici. Speciale FORUM PA CAMP Campania
Scenari
Il quadro economico del Sud: tra segnali di crescita e nuove sfide
Sostenibilità
Lioni Borgo 4.0: un passo verso la città del futuro tra innovazione e sostenibilità
Podcast
Centro Servizi Territoriali: uno strumento per accompagnare gli enti nell’attuazione della politica di coesione. Il podcast “CapCoe. La coesione riparte dalle persone”
Podcast
EU Stories, il podcast | Politiche di coesione e comunicazione: una sinergia per il futuro
Opinioni
La comunicazione dei fondi europei da obbligo ad opportunità
eBook
L'analisi della S3 in Italia
Norme UE
European Accessibility Act: passi avanti verso un’Europa inclusiva
Agevolazioni
A febbraio l’apertura dello sportello Mini Contratti di Sviluppo
Quadri regolamentari
Nuovi Orientamenti sull’uso delle opzioni semplificate di costo
Coesione
Nuovo Bauhaus Europeo (NEB): i premi che celebrano innovazione e creatività
Dossier
Pubblicato il long form PO FESR 14-20 della Regione Sicilia
Iniziative
400 milioni per sostenere lo sviluppo delle tecnologie critiche nel Mezzogiorno
Formazione
“Gian Maria Volonté”: dalle aule al mondo del lavoro, focus sui tirocini della Scuola d’Arte Cinematografica
TRANSIZIONE ENERGETICA
Il ruolo del finanziamento BEI per lo sviluppo del fotovoltaico in Sicilia
Formazione
“Gian Maria Volonté”: dalla nascita ai progetti futuri, focus sulla Scuola d’Arte Cinematografica. Intervista al coordinatore Antonio Medici
MedTech
Dalla specializzazione intelligente di BionIT Labs una innovazione bionica per la disabilità
Finanza sostenibile
BEI e E-Distribuzione: investimenti per la sostenibilità energetica
Professioni
Servono competenze adeguate per gestire al meglio i fondi europei
Master
Come formare nuove professionalità per governare e gestire al meglio i fondi europei?
Programmazione UE
Assunzioni per le politiche di coesione: prossimi passi e aspettative dal concorso nazionale. Il podcast “CapCoe. La coesione riparte dalle persone”
innovazione sociale
Rigenerazione urbana: il quartiere diventa un hub dell’innovazione. La best practice di San Giovanni a Teduccio
Programmazione europ
Fondi Europei: la spinta dietro ai Tecnopoli dell’Emilia-Romagna. L’esempio del Tecnopolo di Modena
Interventi
Riccardo Monaco e le politiche di coesione per il Sud
Iniziative
Implementare correttamente i costi standard, l'esperienza AdG
Finanziamenti
Decarbonizzazione, 4,8 miliardi di euro per progetti cleantech
Formazione
Le politiche di Coesione UE, un corso gratuito online per professionisti e giornalisti
Interviste
L’ecosistema della ricerca e dell’innovazione dell’Emilia-Romagna
Interviste
La ricerca e l'innovazione in Campania: l'ecosistema digitale
Iniziative
Settimana europea delle regioni e città: un passo avanti verso la coesione
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
EuroPCom 2024: innovazione e strategia nella comunicazione pubblica europea
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia

Articoli correlati

Articolo 1 di 4