intelligenza artificiale

GPT-4o mini, costi ridotti e buone prestazioni: la nostra prova



Indirizzo copiato

GPT-4o Mini offre prestazioni superiori a GPT-3.5 a costi ridotti. Migliora la capacità di ragionamento e gestisce input multimodali, aprendo nuovi scenari di utilizzo sostenibili

Pubblicato il 2 ago 2024

Antonio Cisternino

Università di Pisa



intelligenza artificiale mano

Senza troppo clamore OpenAI ha annunciato il nuovo modello GPT-4o mini, sarà perché in fondo si tratta di un modello meno capace di GPT-4o, ma in concreto si tratta di un annuncio di grande impatto: un po’ perché ha pensionato GPT-3.5, il modello che ha di fatto dato il via alla diffusione dell’AI generativa a fine 2022, un po’ perché è il modello che viene utilizzato per gli utenti che usano ChatGPT nel livello gratuito, un po’ perché abbassa ulteriormente il costo per chi fa uso delle API, portando a 15 centesimi per milione di token di input e 60 centesimi per milione di token (circa 2500 pagine di testo).

OpenAI's GPT-4o-Mini - The Maxiest Mini Model?

Il modello si comporta significativamente meglio di GPT-3.5 turbo in tutti i benchmark, e aggiunge anche la possibilità di analizzare immagini ad un costo decisamente più basso del modello più grande GPT-4o.

Immagine che contiene testo, Policromia, schermata, diagrammaDescrizione generata automaticamente

Il calo del costo dei modelli

L’annuncio di OpenAI sottolinea come il costo dei modelli è calato del 99% rispetto al 2022, e sicuramente si tratta di un fatto degno di nota. Costi più bassi per l’accesso a mega-modelli capaci di parlare molte lingue implica una pervasività maggiore in servizi. Si tratta anche di un costo che rende difficile da confrontare rispetto all’esecuzione locale di modelli aperti, anche se ovviamente la questione della riservatezza dei dati è rilevante; anche se recentemente OpenAI ha pubblicato un articolo in cui discute l’uso di un meccanismo noto come RBR per addestrare i modelli a comportarsi in modo sicuro invece del tipico RLHF basato sul feedback umano, riducendo la necessità di grandi moli di dati generati dagli utenti per l’addestramento.

Un confronto con GPT-3.5

Sappiamo bene come i benchmark possano essere fuorvianti rispetto alla performance percepita nell’uso dei modelli in casi d’uso reali. Proviamo quindi a confrontare i due modelli utilizzando il Playground che OpenAI mette a disposizione degli sviluppatori, anche perché si tratta dell’unico modo in cui si possa ancora utilizzare GPT-3.5 puntualmente rimosso dall’interfaccia di ChatGPT.

Una prova pratica per testare la differenza nella capacità di ragionamento

Useremo la capacità del playground di confrontare due modelli a parità di prompt:

Immagine che contiene testo, ricevuta, Carattere, lineaDescrizione generata automaticamente

Usando uno dei miei test personali di ragionamento si vede subito la differenza nella capacità di ragionamento:

Immagine che contiene testo, schermata, Carattere, ricevutaDescrizione generata automaticamente

GPT-4o mini risponde sempre correttamente mentre 3.5 risponde spesso in modo differente e qualche volta addirittura correttamente (ma il più delle volte sbaglia).

Anche la capacità di argomentazione è più consistente ed articolata nel caso del nuovo arrivato:

Immagine che contiene testo, schermata, documento, CarattereDescrizione generata automaticamente

Risposte veloci e più accurate con Gpt4o mini

Anche se si pongono problemi logici un po’ più complessi la qualità della risposta è decisamente superiore:

Immagine che contiene testo, schermata, Carattere, documentoDescrizione generata automaticamente

È sicuramente da notare come la latenza nella risposta dei due modelli sia paragonabile, è quindi davvero possibile avere anche delle risposte veloci e più accurate con il nuovo modello.

Anche se usiamo indovinelli con trabocchetto GPT-4o mini è decisamente superiore

Immagine che contiene testo, schermata, documento, CarattereDescrizione generata automaticamente

Modelli a confronto su domande di conoscenza generale

Su domande di conoscenza generale i due modelli si comportano in modo analogo:

Immagine che contiene testo, schermata, Carattere, documentoDescrizione generata automaticamente

Il comportamento in presenza di conoscenza inserita nel prompt da un sistema RAG è consistente e paragonabile:

Immagine che contiene testo, schermata, Carattere, documentoDescrizione generata automaticamente

Se la richiesta prevede la capacità di ragionare utilizzando la conoscenza fornita nel prompt GPT-4o mini si comporta decisamente meglio di GPT-3.5.

L’ultimo modello consente anche l’analisi di immagini ad un prezzo decisamente più basso del modello GPT-4o e con un risultato di buona qualità:

Immagine che contiene testo, schermata, Pagina Web, Sito WebDescrizione generata automaticamente
Immagine che contiene aria aperta, cielo, terreno, acquaDescrizione generata automaticamente

Se invece chiediamo a GPT-3.5 otteniamo un errore:

Immagine che contiene testo, schermata, Pagina Web, softwareDescrizione generata automaticamente

Perché Gpt-4o mini è superiore a Gpt-3.5

Dai primi test GPT-4o mini è un modello decisamente superiore rispetto a GPT-3.5 che a questo punto può serenamente andare in pensione. OpenAI assume circa 400 token per pagina di testo, e quindi il supporto di finestre di contesto di 128 mila token in input e fino a 16 mila token in output corrispondono alla possibilità di analizzare un documento di circa 300 pagine e generare un documento di circa 40 pagine.

Costi e empowerment

Anche dal punto di vista dei costi, i nuovi modelli di OpenAI, nonostante siano più capaci, costano meno del 40% rispetto al costo di GPT-3.5 offrendo l’accesso ad un modello molto capace ad un costo addirittura inferiore.

Da un punto di vista dell’empowerment la possibilità di fornire immagini in input apre nuovi scenari anche a chi non vuole spendere troppo nel fornire servizi ai propri utenti.

Immagine che contiene testo, schermata, Carattere, documentoDescrizione generata automaticamente
Immagine che contiene testo, schermata, Carattere, documentoDescrizione generata automaticamente

Ho provato a fornire lo screenshot delle proprietà del mio WiFi di casa chiedendo un’opinione sui profili di rischio. La valutazione della schermata è stata decisamente ineccepibile.

Ssostenibilità

La possibilità quindi di usare un modello a basso costo che ammetta input multimodale potrebbe aprire scenari interessanti non tanto per la possibilità, ma per la sostenibilità dei costi in produzione.

Conclusioni

Non possiamo che concludere che per chi abbia usato GPT-3.5 nei propri programmi conviene passare al nuovo GPT-4o mini semplicemente cambiando la stringa del modello. Per chi usa ChatGPT potrà attendersi risposte migliori anche dal servizio gratuito.

Ancora una volta OpenAI ha mostrato un’attenzione che non si limita alle sole capabilities della tecnologia, ma anche ai suoi impieghi e costi. Non resta che vedere cosa faranno gli sviluppatori con un modello il cui comportamento è molto vicino al fratello maggiore GPT-4o ma ad un prezzo decisamente più basso.

Non scordiamoci però di ringraziare GPT-3.5 per il suo servizio, e per aver rivelato al mondo che l’AI generativa era pronta per il grande pubblico, un po’ mi mancherà, ma forse sto solo personificando un sistema software. Chissà se ha chiesto di non essere spento come HAL in 2001 Odissea nello spazio…

Speciale PNRR

Tutti
Incentivi
Salute digitale
Formazione
Analisi
Sostenibilità
PA
Sostemibilità
Sicurezza
Digital Economy
CODICE STARTUP
Imprenditoria femminile: come attingere ai fondi per le donne che fanno impresa
DECRETI
PNRR e Fascicolo Sanitario Elettronico: investimenti per oltre 600 milioni
IL DOCUMENTO
Competenze digitali, ecco il nuovo piano operativo nazionale
STRUMENTI
Da Istat e RGS gli indicatori per misurare la sostenibilità nel PNRR
STRATEGIE
PNRR – Piano nazionale di Ripresa e Resilienza: cos’è e novità
FONDI
Pnrr, ok della Ue alla seconda rata da 21 miliardi: focus su 5G e banda ultralarga
GREEN ENERGY
Energia pulita: Banca Sella finanzia i progetti green incentivati dal PNRR
TECNOLOGIA SOLIDALE
Due buone notizie digitali: 500 milioni per gli ITS e l’inizio dell’intranet veloce in scuole e ospedali
INNOVAZIONE
Competenze digitali e InPA cruciali per raggiungere gli obiettivi del Pnrr
STRATEGIE
PA digitale 2026, come gestire i fondi PNRR in 5 fasi: ecco la proposta
ANALISI
Value-based healthcare: le esperienze in Italia e il ruolo del PNRR
Strategie
Accordi per l’innovazione, per le imprese altri 250 milioni
Strategie
PNRR, opportunità e sfide per le smart city
Strategie
Brevetti, il Mise mette sul piatto 8,5 milioni
Strategie
PNRR e opere pubbliche, la grande sfida per i Comuni e perché bisogna pensare digitale
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr
CODICE STARTUP
Imprenditoria femminile: come attingere ai fondi per le donne che fanno impresa
DECRETI
PNRR e Fascicolo Sanitario Elettronico: investimenti per oltre 600 milioni
IL DOCUMENTO
Competenze digitali, ecco il nuovo piano operativo nazionale
STRUMENTI
Da Istat e RGS gli indicatori per misurare la sostenibilità nel PNRR
STRATEGIE
PNRR – Piano nazionale di Ripresa e Resilienza: cos’è e novità
FONDI
Pnrr, ok della Ue alla seconda rata da 21 miliardi: focus su 5G e banda ultralarga
GREEN ENERGY
Energia pulita: Banca Sella finanzia i progetti green incentivati dal PNRR
TECNOLOGIA SOLIDALE
Due buone notizie digitali: 500 milioni per gli ITS e l’inizio dell’intranet veloce in scuole e ospedali
INNOVAZIONE
Competenze digitali e InPA cruciali per raggiungere gli obiettivi del Pnrr
STRATEGIE
PA digitale 2026, come gestire i fondi PNRR in 5 fasi: ecco la proposta
ANALISI
Value-based healthcare: le esperienze in Italia e il ruolo del PNRR
Strategie
Accordi per l’innovazione, per le imprese altri 250 milioni
Strategie
PNRR, opportunità e sfide per le smart city
Strategie
Brevetti, il Mise mette sul piatto 8,5 milioni
Strategie
PNRR e opere pubbliche, la grande sfida per i Comuni e perché bisogna pensare digitale
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr

Articoli correlati

Articolo 1 di 3