intelligenza artificiale

AI generativa: sei strade per lo sviluppo nel 2024



Indirizzo copiato

Difficile prevedere le evoluzioni dell’intelligenza artificiale generativa nel 2024,considerando i cambiamenti repentini di questa innovazione nell’anno appena trascorso: ecco qualche prospettiva

Pubblicato il 8 gen 2024

Antonio Cisternino

Università di Pisa



intelligenza artificiale digitale

È difficile fare ipotesi sugli sviluppi dell’intelligenza artificiale nel corso del 2024. Del resto, per fare un esempio, in meno di due anni Midjourney è passata dalla generazione di immagini facilmente identificabili come tali a immagini che anche agli occhi più esperti sono difficili da identificare come generate.

E non è un caso che il Presidente della Repubblica Sergio Mattarella abbia menzionato l’intelligenza artificiale come uno dei grandi temi nel messaggio di fine anno il 31 dicembre 2023, sottolineandone la centralità e l’urgenza affinché sia una tecnologia capace di mantenere l’uomo al centro.

Sebbene rivoluzionario, il 2023 è stato caratterizzato da un continuo miglioramento di intelligenze artificiali basati sull’architettura dei transformer e la loro applicazione all’audio, al video e al testo.

È difficile immaginare quindi che il progresso delle tecnologie base dell’intelligenza artificiale generativa porti a nuove rivoluzioni, a meno di introduzione di nuove tecniche e fattori di innovazione; è piuttosto prevedibile che il 2024 sarà un anno di consolidamento degli elementi di base come, ad esempio, dei modelli LLM e dei modelli cosiddetti multimodali, capaci di usare audio, video e testo nell’interazione come sottolineato dal video di Google che annunciava il nuovo modello Gemini.

Le prospettive 2024: sei evoluzioni per l’AI

Da quello che si è potuto osservare negli ultimi mesi i vettori di sviluppo dei sistemi di AI, il 2024 sembra caratterizzarsi attorno le seguenti sei direzioni:

  • L’avvento dei modelli multimodali e i grandi modelli
  • La crescita dei piccoli modelli e il loro avvicinarsi alle capacità dei grandi modelli
  • La sfida del ragionamento
  • L’introduzione di piccoli modelli capaci di eseguire all’interno di dispositivi di uso personale come smartphone e PC
  • L’integrazione nei sistemi tradizionali di funzioni di AI generativa, a partire dal cloud
  • L’impiego di modelli AI in processi di analisi e produttivi come, ad esempio, lo sviluppo di applicazioni, il design ingegneristico o la diagnosi di immagini.

Lo sviluppo di queste tecnologie sarà inevitabilmente condizionato dalle azioni legislative e giudiziarie concentrate sull’AI generativa come, ad esempio, i pronunciamenti in cause come quella fatta dal New York Times a Microsoft e Open AI relativamente al materiale utilizzato per addestrare GPT. Come è già successo dopo il provvedimento del garante italiano nei confronti di OpenAI, questi procedimenti potrebbero condizionare lo sviluppo contribuendo a correggere la traiettoria e portare ad innovazioni che siano anche rispettose degli aspetti sociali.

I modelli multimodali

La fine del 2023 è stata caratterizzata dall’introduzione di Google del modello Gemini, il primo che sembra in grado di contrastare l’attuale dominio di OpenAI e Microsoft. Sebbene OpenAI disponga di modelli come GPT-Vision e i modelli di analisi e sintesi di audio, l’integrazione di questi elementi non sembra così matura nelle attuali implementazioni. Certo, è possibile parlare con l’AI utilizzando la app, ma la sottomissione di immagini è ancora in qualche modo avulsa dall’interazione e viene di fatto ricondotta alla richiesta esplicita dell’utente e non è integrata nel flusso interattivo come invece sembrerebbe fare Gemini nella versione ultra che sarà rilasciata a breve.

Per loro natura i modelli multimodali richiedono più risorse computazionali per l’addestramento, è lecito quindi aspettarsi che le novità del 2024 in questo settore arriveranno dai big: Microsoft/OpenAI, Google, Amazon e forse Apple (che ha dichiarato di lavorare nel settore senza dare ulteriori informazioni).

Samsung probabilmente lancerà già nel 2024 il suo primo smartphone con AI integrata.

Nella prima metà dell’anno ci si aspetta la risposta di Microsoft e OpenAI a Gemini in termini di GPT-4.5 o GPT-5, anche se Google deve ancora lavorare sull’ecosistema che fornisce accesso al modello, sia in termini dell’API che con funzionalità come i plugin o le funzioni che sono ancora assenti nell’offerta del gigante di Mountain View.

La crescita dei piccoli modelli

La startup francese Mistral ha mostrato come sia possibile avvicinarsi alle prestazioni di GPT-3.5 con un modello con meno di un terzo dei parametri (56 miliardi contro i 175 miliardi) e soprattutto con la capacità di usarne poco più di un ottavo riducendo significativamente la necessità computazionale della sua esecuzione. Mixtral8x7 consente infatti di comportarsi come un gruppo di 8 AI che vengono consultate selettivamente mostrando, almeno nei benchmark, delle prestazioni decisamente interessanti per un modello relativamente piccolo, confrontabile con quelli da 7 e 13 miliardi di parametri.

La natura aperta del modello ha inoltre contribuito a ispirare altri ricercatori che hanno prodotto altri modelli piccoli ma molto efficaci anch’essi capaci di parlare italiano come Loquace o Llamantino.

I modelli di questa taglia possono essere eseguiti senza dover attingere a risorse disponibili solo ai grandi cloud provider, anche se gli investimenti per poter erogare un servizio basato su questi modelli non sono certo trascurabili, anche se l’introduzione di acceleratori specifici come quelli prodotti da Groq sembra rendere possibile la realizzazione di servizi di AI generativa eseguiti da organizzazioni medio/grandi, superando il problema dell’elaborazione dei dati da parte dei grandi cloud provider.

La sfida del ragionamento e affidabilità

Le varie tecniche di prompting richiedono sempre più spesso una grande capacità dei modelli di seguire delle istruzioni. Sappiamo bene che l’attuale capacità dei modelli di seguire delle istruzioni esplicite non è sempre adeguata. Non le segue in modo deterministico; a volte le rispetta a volte no.

Non è un caso che sia nei modelli su Huggin Face che nei grandi annunci viene sempre più spesso enfatizzata una migliore capacità di eseguire delle istruzioni in modo affidabile. È quindi lecito attendersi un significativo miglioramento di questo aspetto nei modelli sviluppati nel corso del 2024.

Tema diverso è quello delle allucinazioni, che per come funzionano gli LLMA potrebbe essere un problema irrisolvibile. Almeno per quest’anno.

L’AI nei dispositivi personali

La seconda metà del 2023 è stata caratterizzata da due annunci molto importanti il cui effetto caratterizzerà significativamente il 2024, anche se è ancora presto per capire quali saranno le reali capacità e innovazioni portate dalle tecnologie annunciate. Il primo annuncio è stato di Intel e riguardava la nuova generazione di processori per i PC caratterizzati da una NPU (Neural Processing Unit) integrata nel processore al fine di poter eseguire modelli di AI localmente, consentendo applicazioni come l’indicizzazione “semantica” dei contenuti del proprio dispositivo offline e con la garanzia che i dati siano elaborati solo localmente, a tal proposito il calcolo degli “embeddings” usati dai sistemi RAG può certamente beneficiare da questo tipo di accelerazione hardware alla base dell’AI PC come è stato battezzato da Pat Gelsinger CEO di Intel.

Google ha poi annunciato il rilascio a inizio 2024 del modello Gemini nano, una versione compatta della sua nuova AI capace di eseguire in uno smartphone Android. Al momento è difficile capire l’effettivo contributo del modello nelle funzioni annunciate con il Pixel 8 Pro, dato che molte funzioni fanno uso dell’AI con capacità che difficilmente possono essere eseguite localmente.

Sembra che le funzioni che beneficiano di Gemini nano per ora sono solo la “summarize in recorder” (ovverosia la capacità di riassumere le registrazioni) e la funzione di “smart reply” in GBoard, capace di proporre risposte nelle conversazioni più sofisticate dei soliti commenti standard a cui ci hanno abituato questi sistemi.

Lo sviluppo delle capacità di Personal AI caratterizzerà molto delle innovazioni del 2024 poiché si tratta di una nuova area di impiego e che potrà portare a rapidi miglioramenti dei sistemi.

Integrazione delle tecnologie di AI generativa nei sistemi tradizionali

I sistemi come Microsoft Copilot, Google Duet, Adobe firefly continueranno la propria espansione nel corso del 2024. Sempre più spesso potremo avvalerci delle funzioni di AI generativa direttamente all’interno degli strumenti di produttività, generando bozze di testo, o generando elementi in un’immagine che si sta elaborando.

Si tratterà di una nuova caccia all’oro dei dati, è necessario infatti costruire indici “semantici” con le informazioni necessarie per poter generare i prompt che poi effettivamente generino informazioni utili, e nel corso dell’anno l’uso di questi indici, soprattutto per i sistemi consumer che non si pagano, sarà un nuovo e più intimo modo di analizzare il comportamento degli utenti.

Si intravedono già i primi effetti di questa pervasività degli strumenti AI, molti degli auguri di queste feste natalizie contenevano immagini evidentemente create da AI generativa, spesso rimpiazzando le immagini riciclate per inoltro degli anni precedenti.

Impiego nei processi di design, sviluppo e analisi

Il 2023 è stato caratterizzato dalle prime sperimentazioni nell’uso delle API per l’integrazione dei modelli AI in sistemi reali. Il 2024 vedrà sicuramente un impiego in produzione di questi prototipi per supportare i processi di design e sviluppo industriale (inclusa la programmazione e lo sviluppo di sistemi) e i sistemi di analisi di dati e immagini. Vedremo come la capacità di accelerare i processi produttivi contribuirà alla realizzazione di nuove funzioni e sistemi presumibilmente più complessi.

Conclusioni

Anticipare le evoluzioni di un settore così in fermento come quello dell’intelligenza artificiale è sicuramente un compito arduo e rischioso, non vedo però l’ora di vedere quanto mi sono sbagliato tra un anno, e quante novità non ho saputo anticipare in questo momento storico entusiasmante e rivoluzionario. Assumendomi il rischio penso di poter dire che il 2024 sarà l’anno delle popolazioni di AI, grazie alle capacità di eseguire modelli piccoli su dispositivi per uso personale e ai modelli capaci di comportamenti sofisticati con un numero relativamente piccolo di parametri.

È possibile immaginare quindi sistemi con agenti intelligenti specializzati su specifici domini di conoscenza che cooperano e si coordinano per risolvere problemi più complessi, si vocifera che già questa sia la struttura di GPT-4 ma in ogni caso è presumibile che la direzione promettente sia quella di aggregare modelli più piccoli come anche testimoniato dal modello mixtral8x7.

Come ultima nota: questo, come gli articoli precedenti, non è stato scritto con l’ausilio di AI generativa, il giorno che questo cambierà non mancherò di farvelo sapere.

EU Stories - La coesione innova l'Italia

Tutti
Analisi
Video
Iniziative
Social
Programmazione europ
Fondi Europei: la spinta dietro ai Tecnopoli dell’Emilia-Romagna. L’esempio del Tecnopolo di Modena
Interventi
Riccardo Monaco e le politiche di coesione per il Sud
Iniziative
Implementare correttamente i costi standard, l'esperienza AdG
Finanziamenti
Decarbonizzazione, 4,8 miliardi di euro per progetti cleantech
Formazione
Le politiche di Coesione UE, un corso gratuito online per professionisti e giornalisti
Interviste
L’ecosistema della ricerca e dell’innovazione dell’Emilia-Romagna
Interviste
La ricerca e l'innovazione in Campania: l'ecosistema digitale
Iniziative
Settimana europea delle regioni e città: un passo avanti verso la coesione
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
EuroPCom 2024: innovazione e strategia nella comunicazione pubblica europea
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia
Programmazione europ
Fondi Europei: la spinta dietro ai Tecnopoli dell’Emilia-Romagna. L’esempio del Tecnopolo di Modena
Interventi
Riccardo Monaco e le politiche di coesione per il Sud
Iniziative
Implementare correttamente i costi standard, l'esperienza AdG
Finanziamenti
Decarbonizzazione, 4,8 miliardi di euro per progetti cleantech
Formazione
Le politiche di Coesione UE, un corso gratuito online per professionisti e giornalisti
Interviste
L’ecosistema della ricerca e dell’innovazione dell’Emilia-Romagna
Interviste
La ricerca e l'innovazione in Campania: l'ecosistema digitale
Iniziative
Settimana europea delle regioni e città: un passo avanti verso la coesione
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
EuroPCom 2024: innovazione e strategia nella comunicazione pubblica europea
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia

Articoli correlati

Articolo 1 di 2