Nelle ultime settimane non ho potuto fare a meno di notare una tendenza nelle previsioni 2024 per l’AI: molte sembrano quasi troppo ovvie per essere etichettate come previsioni. Affermazioni sulla crescita dell’influenza dell’AI in vari settori, la maggior richiesta di competenze in materia di AI e la diffusione delle soluzioni AI multimodali sono certamente probabili, ma definirle previsioni mi pare un’esagerazione.
Sulla base di ciò, ho deciso di condividere le mie previsioni personali sull’IA per il 2024. Si noti che queste sono puramente congetture personali.
Oltre il linguaggio umano: i modelli di mondi
Riflettendo sulla storia dell’AI Generativa, è chiaro che i LLM come ChatGPT e Bard sono stati inizialmente focalizzati prevalentemente sull’elaborazione del testo. Per quanto rivoluzionari, il loro ambito è stato in gran parte confinato a compiti linguistici (sono correttamente chiamati “Large Language Models”). Man mano che l’IA evolve per integrare domini multimodali – che comprendono testo, immagini, audio, video, interazioni fisiche e scientifiche – il termine ‘LLM’ (Large Language Model) sembra sempre più inadeguato.
Mi aspetto che presto osserveremo un cambiamento fondamentale sia nella terminologia che nelle soluzioni AI, che rimodellerà la nostra comprensione dell’IA. Questa trasformazione, che credo fermamente definirà il 2024, ci porta dal regno dei Large Language Models (LLM) a un’era dominata da ciò che propongo di chiamare “modelli di mondi”. Questo cambio non è solo un aggiornamento linguistico; rappresenta una rivoluzione concettuale profonda, segnalando il progresso dell’IA verso un’era più integrata e globalmente sfumata.
I modelli di mondi non saranno solo abili nell’elaborazione di una varietà di input di dati – trascendono i confini tradizionali. Immaginate un modello di IA progettato per la scoperta di farmaci, che analizza le strutture molecolari. Questo modello non è solo un modello linguistico; sta avventurandosi nel regno della linguistica biologica. In chimica si possono utilizzare i componenti chimici come “parole” per il WM, e questo si estende a tutti i regni della scienza. Qui, il termine WM diventa molto più appropriato, racchiudendo le capacità più ampie del modello.
Le potenziali applicazioni
Le potenziali applicazioni dei WM sono incredibilmente emozionanti. Nell’assistenza sanitaria, i WM rivoluzioneranno la medicina personalizzata interpretando complessi dati genetici. Nelle scienze ambientali, prevedono modelli climatici analizzando vasti array di immagini satellitari e dati sensoriali. E nella robotica, i WM consentono alle macchine di comprendere e interagire con il mondo con un livello di sofisticazione senza precedenti, combinando dati visivi, suoni, percezione fisica e persino sensori non umani come infrarossi, radar, scanner termici e altri dati IoT mondiali, per la presa di decisioni in tempo reale. In breve, il nostro mondo diventerà il linguaggio dei WM.
È degno di nota che l’avvento dei Modelli di Mondi richiede una collaborazione interdisciplinare senza precedenti. Integrare l’esperienza di campi come la linguistica, la sociologia, le scienze ambientali e altro è fondamentale per garantire che i WM non siano solo tecnicamente competenti, ma anche consapevoli del contesto e sensibili alle sfumature di vari domini. Questo approccio collaborativo sarà fondamentale nello sviluppo di WM non solo innovativi ma anche responsabili e riflessivi del mondo diversificato a cui sono destinati. La transizione ai WM non sarà senza le sue sfide. Problemi come la privacy dei dati, le esigenze di risorse computazionali e i pregiudizi intrinseci nei modelli di IA sono ostacoli significativi. Affrontare queste sfide richiederà uno sforzo collettivo maggiore da parte di tecnologi, etici e politici. I WM hanno la promessa di un mondo più interconnesso e intelligente, ma portano anche domande critiche sulla governance dei dati e l’etica dell’IA che dobbiamo affrontare direttamente.
Dai modelli generativi alle AI attive e personalizzate
Man mano che avanziamo nel 2024, il panorama dell’Intelligenza Artificiale potrebbe evolversi da essere prevalentemente generativo a diventare altamente personalizzato e proattivo nel suo approccio. I modelli Pre-addestrati Generativi (GPT), che sono stati il simbolo dei recenti avanzamenti dell’IA, specialmente nel 2023, sono ora integrati con dati specifici degli utenti, portando a una nuova era di esperienze AI personalizzate.
Uno dei passi significativi nello sviluppo dell’IA è l’emergenza di modelli basati su agenti. Questi modelli sono progettati per interagire con varie interfacce come le risorse della tua azienda, piattaforme per l’acquisto di biglietti e app per i trasporti, fornendo un’esperienza più integrata e interattiva. Sebbene questi modelli abbiano mostrato solo progressi tentativi nel 2023, potrebbero dimostrare applicazioni più convincenti nel 2024. Ad esempio, compiti noiosi come la presentazione di richieste di assicurazione potrebbero essere semplificati usando questi AI basati su agenti, mostrando la loro utilità pratica in scenari reali.
I “compagni AI”
Un problema è che ChatGPT e altri strumenti di AI generativa non ti conoscono davvero. Possono ricordare alcune delle tue richieste precedenti, ma queste vengono rapidamente dimenticate. Immagina uno strumento che ti conosce davvero – cosa ti piace, come lavori, cosa sai e cosa non sai, cosa hai chiesto in passato e cosa potresti aver bisogno in futuro. Un compagno AI saprà quale app può risolvere un problema che hai, poi la scaricherà e la configurerà per te.
Ti aiuterà a redigere una proposta di affari, scrivere un’email, condividere un selfie, analizzare i tuoi dati, proporre un corso di formazione, pianificare una riunione, acquistare un biglietto del treno o persino suggerire un cambiamento nello stile di vita. Questi “compagni AI” saranno progettati per comprendere le preferenze e i comportamenti individuali degli utenti. A differenza degli strumenti AI precedenti, che avevano una comprensione limitata del contesto dell’utente, questi compagni AI saranno in grado di offrire assistenza personalizzata. Promettono di essere più che semplici assistenti; mirano a essere compagni proattivi nella gestione di vari aspetti della nostra vita.
Clippy non è sopravvissuto e Siri, Alexa e Cortana a volte possono essere stati deludenti. Ma questi strumenti erano alimentati da vecchia tecnologia AI. I compagni AI generativi saranno in grado di prevedere ciò che desideri, trovare ciò di cui hai bisogno e generare nuove informazioni per aiutarti a vivere e lavorare meglio. Vuoi pianificare un weekend a Bergamo? Suggerirà hotel adatti al tuo budget, ristoranti che servono cibo che ti piace e attività compatibili con il tuo stile di vita. Poi, se approvi, cercherà su Internet le migliori offerte, negozierà i prezzi direttamente e gestirà la prenotazione per te, organizzando il tuo intero weekend in base alle tue preferenze e indicazioni.
Questo passaggio verso la personalizzazione, combinato con l’agire proattivo dei sistemi AI, segnerà una nuova era in cui l’IA non è solo uno strumento per compiti generativi ma un compagno attivo personalizzato che aiuta in vari aspetti della vita. Sebbene rimangano sfide come le preoccupazioni per la privacy, i benefici offerti da questi sistemi AI avanzati potrebbero portare alla loro diffusa adozione nel 2024.
L’anno dei Deep fake
La mia terza previsione per il 2023 ruota più attorno a una preoccupazione pressante piuttosto che a una semplice previsione. L’anno 2024 potrebbe essere segnato come l’anno del Deep fake, una tecnologia che è stata sullo sfondo ma che è destinata a emergere in primo piano nel prossimo anno a causa della sua migliore accessibilità, qualità e potenziali conseguenze.
Gli strumenti necessari per creare deep fake stanno diventando sempre più disponibili e convenienti. L’intelligenza artificiale generativa, che è molto efficace in questo dominio, è un fattore chiave. Ad esempio, l’IA può ora generare email in qualsiasi stile con notevole accuratezza. Sta diventando difficile discernere se un messaggio provenga veramente da una persona o sia una facciata generata dall’IA. Questa incertezza ha persino portato alcuni nel mondo della tecnologia a scrivere in minuscolo senza punteggiatura, come mezzo per distinguere l’autore umano.
I veri progressi nel 2024, tuttavia, sono attesi nei settori audio e video. Le tecnologie di clonazione vocale, come quelle di molte aziende start-up, hanno raggiunto un punto in cui possono replicare le voci con sorprendente precisione. Questo avanzamento minaccia l’affidabilità delle misure di sicurezza basate sulla voce e delle segreterie telefoniche. Potresti facilmente usare questa tecnologia per clonare la tua voce, permettendoti di narrare contenuti scritti senza sforzo. Tuttavia, questa comodità viene con un lato negativo: nelle mani sbagliate, potrebbe portare a rappresentazioni fuorvianti.
Il settore video è ancora più trasformativo. Combinando voci clonate con video si otterranno filmati altamente convincenti di individui che dicono o fanno cose che non hanno mai fatto. Questi video stanno diventando più realistici, accessibili ed economici da produrre. Considera il caos che potrebbe essere scatenato da un video fabbricato che mostra un CEO di spicco in una situazione compromettente o un dirigente che fa ammissioni dannose sui loro prodotti. Questo potrebbe intensificare lo spionaggio aziendale e il ricatto.
Gli impatti sulla politica e le possibili ripercussioni
L’impatto si estende all’arena politica. Nel 2024, sono previste elezioni chiave a livello globale in paesi come gli Stati Uniti, l’India, l’Indonesia, il Messico, la Russia e il Regno Unito. Sono molto preoccupato dell’impatto che i video deep fake potrebbero avere nell’influenzare queste elezioni. La diffusione diffusa di video deep-fake potrebbe creare incertezza sull’autenticità delle informazioni, potenzialmente influenzando gli esiti delle elezioni.
Le ripercussioni sono vaste, che vanno dalla frode elettorale e dal ricatto aziendale alla manipolazione del mercato e agli incidenti di cybersecurity che coinvolgono deep fakes. Una chiave per discernere l’autenticità dei contenuti potrebbe risiedere in piccoli dettagli, come l’aspetto delle orecchie e delle dita. Come risposta, potrebbe emergere un’industria specializzata, incentrata sullo sviluppo di strumenti di IA per rilevare contenuti creati da altre tecnologie di IA.
Conclusione
Ho scelto di condividere le tre previsioni sull’IA per il 2024 sopra, poiché credo che comprendano sviluppi ampi e potenzialmente impattanti sulla vita di molti di noi. Ci sono numerosi altri avanzamenti che l’IA porterà nel nuovo anno. Questi includono applicazioni mainstream che integrano l’IA, un riposizionamento oltre la dicotomia tra Ricerca e Generativo, progressi significativi nella traduzione simultanea e una varietà di nuove applicazioni specifiche per l’industria e la funzione dell’IA.