Le applicazioni basate su LLM come Microsoft Copilot, Amazon Q e il prossimo Project Astra di Google stanno passando dalla produzione di conoscenza a determinare azioni concrete.
Aziende e laboratori di ricerca come Adept, crewAI e Imbue stanno sviluppando architetture basate su agenti e sistemi multi-agente. Data la velocità di crescita delle innovazioni nel settore AI, gli agenti potrebbero diventare comuni come lo sono oggi i chatbot.
Gli agenti sono la prossima tappa dell’intelligenza artificiale generativa
Negli ultimi due anni, il mondo si è meravigliato delle capacità e delle potenzialità dimostrate dall’intelligenza artificiale generativa (GenAI). I modelli di base come i modelli linguistici di grandi dimensioni (LLM) possono estrarre informazioni e generare su numerosi media, come testo, audio, immagini e video. Ma la fase successiva dell’intelligenza artificiale generativa sarà probabilmente più trasformativa. Stiamo iniziando un’evoluzione da strumenti basati sulla conoscenza e alimentati dall’intelligenza artificiale generativa (ad esempio, chatbot che rispondono a domande e generano contenuti) ad “agenti” abilitati da GenAI che utilizzano modelli di base per eseguire flussi di lavoro complessi in un mondo digitale. In breve, la tecnologia si sta spostando dal pensiero all’azione.
Di cosa parliamo quando parliamo di sistemi ad agenti
In termini generali, i sistemi ad agenti si riferiscono a sistemi digitali che possono interagire in modo indipendente in un mondo dinamico. Dal secolo scorso, sono nati sistemi software ispirati a questo principio, ed i Nobel appena attribuiti a John Hopfield e Geoffrey Hinton, per ricerche che risalgono agli anni 80 del XX secolo, lo dimostrano ampliamente, e nell’ultima decade molte aspettative sono state avanzate dalla proposta di mercato designata dalla Robotic Process Automation. Tuttavia, le capacità di linguaggio naturale della GenAI offrono ai sistemi ulteriori possibilità di pianificare le proprie azioni, di collaborare con altri agenti e persone senza preoccuparsi dei formati di comunicazione, di utilizzare strumenti online pensati per le persone e di imparare a migliorare le proprie prestazioni.
Cosa rende speciali l’IA e gli agenti intelligenti
Tutti i software completano autonomamente diverse attività stabilite dallo sviluppatore. Quindi cosa rende speciali l’IA e gli agenti intelligenti? Gli agenti di IA sono agenti razionali, cioè prendono decisioni razionali in base ai dati a loro disposizione per produrre prestazioni e risultati ottimali. Un agente di IA rileva il proprio ambiente con interfacce fisiche o software. Ad esempio, un agente robotico raccoglie i dati dei sensori e un chatbot utilizza le richieste dei clienti come input. Quindi, l’agente di IA analizza i dati raccolti per prevedere i migliori risultati a supporto degli obiettivi predeterminati e produce decisioni informate. Successivamente utilizza i risultati anche per formulare l’azione successiva da intraprendere. Ad esempio, le auto a guida autonoma aggirano gli ostacoli sulla strada in base ai dati provenienti da più sensori formulando un piano di guida velocemente rivedibile.
I sistemi agenti sono stati tradizionalmente difficili da implementare, richiedendo una programmazione laboriosa basata su regole o una preparazione di modelli di apprendimento supervisionato svolta su dati molto specifici, difficili da produrre, rilevare e raccogliere. Quando invece i sistemi ad agenti vengono creati utilizzando modelli fondativi (che sono stati addestrati su set di dati non strutturati estremamente grandi e vari) anziché regole predefinite, hanno il potenziale per adattarsi a diversi scenari nello stesso modo in cui gli LLM possono rispondere in modo intelligibile a richieste su cui non sono stati addestrati in modo esplicito. Inoltre, utilizzando il linguaggio naturale anziché il codice di programmazione, un utente umano potrebbe istruire un sistema di agenti abilitato da GenAI e sviluppare una vera e propria organizzazione al suo comando. Gli agenti GenAI potrebbero riuscire ad operare come collaboratori virtuali lavorando con i colleghi umani in modo fluido e naturale. Un assistente virtuale, ad esempio, potrebbe pianificare e prenotare un itinerario di viaggio di lavoro complesso, gestendo la logistica su più piattaforme di viaggio e interagendo con operatori del turismo. Utilizzando il linguaggio di tutti i giorni, un ingegnere potrebbe descrivere una nuova funzionalità software a un agente programmatore, che quindi codificherebbe, testerebbe e distribuirebbe lo strumento che ha contribuito a creare.
Il valore aggiunto degli agenti di intelligenza artificiale
Pensiamo a casi d’uso complessi, caratterizzati da input e output altamente variabili. Persino un caso semplice, come il viaggio di lavoro che menzioniamo sopra, può comportare numerosi possibili itinerari che comprendono diverse compagnie aeree e voli, per non parlare di programmi di premi alberghieri, prenotazioni di ristoranti e attività fuori orario, tutti gestiti su diverse piattaforme online, con molti vincoli contrastanti, come i costi e le agende di lavoro.
Nonostante gli sforzi fatti per automatizzare parti di questo processo, gran parte di esso deve finora essere fatto manualmente, in gran parte perché l’ampia varietà di potenziali input e output rende il processo troppo complicato, costoso o dispendioso in termini di tempo per essere automatizzato.
Le capacità degli Agenti AI che possono cambiare le carte in tavola
In questi casi complessi e aperti, che storicamente sono stati difficili da gestire in modo efficiente con l’automazione digitale, gli agenti abilitati da GenAI possono cambiare le prospettive per le nuove capacità che offrono[1], che possiamo schematizzare nelle tre seguenti.
I sistemi ad agenti possono gestire la varietà del reale
Finora, per automatizzare un caso d’uso, deve prima essere suddiviso in una serie di regole e passaggi che possono essere codificati. Questi passaggi vengono in genere tradotti in codice informatico e integrati nei sistemi software, un processo spesso costoso e laborioso che richiede una notevole competenza tecnica. I sistemi basati su regole spesso si dimostrano fragili, cioè si rompono quando si trovano di fronte a situazioni non contemplate dai progettisti delle regole esplicite. In realtà molti flussi di lavoro di interesse pratico sono poco prevedibili, sono caratterizzati da eventi inaspettati con tanti possibili esiti, magari improbabili; questi flussi di lavoro richiedono una gestione speciale e un giudizio sfumato che impedisce l’automazione basata su regole. I sistemi di agenti di GenAI, cioè basati su modelli fondativi, hanno il potenziale per gestire un’ampia varietà di situazioni meno probabili per un dato caso d’uso, adattandosi in tempo reale, per eseguire le attività specializzate richieste e portare a termine un processo.
I sistemi ad agenti possono essere diretti con il linguaggio naturale
Poiché i sistemi di agenti GenAI utilizzano il linguaggio naturale come forma di istruzione, anche i flussi di lavoro complessi possono essere codificati più rapidamente e facilmente. Inoltre, il processo può essere potenzialmente eseguito da dipendenti non tecnici, anziché da ingegneri del software. Ciò semplifica l’integrazione delle competenze, garantisce un accesso più ampio agli strumenti di intelligenza artificiale e semplifica la collaborazione tra team tecnici e no.
I sistemi ad agenti possono lavorare con strumenti e piattaforme digitali esistenti
Oltre ad analizzare e generare conoscenza, i sistemi di agenti possono utilizzare strumenti e comunicare attraverso un ecosistema digitale più ampio. Ad esempio, un agente può essere indirizzato a lavorare con applicazioni software (come strumenti di tracciamento e creazione di grafici), cercare informazioni sul Web, raccogliere e compilare feedback umani e persino sfruttare modelli fondativi più specializzati. L’ecosistema degli strumenti digitali è da sempre il mondo degli agenti, ma con GenAI le possibilità si moltiplicano. Ad esempio, i sistemi ad architettura RAG (Retrieval Augmented Generation) possono imparare a interagire con gli strumenti tramite linguaggio naturale e possono riprogrammarli generando codice. Senza GenAI, queste capacità richiederebbero lenti strumenti tradizionali per integrare i sistemi (ad esempio, utilizzando strumenti Extract/Transform/Load) oppure un’accurata ed esperta analisi dei metadati delle API (Application Programming Interface) disponibili sulle piattaforme.
Le prime applicazioni nel settore pubblico
Il settore pubblico sta iniziando a utilizzare gli agenti GenAI. La corporate statunitense DXC riporta tra i suoi casi di successo[2] la semplificazione del processo fiscale a Bruxelles.
Il lavoro di DXC con il Dipartimento delle imposte di Bruxelles
Il lavoro di DXC con il Dipartimento delle imposte di Bruxelles è un chiaro esempio di come gli agenti AI possano contribuire a semplificare l’intero processo di amministrazione fiscale.
L’amministrazione ha focalizzato due obiettivi: da un lato soddisfare le crescenti richieste dei cittadini di supporto alle loro dichiarazioni, dall’altro semplificare il lavoro amministrativo ed eliminare gli arretrati lavorativi. I risultati che si attendono sono un aumento della “citizen satisfaction” e dell’alleggerimento del carico di lavoro sul personale dell’amministrazione, che può essere impiegato per introdurre nuovi servizi. Dirk De Smedt, Direttore Generale di Brussels Fiscaliteit, ha dichiarato che DXC ha combinato l’esperienza del settore AI con una conoscenza approfondita dell’attuale contesto IT dell’amministrazione. I risultati verranno nel tempo, ma i primi riscontri di soddisfazione degli addetti sono evidenti. Il progetto è stato di esempio per l’amministrazione belga ed ha dato il via alla costruzione di una propria roadmap AI.
Il lavoro di DXC con il Ministero dei beni culturali italiano
In Italia il Ministero dei beni culturali italiano aveva una sfida completamente diversa in serbo. Occorreva un nuovo modo di indicizzare decenni di informazioni bibliografiche ad uso degli utenti del suo portale Alphabetica, che collega milioni di record e materiali digitali da oltre 6.500 biblioteche del Servizio bibliotecario nazionale italiano. I vecchi metodi richiedono ai ricercatori e studenti troppo tempo e competenze specifiche. DXC sta introducendo in Alphabetica degli agenti GenAI che svolgeranno le ricerche più rilevanti in parallelo e si prepareranno a fornire risultati immediati agli utenti del portale.
Sono solo due esemplificazioni di amministrazioni pubbliche che troppo spesso lottano con una miriade di attività ripetitive e dispendiose in termini di tempo, con montagne di dati da gestire e con processi inefficienti che possono prosciugare risorse e ostacolare la produttività. Nel frattempo, i cittadini cercano spesso maggiore trasparenza da parte dei governi sul lavoro che svolgono e modi più semplici per accedere ai servizi pubblici, senza perdersi in un labirinto di moduli online e siti Web confusi, con processi amministrativi che non sono di immediata comprensione.
Gli agenti GenAI possono essere utilizzati dalla pubblica amministrazione per analizzare i propri vasti dataset ad alta velocità e ricorsivamente, fornire ai propri addetti informazioni che possono mettere immediatamente in pratica, snellire i processi interni, automatizzandone le parti che possono esserlo e fungendo da co-pilota per gli impiegati pubblici. Questi nuovi agenti, quindi, si candidano con autorevolezza a determinare un miglioramento dei servizi offerti ai cittadini.
Il flusso di azione e l’architettura di un agente GenAI
Completiamo questo panorama con un esempio di come funzionano in pratica i sistemi Gen AI e per chiarezza ci riferiamo allo schema seguente presentato da AWS[3] per un’applicazione in ambito di spettacolo.
Fig 1. Esempio di processo per agenti GenAI
Dal momento in cui un sistema ad agenti GenAI, finalizzato a scegliere lo spettacolo a cui assistere al cinema, è messo a disposizione di un utente su un portale, parte un processo che si svolge in cinque passaggi:
- Prompt – l’utente fornisce istruzioni attraverso un prompt in linguaggio naturale, ad esempio richiedendo di raccomandargli un film al cinema.
- Caso d’uso – Il sistema identifica il caso d’uso previsto, confrontando quanto sa di quell’utente specifico rispetto all’insieme di utenti che conosce da altre banche dati, in cui sono presenti le preferenze per genere, attori, registi.
- Query di DB esterni – l’agente cerca ulteriori dati, ad esempio, la lista dei film nei cinema della città, i biglietti di film già visti e le eventuali carte fidelity dell’utente.
- GenAI – presenta un prompt con i metadati aggiunti al LLM disponibile, e presenta la proposta all’utente, definendo lo spettacolo specifico (luogo ed orario).
- Delivery – acquista il biglietto attraverso e-commerce, con transazione autorizzata dall’utente, e lo invia all’utente.
Al contrario delle chat come chatGPT, gli agenti GenAI hanno bisogno di informazioni dinamiche per svolgere le attività richieste. Nell’esempio, devono estrarre i registri delle conversazioni per analizzare le opinioni dei clienti, accedere ad Internet per cercare e recuperare le informazioni pubblicate dagli esercenti cinematografici. In alcune applicazioni, un agente intelligente può interagire con altri agenti o altri LLM per scambiare informazioni in reciproco possesso. Gli agenti GenAI sono metodici nella loro attività: completata un’operazione, la rimuovono dall’elenco e passano a quella successiva. Tra un completamento di un’attività e un altro, l’agente valuta se ha raggiunto l’obiettivo designato cercando un feedback esterno e controllando i propri registri. Durante questo processo, l’agente potrebbe creare e svolgere più attività per raggiungere il risultato finale, che comunque andranno tutte tracciate per eseguire la governance di sistema.
Nonostante la estrema varietà di applicazioni, la struttura interna dei sistemi ad agenti GenAI si sta stabilizzando come nello schema sottostante presentato in un recente rapporto McKinsey[4].
Fig 2. Schema di architettura ad agenti
L’architettura è la struttura organizzativa interna del sistema di agenti GenAI. Nel caso che stiamo trattando si tratta di un’architettura logica, implementata tramite software. A destra è mostrato un insieme di piattaforme digitali che consentono di approvvigionare informazioni e di compiere azioni: possono essere ad esempio data base amministrativi, anagrafiche e gestori di processi amministrativi. A sinistra c’è il sistema di agenti, che è articolato su due livelli gerarchici. Al livello più alto un Manager Agent, cui è affidata la relazione con l’esterno, sia un utente umano o un altro agente. Il manager elabora i prompt e richiede ad un planner, cioè un sotto-agente specializzato un piano di lavoro, articolato in attività e sotto-attività. I task saranno contestualmente assegnati ad altri sotto-agenti specializzati, i cosiddetti “specialist”. Gli specialist sono dotati delle necessarie conoscenze e strumenti di dominio, attingono a “esperienze” precedenti e competenze di dominio codificate, coordinandosi tra loro e utilizzando dati e sistemi organizzativi per eseguire i compiti assegnati.
Ogni agente o sotto-agente GenIA può utilizzare prompt di testo, LLM specializzati, database e API per perseguire in relativa autonomia le operazioni assegnate, mentre il manager controlla lo svolgimento delle attività. Il manager può richiedere altri input all’utente per verificare l’accuratezza e la pertinenza del suo piano e dei risultati preliminari, e può iterare su ciascun feedback condiviso dall’utente. Quando il manager è certo delle azioni richieste le esegue nel mondo e completa l’attività richiesta dall’utente.
Su questa struttura, gli sviluppatori progettano la funzione dell’agente, descrivendo accuratamente in che modo i dati raccolti vengono tradotti in azioni che supportano l’obiettivo finale. Successivamente, la funzione viene tradotta in codice, che incorpora l’analisi e l’elaborazione delle informazioni, le funzionalità di GenAI, la knowledge base, il meccanismo di feedback e altre tecnologie richieste. Il codice dell’agente deve rispecchiarne la logica processiva e assicurare la soddisfazione dei requisiti tecnici e prestazionali.
I prossimi passi per l’utilizzo degli agenti GenAI nel settore pubblico
Per il futuro prossimo si parla già di molti agenti intelligenti interagenti ad un livello di astrazione superiore, denominato Agentic AI (AgAI) in cui i sistemi saranno in grado di aumentare esponenzialmente il lavoro umano, comprendendo e interpretando informazioni e obiettivi complessi e quindi intraprendendo azioni basate sull’apprendimento continuo.
Gli opportuni strumenti di governance
Tuttavia, per passare all’implementazione di semplici agenti di AI, in forma co-pilota, per i casi d’uso di pubblica amministrazione, il settore pubblico deve dotarsi degli opportuni strumenti di governance. Da un lato occorre svolgere la data governance a livello più spinto, visto che gli agenti GenAI richiedono l’accesso autenticato ai data base ed alle piatteforme di processi amministrativi. Inoltre, gli agenti determinano enormi volumi di dati che, secondo l’AI Act, vanno registrati per tracciarne le azioni. Le amministrazioni dovranno adottare nuove misure per migliorare il livello di sicurezza dei dati e delle transazioni, nonché per soddisfare i nuovi requisiti di record management per i sistemi AI.
L’applicazione di misure di salvaguardia
Sul fronte funzionale rimane il problema che i modelli LLM possono produrre risultati ingiusti, distorti o imprecisi. L’applicazione di misure di salvaguardia, come le revisioni umane, dovrebbe garantire che le azioni compiute dagli agenti non determinino danni di alcun genere ai cittadini. Tuttavia, ciò richiede una governance tecnica molto spinta. Gli agenti GenIA richiedono, più che mai, esperienza e conoscenza specialistiche nell’ambito delle tecnologie di machine learning, come nella capacità di addestrare gli agenti secondo le procedure ed i dati specifici dell’amministrazione, e nella valutazione continua delle loro performance. Persino la gestione degli incidenti determinati dagli agenti GenAI impiegati nel settore pubblico, che è sempre una richiesta dall’AI Act, diventa molto complessa, di livello almeno pari a quella dell’incident handling in cybersecurity, su cui abbiamo ormai molta esperienza.
Resta infine il tema del consumo delle risorse di calcolo, che sono ingenti. Quando le amministrazioni implementano questi agenti on-premise, devono investire su un’infrastruttura costosa che non è facilmente scalabile né facile da mantenere e che presenta nuovi impatti di sostenibilità ambientale.
Disclaimer
L’articolo riferisce le opinioni degli autori, che non vanno considerate come posizioni ufficiali dell’ente cui afferiscono.
Referenze
Amazon Web Services – https://aws.amazon.com/what-is/ai-agents
DXC – https://dxc.com/us/en/insights/perspectives/paper/ai-agents-power-the-public-sector