intelligenza artificiale

Dare “corpo” all’IA: il nostro futuro con i robot intelligenti



Indirizzo copiato

L’intersezione tra IA e robotica apre nuovi scenari applicativi, in cui l’intelligenza dei robot va oltre la semplice produzione di testi e si estende a sfera cognitive più complesse. Un esempio emblematico è rappresentato da Figure 01, un robot che sembra anticipare un futuro in cui il confine tra intelligenza umana e artificiale sarà sempre più sfumato

Pubblicato il 23 apr 2024

Paolo Rocco

Politecnico di Milano

Andrea Maria Zanchettin

Politecnico di Milano



Robot,Arm,And,Communication,Network,Concept.,Industrial,Technology.,Industry4.0

Parlare di robotica oggi vuol dire fare riferimento a una tecnologia di grande diffusione in industria (e non solo).

I robot sono utilizzati in una varietà apparentemente illimitata di applicazioni, che spaziano da quelle più tradizionali (movimentazione pezzi, asservimento macchine, saldatura, assemblaggio, verniciatura, pallettizzazione) ad applicazioni nuove, in particolare nel settore biomedicale (preparazione farmaci, operazioni in ambienti sterili, ecc.).

La robotica oggi: definizioni e applicazioni

Come è noto, è la combinazione di autonomia (il robot è in grado di operare da solo, una volta programmato) e versatilità (il robot può eseguire innumerevoli compiti, grazie alla sua possibilità di articolare movimenti nello spazio) che fa del robot lo strumento di eccellenza per l’automazione flessibile. E i dati di vendita, diffusi dall’IFR (International Federation of Robotics [1]), non fanno che confermare il buono stato di salute della robotica, con trend di crescita inarrestabili per la robotica industriale, mentre analoghe se non maggiori prospettive di espansione si registrano per i robot di servizio per uso professionale.

Detto questo, la robotica evolve e si tiene al passo con le nuove tecnologie: l’apertura delle macchine a internet attraverso i protocolli della Internet of Things ha consentito importanti sviluppi che vanno dall’asset management, allo sviluppo di digital twin del robot o dell’intero processo di produzione, alla manutenzione predittiva. Il robot può anche scambiare informazioni con altri robot dislocati ovunque nel mondo per condivisione di programmi e miglioramento dell’esecuzione di operazioni.

Il trend di sviluppo più significativo negli ultimi anni è però certamente quello della robotica collaborativa [2]: si tratta come è noto dei robot destinati a operare in sicurezza fianco a fianco dell’uomo, grazie alla loro sofisticata meccanica ed elettronica di controllo. I robot collaborativi stanno cambiando lo scenario con cui la robotica entra nelle aziende produttive. Più facili da installare, privi di barriere fisiche di protezione e anche facili da programmare, i cobot costituiscono una soluzione di automazione potenzialmente ideale per la piccola e media impresa. Tant’è che le applicazioni di robotica collaborativa, sempre secondo il report dell’IFR, hanno raggiunto nel 2022 (ultimo dato disponibile) il 10% delle installazioni annuali a livello mondiale.

Il livello di interazione del robot industriale

Fig. 1 – Il robot collaborativo (fonte Universal Robots)

Ma qual è oggi il livello di interazione del robot industriale, o del cobot, con l’ambiente in cui opera? Il robot può “vedere” gli oggetti grazie a telecamere montate sul robot stesso o fisse nell’ambiente. Può “toccare” l’ambiente e percepire, se dotato degli appositi sensori, le forze che scambia con l’ambiente stesso. In particolare può riconoscere una collisione, con l’ambiente o con l’uomo, e arrestare conseguentemente il moto. Il robot può anche “sentire”, in alcuni casi, l’essere umano e tradurre comandi impartiti in linguaggio naturale. Il robot è anche capace di manipolare in modo complesso gli oggetti con cui interagisce, sia con le pinze di cui sono dotati i robot tradizionali, sia con le mani robotiche di ultima generazione.

Vede, tocca, sente, manipola oggetti: il robot, e non stiamo parlando dei robot umanoidi di nuova generazione, si sta sempre più avvicinando a comportamenti umani. Resta però un ultimo scoglio: l’emulazione dell’intelligenza umana. Vedremo in queste pagine a che punto siamo su questo fronte e che prospettive ci può riservare il futuro.

L’intelligenza dei robot: progressi e limiti

I progressi dell’intelligenza artificiale sono sotto gli occhi di tutti. Senza arrivare all’ultima frontiera dell’AI (Artificial Intelligence) generativa, a cui accenneremo più avanti, le potenzialità dell’intelligenza artificiale nella soluzione di problemi complessi sono oggi enormi. Agenti dotati di AI sono in grado di riconoscere con elevata affidabilità il linguaggio naturale, sia scritto sia parlato, dandogli significato e quindi ingaggiando dialoghi con l’uomo. Il riconoscimento di immagini, la classificazione di oggetti, la soluzione di problemi complessi, sono risultati oggi ampiamente raggiunti dall’intelligenza artificiale. E tuttavia stentiamo a riconoscere un corrispondente progresso nelle capacità dei robot di interagire in modo “intelligente” con l’ambiente. Il paradosso di Moravec [3] descrive la situazione: oggi è possibile attribuire all’AI capacità umane, o sovrumane, tanto che l’AI può sconfiggere il miglior giocatore di scacchi al mondo e tuttavia il robot si trova in difficoltà a eseguire un compito di manipolazione che richieda una destrezza alla portata di un bambino di tre anni.

Fig. 2 – Operazioni alla portata di un bambino sono complesse per il robot

Il punto è che quando l’AI deve fare i conti con la realtà fisica, il gap che la tecnologia mostra rispetto alle capacità umane è ancora significativo. L’interazione non pre-programmata con l’ambiente destrutturato richiede capacità di dare significato agli oggetti che il robot manipola e alle azioni che il robot compie, cognizione dei rapporti di causa ed effetto tra le azioni compiute e il risultato che esse hanno con l’ambiente, capacità di percezione avanzate, oltre che di manipolazione sempre più spinte. Soprattutto è richiesto un processo di incorporazione o “embodiment” dell’intelligenza artificiale, che consiste nel dare un correlato fisico all’agente autonomo. Per noi umani, operazioni come prendere dalla nostra credenza un pacco di pasta, riconoscendolo visivamente, spostando gli altri oggetti (barattoli, lattine, ecc.) che si frappongono, e facendo attenzione a non colpire altri oggetti, sono alla portata di un bambino, per il robot sono al limite, e in molti casi oltre, le capacità dell’attuale progresso scientifico e tecnologico.

Per non parlare poi di operazioni domestiche quotidiane, per noi del tutto naturali, per il robot molto complesse. Ha fatto molto scalpore recentemente il video del robot Optimus di Tesla [4] che piegava in maniera estremamente naturale una maglietta, salvo poi appurare che in realtà il robot era teleguidato da un operatore nei suoi movimenti. Questo non vuol dire che Optimus non arriverà a eseguire in autonomia il task, ma che la strada da percorrere è ancora significativa.

Fig. 3 – Il robot Optimus di Tesla piega una maglietta

Anche per i robot che interagiscono con l’uomo le cose non vanno meglio. Far comprendere al robot il significato delle azioni compiute dall’uomo per prevederne le azioni future (se l’uomo afferra un cacciavite, posso presumere quale sarà la sua futura azione) e quindi agire di conseguenza è una capacità che nei laboratori di robotica si sta affinando, ma non è ancora pronta per essere trasferita all’industria.

Questo gap tra le potenzialità virtualmente illimitate dell’intelligenza artificiale e la capacità del robot di interagire naturalmente con l’ambiente sta costituendo un freno alla diffusione ancora più capillare dei robot e all’impatto economico che i robot potrebbero avere. La domanda che ci possiamo porre oggi è quindi se i recenti sviluppi dell’intelligenza artificiale possano aiutare a colmare questo gap.

AI generativa in industria: oltre la produzione di testi

Da qualche tempo i media parlano diffusamente della “AI generativa”, per lo più spinti dal grande successo popolare di software come ChatGPT [5]. L’AI generativa è un nuovo modello di intelligenza artificiale in grado di produrre nuovi contenuti, sulla base dell’addestramento eseguito su grandi quantità di dati. Si tratta di un salto di qualità rilevante nell’intelligenza artificiale, che non è più in grado solamente (si fa per dire) di eseguire classificazioni di immagini o predizione di andamenti di variabili, o di interagire con input dato in linguaggio naturale selezionando la risposta più appropriata contestualizzando e interpretando la richiesta, ma anche di generare ex-novo dei contenuti. Stiamo parlando di produzione di testi, immagini, audio o video, preparazione di report, concezione di nuovi prodotti, ideazione di campagne di marketing e quant’altro.

Gli strumenti tecnici su cui si basano i modelli di AI generativa si riconducono generalmente al deep learning, ovvero a reti neurali che imitano il funzionamento del nostro cervello, apprendendo modelli complessi da grandi, o gigantesche, quantità di dati. Le conseguenze di questo processo sono potenzialmente enormi, e stanno già modificando le abitudini lavorative di molti di noi. Rivedere un testo chiedendo al software di AI generativa un aiuto, o anche produrre un testo ex-novo sulla base di alcuni input forniti in linguaggio naturale, sta diventando pratica quotidiana.

D’altra parte anche l’industria e i servizi non si stanno lasciando sfuggire le opportunità di utilizzo dell’AI generativa, peraltro ancora ai suoi albori. Le applicazioni sono potenzialmente sterminate: si va dalla produzione di report, all’elaborazione di scenari di utilizzo di prodotti, al supporto decisionale, alla preparazione di campagne pubblicitarie, all’invenzione di nuovi farmaci, al supporto al medico nella diagnosi fino ad arrivare alla guida autonoma dei veicoli. Le prospettive di crescita del settore dell’intelligenza artificiale sono vertiginose e gli analisti concordano nel predire tassi di crescita (CAGR) intorno al 40% nei prossimi anni [6].

Detto questo, non bisogna neanche cadere nell’ingenuità di pensare che l’AI generativa sarà la panacea di tutti i mali della nostra industria. Come già sottolineato, i modelli di AI generativa richiedono enormi quantità di dati, che possono essere a disposizione dei big player (Google, Tesla, OpenAI) ma non certo della piccola o media impresa. Un tema rilevante nel futuro sarà infatti anche quello di rendere fruibili questi nuovi strumenti alle PMI (che come è noto costituiscono l’ossatura del nostro sistema imprenditoriale).

È uno scenario comunque esplosivo quello dell’AI generativa, cui si accompagnano problemi di natura etica, da un lato, e preoccupazioni sui livelli occupazionali, dall’altro. Entrambe le questioni devono necessariamente essere all’attenzione del decisore politico, il cui non semplice compito sta nel trovare un compromesso tra l’esigenza di un uso etico e responsabile di questi strumenti e la necessità di non mettere freni allo sviluppo tecnologico, in particolare in Europa dove il rischio di perdere terreno rispetto all’America e all’Asia è significativo. Il supporto all’occupazione in questi scenari futuri, in cui l’ingombrante agente intelligente prenderà inevitabilmente il posto di molti lavoratori, è un altrettanto complesso, per quanto ineludibile, compito della politica.

Un robot super intelligente? Il caso di Figure 01

È quindi possibile applicare le ultime tecnologie dell’intelligenza artificiale alla robotica? Certamente sì, anzi, è già stato fatto. Ne è dimostrazione il video di OpenAI pubblicato a inizio marzo 2024 che mostra le avanzate capacità di interazione vocale del robot Figure 01 [7].

Fig. 4 – Figure 01, il robot di OpenAI

Di notevole interesse la fase nella quale viene chiesto al robot “Can I have something to eat?” (“Posso avere qualcosa da mangiare?”). Il robot non esita un momento e afferra una mela collocata proprio davanti a lui.

Che c’è di strano? Non tanto che il robot abbia associato “qualcosa da mangiare” a “mela” ma che sia stato in grado di trasformare una richiesta in un sofisticato movimento per afferrare la mela e porgerla all’interlocutore. Questa dimostrazione va oltre un “banale” chatbot (come ChatGPT) che riesce a rispondere in maniera naturale ad un interlocutore umano. Quello che impressiona è la capacità di interpretare comandi vocali e tradurli in movimento.

Quanto l’interazione sia effettivamente spontanea e quanto il movimento sia stato pre-programmato o dimostrato non lo sappiamo. Nasce però il dubbio: se al posto della mela ci fosse stata una banana? Il robot sarebbe stato in grado di rispondere altrettanto correttamente alla richiesta? Anche se fosse stato addestrato solo ad afferrare mele?

Che “capisca” che la banana è anch’essa un frutto e quindi “qualcosa da mangiare” probabilmente non stupirebbe. Se con la stessa naturalezza fosse però in grado di afferrare un frutto mai visto (e, come la banana, di ben altra forma rispetto alla mela) e a porgerla all’interlocutore sarebbe davvero stupefacente. Tutto è possibile a patto di avere tempo e dati a sufficienza. Ma la sfida alla generalizzazione è ancora tutta da vincere.

Le tecnologie Covariant per la gestione dei magazzini

Altro caso di interesse è quello di Covariant [8], startup americana fondata da ricercatori dell’Università di California a Berkeley.

Fig. 5 – Robot di Covariant

Covariant sta sviluppando, per la gestione dei magazzini, robot intelligenti alimentati da una quantità enorme di dati raccolti con sensori di varia natura. I dati, elaborati dai modelli di intelligenza artificiale, consentono al robot di trovare il comportamento corretto a fronte di situazioni ignote a priori. Il robot sarà quindi in grado di afferrare un determinato oggetto anche se non lo ha mai visto prima né, ed è questo il nodo, è stato programmato specificatamente per prendere tale oggetto. Probabilmente l’utilizzo di questa tecnologia in operazioni di magazzino, dove non sono richieste precisioni eccessive, è meno complessa rispetto a operazioni nella produzione manifatturiera, ma le potenzialità e l’impatto sono comunque notevolissimi, tanto è vero che l’azienda ha già raccolto fondi per più di 200 milioni di euro [9].

Dietro tutti questi sviluppi ci sono strumenti tecnici sempre più sofisticati per accrescere l’intelligenza degli agenti autonomi, e in particolare dei robot. Al “reinforcement learning”, ossia la tecnica per cui il robot impara attraverso la propria esperienza (ossia mediante “trial and error”) si affianca l’“imitation learning”, vale a dire la possibilità di istruire il robot mediante dimostrazione da parte dell’operatore, per teleoperazione o mediante apprendimento basato sulla visione. Del resto, non stiamo facendo altro che riprodurre sugli agenti autonomi il modo in cui tutti noi abbiamo imparato quanto sappiamo.

Che futuro ci attende?

La convergenza dei progressi dell’intelligenza artificiale e della robotica sta preparando il terreno al salto tecnologico atteso da tanti anni. Dare corpo all’intelligenza artificiale, non a caso il claim di I-RIM, l’Istituto di Robotica e Macchine Intelligenti [10] che da alcuni anni riunisce tutti i portatori di interessi sulla robotica in Italia, è la sfida del futuro. Questa sfida ci porterà finalmente ad avere il robot intelligente, che sa prendere decisioni autonomamente, in due parole sa “cavarsela da solo”, senza il papà programmatore che lo istruisca per ogni eventualità.

E allora non sarà più vero che il robot non è in grado di eseguire compiti alla portata del bambino di 3 anni. Il futuro è ancora tutto da scrivere.

Riferimenti

[1] International Federation of Robotics, https://ifr.org/

[2] P. Rocco, “Il “cobot” nuova star della fabbrica smart, ecco i vantaggi”, Agenda Digitale, Dicembre 2019

[3] Paradosso di Moravec, https://it.wikipedia.org/wiki/Paradosso_di_Moravec

[4] Robot Optimus di Tesla, https://newatlas.com/robotics/tesla-optimus-folds-shirt/

[5] ChatGPT, https://chat.openai.com/

[6] Bloomberg, Generative AI to Become a $1.3 Trillion Market by 2032, Research Finds https://www.bloomberg.com/company/press/generative-ai-to-become-a-1-3-trillion-market-by-2032-research-finds/

[7] Figure 01, il robot di OpenAI, https://www.youtube.com/watch?v=Sq1QZB5baNw

[8] Covariant, https://covariant.ai/

[9] How the A.I. That Drives ChatGPT Will Move Into the Physical World,The New York Times, https://www.nytimes.com/2024/03/11/technology/ai-robots-technology.html

[10] I-RIM, Istituto di Robotica e Macchine Intelligenti, https://i-rim.it/it/

EU Stories - La coesione innova l'Italia

Tutti
Iniziative
Analisi
Iniziative
Parte la campagna di comunicazione COINS
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia
Iniziative
Parte la campagna di comunicazione COINS
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia

Articoli correlati

Articolo 1 di 2