Con la domanda di trasporto in costante aumento, specialmente nel mercato delle merci e dei servizi, la creazione di un sistema di controllo efficiente per la logistica del traffico è di fondamentale importanza. Un tale sistema può ridurre l’inquinamento dell’aria, il rumore, gli incidenti e il costo del trasporto. Queste osservazioni portano naturalmente alla questione di come coordinare in modo efficiente i semafori che regolamentano il traffico stradale per ridurre la congestione e rendere fluidi i flussi di veicoli. Il crescente successo delle tecniche di machine learning suggerisce di applicare vari algoritmi basati sull’intelligenza artificiale al problema della gestione del controllo degli incroci semaforizzati.
Nel presente studio riportiamo [1] i risultati di una tecnica di intelligenza artificiale chiamata apprendimento per rinforzo (nello specifico, una strategia multiagente descritta in [2] e in [3]) che viene utilizzata per determinare le logiche semaforiche più efficaci per ridurre la congestione stradale. I nostri esperimenti sono stati effettuati riproducendo una rete stradale localizzata in una zona adiacente alle mura della città di Bologna [4] tramite un simulatore di micro-traffico chiamato SUMO [5].
Intelligenza artificiale e semafori: il problema
Nella simulazione implementata in SUMO, ogni incrocio regolato dai semafori viene considerato come un agente il cui scopo è quello di minimizzare le code che si verificano presso i ”propri” semafori. Per assolvere il suo compito ogni agente osserva numero e stato di marcia dei veicoli in prossimità dei ”propri” semafori (tramite spire magnetiche, telecamere o altri sensori adibiti a questo fine) scambia informazioni con altri agenti e, infine, modifica progressivamente la logica dei ”propri” semafori in modo da limitare la formazione di code di veicoli. Formalmente, fra gli agenti che partecipano alla simulazione (ovvero fra i vari incroci semaforizzati) si instaura un gioco stocastico con elementi di cooperazione e di competizione che trova il suo equilibrio quando tutti i partecipanti riescono ad assolvere al loro compito, ovvero riescono a ridurre la lunghezza delle code di veicoli.
Figura 1: Rete stradale: i punti tondi ombreggiati (azzurro) si riferiscono alle intersezioni segnalate (agenti); i rispettivi incroci, contenuti nei punti tondi, sono evidenziati in colore scuro (verde); gli incroci non controllati da semafori sono evidenziati in colore chiaro (giallo).
Simulazione
La figura 1 mostra una porzione stradale della rete metropolitana della città di Bologna situata nei pressi di via Andrea Costa. Il grafo mostra come le strade della rete sono state riprodotte all’interno del simulatore di microtraffico SUMO. Le aree ombreggiate rappresentano gli incroci semaforizzati, che, nella simulazione, vengono visti come agenti intenti a cercare un equilibrio che consenta a tutti di minimizzare la lunghezza delle code di veicoli in prossimità dei semafori. Per stimare gli effetti in termini di consumo carburante e rilascio di inquinanti la simulazione è stata progettata nel seguente modo:
- La nostra tipica simulazione del traffico si estende su 3600 passi temporali (time steps);
- Nella prima parte della simulazione (passi di tempo [0, 2000]) un veicolo è inserito in una posizione casuale sulla mappa per ogni step temporale e segue un percorso anch’esso casuale;
- Nella seconda parte della simulazione (passi di tempo [2000, 3600]) non viene inserito nessun veicolo. Alla fine della simulazione, tutti i veicoli che circolano sulla mappa escono attraverso una delle corsie di uscita o terminano il loro viaggio raggiungendo la loro destinazione.
Risultati dello studio per uso intelligenza artificiale nei semafori
La figura 2 mostra il numero di veicoli in moto (running vehicles) sulla rete stradale rappresentata in Figura 1 nel caso in cui gli algoritmi di apprendimento per rinforzo regolino la sincronizzazione tra i vari incroci semaforizzati (caso ’sync’, rappresentato dalla curva verde) e nel caso in cui nessun tipo di sincronizzazione venga operata (caso ”no sync”, rappresentato dalla curva nera). Da un rapido esame delle due curve si vede come il coordinamento degli incroci semaforizzati produce una rilevante velocizzazione del traffico veicolare, tale che nella terza fase della simulazione (passi di tempo [2000, 3600]) il numero di veicoli sulle strade decresce con estrema rapidità.
Figura 2: Numero di veicoli presenti nella rete stradale durante i 3600 passi temporali della simulazione.
Le figure 3, 4 e 5 mostrano il dettaglio delle emissioni di NOx. Come evidenziato, tali emissioni sono estremamente ridotte nel caso in cui gli incroci semaforizzati siano sincronizzati. Questo risulta evidente in tutte le fasi dell’esperimento, e in particolar modo nella figura 5, quando l’immissione di veicoli nella rete stradale viene interrotta e, mentre nel caso in cui la sincronizzazione non viene effettuata i veicoli devono attendere in coda prima di raggiungere le loro destinazioni, nel caso sincronizzato procedono senza particolari rallentamenti con evidente beneficio in termini di emissioni di NOx.
(a) Andrea Costa, no sync (b) Andrea Costa, sync
Figura 3: Emissioni di NOx, intervallo temporale [0, 1000]
Infine, Figura 6 mostra come, a seguito della maggiore fuidità del flusso dei veicoli, sia i consumi di carburante sia le emissioni di tutti gli inquinanti atmosferici si riducono in maniera piuttosto evidente passando dal caso ’No Sync’ (colonne azzurre) a quello ’Sync’ (colonne arancioni).
(a) Andrea Costa, no sync (b) Andrea Costa, sync
Figura 4: Emissioni di NOx, intervallo temporale [1000, 2000]
(a) Andrea Costa, no sync (b) Andrea Costa, sync
Figura 5: Emissioni di NOx, intervallo temporale [2000, 3600]
Conclusioni
Il presente studio ha mostrato l’effetto di una sincronizzazione tra incroci semaforizzati effettuata tramite tecniche di intelligenza artificiale (apprendimento per rinforzo). Gli esperimenti effettuati mostrano come tali tecniche apportano benefici alla circolazione dei veicoli in termini di riduzione delle code, contribuendo a una significativa limitazione dei consumi e degli inquinanti immessi nell’atmosfera.
Pur nello scenario tratteggiato, che consta dell’inserzione regolare di 2000 veicoli in un intervallo di 3600 unità di tempo in maniera randomica, risultano evidenti i vantaggi di introdurre algoritmi di machine learning nelle logiche di sincronizzazione degli incroci semaforizzati. Meno code di veicoli ai semafori, oltre che essere collegate alla riduzione di inquinanti e consumi che abbiamo visto, si traducono in una drastica diminuzione della probabilità di incidenti che sua volta è collegata ad un’esperienza di guida meno stressante e frenetica. L’ulteriore beneficio di quest’ultimo aspetto sulla salute, la cui quantificazione esula dagli obiettivi del presente studio, costituisce tuttavia un aspetto non secondario soprattutto nel lungo periodo. Il fatto che i risultati siano stati ottenuti con l’utilizzo di traiettorie randomiche, costituisce un’ulteriore, promettente, caratteristica in vista dell’applicazione di questi algoritmi a flussi di veicoli che riproducono andamenti reali.
Figura 6: Emissioni e Consumi di Carburante
In quest’ultimo caso infatti, essendo i flussi più strutturati (quindi meno rumorosi) il problema posto alle reti neuronali insite negli algoritmi di apprendimento per rinforzo studiati, si configura come di più semplice risoluzione.