C’è un mercato nascente, nel mondo dell’assistenza post-Covid. Quello dei chatbot in grado di risolvere problemi al confine fra il counselling e la terapia. Il Giappone li ha abbondantemente sperimentati nel corso del picco epidemico. Ma la domanda è destinata a crescere in tutto il mondo.
Cresce la domanda di tecnologia per la salute
Il motivo è chiaro. Durante la crisi, il sistema sanitario si è dovuto concentrare sull’assistenza ospedaliera ai casi conclamati, lasciando quasi completamente scoperto il terreno dell’assistenza e del consiglio a chi – malato paucisintomatico o semplicemente preoccupato – era confinato a casa. In questo articolo ci chiediamo se lo stato di ansietà dovuto alla pandemia avrà effetti di lungo termine creando una domanda permanente di supporto tecnologico per la salute.
Partiamo dall’esperienza di Paesi abituati più di noi a fare affidamento sull’interazione uomo-macchina per risolvere problemi al confine tra gli interventi terapeutici (sanità) e i consigli di comportamento (salute). Vogliamo discutere se la piattaforma tecnologica basata su 5G ed Intelligenza artificiale arriverà a giocare un ruolo fondamentale nella gestione dell’ansia del mondo post-COVID. I fornitori di sistemi intelligenti hanno iniziato ad accorgersi di questo potenziale mercato, tanto che IBM ha offerto il suo Watson Assistant for Citizens in uso gratuito per 90 giorni a governi e aziende sanitarie gratuitamente per 90 giorni.
Giappone campione di counselling-chat
Durante i mesi più intensi della pandemia il Giappone ha visto un’esplosione delle chiamate ai servizi di consulenza gratuiti, sia in giapponese che in inglese. Questi ultimi sono gestiti da organizzazioni no-profit come Tell Japan (che serve la comunità internazionale che risiede in Giappone fin dal 1973). Altri servizi in inglese hanno offerto incontri di gruppo. Ad esempio, 7 Cups è un servizio internazionale di salute emotiva che fornisce connessioni anonime (anche via chat) e dichiara di avere ascoltatori umani preparati, premurosi e compassionevoli. La Prefettura di Tokyo ha attivato servizi informativi mutlilingue.
Per i giapponesi, i servizi gratuiti di consulenza psicologica e le terapie di sostegno attivate durante la crisi COVID sono stati in gran parte forniti dalle aziende per cui lavorano, come parte del programma di assistenza sanitaria aziendale per i dipendenti che si aggiunge al sistema sanitario nazionale. E’ interessante notare che la delega al sistema delle imprese della tutela della salute mentale dei singoli dipendenti non venga considerata da molti un pericolo per la privacy individuale. La maggior parte delle aziende giapponesi, comunque, ha fatto ricorso a servizi di counselling esterni (VIsual Counselling Agent – VICA) che forniscono consulenza psicologica ai dipendenti in forma anonima e riservata. In questi servizi VICA, l’interazione è affidata a chatbot basati su tecniche di Intelligenza Artificiale, che lasciano al terapista umano un ruolo di pura supervisione.
Il successo di questi servizi chatbot via Rete non era del tutto inatteso, perché il counselling per ripristinare il comfort emotivo era molto diffuso in Giappone anche prima del COVID (più di 2 milioni di client in Giappone). La vastità del fenomeno ha comunque portato il governo giapponese a ricordare alla popolazione che “nessun sistema di terapia o consulenza online può sostituire il supporto della famiglia o dei propri cari”.
Chatterbox “nipoti” di Eliza
Nell’ambito dei Visual Counselling Agent (VICA), l’Intelligenza Artificiale è dappertutto, tranne forse dove ci aspetteremmo di trovarla, cioè nella comprensione diretta delle frasi pronunciate dal chiamante in linguaggio naturale. Anzitutto, bisogna considerare che lo scopo della conversazione con un chatterbox non è capire cosa dice il chiamante, ma (non necessariamente in quest’ordine) farlo sentire meglio, dargli informazioni utili e raccogliere informazioni su di lui.
Il cuore algoritmico dei VICA si occupa di generare una risposta accettabile: ad esempio, sono diffusi semplici modelli k-NN (k Nearest Neighbors) che permettono di identificare le k frasi più vicine a quella pronunciata dall’utente per cui è nota una risposta, e poi sceglierne una in modo casuale, evitando così di dare sempre la stessa risposta alla stessa domanda. Si tratta dell’evoluzione di una tecnica nota fin dagli anni Sessanta, quando Joseph Weizenbaum scrisse un chatbot ante litteram, ELIZA, che faceva la parodia di uno psicoterapeuta, rispondendo al paziente con frasi perlopiù ottenute dalla riformulazione di affermazioni precedenti del paziente stesso.
La distanza usata per identificare il pool di risposte nel modello k-NN (o Random Forest) interno dei chatbot di oggi però è calcolata in uno spazio metrico i cui vettori comprendono, oltre alla codifica delle domande e risposte precedenti attraverso un “language model” (ossia un istogramma che rappresenta il numero di occorrenze delle singole parole o n-grammi), anche la codifica del profilo emozionale (mood) dell’utente, magari estratto da un sofisticato modello Deep Learning sulla base dell’espressione del viso.
L’apprendimento computazionale ha invece un ruolo chiave nell’acquisizione e nella sintesi del parlato. I chatbot lavorano sulla trascrizione del parlato e non direttamente sull’audio, e quindi è importante che la trascrizione sia impeccabile. Il problema dell’acquisizione corretta del parlato umano è stato quasi completamente risolto da Google, Apple e Amazon per le interfacce conversazionali di comando come Alexa o Siri, ma presenta ancora numerose incognite per quelle dialogiche dei chatbox, soprattutto per le lingue diverse dall’inglese.
Il problema di sintetizzare il parlato del chatbot con l’opportuna inflessione (ad esempio, compassionevole o di conforto) dettata dall’umore dell’utente o dall’andamento della conversazione è invece una sfida ancora aperta. Al momento, i VICA stanno imparando a utilizzare le sfumature della lingua nelle loro risposte e nelle loro inflessioni.
Se i codec voce/testo e testo/voce risiedono sugli smartphone, il cuore algoritmico dei VICA è eseguito in cloud. I requisiti per erogare un VICA sono onerosi: una latenza nella risposta ad ogni domanda inferiore a 50 msec, e una banda 0.3 Mbps (upstream)-1.5 Mbps (downstream). La prefettura di Tokyo genera normalmente intorno a 1000 chiamate giornaliere ai servizi di assistenza. Secondo Setsuo Tsuruta e Yoshi Sakurai delle Meji University, durante l’esplosione del COVID-19 a Tokyo il ricorso ai servizi ha riguardato più di 100K persone al giorno (la popolazione di Tokyo supera i 14 milioni) con una richiesta complessiva di banda 15-150Gbps.
Chatbot pronti per il 5G
I VICA attualmente disponibili su rete mobile 4G saranno presto proposti su rete 5G. Per capire il motivo di questa transizione, occorre tener presente che gli attuali modelli AI per chatbot dovranno essere integrati con la realtà virtuale per generare, insieme al parlato, una comunicazione non verbale che tenga conto delle espressioni facciali e del linguaggio del corpo del chiamante.
La bassa latenza (Ultra Low Latency – URLLC), e la banda elevata (eMBB – Enhanced Mobile BroadBand) del 5G sono essenziali per poter basare in cloud i futuri avatar in realtà aumentata, che dovranno riconoscere ogni sottile cambiamento delle emozioni degli utenti in tempo reale sulla base dell’immagine e del tono di voce.
Lo scambio internazionale attraverso la rete 5G di servizi chatbot di consiglio medico in lingue diverse è uno dei casi d’uso di un progetto Catalyst italo-franco-giapponese promosso dal TM Forum, l’organizzazione che riunisce gli operatori di rete mobile. Il progetto (Figura 1), guidato da Orange con la partecipazione di TIM, Meji University e Università di Milano, permette di gestire i chatbot in cloud tenendo conto della lingua e della cultura del chiamante, dovunque quest’ultimo si trovi.