Dobbiamo aspettarci che l’intelligenza artificiale entri massicciamente in azienda per aiutare la ripresa economica post-Covid. La narrazione ricorrente è che l’IA, applicata da esperti “data scientist”, sostituirà presto il talento manageriale umano: tuttavia, questo punto di vista non è condiviso del tutto e iniziano ad avanzare critiche a tale approccio, per esempio relativamente ai problemi riscontrati nell’analisi di alcune particolarità legate ai modelli d’acquisto. Approfondiamo la situazione.
Il contesto: l’IA in azienda
Ogni giorno gli imprenditori e i manager di tutto il mondo si sentono ripetere che l’intelligenza artificiale rivoluzionerà l’economia. Dopo tutto, un manager d’eccezione come l’amministratore delegato di Google Sundar Pichai ha affermato qualche tempo fa che nella storia delle invenzioni umane l’IA è più importante dell’elettricità o del fuoco. Dal punto di vista tecnologico l’affermazione di Pichai può non sembrare del tutto infondata: l’IA ha dimostrato di saper migliorare il riconoscimento facciale, la diagnosi automatica delle malattie, i consigli sui film da scaricare in Rete, e persino i programmi delle lavatrici.
Dilaga il pensiero sulla sostituzione del talento umano da parte dell’IA: basta prendere grandi quantità di dati (preferibilmente acquisiti attraverso un monitoraggio a tappeto di tutti processi aziendali), mandarli in ingresso a qualche tipo di “modello”, e si ottengono previsioni commerciali infallibili (ad esempio, quanti e quali tra i nostri clienti sono disposti a pagare per avere un’estensione della garanzia sui prodotti che acquistano?) e decisioni manageriali accurate (ad esempio, quale offerta (o mix di offerte) tra quelle presentate dai nostri fornitori garantisce il minor costo di messa in opera, inclusi gli interventi di manutenzione in garanzia?). Le aziende che adotteranno rapidamente l’IA avranno un vantaggio competitivo decisivo in questa fase di recessione, e sarà compito dello Stato aiutare e incentivare questa adozione. In realtà, questa narrazione sta avendo qualche scricchiolio.
I punti di forza dell’IA in azienda
I modelli di classificazione e predizione basati sull’apprendimento computazionale imparano a riconoscere le regolarità statistiche degli input visti in passato che hanno portato a un certo output; poi le generalizzano, in modo da calcolare, con ridotti margini d’errore, l’output previsto anche per input mai visti prima. Certamente, questo modo di procedere apre nuovi orizzonti al “decison-making” aziendale. Prendiamo ad esempio il problema di prevedere la sottoscrizione da parte di un cliente di un’estensione alla garanzia di un prodotto che ha appena comprato. Un previsore umano può considerare un numero limitato di variabili per ogni acquisto (profilo del cliente, importo, tipo di prodotto, data dell’acquisto e due o tre altre al massimo).
Un modello IA di apprendimento computazionale “profondo” può invece ricevere in input molte rappresentazioni complesse del contesto dell’acquisto, ciascuna composta da un enorme numero di variabili rilevate da sensori (compreso il video della scena dell’acquisto), rilevare gli output (garanzia sì, garanzia no) ed imparare a identificare (ed associare ai due valori di output) delle regolarità statistiche negli input di cui il previsore umano non può accorgersi.
I problemi
Queste regolarità si aggiungono a quelle più semplici che anche l’esperto umano userebbe (banalmente, un importo elevato dell’acquisto aumenta la percezione del rischio in caso di guasto e quindi rende i clienti più propensi a un acquisto dell’estensione della garanzia). Di conseguenza, bisogna addestrare il modello di apprendimento computazionale secondo un principio come: “Non basarti sulle regolarità statistiche che tutti conoscono; cerca invece quelle complesse e finora sconosciute”.
Anche quando questo è possibile, le regolarità che coinvolgono simultaneamente parti diverse della rappresentazione del contesto dell’acquisto (ad esempio, il colore delle pareti del negozio, il momento della transazione e l’età dell’acquirente) spesso risultano “sottili”: non corrispondono alle classiche distribuzioni statistiche parametriche, ciascuna sottende un numero limitato di casi e quindi giustifica una minima parte delle decisioni (caratteristiche che, tra l’altro, rendono problematico il bilanciamento dei training set). Quindi, rispetto al semplice predittore basato sull’importo dell’acquisto, il valore economico del modello di apprendimento profondo sta nel risultato operativo della sua applicazione (la percentuale di correttezza delle previsioni) molto più che nella conoscenza manageriale che ne deriva (la comprensione del perché la previsione è stata fatta).
Peccato che anche il risultato del modello di previsione possa rivelarsi fragile: i modelli meglio addestrati possono iniziare a sbagliare quando i dati su cui erano stati addestrati non rappresentano più il mondo in cui sono immersi, un fenomeno che viene chiamato “non stazionarietà”. Nel mondo del business, e più in generale nei sistemi economici, i fenomeni non-stazionari sono frequenti (si pensi alle mode) e l’informazione disponibile al momento dell’addestramento del modello non è sempre una buona guida per prevedere quello che succederà al momento della sua applicazione. Per gestire la non-stazionarietà, occorre che il modello continui ad apprendere sulla base dei dati che vede in produzione, anche dopo la messa in opera; ma per fare questo, bisogna trovare un delicato compromesso tra la plasticità del modello e il suo tempo di decisione.
Un altro problema tecnico dell’applicazione dei modelli di apprendimento computazionale al business è il dimensionamento della memoria. Il modello di apprendimento computazionale per la previsione dell’acquisto della garanzia che abbiamo menzionato sopra è “stateless”, poiché esamina separatamente ogni contesto di acquisto. Spesso, però, la decisione del cliente è influenzata – oltre che dal contesto dell’acquisto attuale – anche dalla storia (il “business log”) dei suoi acquisti precedenti. Per fare la previsione del nostro esempio sulla base di un log, si può usare un modello di apprendimento computazionale con memoria ( “stateful”) che riceve in input la rappresentazione del contesto dell’acquisto corrente insieme a quella dello stato in cui si trova il cliente, che riassume gli acquisti precedenti. Risulta però difficile trovare un valore unico che esprima “quanto” del passato considerare, perché il peso del passato può essere diverso passando da un cliente a un altro.
L’opinione degli esperti di business process mining
La comunità scientifica del business process mining ha fatto rilevare da tempo che i due problemi della non-stazionarietà e della gestione dello stato sono collegati e devono essere entrambi risolti prima di parlare di gestione aziendale automatica basata su IA. Ancora oggi, però, affrontare istanze reali di questi due problemi è più un’arte che una scienza.
Come risultato, stanno diminuendo le attese trionfalistiche sull’uso di modelli di apprendimento computazionale come “bacchette magiche” da usare al posto dei manager (e delle tecniche di ottimizzazione algoritmiche tradizionali) per classici problemi di management come l’identificazione delle abitudini di acquisto degli acquirenti, o del modo migliore di instradare le merci attraverso una catena di approvvigionamento. L’IA in azienda sta invece dando il meglio di sé in un compito apparentemente subalterno: sintetizzare, partendo dai dati aziendali, la conoscenza da usare da parte degli umani e degli algoritmi per prendere decisioni.