Nell’era della digital transformation, dell’informazione diffusa e dei big data risulta fondamentale saper estrarre informazioni utili dalla miniera di dati grezzi che ogni giorno ognuno di noi produce e che governi e aziende immagazzinano in tempo reale. InfoCamere, braccio tecnologico delle Camere di commercio, ha messo in campo sistemi di Intelligenza artificiale in grado di valorizzare i dati aziendali e governare l’innovazione. L’algoritmo delle reti neurali artificiali e il ruolo dei data scientist.
Prevedere il futuro
Conoscere quello che è accaduto, come e perché, permette di prevedere quello che potrebbe accadere: istituzioni, imprese e professionisti che riescono a valorizzare i dati a disposizione, possono trarre dei benefici all’interno del loro perimetro di riferimento. Non solo. In ogni organizzazione, anche nella più piccola, esistono decine/centinaia di processi che producono quotidianamente enormi ed importanti quantità di dati che possono essere accumulati ed analizzati per migliorare i processi stessi.
Ma come analizzare e valorizzare questa enorme mole di dati e soprattutto come fare previsioni (affidabili) su ciò che potrebbe accadere nel contesto che li riguarda?
Qui entrano in gioco i cosiddetti algoritmi, di cui tanto sentiamo parlare. Un algoritmo è un insieme più o meno complesso di funzioni matematiche, ovvero istruzioni per risolvere problemi ed ottenere come risultato azioni volute o informazioni necessarie a prendere decisioni. Internet è mosso da algoritmi, così come i motori di ricerca, i social network, le app, i navigatori, l’intelligenza artificiale, i videogiochi, i siti di dating e quelli che consigliano viaggi, libri o vini. Tutte queste cose, senza algoritmi, non esisterebbero.
Efficacia delle reti neurali digitali
Tra gli algoritmi più utilizzati, le reti neurali artificiali (RNA) si sono dimostrati quelli più efficaci. Il motivo risiede nella loro flessibilità, nella possibilità di essere applicate in innumerevoli campi e per assolvere a diversi compiti. Il nome deriva dalla loro struttura: l’insieme di funzioni utilizzate e la loro interazione ricorda, infatti, la struttura delle reti neurali biologiche (ad esempio il cervello umano), costituite da miliardi di neuroni interconnessi tra loro in modo da variare la loro configurazione in risposta agli stimoli esterni. Similmente, i modelli artificiali cercano di replicare questo tratto distintivo della biologia e quindi, anche nel caso delle RNA, si può parlare di “apprendimento”.
Analogamente a quelle biologiche, anche le RNA sono composte da “neuroni” detti nodi suddivisi in diversi strati, detti layers, interconnessi tra loro attraverso funzioni matematiche dette funzioni di attivazione, che trasferiscono informazioni da un nodo all’altro e tra i vari layers. Il primo strato di una rete è formato dai dati di input, l’ultimo è rappresentato dall’output e tutti gli altri strati intermedi sono detti hidden layers. Così come avviene a livello biologico, anche una RNA può essere “addestrata” per diversi task: dalla previsione di fenomeni quantitativi al riconoscimento e classificazione di oggetti.
RNA: come li utilizza InfoCamere
In InfoCamere – la società delle Camere di Commercio per l’innovazione digitale – una delle prime applicazioni di Intelligenza artificiale ha riguardato proprio l’applicazione di alcune tipologie di RNA, con ottimi risultati. In particolare sono state implementate reti neurali ricorrenti per analizzare le serie storiche relative ai volumi di richiesta di alcuni servizi online, con l’obiettivo di prevederne l’andamento futuro.
Per un’organizzazione complessa come InfoCamere – gestendo il Registro delle Imprese delle Camere di Commercio governa un flusso di circa 100 milioni di operazioni e 100mila controlli giornalieri – questo tipo di informazione è importante. Da un lato, per tarare le risorse necessarie affinché il servizio sia sempre disponibile; dall’altro, per avere delle linee guida affidabili in fase di pianificazione del budget previsionale.
Un altro tipo di rete neurale artificiale “addestrata” in InfoCamere è quella di tipo convoluzionale, ossia reti specifiche per il riconoscimento di immagini relative a documenti di varia natura, con lo scopo di automatizzare alcune attività di controllo altrimenti svolte manualmente e quindi più soggette a errori.
Non solo. A testimonianza della flessibilità di questo algoritmo, le RNA sono state applicate per analizzare, ad esempio, lo stock di imprese presenti nel Registro Imprese e prevederne la dinamica a breve termine. In questo caso la previsione fornisce indicazioni a livello macro del numero di imprese presenti sul territorio e sulla sua probabile evoluzione, al fine – ad esempio – di tarare in modo più accurato le risorse necessarie a gestirne le esigenze amministrative.
Chi “addestra” le reti neurali
Esistono innumerevoli configurazioni di RNA, la scelta dipende dal risultato che si vuole raggiungere. Nonostante ciò, le reti neurali non sono da considerarsi scatole nere ma, al contrario, si fondano su basi teoriche precise e accessibili a tutti. L’importante è che il loro utilizzo, in qualsiasi campo, sia guidato da esperti o da figure professionali – come i data scientist – che abbiano una conoscenza approfondita di questi sistemi al fine di evitare il raggiungimento di risultati fuorvianti e/o di scarsa utilità.
Grazie alle competenze matematiche e statistiche e alla capacità di utilizzare le tecnologie analitiche più avanzate, i data scientist rappresentano oggi quelle figure aziendali strategiche per estrarre valore dai dati e consentire all’azienda di sbagliare di meno, di rivoluzionare modalità operative e di relazione con i propri clienti. Attraverso le RNA, i data scientist sono in grado di indagare gli aspetti più complessi, accelerando i tempi d’analisi e valorizzando ulteriormente il patrimonio dati aziendale.
Nei prossimi anni la crescente disponibilità di dati, unitamente a infrastrutture hardware (CPU e GPU) sempre più performanti e servizi computazionali accessibili “on demand” consentiranno ai data scientist di sfruttare al meglio le RNA e le altre tecnologie di machine learning e gestire più agevolmente le richieste di informazioni che servono alle istituzioni (per essere più efficienti e capaci di rispondere ai propri stakeholder), e alle imprese (per essere più competitive sui propri mercati).