Mentre il mondo si affaccia alle potenzialità delle reti neurali (NN) e dell’intelligenza artificiale, si aprono nuovi campi di ricerca che sfruttano le competenze della matematica applicata e delle scienze computazionali, dell’informatica e delle scienze fisiche per studiare fenomeni e ambiti in cui si hanno pochi dati e non si conoscono ancora le leggi specifiche che le governano. In quest’ambito di scoperte scientifiche data-driven, si inseriscono scienze come il cosiddetto Scientific Machine Learning (SML) e metodologie pionieristiche molto più ampie dell’SML, come le reti neurali informate dalla fisica (PINN).
L’intelligenza artificiale nei sistemi HPC: cosa sono le Physics-Informed Neural Networks
Le PINN, Physics-Informed Neural Networks, nate come una struttura di apprendimento multi-task in cui una NN deve adattarsi ai dati osservati, sono oggi utilizzate per risolvere PDE, equazioni frazionarie, equazioni integrali-differenziali e PDE stocastiche.
Deep neural network, PINN e oltre
In tantissimi settori dalla medicina al manufacturing, utilizziamo ogni giorno reti neurali anche profonde, addestrate ad elaborare output sulla base di set di dati selezionati, scelti e forniti dai data scientist. Se da una parte sappiamo come lavorano singoli strati (layer) di neuroni, non sappiamo ancora come tutti i neuroni lavorino insieme per arrivare all’output. Spesso non è nemmeno chiaro cosa faccia un singolo neurone da solo quando riceve input da altri neuroni. In pratica, ogni neurone di una deep neural network riceve una serie di input da altri neuroni, li moltiplica sulla base di parametri appresi durante l’addestramento e poi calcola un output. Se ogni strato di neuroni lavora secondo un modello matematico preciso, tuttavia la “black box”, ovvero il buio dell’incertezza, si presenta quando cerchiamo di considerare il modo in cui più neuroni lavorano insieme. In alcuni ambiti, specie in cui non sono presenti dati sufficienti per addestrare le reti neurali oppure il contesto in cui i dati si inseriscono non è ben identificabile, l’output elaborato può non essere corretto per l’ambito di studio.
Non solo: le reti neurali hanno bisogno di essere addestrate con grandi quantità di dati di valore per elaborare output robusti in ambiti specifici. In alcuni ambiti, come le scienze fisiche, i set di dati possono essere di bassa qualità, alcuni sono unlabeled oppure quantitativamente scarsi, o non ci sono dati di riferimento. Nei settori industriali o di ricerca in cui si hanno informazioni, anche parziali, sulle leggi fisiche che li governano, come ad esempio la fluidodinamica è possibile sfruttare le PINN. È proprio qui che si sviluppano e si inseriscono le reti neurali informate dalla fisica (PINN), ovvero un pionieristico tipo di tecnologia che favorisce il processo di apprendimento e di elaborazione di soluzioni robuste a cura delle reti neurali quando non sono ancora disponibili set di dati sufficienti all’addestramento delle sole reti. Questo è quello che cerca di fare una disciplina emergente, lo scientific machine learning (SciML): estrarre conoscenze robuste, affidabili e utili da insiemi di dati specifici in un determinato ambito, attraverso soluzioni metodologiche innovative come le PINN.
L’importanza potenziale delle PINN nelle data-driven discovery
Le PINN vengono utilizzate nelle scienze computazionali per affrontare un’ampia gamma di problemi. L’utilizzo dell’addestramento delle sole reti neurali, per quanto profonde, ha dimostrato, in determinati contesti fisici da indagare, di produrre soluzioni (output) che potrebbero non essere corrette dal punto di vista fisico. Le reti neurali informate dalla fisica (PINN), invece, sono progettate per fornire alle reti neurali l’addestramento e le equazioni fisiche che delimitano il contesto da studiare. Pertanto, con una conoscenza delle caratteristiche (leggi) fisiche del problema e i dati di addestramento (input), anche se scarsi e incompleti, le PINN possono essere utilizzate per trovare soluzioni ottimali e fisicamente consistenti.
Le innovazioni nel campo del machine learning (ML) e dei “big data” stanno iniziando a guidare i progressi in discipline scientifiche come le Earth Sciences, ma il pieno potenziale di queste nuove tecnologie per le scoperte data-driven deve ancora essere pienamente realizzato. Un ostacolo alla data-driven discovery è che i metodi esistenti spesso non soddisfano le esigenze dei ricercatori di estrarre nuove conoscenze scientifiche dai dati. I modelli tradizionali limitati dall’addestramento “application-agnostic” o dalla progettazione di algoritmi di ML come l’elaborazione delle immagini o del linguaggio naturale, spesso non possono essere utilizzati direttamente per nuove scoperte, ma richiedono modifiche importanti e specifiche. In altri casi, i modelli o i risultati forniti dagli algoritmi non hanno l’affidabilità e le garanzie per renderli applicabili a nuove scoperte scientifiche.
L’utilizzo delle PINN nell’addestramento delle reti neurali, invece, ha il potenziale di favorire l’elaborazione di output plausibili e ammissibili in contesti in cui esiste incertezza delle leggi fisiche sottese a un determinato ambito che si desidera indagare e non si dispone di dati adeguati per l’addestramento delle NN. In pratica, le PINN servono a descrivere e limitare con modelli matematici (equazioni differenziali parziali – PDE), il contesto in cui le reti neurali dovranno produrre output. Questo al fine di ridurre l’approssimazione della funzione e migliorare il valore informativo di input non big-data o di big-data ma rumorosi o sporchi, oltre ad aumentare la capacità delle reti neurali di individuare la soluzione giusta per il contesto di ricerca.