Un tratto caratteristico del livello Plus di ChatGPT è la capacità di analizzare dati contenuti in uno o più file che saranno utilizzati per produrre le risposte. Come si può beneficiare di questa funzione nel lavoro quotidiano? Quanto sono affidabili le analisi svolte e come si può verificare l’operato dell’AI? Cerchiamo insieme di capirlo.
Indice degli argomenti
Funzionamento base di ChatGPT Plus per l’analisi di dati
Prima di elencare usi possibili cerchiamo di capire cosa significhi caricare un file in ChatGPT e porre domande sullo stesso: il processo di base è quello di caricare i file in un container linux ed analizzarlo mediante tecniche che dipendono dal file in oggetto. Nel caso di analisi di dati GPT genererà degli script Python per analizzare i dati e produrre analisi affidabili (cosa decisamente impossibile per un modello LLM puro). In questo caso l’interfaccia consente di visualizzare il testo dello script generato in modo che sia possibile verificare l’approccio seguito e controllare quindi se le operazioni svolte sono compatibili con la richiesta fatta.
Data Analytics nel settore Energy e Utility: come leggere i dati in un mercato in evoluzione?
Proviamo a vedere come si comporta in presenza di file di testo, sorgenti dati, e di immagini.
Elaborazione documenti e generazione di contenuti con ChatGPT Plus
Ho provato a caricare il file PDF del nuovo piano triennale per l’informatica nella pubblica amministrazione per il triennio 2024-2026.

È interessante capire come si comporta nell’analizzare un documento articolato come il piano triennale. Come riassunto di altissimo livello quello generato da GPT non è pienamente soddisfacente, ma ponendo ulteriori domande è possibile approfondire aspetti come, ad esempio, le novità:

Correttamente il modello identifica nell’AI l’aspetto innovativo del piano, e personalmente condivido la scelta fatta. È possibile approfondire ulteriormente:

La manipolazione dei documenti con ChatGPT Plus
La manipolazione dei documenti non è senza limiti, in generale le attività di riassunto o di ricerca di informazione all’interno di un documento funziona bene, ma se si cerca di generare un documento di dimensioni paragonabili il modello presenta vari problemi, sottolineando come la dimensione del testo generato non sempre sia gestibile. Se si chiede, ad esempio, la traduzione in inglese del documento la risposta è molto lontana dalle aspettative:

È possibile chiedere di produrre una presentazione PPTX del piano ma, a parte la scelta dell’inglese per la loro composizione:

In questo caso ChatGPT ha deciso di impiegare python per governare la generazione: cliccando sull’icona con il simbolo del prompt è possibile visualizzare il sorgente del programma utilizzato per produrre il risultato. Nel caso della generazione della presentazione PPT a partire dal documento in formato PDF:

Come è facile verificare il sistema genera il codice che, usando il modello di programmazione basato su Office automation viene assemblato il contenuto della presentazione. Il risultato dell’esecuzione è il file pptx che si può scaricare.
È bene sottolineare che Copilot 365, seppur utilizzando lo stesso modello AI, è capace di generare presentazioni più accurate e con immagini di accompagnamento.
Analisi di immagini con ChatGPT Plus
L’analisi delle immagini ha numerose applicazioni, la mera descrizione testuale può aiutare utenti con ridotte o nulle capacità visive. La richiesta di descrivere un’immagine provoca l’invocazione del modello vision di OpenAI:

Ma nel momento in cui si fanno domande puntuali GPT decide di usare l’analisi di immagini utilizzando Python e una libreria per l’analisi di immagini:

La foto non contiene chiaramente 1070 tronchi ma la risposta dipende dall’approccio usato che consiste nel cercare cerchi all’interno dell’immagine:

Quando messa in discussione GPT prova un altro approccio generando un altro script che produce un numero decisamente vicino ai 118 tronchi che ho contato:

È interessante osservare come lo script usi un filtro per trovare i contorni nell’immagine:

Analisi di dati tabellari con ChatGPT Plus
È possibile analizzare dati tabellari (es file excel o CSV). In questo caso GPT Plus è anche capace di incrociare dati presenti in più file oppure integrando con dati reperiti dal Web. Si tratta di un’abilità che rende possibile analizzare l’enorme patrimonio di Open Data che è stato rilasciato nel tempo e che è spesso rimasto un mero adempimento ad obblighi di legge.
A titolo di esempio se scarichiamo i dati della popolazione legale dal sito di ISTAT è possibile fare domande interessanti come ad esempio:

La verifica della correttezza del calcolo è semplice e il codice Python generato decisamente semplice da leggere:

Oltre il modello LLM: vantaggi e sfide dell’uso di ChatGPT Plus
Quello che colpisce e distingue l’approccio di OpenAI rispetto agli altri strumenti di Chat basata su AI generativa è questa capacità di utilizzare il modello non solo come un oracolo che risponde a domande linguistiche: il modello viene utilizzato per svolgere funzioni con l’ausilio di strumenti esterni, in questo caso del linguaggio di programmazione Python e delle librerie utili all’analisi dei dati.
L’affidabilità dell’analisi è quindi meno affetta dal fenomeno dell’allucinazione, ma è comunque opportuno effettuare delle verifiche o delle quadrature: come è avvenuto nel caso dei tronchi è possibile che l’approccio seguito dall’AI non sia quello atteso.
Potenziali scenari futuri per l’utilizzo di ChatGPT Plus nell’analisi dei dati
La capacità di analizzare file offre però un’interessante opportunità di nuovi scenari nell’impiego dell’AI generativa nei processi aziendali. Resta aperto il tema della riservatezza, ma anche la sola analisi di dati pubblici può aiutare ad accelerare processi aziendali, come ad esempio analisi comparative.
Un’abilità che colpisce del modello è quella di analizzare correttamente il significato delle colonne di una tabella di dati e proporre delle analisi di conseguenza. È certamente un acceleratore nel processo di analisi contribuendo a liberare le potenzialità delle piattaforme OpenData della PA italiana.
PA: Guida pratica alla transizione al cloud per i servizi SaaS