I large language models hanno sorpreso fin dalla ribalta di ChatGPT con la versione 3.5 del modello per la grande capacità di sintesi anche a fronte di grandi quantità di testo. È in parte dovuta a questa capacità la spinta a cercare contesti sempre più grandi per consentire l’analisi integrale di testi anche lunghi che hanno portato a contesti di 128 mila token e più (assumendo che il testo di una pagina equivalga a 400 token equivale a dire 320 pagine e più).
Quando però si cerca di ottenere una sintesi è esperienza comune che si tratti spesso di sintesi troppo concise ed è complicato convincere un sistema di AI generativa ad espandere la sintesi di un documento. Si potrebbe quindi pensare che l’eccesso di sintesi si possa estendere anche alla generazione di una presentazione, ma per motivi legati al processo di generazione del testo e di come sono scritti questi sistemi apparentemente la sintesi di un documento, per quanto lungo, viene decisamente meglio quando si chiede al modello di generare le slides di una presentazione. Cerchiamo di capire quali approcci si possono seguire per la generazione di presentazioni PowerPoint sia a partire dalla conoscenza del modello che con l’analisi di un documento testuale, anche di grandi dimensioni.
Generare presentazioni con GPT-4o mini
Cominciamo a vedere come sia possibile generare una presentazione con ChatGPT usando il modello GPT-4o-mini disponibile per tutti. Il primo tentativo evidenzia come il modello tenda ad offrire lo schema della presentazione senza però fornire il contenuto:
Insistendo di più col prompt si può ottenere un po’ più di dettaglio:
Il modello mini, seppure più capace di GPT-3.5 non riesce a generare file e se chiediamo un file PPTX questa è la risposta:
Cosa succede se usiamo il modello GPT-4o
Se usiamo il modello GPT-4o otteniamo da subito le slides e alla domanda sulla generazione del file otteniamo quanto desiderato:
Aggiunta di elementi grafici e immagini di accompagnamento
Il contenuto di una slide non si limita però al solo testo, siamo tutti abituati ad elementi grafici che però il modello non genera autonomamente. È possibile utilizzare un GPT specializzato (ad esempio Presentation and Slides GPT: PowerPoints, PDFs) ma l’introduzione di un servizio esterno porta con sé inevitabili complicazioni come, ad esempio, il tentativo di farci usare qualche servizio esterno.
Una volta ottenuto il file PPTX (o copiato il contenuto se si usa il modello mini) è possibile avvalersi di un’altra AI meno conosciuta ma presente in PowerPoint: il designer, uno strumento che propone layout grafici e immagini di accompagnamento per formattare slides a partire dal contenuto:
Con pochi click è possibile avere una presentazione decisamente professionale che usa anche funzioni di PowerPoint come le smart Art che consentono di uscire dalla monotonia delle liste puntate:
Realizzare una presentazione a partire da un file
Lo stesso flusso operativo può essere seguito caricando un file (in questo caso è necessario usare GPT-4o) e chiedendo di realizzare una presentazione PowerPoint e indicando i vincoli, come ad esempio, il numero di slides, l’audience a cui è rivolta, ecc.
Le presentazioni generate con l’aiuto di GPT sono in generale di buona qualità ma a volte è difficile costringere il modello ad essere preciso, ma con un po’di ingegno è assolutamente possibile:
Il testo proposto prevede anche delle formule:
Queste però si perdono nella conversione a PowerPoint che comunque consente una rapida formattazione anche se richiede qualche altro ritocco:
Usare PowerPoint e Copilot 365
Se si usa la versione a pagamento di Copilot integrata con Office 365 è possibile ottenere un’interazione paragonabile anche con l’assistente di Microsoft, con la differenza che il modello GPT-4 usato da Microsoft manipola direttamente PowerPoint introducendo direttamente elementi grafici e note nelle singole slides. Un primo aspetto è l’interazione decisamente meno naturale e più orientata ai comandi, infatti se non si usa una delle formulazioni previste per il prompt PowerPoint non riconosce la richiesta:
Se ci conformiamo ai prompt previsti ecco che otteniamo quanto richiesto:
Emerge chiaramente come la generazione sfrutti meglio le capacità di formattazione di PowerPoint, ma i contenuti sono decisamente più scarni di quelli generati da GPT con la stessa richiesta.
Sebbene il modello LLM usato da entrambi sia analogo le direttive usate da Copilot sembrano privilegiare slides più essenziali e con meno testo.
È possibile fornire anche un file da cui ricavare una presentazione ma, contrariamente a quanto fa GPT-4o, Copilot accetta solo file in formato .docx (è spesso facile ottenere il file in tale formato aprendo un file PDF con Word e salvando il file nel formato di Microsoft).
Generazione di presentazioni complesse
Utilizzando le Linee guida per la Formazione, Gestione e Conservazione documentale abbiamo chiesto a GPT e a Copilot la generazione di una presentazione di trenta minuti. Il primo ha generato una presentazione di venti slides mentre il secondo una di quaranta slides. In entrambi i casi la struttura segue quella del documento, ma GPT ha generato uno schema che tiene più conto del tempo richiesto e con indicazioni meno di dettaglio rispetto alla generazione effettuata da Copilot.
Conclusioni
La generazione di presentazioni con i modelli LLM è una realtà, e gli approcci consentono di ottenere presentazioni di buona qualità con molto meno sforzo rispetto a poco più di un anno fa, a testimonianza degli enormi progressi compiuti da queste tecnologie. Spesso la presentazione generata può richiedere una revisione per adattarla alle proprie necessità. La combinazione che sembra essere più efficace per generare intere presentazioni sembra essere la combinazione di ChatGPT e PowerPoint Designer, per arricchire una presentazione già pronta invece Copilot 365 è decisamente più efficace. L’accesso gratuito, seppur contingentato, a GPT-4o, consente di utilizzare GPT e PowerPoint senza dover sostenere costi anche se l’uso contingentato del modello può rendere complesso un processo di raffinamento della presentazione.