Assessment di Qualità

ChatGPT a supporto del Project Manager per il PNRR



Indirizzo copiato

A fronte della “esplosione” del fenomeno ChatGPT, i maggiori esperti di project management concordano nel ritenere che il suo più immediato e proficuo utilizzo sia proprio nel ruolo di “personal assistant” del PM. In attesa di poter testare anche la prossima versione

Pubblicato il 30 mag 2023

Federico Minelle

Honorary Fellow ISIPM (Istituto Italiano di Project Management), Past President P.R.S.

Franco Stolfi

Senior Partner P.R.S. (Planning Ricerche e Studi), Advisory Board ISIPM Professioni



procurement, procurement pubblico, appalti pubblici, consip convenzioni

L’utilizzo della Intelligenza Artificiale (AI) a supporto del Project Manager (PM) sembra vicino, ma già oggi è efficace?

Per comprenderlo abbiamo effettuato una prima prova per l’assessment di qualità su ChatGPT, al fine di verificare la sua utilità come “personal assistant” di un project manager responsabile per un progetto ICT pubblico, nell’ambito del PNRR. La valutazione risultante, utilizzando le sue caratteristiche attuali, esprime ancora qualche punto debole, anche se le prospettive sembrano interessanti specie in attesa di verificare le capacità, annunciate notevolmente più elevate, della versione 4 da poco rilasciata e non ancora disponibile a tutti e dei rilasci annunciati dai potenziali competitor.

Auspicando che ormai si siano risolte positivamente le criticità che hanno prima portato al temporaneo blocco di ChatGPT da parte del Garante della Privacy ed ora al suo recente sblocco.

Piano di assessment

Sulla base delle prospettive indicate nei blog dei principali autori sulla materia proprio sul possibile ruolo di ChatGPT come personal assistant del Project Manager, è stato costruito un “progetto campione”, estrapolato con le opportune semplificazioni da un effettivo progetto ICT della Pubblica Amministrazione. Una breve sintesi del progetto “Integrazione Servizi di Pagamento PA” (ISPA) è riportata in Figura 1, che rappresenta lo screenshot della conversazione iniziale con il tool.

Figura 1 – Caratteristiche del progetto “campione” ISPA e accettazione ChatGPT

Sono state poi sottoposte al tool una serie ordinata di 30 domande, tutte in formato aperto, relative alla gestione del progetto campione, posizionando temporalmente le domande in diversi momenti del suo ciclo di vita:

1. ad avvio progetto (Fase 1: principale focus su approccio metodologico),

2. dopo 1 mese da inizio progetto (Fase 2: principale focus su situazione/azione richiesta),

3. ad 1 settimana dalla fine del progetto (Fase 3: principale focus su lezioni apprese).

Uno stralcio delle domande, relative a ciascuno dei momenti del ciclo di vita simulato, è riportato nelle seguenti Figure 2, 3 e 4. Maggiori dettagli sulla intera ricerca sono disponibili, per chi fosse interessato.

Figura 2 – Domande su approccio metodologico

Figura 3 – Domande su situazione/azione richiesta

Figura 4 – Domande su lezioni apprese

Le risposte ottenute

Nelle sessioni di conversazione con il tool, alle domande per ciascuno dei momenti del ciclo di vita del progetto, sono state ottenute le relative risposte, delle quali uno stralcio è riportato nelle Figure 5, 6 e 7.

Figura 5 – Risposte su approccio metodologico

Figura 6 – Risposte su situazione/azione richiesta

Figura 7 – Risposte su lezioni apprese

Il modello di qualità applicato

Le risposte ottenute alle domande poste sono state valutate dagli autori secondo i criteri, in buona parte derivati da:

Infatti, come già detto, lo specifico ruolo assegnato a ChatGPT è stato quello di personal assistant al Project Manager del progetto ISPA.

Si è anche considerata la diretta esperienza acquisita in una pioneristica ricerca sulla certificazione della qualità dei siti web della PA Italiana.

In sintesi, le caratteristiche di qualità considerate (e relative sotto-caratteristiche, omesse in questo articolo per brevità) sono di seguito riportate, opportunamente pesate per la loro valutazione aggregata:

  • Adeguatezza: risposte coerenti con le domande poste e verificabili, precise e di lunghezza adeguata, contenuti adeguati a soddisfare le esigenze informative esposte, conoscenza delle esigenze tipiche del project manager, …
  • Completezza: risposte esaurienti (basate su più fonti), riferimenti a bibliografia/esperienze specifiche (rintracciabili), indicazioni su affidabilità risposte o presenza di alternative, …
  • Originalità e capacità apprendimento: evidenza di elaborazione autonoma rispetto alle fonti, linguaggio (appropriato al contesto) e allineato alle domande, capacità di imparare dai feedback e dalle esperienze passate, …
  • Usabilità: facilità di accesso e d’uso, tempestività (tempi di attesa accettabili per l’utente), comprensibilità domande/risposte, mantenimento della sequenza della conversazione (anche in più sessioni), …

La valutazione della risposta è stata effettuata assegnando un giudizio ad ognuna delle sotto-caratteristiche in una scala crescente: da 0 (totalmente non soddisfacente) a 3 (totalmente soddisfacente).

Il livello di soglia richiesto per ciascuna caratteristica di qualità è stato fissato pari a 2: parzialmente soddisfacente.

Valutazione: caratteristiche esaminate e risultati

Preliminarmente si è evidenziata una difficoltà del tool nel fornire una sequenza completa di risposte al singolo gruppo di domande, sottoposte separatamente per ciascuno dei momenti del ciclo di vita del progetto. Le interruzioni nel flusso di risposte (sistema “bloccato”) hanno costretto a sottoporre, in alcuni casi più volte, il singolo gruppo di domande, fino ad ottenere il quadro di risposte sopra riportato. Questo aspetto ha influito sulla valutazione della caratteristica di “Usabilità”.

Inoltre, si è avvertita la mancanza di qualsiasi evidenza delle eventuali fonti dalle quali siano emerse le risposte fornite. In effetti, la scelta di non richiedere esplicitamente i riferimenti puntuali delle fonti è stata anche originata dalla esperienza effettuata in precedenti test, dove spesso i riferimenti forniti dal tool sono stati di “fantasia” e non riscontrabili: fenomeno noto alla comunità specialistica come hallucination.

Questo aspetto, comunque, non ha penalizzato in modo significativo la valutazione per la caratteristica di “completezza”.

La valutazione mediata sulle diverse caratteristiche di qualità definite (Figura 8) mostra una sostanziale accettabilità per le risposte fornite nel momento di avvio (Fase 1), mentre nei momenti successivi (Fasi 2 e 3) la valutazione si pone sotto la soglia, con valori intermedi tra l’insufficienza e la sufficienza.

Figura 8 – Qualità nei diversi momenti (valutazione su media pesata sulle caratteristiche)

Questo conferma la capacità del tool di fornire un ragionevole supporto al PM per gli aspetti metodologici, tipici nel momento iniziale di organizzazione del progetto, mentre risulta (almeno per ora) meno efficace nel suggerire le decisioni da prendere a fronte delle situazioni emergenti o, ancor meno, nel riassumere le “lezioni apprese” nel corso del progetto. Probabilmente questo potrebbe essere condizionato anche dalla descrizione dello scenario “situazionale” delle fasi 2 e 3: non si ha evidenza se a fronte di un maggiore insieme di dati di dettaglio sulla situazione corrente, come avviene per un progetto nella realtà, il tool avrebbe potute fornire risposte maggiormente pertinenti.

Una analisi più dettagliata delle valutazioni puntuali fa emergere alcuni punti salienti sulle caratteristiche di qualità espresse nelle risposte per i diversi momenti simulati nel ciclo di vita del progetto:

  • Adeguatezza: generalmente accettabile, più che accettabile per il supporto nella Fase 1 (momento di avvio);
  • Completezza ed Originalità: generalmente inaccettabili, leggermente migliori per il supporto nella Fase 1;
  • Usabilità: generalmente accettabile, leggermente peggiore nella Fase 1.

In relazione all’annunciato progressivo miglioramento del tool da parte della start-up OpenAI che lo ha realizzato, si prevede di effettuare ulteriori simulazioni, posizionate anche in altri momenti del ciclo di vita del progetto pilota, fornendo specifiche informazioni situazionali. L’ampliamento del panel di valutatori “esperti” (sul project management e l’intelligenza artificiale) potrebbe costituire un ulteriore elemento migliorativo.

Conclusioni

A fronte della “esplosione” del fenomeno ChatGPT, i maggiori esperti di project management concordano nel ritenere che il suo più immediato e proficuo utilizzo sia proprio nel ruolo di “personal assistant” del PM. Nell’assessment effettuato (modello in ß test, come anche lo stesso tool esaminato), si notano buoni risultati sulle questioni di carattere metodologico, ma una sostanziale minore efficacia a fronte dei quesiti che richiedono una maggiore comprensione della situazione, fornendo spesso risposte connotate solo metodologicamente e talvolta eludendo la specificità della domanda.

Questo è da una parte comprensibile: la ovvia disponibilità dei vari standard di project management e relativi “Book of Knowledge” consente al tool basato sull’AI di affrontare adeguatamente questioni metodologiche, utilizzando i testi maggiormente consoni. Ma dall’altra parte, quando le informazioni fornite sono insufficienti o non trovano corrispondenza nella base di conoscenza del tool, piuttosto che risposte non “a tono”, sarebbe stato preferibile ottenere una più esplicita dichiarazione di incapacità a rispondere adeguatamente.

La valutazione emergente, utilizzando le caratteristiche attuali di ChatGPT, esprime ancora qualche punto debole, ma mostra prospettive interessanti, specie in attesa di verificare le capacità, annunciate notevolmente più elevate, della versione da poco rilasciata e non ancora disponibile a tutti e dei rilasci annunciati a breve dai potenziali competitor.

L’auspicata disponibilità di un valido supporto ai progetti reali, integrata con un sistema informativo di gestione progetto (PMIS Project Management Information System) potrà dare, anche in tempi brevi, maggiore affidabilità ed efficacia a strumenti di questo tipo, lasciando al Project Manager maggior disponibilità ed attenzione verso gli aspetti relazionali e strategici della sua funzione.

.

EU Stories - La coesione innova l'Italia

Tutti
Analisi
Video
Iniziative
Social
Programmazione europ
Fondi Europei: la spinta dietro ai Tecnopoli dell’Emilia-Romagna. L’esempio del Tecnopolo di Modena
Interventi
Riccardo Monaco e le politiche di coesione per il Sud
Iniziative
Implementare correttamente i costi standard, l'esperienza AdG
Finanziamenti
Decarbonizzazione, 4,8 miliardi di euro per progetti cleantech
Formazione
Le politiche di Coesione UE, un corso gratuito online per professionisti e giornalisti
Interviste
L’ecosistema della ricerca e dell’innovazione dell’Emilia-Romagna
Interviste
La ricerca e l'innovazione in Campania: l'ecosistema digitale
Iniziative
Settimana europea delle regioni e città: un passo avanti verso la coesione
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
EuroPCom 2024: innovazione e strategia nella comunicazione pubblica europea
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia
Programmazione europ
Fondi Europei: la spinta dietro ai Tecnopoli dell’Emilia-Romagna. L’esempio del Tecnopolo di Modena
Interventi
Riccardo Monaco e le politiche di coesione per il Sud
Iniziative
Implementare correttamente i costi standard, l'esperienza AdG
Finanziamenti
Decarbonizzazione, 4,8 miliardi di euro per progetti cleantech
Formazione
Le politiche di Coesione UE, un corso gratuito online per professionisti e giornalisti
Interviste
L’ecosistema della ricerca e dell’innovazione dell’Emilia-Romagna
Interviste
La ricerca e l'innovazione in Campania: l'ecosistema digitale
Iniziative
Settimana europea delle regioni e città: un passo avanti verso la coesione
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
EuroPCom 2024: innovazione e strategia nella comunicazione pubblica europea
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia

Articoli correlati