OpenAI ha finalmente aperto la possibilità di integrare la conoscenza di ChatGPT con fonti esterne mediante due meccanismi centrali: l’uso di ricerca Web e i plugin. La nuova versione è disponibile ora in beta e quindi a coloro che hanno sottoscritto la versione Plus (e a pagamento) del servizio.
Come usare i plugin nella versione Plus
Ci sono due aspetti centrali da tenere presente anche se si ha accesso alla versione Plus: il primo è che queste funzioni sono disponibili per il modello GPT-4 che è ancora limitato nel numero di messaggi che si possono usare; il secondo è che è necessario attivare i due servizi accedendo alla sezione “settings” del proprio account e spuntare le due opzioni nella sezione “Beta features” come mostrato in figura.
Una volta attivate le nuove funzionalità muovendo il cursore sull’opzione GPT-4 si avrà accesso ad una delle tre modalità d’uso:
La modalità d’uso “Default” è quella a cui siamo già abituati e si limita ad utilizzare la conoscenza presente nel modello. La modalità “Browsing” assomiglia nel funzionamento a quanto fanno Bing e you.com e non può, al momento, essere combinata con l’uso dei plugin che infatti ha una modalità “Plugins” separata.
La modalità Browsing in ChatGpt
La prima cosa che colpisce della modalità browsing è che non funziona come i motori di ricerca che fanno sempre una ricerca Web per rispondere alle domande, infatti a seconda della domanda che si pone l’AI decide se rispondere in autonomia oppure chiedere “un aiutino dal Web”.
Se si fa una richiesta che evidentemente richiede l’uso del Web automaticamente veniamo informati che sta consultando il Web.
Come avviene per Bing vengono visualizzate le ricerche che effettua e poi sembra interagire con i risultati come si può vedere in figura.
I tentativi che ho fatto sabato, sia in italiano che in inglese, davano solo risposte di scuse perché non riesce ad accedere alle informazioni on-line.
Domenica invece dava informazioni corrette.
Ciascun paragrafo riferisce una fonte che può essere esaminata, ma la qualità delle sintesi sembra decisamente migliore e più accurata. Il processo di ricerca è però molto più farraginoso probabilmente a causa del fatto che viene effettuata una ricerca simulando i click per leggere i risultati. L’impressione è che Bing faccia uso direttamente dell’indice per produrre i risultati
Facendo esplicitamente riferimento al prossimo anno l’anno viene correttamente aggiunto:
La modalità Plugins
Nella modalità Plugins è prima necessario selezionare i plugins che si vogliono utilizzare nella conversazione. Anche in questo caso sarà l’AI a decidere se e quando invocare le funzioni di un plugin in base al contenuto della conversazione.
Accedendo al Plugin store è possibile “installare” plugin che l’AI utilizzerà, potenzialmente trasferendo informazioni a parti terze. Ad oggi sono presenti oltre 100 plugin in sviluppati spesso da servizi popolari come ad esempio Wolfram alpha.
Per fare i test ho installato quattro plugin anche se se ne possono abilitare simultaneamente solo 3:
Ecco un esempio in cui dalla domanda GPT decide che il plugin di Wolfram Alpha è il più appropriato per rispondere:
Il Plugin Show Me è per me sempre abilitato, la capacità di generare schemi è sempre molto utile, come nel seguente esempio:
Si tratta di un progetto open source che consente anche di capire l’anatomia di un plugin che ha un comportamento decisamente non banale.
È sicuramente da osservare come si possa espandere le informazioni sull’uso del plugin per soddisfare la richiesta:
In questo modo si possono vedere i dati inviati al plugin e la risposta ottenuta. Sicuramente una funzione utile a valutare eventuali trasferimenti di dati da ChatGPT ai vari fornitori. Come si può osservare Show Me restituisce solo l’immagine, il resto del testo è generato da GPT.
Quello che non ti aspetti…
I plugin rappresentano un pattern classico di sviluppo dei sistemi software. Si definisce un’interfaccia programmatica generica nel software che ospita un plugin, e i plugin la devono implementare pedissequamente affinché il sistema funzioni. Il vantaggio è evidente: un sistema software può essere esteso senza il bisogno di doverlo ricompilare e con il contributo di sviluppatori terzi rispetto a quelli del sistema stesso.
Leggendo la documentazione emerge con evidenza che OpenAI non è così rigido come vuole la tradizione: un file in formato JSON descrive la funzione del plugin e un altro file in formato YAML descrive le chiamate “disponibili”, senza che queste debbano richiedere una struttura specifica.
Sarà l’AI a decidere in base alla descrizione se chiamare il particolare plugin e quale funzione chiamare e con che parametri. È noto che GPT si comporta bene nell’analisi del codice, ma vederlo in azione per realizzare una funzione come quella dei Plugin è decisamente impressionante.
Conclusioni
Le nuove funzioni web browsing e il plugins sono decisamente importanti aggiunte a ChatGPT. Quello che rende rilevante entrambe le funzioni è la discrezionalità che l’AI utilizza per decidere se rispondere senza ricorrere a queste risorse esterne, oppure usare una risorsa e come utilizzarla. Si tratta di una funzione decisamente avanzata dal punto di vista del software engineering, e allo stesso tempo molto utile poiché consente di fornire conoscenza specifica all’AI superando il limite di avere una conoscenza chiusa al momento dell’apprendimento.
Si sta rapidamente affermando uno “store” di plugin che per il momento non sono a pagamento ma è facile immaginare che alcuni plugin lo possano diventare nel tempo.
Uscire dal mondo chiuso della collezione dei dati utilizzati per l’addestramento è sicuramente un’opportunità, ma allo stesso tempo renderà ancora più complessa la valutazione delle implicazioni sul testo generato, e non solo in materia di privacy.