Intelligenza artificiale

Claude AI di Anthropic: la guida a punti forti e deboli

Claude AI di Anthropic si distingue per la sua interfaccia elegante e la capacità di generare artefatti eseguibili. Nonostante l’assenza di ricerca su Internet e interazione vocale, Claude offre un buon ragionamento matematico e un contesto ampio di 200.000 token, rendendola una valida alternativa nel panorama delle AI

Pubblicato il 12 set 2024

Antonio Cisternino

Università di Pisa

Anthropic è un’azienda nata da alcuni fuoriusciti da OpenAI tra cui Ilya Sutskever che ha come obiettivo la creazione di intelligenze artificiali sicure e intelligenti. La sua intelligenza artificiale Claude è stata a lungo limitata di fatto al mercato americano. Non più: mentre recentemente si è aperta al mercato globale supportando molte lingue, italiano incluso.

Qual è il miglior modello di AI: Gpt, Claude e Llama a confronto

Indice degli argomenti

Quale spazio per Claude nell’affollato scenario delle AI

Ci si potrebbe chiedere perché usare anche questa AI oltre a ChatGPT, Microsoft Copilot 365, Google Gemini, Mistral AI, Llama di Meta giunto alla versione 3.1 etc.

Il panorama delle AI si sta rapidamente saturando e in assenza di una reale capacità di confronto ciascuno di noi valuta queste AI e decide quando usare ciascuna di esse. Ad esempio io preferisco usare Copilot Web quando faccio fact checking grazie al suo comportamento più deterministico nei confronti della search Web (ad ogni richiesta sicuramente viene fatta la ricerca che poi viene riassunta con indicazione alle fonti che finalmente anche Google Gemini ha recepito).

Per l’interazione vocale con l’AI preferisco ChatGPT così come per i task di ragionamento, mentre sono un utente occasionale di Google Gemini e Mistral lo tengo d’occhio.

È naturale quindi chiedersi quale spazio rimanga per una nuova AI e se la qualità del suo modello sia sufficiente a giustificare l’inclusione nel sempre più affollato mondo delle AI. Cerchiamo di scoprirne le caratteristiche e in cosa si distingue dagli altri attori.

Una prima interazione con Claude AI

Per usare Claude, basata sul modello Sonnet 3.5, è sufficiente puntare il proprio web browser all’indirizzo https://claude.ai, registrarsi e cominciare ad usare il chatbot come in ogni altro sistema di questo tipo.

La prima cosa che salta all’occhio è l’estrema cura e pulizia dell’interfaccia con un’attenzione spasmodica al design elegante e minimalista. La presenza delle icone della macchina fotografica e della graffetta ci rassicurano sul fatto che il modello accetta in input dati e immagini come ormai fanno tutti e quindi sarà possibile fornire informazioni oltre al prompt per porre questioni all’AI.

Pagina iniziale di Claude AI in cui sono presenti le icone della macchina fotografica e della graffetta poiché il modello accetta in input dati e immagini.

Chiedendo a Claude un confronto con i suoi competitor genera una risposta in un buon italiano e, seppur evitando il confronto, da informazioni utili in particolare evidenziando un primo limite del sistema: non ha accesso alla search internet limitando la conoscenza al momento in cui è stato eseguito l’apprendimento.

La creatività di Claude AI

Se proviamo la creatività del modello chiedendo la generazione di una breve storia il modello sicuramente non delude le nostre aspettative:

Esempio di prompt su Claude AI in cui si chiede: Raccontami una brevissima storia per un bambino di 3 anni chiamato Fabio.

L’abilità di ragionamento matematico di Claude AI

L’abilità di ragionamento matematico è sicuramente degna di nota, ho chiesto di dimostrare un fatto non così noto e la risposta è stata decisamente soddisfacente:

Test su abilità di logica di Claude AI: esempio di prompt in cui si chiede: dimostra che il numero di minuti in una settimana è 2*7.

Ho provato a chiedere un approccio diverso alla dimostrazione e, a parte un piccolo errore di visualizzazione (7*24*60 è stato interpretato dalla visualizzazione come formattazione), la risposta non mi ha certo deluso:

Test di abilità logica di Claude AI con esempio di prompt: Ma non si poteva invece partire dalla fattorizzazione di 72460 nella dimostrazione?.

L’interfaccia di Claude AI: pregi e difetti

Abbiamo già commentato che l’interfaccia colpisce assolutamente per la cura maniacale dei dettagli. L’uso di vari font e la scelta di usare font serif (con grazie) rende molto piacevole la lettura ricordando molto un libro sulla parte di contenuto generato dall’AI riservando font sans serif agli elementi di controllo.

L’assenza di un’interazione vocale

La prima cosa che mi ha colpito è l’assenza di un’interazione vocale, ritengo che questo sia il limite più grosso del sistema dal punto di vista dell’interazione, anche sulla app mobile. L’interazione scritta, soprattutto su dispositivi mobili, limita significativamente la fruibilità dell’interazione.

Il pannello HTML

Un aspetto straordinario dell’interfaccia è invece un pannello HTML in cui l’AI genera codice che viene eseguito direttamente dal Web browser per ottenere varie visualizzazioni. Dopo aver chiesto lo studio della funzione x^x/log(x) mi è venuto spontaneo chiedere la visualizzazione del grafico e la risposta mi ha decisamente sorpreso:

L’AI si è avvalsa di HTML e SVG per generare la visualizzazione. In questo è decisamente un’interfaccia unica e molto efficace nello sfruttare l’abilità del browser di eseguire codice (ho provato a far generare codice pericoloso ma per ora senza successo, si tratta però di un elemento di potenziale vulnerabilità nel caso in cui il modello dovesse allucinare).

Gli “artefatti”

Questi elementi eseguibili generati sono chiamati da Claude “artefatti” e possono essere condivisi come le chat.

Volendo sperimentare questa funzione di cui avevo letto ho chiesto di generare un’interfaccia per giocare a Sudoku:

Prompt inserito in Claude AI: Genera una pagina HTML capace di far giocare Sudoku generando ogni volta una partita.

L’output è immediato e per certi versi sorprendente:

Esempio di pannello di Claude AI per la generazione degli artefatti, in questo caso il Sudoku.

Il gioco è perfettamente funzionante e le partite generate non evidenziano errori particolari (il link a questo artefatto è https://claude.site/artifacts/31157b34-9cdf-409a-9b94-253ca7a93783, notare come il sistema ci informa che eseguirà codice generato e quindi potenzialmente insicuro).

Il codice genera una soluzione in un array e poi la confronta con i valori inseriti dall’utente nelle varie celle. Il cuore è quindi:

Esempio del codice generato da Claude AI per la produzione dell'artefatto.

Esempio di codice generato da Claude AI per creare il gioco Sudoku.

Si tratta di un algoritmo ricorsivo che riempie la griglia inizialmente popolata di 0 e verifica ad ogni passo se il numero scelto è corretto con lo stato attuale. Sembra una soluzione ragionevole anche se non l’ho verificata con la dovuta attenzione.

La qualità del codice HTML generato è decisamente buona e anche e soprattutto del codice javascript che risulta essere leggibile e chiaro.

Analizzare dati con Claude AI

Si possono fornire dati in due modi: mediante uno screenshot (l’icona della macchina fotografica non si riferisce ad una foto bensì ad uno screenshot) per chiedere informazioni relative allo schermo o ad una finestra, oppure caricare file.

L’analisi delle immagini

L’analisi di immagini è sicuramente di buona qualità:

Analisi e riconoscimento delle immagini con Claude AI.

L’analisi di un file CSV contenenti opendata

Se carichiamo un file CSV contenenti opendata (in questo caso i dati sulla contribuzione universitaria nel 2023) e ne chiediamo l’analisi otteniamo un buon output:

Analisi di un file in CSV con Claude AI.

Non posso però non notare che contrariamente a quanto fa OpenAI qui non si vede il codice Python utilizzato per l’analisi dei dati, è quindi più difficile verificare le conclusioni rendendo meno affidabile il risultato. Sicuramente la capacità di capire la natura del dato e interpretarlo funziona molto bene.

Le API disponibili con Claude AI

Come per Gemini e OpenAI anche Anthropic consente di accedere ai propri modelli mediante API proprie. L’integrazione di questi modelli con API differenti diventa sempre più complesso ma esistono già librerie che consentono di convertire chiamate da un formato all’altro come ad esempio il progetto claude2openai.

In ogni caso è quindi possibile includere nei propri progetti le capacità di questo modello, un aspetto sicuramente interessante visto che Sonnet 3.5 ha un contesto di 200.000 token, più ampio dei 128.000 token previsti da OpenAI, rendendolo sicuramente interessante in termini di analisi documentale.

Conclusioni

Claude e Sonnet 3.5 sono benvenuti nel panorama delle AI, e la qualità dell’interfaccia e gli artefatti sono sicuramente apprezzabili. Il modello di per sé sembra essere di buona qualità e paragonabile a GPT-4o e a Google Gemini, almeno da una prima prova (ci vogliono settimane di utilizzo per trovare le magagne). L’ecosistema però sembra mancare di elementi molto importanti, primo tra tutti la capacità di cercare su Internet. Anche l’assenza di un’interazione vocale, ance basilare, sembra essere un limite significativo.

Gli artefatti invece sono uno straordinario elemento che rende efficace l’interazione e si presta moltissimo allo sviluppo, e anche la generazione del codice è di ottima qualità.

Da un punto di vista applicativo le API consentono accesso al modello e quindi il loro uso negli applicativi, con un modello da notevoli capacità di ragionamento e che parla un buon italiano e soprattutto con un contesto molto ampio (200k token).

Ritengo che Claude e Sonnet con le relative API siano meritevoli di essere provate e tenute d’occhio quando si realizzano sistemi basati su AI e grandi modelli LLM.

@RIPRODUZIONE RISERVATA