Anthropic è un’azienda nata da alcuni fuoriusciti da OpenAI tra cui Ilya Sutskever che ha come obiettivo la creazione di intelligenze artificiali sicure e intelligenti. La sua intelligenza artificiale Claude è stata a lungo limitata di fatto al mercato americano. Non più: mentre recentemente si è aperta al mercato globale supportando molte lingue, italiano incluso.
Quale spazio per Claude nell’affollato scenario delle AI
Ci si potrebbe chiedere perché usare anche questa AI oltre a ChatGPT, Microsoft Copilot 365, Google Gemini, Mistral AI, Llama di Meta giunto alla versione 3.1 etc.
Il panorama delle AI si sta rapidamente saturando e in assenza di una reale capacità di confronto ciascuno di noi valuta queste AI e decide quando usare ciascuna di esse. Ad esempio io preferisco usare Copilot Web quando faccio fact checking grazie al suo comportamento più deterministico nei confronti della search Web (ad ogni richiesta sicuramente viene fatta la ricerca che poi viene riassunta con indicazione alle fonti che finalmente anche Google Gemini ha recepito).
Per l’interazione vocale con l’AI preferisco ChatGPT così come per i task di ragionamento, mentre sono un utente occasionale di Google Gemini e Mistral lo tengo d’occhio.
È naturale quindi chiedersi quale spazio rimanga per una nuova AI e se la qualità del suo modello sia sufficiente a giustificare l’inclusione nel sempre più affollato mondo delle AI. Cerchiamo di scoprirne le caratteristiche e in cosa si distingue dagli altri attori.
Una prima interazione con Claude AI
Per usare Claude, basata sul modello Sonnet 3.5, è sufficiente puntare il proprio web browser all’indirizzo https://claude.ai, registrarsi e cominciare ad usare il chatbot come in ogni altro sistema di questo tipo.
La prima cosa che salta all’occhio è l’estrema cura e pulizia dell’interfaccia con un’attenzione spasmodica al design elegante e minimalista. La presenza delle icone della macchina fotografica e della graffetta ci rassicurano sul fatto che il modello accetta in input dati e immagini come ormai fanno tutti e quindi sarà possibile fornire informazioni oltre al prompt per porre questioni all’AI.
Chiedendo a Claude un confronto con i suoi competitor genera una risposta in un buon italiano e, seppur evitando il confronto, da informazioni utili in particolare evidenziando un primo limite del sistema: non ha accesso alla search internet limitando la conoscenza al momento in cui è stato eseguito l’apprendimento.
La creatività di Claude AI
Se proviamo la creatività del modello chiedendo la generazione di una breve storia il modello sicuramente non delude le nostre aspettative:
L’abilità di ragionamento matematico di Claude AI
L’abilità di ragionamento matematico è sicuramente degna di nota, ho chiesto di dimostrare un fatto non così noto e la risposta è stata decisamente soddisfacente:
Ho provato a chiedere un approccio diverso alla dimostrazione e, a parte un piccolo errore di visualizzazione (7*24*60 è stato interpretato dalla visualizzazione come formattazione), la risposta non mi ha certo deluso:
L’interfaccia di Claude AI: pregi e difetti
Abbiamo già commentato che l’interfaccia colpisce assolutamente per la cura maniacale dei dettagli. L’uso di vari font e la scelta di usare font serif (con grazie) rende molto piacevole la lettura ricordando molto un libro sulla parte di contenuto generato dall’AI riservando font sans serif agli elementi di controllo.
L’assenza di un’interazione vocale
La prima cosa che mi ha colpito è l’assenza di un’interazione vocale, ritengo che questo sia il limite più grosso del sistema dal punto di vista dell’interazione, anche sulla app mobile. L’interazione scritta, soprattutto su dispositivi mobili, limita significativamente la fruibilità dell’interazione.
Il pannello HTML
Un aspetto straordinario dell’interfaccia è invece un pannello HTML in cui l’AI genera codice che viene eseguito direttamente dal Web browser per ottenere varie visualizzazioni. Dopo aver chiesto lo studio della funzione x^x/log(x) mi è venuto spontaneo chiedere la visualizzazione del grafico e la risposta mi ha decisamente sorpreso:
L’AI si è avvalsa di HTML e SVG per generare la visualizzazione. In questo è decisamente un’interfaccia unica e molto efficace nello sfruttare l’abilità del browser di eseguire codice (ho provato a far generare codice pericoloso ma per ora senza successo, si tratta però di un elemento di potenziale vulnerabilità nel caso in cui il modello dovesse allucinare).
Gli “artefatti”
Questi elementi eseguibili generati sono chiamati da Claude “artefatti” e possono essere condivisi come le chat.
Volendo sperimentare questa funzione di cui avevo letto ho chiesto di generare un’interfaccia per giocare a Sudoku:
L’output è immediato e per certi versi sorprendente:
Il gioco è perfettamente funzionante e le partite generate non evidenziano errori particolari (il link a questo artefatto è https://claude.site/artifacts/31157b34-9cdf-409a-9b94-253ca7a93783, notare come il sistema ci informa che eseguirà codice generato e quindi potenzialmente insicuro).
Il codice genera una soluzione in un array e poi la confronta con i valori inseriti dall’utente nelle varie celle. Il cuore è quindi:
Si tratta di un algoritmo ricorsivo che riempie la griglia inizialmente popolata di 0 e verifica ad ogni passo se il numero scelto è corretto con lo stato attuale. Sembra una soluzione ragionevole anche se non l’ho verificata con la dovuta attenzione.
La qualità del codice HTML generato è decisamente buona e anche e soprattutto del codice javascript che risulta essere leggibile e chiaro.
Analizzare dati con Claude AI
Si possono fornire dati in due modi: mediante uno screenshot (l’icona della macchina fotografica non si riferisce ad una foto bensì ad uno screenshot) per chiedere informazioni relative allo schermo o ad una finestra, oppure caricare file.
L’analisi delle immagini
L’analisi di immagini è sicuramente di buona qualità:
L’analisi di un file CSV contenenti opendata
Se carichiamo un file CSV contenenti opendata (in questo caso i dati sulla contribuzione universitaria nel 2023) e ne chiediamo l’analisi otteniamo un buon output:
Non posso però non notare che contrariamente a quanto fa OpenAI qui non si vede il codice Python utilizzato per l’analisi dei dati, è quindi più difficile verificare le conclusioni rendendo meno affidabile il risultato. Sicuramente la capacità di capire la natura del dato e interpretarlo funziona molto bene.
Le API disponibili con Claude AI
Come per Gemini e OpenAI anche Anthropic consente di accedere ai propri modelli mediante API proprie. L’integrazione di questi modelli con API differenti diventa sempre più complesso ma esistono già librerie che consentono di convertire chiamate da un formato all’altro come ad esempio il progetto claude2openai.
In ogni caso è quindi possibile includere nei propri progetti le capacità di questo modello, un aspetto sicuramente interessante visto che Sonnet 3.5 ha un contesto di 200.000 token, più ampio dei 128.000 token previsti da OpenAI, rendendolo sicuramente interessante in termini di analisi documentale.
Conclusioni
Claude e Sonnet 3.5 sono benvenuti nel panorama delle AI, e la qualità dell’interfaccia e gli artefatti sono sicuramente apprezzabili. Il modello di per sé sembra essere di buona qualità e paragonabile a GPT-4o e a Google Gemini, almeno da una prima prova (ci vogliono settimane di utilizzo per trovare le magagne). L’ecosistema però sembra mancare di elementi molto importanti, primo tra tutti la capacità di cercare su Internet. Anche l’assenza di un’interazione vocale, ance basilare, sembra essere un limite significativo.
Gli artefatti invece sono uno straordinario elemento che rende efficace l’interazione e si presta moltissimo allo sviluppo, e anche la generazione del codice è di ottima qualità.
Da un punto di vista applicativo le API consentono accesso al modello e quindi il loro uso negli applicativi, con un modello da notevoli capacità di ragionamento e che parla un buon italiano e soprattutto con un contesto molto ampio (200k token).
Ritengo che Claude e Sonnet con le relative API siano meritevoli di essere provate e tenute d’occhio quando si realizzano sistemi basati su AI e grandi modelli LLM.