A seguito dell’accelerazione imposta dal rilascio di DeepSeek R1 anche Anthropic ha rilasciato il nuovo modello, Sonnet 3.7, un modello di terza generazione che è caratterizzato dall’essere un modello ibrido, ovverosia che è capace sia di svolgere compiti secondo una modalità standard dell’LLM sia secondo una modalità di ragionamento simile a quanto fa OpenAI con o1.
In accordo alle informazioni disponibili il modello è unico, ed è solo la modalità con cui viene ingaggiato a determinarne il comportamento, si tratta quindi di un approccio diverso rispetto a quello seguito, ad esempio, dalla concorrente OpenAI, in cui si usano modelli distinti per scopi diversi.
Indice degli argomenti
Il modello Sonnet 3.7
Nonostante sia sempre più difficile elaborare prompt che consentano di provare le capacità di un nuovo modello, l’impressione che si ha nel provare questo nuovo modello è quella di un notevole passo avanti rispetto al suo predecessore (Sonnet 3.5), soprattutto negli aspetti di generazione di codice che poi sono alla base degli artefatti, una funzione su cui Anthropic sta investendo molto.
Sonnet 3.7 alla prova pratica
Dopo un po’ di fatica e tentativi sono riuscito a trovare un indovinello che richiedesse un po’ di ragionamento per ottenere una risposta diversa tra la versione con e senza di Sonnet 3.7. È sorprendente come gli indovinelli classici che richiedono l’uso della logica siano risolti senza l’uso del ragionamento e quello che ha richiesto questa capacità richiede anche l’uso di senso comune e non solo un ragionamento logico:

L‘interfaccia di ragionamento e l’approccio ibrido di Sonnet 3.7
La risposta, sicuramente creativa, è evidentemente errata. Quando attiviamo la modalità di ragionamento otteniamo invece la risposta più ragionevole (e contro le zanzare):

Come si vede l’interfaccia, in modo analogo a quanto avviene per altri modelli, riporta il tempo utilizzato per produrre la risposta ed espandendo il pannello possiamo leggere il ragionamento svolto che nel caso di Claude (come di o1) avviene in inglese:

Vantaggi ed efficienza del modello unico per più funzioni
Sonnet 3.7 appare quindi un modello decisamente migliore del predecessore a cui è anche stata aggiunta la capacità di ragionare. Al momento la natura ibrida del modello da un punto di vista dell’interazione non sembra molto differente da disporre di due modelli, uno per la chat e l’altro per il ragionamento come avviene nel caso di OpenAI. La natura ibrida sembra, almeno per ora, più utile dal punto di vista dei costi di esecuzione: in un cloud basta caricare un solo modello per servire due tipologie di richieste, un approccio che sembra più efficiente in termini di uso risorse.
L‘evoluzione degli artefatti con la migliore generazione di codice
Il miglioramento del modello nell’ambito della generazione di codice ha comportato un netto miglioramento degli artefatti generati. Gli artefatti sono delle piccole applicazioni HTML che vengono eseguite nell’interfaccia stessa di Claude e stanno divenendo sempre più sofisticati.
Ho ottenuto con un semplice prompt il migliore generatore di frattali di Mandelbrot che sia riuscito a far generare, non solo funzionalmente ma anche dal punto di vista dell’organizzazione grafica e delle informazioni visualizzate. È anche possibile provarlo grazie alla possibilità di condividere gli artefatti generati.

Nuove capacità grafiche e animazioni nei risultati generati
È possibile anche ottenere semplici applicazioni che fanno uso di grafica 3D come il seguente simulatore di cubo di Rubik:

Tra le novità troviamo anche l’abilità di generare delle animazioni basate sul formato SVG. Si possono quindi ottenere schemi vettoriali, ad esempio per produrre disegni geometrici (ancora con quale difetto, ma decisamente sorprendenti):

Le funzionalità di analisi dati introdotte da Anthropic
Anthropic ha anche lanciato in anteprima l’abilità di effettuare l’analisi di dati, una funzionalità analoga al Data Analyst di OpenAI. In questo caso il modello genera codice per importare ed analizzare i dati da file in vari formati. Provando con dati in formato CSV sul bilancio di genere nelle Università Italiane sono riuscito ad ottenere prima un’analisi testuale assolutamente ragionevole (anche nei commenti qualitativi).
Ho poi chiesto “Puoi generare una dashboard per visualizzare questi dati?” ed ho ottenuto una dashboard interattiva simile a quelle che si possono ottenere con PowerBI (anche se meno funzionale) e che è visibile nella seguente figura:

La maturazione dell’ecosistema Claude e il futuro di Anthropic
Il nuovo modello Sonnet 3.7 di Anthropic è decisamente un grande passo in avanti, anche nella sua struttura ibrida che consente di assolvere due funzioni distinte: l’interazione ormai “classica” della chat e quella che prevede il ragionamento.
La sensazione, visto anche il recente annuncio dell’uso di Amazon dei modelli di Anthropic nel nuovo servizio Alexa+, è che l’intero ecosistema di Claude stia rapidamente maturando avvicinandosi alla maturità anche nel software intorno al modello che caratterizza i sistemi di OpenAI, che ha di recente rilasciato GPT 4.5.
Il consolidamento del design e le innovazioni nel settore
Alcuni concetti, come i progetti, cominciano ad essere comuni e supportati da più sistemi incluso Claude, e questa è una buona notizia, ed è un segno che questi sistemi stiano cominciando a consolidare alcuni design che caratterizzeranno sicuramente il prossimo futuro.
Anthropic resta l’implementazione più soddisfacente degli artefatti, anche se anche OpenAI ha cominciato ad introdurre una funzione analoga all’interno del Canvas ma che per ora sembra essere meno matura.
L’altra novità degna di nota è l’introduzione dell’analisi dei dati, elemento analogo al code interpreter di OpenAI, che consente al modello di avvalersi dell’esecuzione di programmi per il proprio funzionamento.