intelligenza artificiale

Sora di Openai: come usarlo, che farci: la nostra prova



Indirizzo copiato

Sora, il generatore video di OpenAI con intelligenza artificiale, è una piacevole novità. Non solo il modello, anche la user experience è assolutamente notevole. Se però si pensa di divenire regista grazie all’AI si scopre rapidamente che non è proprio così. Tradurre in risultati piacevoli le proprie idee rimane un compito difficile. Vediamo perché e…

Pubblicato il 23 dic 2024

Antonio Cisternino

Università di Pisa



sora openai

Svolta per l’AI generativa che genera video. OpenAI ha aperto l’accesso a Sora agli utenti che pagano l’abbonamento mentre Google ha annunciato Veo 2, in questi stessi giorni.

L’Europa è al momento tagliata fuori dall’accesso a queste piattaforme, nel caso di Google l’accesso è permesso solo dagli Stati Uniti, mentre OpenAI ha per ora ristretto l’accesso dall’Europa sicuramente per i continui attriti in materia di privacy.

Se si dispone di un account è però possibile utilizzare una VPN, come ad esempio quella del browser Opera, per accedere da un IP americano ed usare il sistema.

La nostra prova di Sora

L’interfaccia di Sora è molto essenziale e al login mostra i video creati dagli utenti (interfaccia ripresa anche da Veo 2). Una volta autenticati con un account con abbonamento Plus o Pro si ha accesso all’interfaccia per la generazione video.

Immagine che contiene schermata, Gioco per PC, collageDescrizione generata automaticamente

L’interfaccia è essenziale, si vedono i video generati recentemente, vi sono alcune funzioni di organizzazione dei propri contenuti e in basso troviamo il pannello per la generazione di nuovi video. Oltre alla possibilità di digitare il prompt possiamo scegliere:

  • il formato del video (16:9, quadrato o 9:16)
  • la risoluzione (480p, 720p, 1080p quest’ultima limitata a chi ha l’abbonamento pro)
  • la durata (5s, 10s, 15s, 20s)
  • il numero di varianti del video da generare (1v, 2v, o 4v)
  • i preset, una sorta di prompt di contesto che indica gli effetti che si desiderano nel video generato (per esempio nel preset Cardboard & Papercraft troviamo “Content Transformation: All characters, objects, and environments are made of inflated balloons, with visible seams and a bouncy quality”)
  • la possibilità di aggiungere immagini o video da utilizzare come input al modello
Immagine che contiene schermata, testo, Software multimediale, softwareDescrizione generata automaticamente

L’interfaccia Storyboard

Il modo più semplice di usare Sora è quello di impostare i parametri e scrivere nel prompt cliccando sulla freccia per avviare la generazione:

Immagine che contiene testo, schermata, CarattereDescrizione generata automaticamente

La richiesta viene messa in coda e, soprattutto per i video a bassa risoluzione, dopo meno di un minuto si può vedere il risultato.

Immagine che contiene testo, natante, nave, trasportoDescrizione generata automaticamente

In basso abbiamo le opzioni per modificare il video generato:

  • Edit prompt – consente di modificare il prompt
  • View story – consente di visualizzare la story board del video e modificarla
  • Re-cut – consente di tagliare il video e modificarlo in un segmento
  • Remix – consente di indicare elementi da sostituire dal video corrente, il video sarà comunque rigenerato
  • Blend – permette di fondere due video secondo politiche indicate nelle opzioni di fusione
  • Loop – consente di generare una variante del video che possa essere visualizzata ripetutamente

In generale la qualità dei video generati è buona ma ci si rende conto subito che il mero prompt è un po’ limitante nella qualità dei risultati e che è necessario sforzarsi nell’apprendere le varie funzioni per avere maggior controllo sull’output.

Innanzitutto vediamo come appare l’editor dello storyboard: la timeline del video ha alcuni keyframe che invece di essere immagini sono sostanzialmente dei prompt che descrivono cosa deve avvenire nella scena a partire da quel momento. Si nota subito come il prompt che abbiamo scritto in Italiano sia stato usato per generare i testi dei vari keyframe che spesso sono però in inglese. Si possono introdurre nuovi key frame con ulteriori descrizioni oppure spostarli sulla timeline per gestire la durata delle varie sequenze.

Immagine che contiene schermata, testo, Software multimediale, softwareDescrizione generata automaticamente

Non sempre le richieste si traducono nel risultato atteso, è bene quindi fare un po’ di esperimenti prima di alzare la risoluzione del risultato. Conviene anche generare più video così che si possano usare per fonderli in un nuovo video consentendo vari cambi di scena ed effetti per ottenere risultati decisamente migliori.

L’applicazione del blend ai video generati sulla nave da crociera a Venezia ha prodotto un interessante sequenza (usando il preset Cardboard).

Come spesso avviene per i prompt usati per generare immagini anche con Sora può valere la pena di chiedere una mano ad un altro LLM. GPT-4o fa un ottimo lavoro a partire da un breve prompt in italiano a generarne uno lungo in inglese (che sembra funzionare meglio con Sora) che aggiunge molti dettagli che sarebbe difficile introdurre a mano.

Immagine che contiene testo, schermata, CarattereDescrizione generata automaticamente

Animare un’immagine

Si può partire da un video o da una foto per influenzare la generazione. Ho provato ad animare un’immagine generata qualche mese fa con l’aiuto di DALL-E per rappresentare un quadrante in cui spesso il personale ICT si ritrova: tutte le energie se ne vanno per assicurare che il sistema sia in funzione non riuscendo però a trovare le risorse per farlo evolvere o introdurre nuovi servizi.

L’animazione del criceto è stata decisamente sorprendente, e la possibilità di creare un’animazione che si ripete ha consentito di catturare l’idea di un lavoro senza fine.

Immagine che contiene testo, schermata, Software multimediale, softwareDescrizione generata automaticamente

Sora: il giudizio con la nostra esperienza

Un’affermazione che Sam Altman ripete nelle presentazioni di Sora è quest’idea che il modello abbia appreso il funzionamento della fisica, e non si tratta quindi solo di generare video. L’impressione che si ha è che piuttosto il modello abbia appreso come evolvono i pixel di una camera che riprende il mondo, aspetto comunque di tutto rispetto.

Sora è una piacevole novità, e non solo il modello, anche la user experience è assolutamente notevole. Se però uno pensa di divenire regista grazie all’AI si scopre rapidamente che non è proprio così, tradurre in risultati piacevoli le proprie idee rimane un compito difficile, ma sicuramente l’AI può aiutare a procedere senza essere un esperto di applicazioni ed editor video.

Creare sequenze più lunghe di 20 secondi può richiedere più lavoro: una cosa non sempre banale è mantenere una coerenza visiva tra video generati successivamente, una tecnica che però aiuta molto è quella di fornire il video precedente come input per la generazione del successivo usando la funzione Remix. In questo modo il modello mantiene una certa coerenza narrativa altrimenti sostanzialmente impossibile.

Per essere una prima versione penso che Sora sia decisamente notevole, ma l’impressione che si ha è che sia solo l’era preistorica di qualcosa che in pochi anni cambierà molte cose. Per ora dispiace che tutte queste funzioni siano inaccessibili dall’Europa e non possiamo che auspicare che si trovi un giusto equilibrio tra privacy diritti e innovazione tecnologica.

EU Stories - La coesione innova l'Italia

Tutti
Analisi
Video
Iniziative
Social
Programmazione europ
Fondi Europei: la spinta dietro ai Tecnopoli dell’Emilia-Romagna. L’esempio del Tecnopolo di Modena
Interventi
Riccardo Monaco e le politiche di coesione per il Sud
Iniziative
Implementare correttamente i costi standard, l'esperienza AdG
Finanziamenti
Decarbonizzazione, 4,8 miliardi di euro per progetti cleantech
Formazione
Le politiche di Coesione UE, un corso gratuito online per professionisti e giornalisti
Interviste
L’ecosistema della ricerca e dell’innovazione dell’Emilia-Romagna
Interviste
La ricerca e l'innovazione in Campania: l'ecosistema digitale
Iniziative
Settimana europea delle regioni e città: un passo avanti verso la coesione
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
EuroPCom 2024: innovazione e strategia nella comunicazione pubblica europea
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia
Programmazione europ
Fondi Europei: la spinta dietro ai Tecnopoli dell’Emilia-Romagna. L’esempio del Tecnopolo di Modena
Interventi
Riccardo Monaco e le politiche di coesione per il Sud
Iniziative
Implementare correttamente i costi standard, l'esperienza AdG
Finanziamenti
Decarbonizzazione, 4,8 miliardi di euro per progetti cleantech
Formazione
Le politiche di Coesione UE, un corso gratuito online per professionisti e giornalisti
Interviste
L’ecosistema della ricerca e dell’innovazione dell’Emilia-Romagna
Interviste
La ricerca e l'innovazione in Campania: l'ecosistema digitale
Iniziative
Settimana europea delle regioni e città: un passo avanti verso la coesione
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
EuroPCom 2024: innovazione e strategia nella comunicazione pubblica europea
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia

Articoli correlati

Articolo 1 di 4