In che modo gli strumenti offerti dalla famiglia di sistemi di intelligenza artificiale NLP (“Natural Language Processing”) possono essere usati per la prototipazione rapida di classici strumenti di marketing, quali le brochure o i post sui social media relativi al lancio di un nuovo prodotto?
Lo abbiamo sperimentato in collaborazione con il corso di Tecnologie avanzate per l’innovazione e l’apprendimento[1] della Libera Università Maria Santissima Assunta (LUMSA) di Roma.
L’idea alla base della ricerca è quella di verificare l’effettiva usabilità e validità dei sistemi NLP per accelerare la produzione di testi e per creare immagini originali. Di particolare interesse per gli scopi della ricerca è la possibilità, offerta dai sistemi NLP più avanzati, di permettere a chiunque di creare rapidamente testi ed immagini, perché per utilizzarli è sufficiente una conoscenza tecnica davvero minima.
Ma vediamo prima di tutto di che strumenti stiamo parlando e quali sono le loro capacità.
Linguaggio naturale e intelligenza artificiale: a che punto siamo
Di cosa parliamo quando parliamo di Natural Language Processing
Il settore dell’intelligenza artificiale chiamato “elaborazione del linguaggio naturale” (NLP) consente ai computer di comprendere, decifrare e manipolare il linguaggio umano, attingendo a diversi settori di ricerca, tra cui l’informatica e la linguistica computazionale.
Le capacità fondamentali delle tecnologie NLP comprendono il riconoscimento del linguaggio, la tokenizzazione e il parsing[2] (noti anche come analisi strutturale), la lemmatizzazione (nota anche come identificazione delle radici), l’etichettatura delle parti del discorso e l’identificazione delle relazioni semantiche[3].
La maggior parte delle attività dell’elaborazione del linguaggio naturale suddivide il testo in brevi unità di base, ne identifica le relazioni e identifica i modi in cui queste unità possano essere utilizzate per produrre significato. In questo ambito di ricerca, il modello GPT-3 (Generative Pre-trained Transformer) ha rappresentato un progresso significativo nell’uso dell’apprendimento non supervisionato per l’elaborazione del linguaggio naturale. GPT-3 è un sistema di completamento automatico, in grado di produrre testi, codici di programmazione e foto a partire da un testo iniziale (il prompt). Grazie ad un apprendimento effettuato su milioni di testi, GPT-3 è in grado di generare frasi estremamente fluide, spesso indistinguibili da quelle scritte da persone reali, anche partendo da prompt molto brevi. Quando viene fornito un input, GPT-3 riesce ad associare molto rapidamente una serie di parole o frasi da utilizzare in risposta, sulla base dei dati (frasi, disegni, codice di programmazione) che l’algoritmo ha già memorizzato.
Strumenti NLP per la creazione di immagini
Sono ormai disponibili diverse applicazioni per la creazione di immagini partendo da brevi descrizioni scritte del contenuto desiderato. Durante la ricerca sono stati valutati alcuni di questi prodotti, sfruttando ove possibile la disponibilità di un periodo di prova gratuito per eseguire test più approfonditi, dei quali si riporta una breve descrizione.
Midjourney
Midjourney un software che permette di generare immagini a partire da un prompt iniziale che descrive più o meno sommariamente l’immagine desiderata.
Per utilizzare il sistema è necessario iscriversi e disporre di un account su Discord, un’applicazione di comunicazione che permette di utilizzare chat vocali, testuali e video per mantenere i contatti con community di utenti.
Figura 1 – Schermata iniziale di midjourney
Una volta creato l’account su Discord ed entrati nel canale di Midjourney, all’utente viene offerta la possibilità di creare delle immagini, sfruttando la prova gratuita in cui sono inclusi 25 prompt.
La creazione di un’immagine avviene digitando, in una chat apposita, il comando “/imagine”, seguito da una descrizione, in inglese, dell’immagine che si vuole generare. Dopo pochi secondi le immagini compariranno nella chat comune e saranno quindi visibili a tutti gli utenti. Per ogni prompt, il software crea quattro immagini differenti e l’utente può scegliere, per una delle quattro,le seguenti opzioni aggiuntive:
- Upscale: crea l’immagine più grande.
- Variazione: crea una nuova immagine basata su quella selezionata.
- Aggiorna: chiede al sistema di creare quattro nuove immagini sulla base dello stesso prompt.
- Scarica: permette di salvare sul proprio PC l’immagine scelta.
Nel complesso, l’esperienza di utilizzo ha messo in luce alcune criticità:
- L’interfaccia ed il processo di iscrizione sono solo scarsamente documentati.
- L’interfaccia non è molto intuitiva e può confondere i nuovi utenti.
- La necessità di utilizzare per la prova gratuita una chat di gruppo, in continuo aggiornamento, si è rivelata molto dispersiva. In particolare tra la propria richiesta e l’effettiva apparizione delle quattro immagini generate appaiono numerose altre immagini e prompt, rendendo faticoso e complicato ritrovare il filo del proprio lavoro..
- La qualità dell’immagine varia molto, è necessario lavorare molto sul prompt per ottenere immagini di qualità adeguata.
Dall-E
Come Midjourney, anche Dall-E genera delle immagini a partire da descrizioni testuali, permette la modifica delle immagini che vengono generate e crea differenti varianti. Il software funziona sulla base di crediti, ogni credito corrisponde alla generazione di immagini sulla base di un prompt. È possibile fruire di un periodo di prova gratuito grazie a dei crediti che vengono assegnati all’atto della prima iscrizione. Anche in questo caso, con ogni prompt vengono create quattro immagini. Per accedere al software è sufficiente registrarsi creando un account, nella homepage è presente un campo di testo in cui inserire la descrizione della scena che si vuole creare , ed è possibile utilizzare sia la lingua inglese sia l’italiano.
Una volta generata l’immagine è possibile creare altre versioni e apportare varie modifiche: è possibile cancellare lo sfondo, sovrapporre altre immagini e ci sono vari strumenti per modificare la foto.
Il software è semplice e intuitivo da utilizzare; se specificato nel prompt il sistema genera sia immagini pittoriche che foto. Tutte le immagini create rimangono salvate nell’account ed è possibile apportare modifiche. Dall-E si è rivelato semplice e intuitivo, inoltre dispone di funzionalità utili quali quelle per modificare le immagini generate direttamente all’interno dell’applicazione.
Strumenti NLP per la creazione di testi
Anche nel campo della generazione dei testi esistono diverse applicazioni accessibili. al pubblico. Nel corso dello studio ne abbiamo valutate alcune per cercare di identificare quella che meglio si prestava ad un utilizzo “professionale”.
Copy AI
Copy AI è uno strumento di scrittura di contenuti che consente di creare articoli
attraverso l’Intelligenza Artificiale. Il software è in grado di scrivere articoli in molte lingue, aiutando l’utente nella creazione di contenuti ad hoc.
Figura 2 – Schermata inziale di Copy.ai
È possibile indicare il tipo di testo che si vuole creare, ad esempio un’e-mail, un post per i social o un post di un blog e descrivere una o due frasi riguardo il contesto del brand o del prodotto,
il software crea più opzioni di contenuti tra cui scegliere e si può modificare o cancellare direttamente sulla pagina. Copy AI permette di utilizzare una prova gratuita creando un account tramite un’e-mail in maniera molto semplice; l’account creato è immediatamente disponibile per generare testi, anche se la prova gratuita offre solo un numero limitato di opzioni fra quelle disponibili. Una interessante funzionalità di Copy AI è il controllo del plagio, che può aiutare a garantire l’originalità dei contenuti creati, grazie ad un rapporto dettagliato sulla presenza di corrispondenze significative fra il testo generato e i testi accessibili via Internet.
RYTR
RYTR anche questo tool permette di creare rapidamente contenuti per un blog, un post su Facebook, un’e-mail, un annuncio per Google Adwords e molti altri scopi.
Rytr è disponibile sia per i privati sia per le aziende, e nella descrizione se ne pubblicizza l’uso per il marketing, i social media, il blogging, la SEO eccetera.
Figura 3 – Schermata iniziale di Rytr
Per generare un testo con Rytr è necessario impostare i parametri di lingua, tono e caso d’uso per il contenuto che si desidera creare, e scrivere un breve prompt contenente le parole chiave per indicare all’algoritmo di Intelligenza Artificiale il contenuto del testo che si vuole venga prodotto.
Figura 4 – RYTR, scelta del tono che si vuole avere dal contenuto creato dalla piattaforma
Con questi dettagli, è possibile realizzare in pochi secondi ciò che può richiedere un impegno più consistente. Una volta generati, i contenuti rimangono salvati nel proprio account.
Una prima cautela nell’utilizzo: il diritto d’autore
I sistemi NLP sono algoritmi di machine learning che “apprendono” l’uso del linguaggio umano grazie ad un training basato sia su testi preesistenti (milioni di test: blog, pagine wikipedia, pagine di prodotti, siti di notzie eccetera), sia su una fase di “affinamento” grazie a conversazioni con soggetti umani, che poi valutano la validità delle risposte per migliorarle.
Uno degli esempi più avanzati è il sistema GPT-3 (Generative Pre-trained Transformer), con il quale è possibile produrre testi, codici e foto a partire da un testo iniziale, detto prompt. Con input molto semplici è possibile chiedere al sistema non solo informazioni su elementi della conoscenza, ma anche variazioni linguistiche ad esso connesse, ad esempio ballate, poesie, haiku. Usando lo stesso sistema, addestrato però sulle immagini, è possibile richiedere al sistema di creare un’immagine – fotorealistica, oppure un dipinto “alla maniera di” – che corrisponde alla descrizione. Ad esempio, usando DALL-E 2, con il prompt “Create a painting of a lady writing a paper about NLP capabilities, in pixel-art style” si ottiene l’immagine seguente.
Uno dei problemi immediatamente evidenti legati all’utilizzo di questi strumenti è la difficoltà nell’attribuzione della paternità dell’opera: non sembra legittimo attribuirla al programmatore della macchina, in quanto questa è stata istruita e addestrata utilizzando un’enorme quantità di dati preesistenti, ma nemmeno può essere attribuito il diritto d’autore alla macchina stessa, in quanto questo può essere riconosciuto solo ad un essere umano. La disciplina italiana, infatti, è allineata a quella della maggioranza degli Stati europei ed extraeuropei, le cui leggi in materia di proprietà intellettuale attribuiscono concordemente la tutela del diritto d’autore solamente alle opere espresse dalla creatività umana[4].
In maniera analoga, è complesso individuare la responsabilità dei contenuti prodotti nel momento in cui si verificano casi di plagio, diffamazione o altre accuse relative al processo di produzione o al risultato.
Quindi, se da un lato l’identificazione dell’autore originale è essenziale poiché rende più facile la soluzione dei problemi di attribuzione di responsabilità, dall’altro questo tipo di tecnologie stanno ridefinendo i limiti del concetto di “diritto d’autore”, come mostra il procedimento, tutt’ora in corso nel quale un gruppo di programmatori che usano la piattaforma GitHub[5] ha citato Microsoft (proprietaria di GitHub) e OpenAI proprio per una supposta violazione del diritto d’autore effettuata dalla stessa Microsoft e da OpnAi, quando queste hanno usato i contenuti di GitHub per “addestrare” il proprio sistema NLP[6]. La proprietà intellettuale e le tecnologie in generale stanno interagendo e i nuovi sviluppi tecnologici determinano la necessità di aggiornare le leggi sulla proprietà intellettuale, e le aziende o i privati che volessero usare questi sistemi per rendere più rapida la creazione di contenuti devono essere al corrente dei potenziali rischi di violazione del diritto d’autore.
I risultati dell’esperienza
La parte sperimentale del lavoro è stata dedicata alla verifica dell’usabilità e dell’utilità di questi strumenti all’interno di un contesto di marketing, ovvero la creazione di materiale pubblicitario, quale una locandina o un post per Instagram relativi ad un nuovo prodotto. L’analisi delle differenti soluzioni NLP ha permesso di selezionare l’applicazione Dall-E per la generazione di immagini, mentre Rytr è stato selezionato per la creazione dei testi. Entrambi erano caratterizzati da una elevata facilità d’utilizzo e da una buona precisione dei risultati ottenuti in risposta ad un prompt.
Il concept utilizzato è relativo ad un prodotto immaginario: una lampada a forma di albero. Come primo passo per la realizzazione del materiale pubblicitario è stato usato Dall-E per generare una foto della lampada stessa. È possibile guidare la generazione indicando nel prompt il tipo di immagine, ad esempio una foto, un quadro, un’illustrazione a fumetti ecc. Il prompt utilizzato era il seguente:
“A photo of a living room, on the table there is a lamp in the shape of a lit tree.”
Figura 5 – L’immaginaria lampada a forma di albero generata da Dall-E
Dopo aver generato queste prime quattro immagini, abbiamo chiesto a Dall-E di usare la prima immagina come “seme” per ulteriori variazioni, ottenendo i risultati seguenti.
Figura 6 – Variazioni di una delle prime immagini, qui indicata con la sovrascritta “original”
Oltre a cambiare lo stile della lampada, Dall-E ha alterato anche lo sfondo e il tavolo presenti nella foto, mentre la composizione è rimasta tutto sommato invariata. La prima immagine generata (la seconda della Figura 6) è stata selezionata per la realizzazione della brochure e del post.
Per la generazione del testo della brochure si usa un processo analogo, proponendo al sistema (Rytr in questo caso) un prompt del contenuto che si vuole ottenere, ad esempio:
“Low consumption tree shaped table lamp are energy efficient light sources and save on light costs as they consume less than 80%. Captivating and unique design to make your salon very glamorous.”
Rytr ha proposto il seguente testo: “Create a glamorous salon with Lamree’s low-consumption, tree-shaped table lamps.
A captivating and unique design that will make any salon look very glamorous. These lamps consume less than 80% of the power of normal bulbs and have a lifespan of up to 20,000 hours.
Compact design: Designed with a low profile base and slim stem, this lamp can be used in many different spaces. The stem is made out of steel and the lamp has three glass panels that diffuse the light. The shade is made out of acrylic which is easy to clean and resistant to heat.
Energy-efficient light sources: With each lamp consuming less than 80% of the power of normal bulbs, this design will save you on your electricity bills. The lifespan for these lamps can also reach up to 20,000 hours for minimal replacement costs!
Perfect for any salon space: Great for home use as well, these lamps are perfect for any salon space because of their unique shape that diffuses light without glare or heat”.
Si noti che Rytr ha utilizzato i suggerimenti contenuti nel testo (energy efficient, 80% less consumption, design unico…) ma ha anche aggiunto alcuni dettagli non presenti, ad esempio le 20.000 ore di durata, o i materiali con cui la lampada è costruita.
Figura 7 – Il testo per la brochure proposto da Rytr
Per la creazione del contenuto del post il prompt utilizzato è stato invece:
“Inspire the community to buy Lamree: the energy-saving tree-shaped lamp with a unique design.”
Rytr ha proposto due opzioni per il post sui social:
- At Lamree, you will always want to be home. Every purchase saves the energy equivalent of 4 trees in your lifetime. Our innovative product has a simple idea: one lamp that doubles up as the ultimate bedtime companion by emitting a soft light instead of getting in the way of sleep. It’s time to switch off and switch on to our amazing Lamree lamps! Consider your purchase as an investment in both your home and its environment. It’s a revolutionary new design to support sustainability
- Save the earth and your wallet this holiday season with Lamree, a new eco-friendly LED lamp for your desk. The pointy head introduces the bright lighting in just the right way to sustain its lifespan. Choose from LED light warm white or cool daylight so you can indulge in more reading time. With Lamree, now you can buy a tree and plant it with each purchase. It is made of innovative PVC that is recycled.
Anche in questo caso, vediamo alcune aggiunte non presenti: nella prima opzione si parla di soft light che aiuterebbe il sonno, mentre nella seconda si parla di luce LED e PVC riciclato.
Figura 8 – Output di Rytr per il post su Instagram
Con l’immagine e i testi sintetici sono state create le due brochure in figura:
Mentre il post pubblicato su Instagram aveva questo aspetto:
Conclusioni
L’esperienza realizzata ha mostrato come i tool messi a disposizione dalla tecnologia NLP siano effettivamente facili da usare, anche per chi non ha competenze tecnologiche molto avanzate. Grazie all’utilizzo di questi tool è possibile velocizzare la fase di prototipazione di alcuni processi di marketing, ad esempio nel caso in esame abbiamo sfruttato la possibilità di usare foto e testi creati dall’intelligenza artificiale per realizzare rapidamente materiale pubblicitario di prova. L’esperimento ha però anche evidenziato la tendenza dei tool a generare testi con elementi informativi non presenti nel prompt iniziale.
Sebbene questa “imprecisione” sia solo minimamente problematica nella fase di ideazione del materiale pubblicitario, la possibilità di una sua occorrenza deve essere nota a chi usa questi tool, specialmente nel caso in cui questi venissero utilizzati per la generazione di testi destinati alla diffusione. La “creatività” del tool potrebbe infatti esporre le aziende a rischio di fornire ai propri clienti informazioni non del tutto veritiere.
Su questi tool inoltre resta sospeso il rischio che la “creazione” di testi o immagini produca risultati troppo simili a testi o immagini esistenti, esponendo quindi gli (inconsapevoli) utilizzatori dei tool al rischio di plagiare opere esistenti. L’inserimento nei tool NLP di salvaguardie per evitare il rischio che ciò accada, come ad esempio l’uso di software antiplagio sui contenuti creati, è sicuramente un elemento di mitigazione del rischio a cui è opportuno prestare attenzione.
Note
- La Libera Università Maria Santissima Assunta (LUMSA) di Roma ha attivato nel 2020 un percorso per la laurea magistrale dal titolo “Comunicazione, Innovazione ed experience design”, che mira a formare figure professionali in grado di lavorare a tutte le fasi di realizzazione di progetti digitali e non, focalizzati sull’utente e sulla sua esperienza, e di promuovere l’innovazione in organizzazioni complesse. Uno degli elementi innovativi del corso riguarda l’introduzione di un solido percorso di competenze digitali, che affianca le tradizionali esperienze di comunicazione, allo scopo di fornire agli studenti gli strumenti per decifrare il contesto tecnologico attuale e utilizzare le capacità dei vari strumenti digitali a disposizione – il cloud, i big data, l’intelligenza artificiale, il metaverso e le blockchain – al fine di rendere più veloce, efficiente e fruibile la realizzazione di nuovi progetti.↑
- “Natural Language Processing (NLP): come funziona l’elaborazione del linguaggio naturale”, 06/04/2021, reperibile all’indirizzo: https://blog.osservatori.net/it_it/natural-language-processing-nlpcome-funziona-lelaborazione-del-linguaggio-naturale ↑
- Altobello, G. “Natural Language Processing: cos’è, come funziona e applicazioni”, 22/08/2022, reperibile all’indirizzo: https://www.ai4business.it/intelligenza-artificiale/natural-language-processingtutto-quello-che-ce-da-sapere/ ↑
- Cassin, G. “Intelligenza artificiale e diritto d’autore 4.0: quale tutela alle opere create dall’IA?”, Luglio 2021, reperibile all’indirizzo https://www.4clegal.com/hot-topic/intelligenza-artificiale-diritto-dautore-40-tutela-opere-create-dallia ↑
- GitHub è una piattaforma di collaborazione e controllo delle versioni basata sul Web per gli sviluppatori di software, acquistata da Microsoft nel 2018. GitHub viene utilizzata per archiviare il codice sorgente di un progetto e tenere traccia della cronologia completa di tutte le modifiche a quel codice, ed include dei testi descrittivi del codice stesso. ↑
- Vincent, J., “The lawsuit that could rewrite the rules of AI copyright”, The Verge, 8 Novembre 2022 ↑