scenari

Intelligenza artificiale e giornalismo: così potrà migliorare il mestiere

Moltissime redazioni stanno usando l’intelligenza artificiale, in molti modi, come scrive un recente rapporto della London School of Economics. E’ chiaro che anche in questo ambito tutto ciò che potrà essere automatizzato sarà automatizzato. Vediamo con quali conseguenze

Pubblicato il 10 Dic 2019

Andrea Benedetti

Senior Cloud Architect Data & AI, Microsoft

Già oggi, gli algoritmi di intelligenza artificiale sono in grado di elaborare e realizzare contenuti in un tempo che nessun umano riuscirebbe ad avere, e le potenzialità di evoluzione di quello che viene chiamato giornalismo automatizzato, noto anche come giornalismo algoritmico o giornalismo robotico, ovverosia la generazione di articoli e notizie in maniera automatica da sistemi computerizzati, sono tutte ancora da scoprire.

Se, infatti, fino al 2016, erano ancora poche le organizzazioni che facevano uso di giornalismo automatizzato (tra i primi ad adottare queste tecnologie, ci furono anche Forbes e ProPublica), oggi le aziende che si occupano di data science (in breve: un ambito che utilizza metodologie, algoritmi e sistemi scientifici per estrarre conoscenza e valore dai dati) e IA sviluppano e forniscono algoritmi alle principali media company utili per la scrittura e la generazione di contenuti.

Proviamo a esaminare gli ambiti applicativi più promettenti, partendo dai dati forniti dal think-tank giornalistico Polis, della London School of Economics, che ha di recente pubblicato un rapporto basato su un sondaggio condotto tra 71 organizzazioni giornalistiche di 32 nazioni differenti in merito a come è stata utilizzata l’intelligenza artificiale nelle loro redazioni e quali sono le opinioni relative al potenziale e ai rischi per l’industria delle notizie.

Indice degli argomenti

Giornalismo e intelligenza artificiale

L’interessante rapporto, dal titolo “A global survey of journalism and artificial intelligence”, racconta in prima analisi che sono tre i principali motivi che spingono queste imprese all’utilizzo di tecnologie di IA:

Rendere più efficiente il lavoro dei giornalisti (68% delle risposte)
Fornire agli utenti contenuti più pertinenti (45%)
Migliorare l’efficienza aziendale (18%).

Il potere e il potenziale descritti in questo studio, raccontano come tutte le redazioni dovrebbero almeno iniziare a prestare attenzione all’IA, partendo da strumenti che sono facilmente utilizzabili anche con lo scopo di prenderne dimestichezza e poterne provare benefici, usi e potenzialità.

Il mondo del giornalismo, in particolare il settore dei media, potrà essere rimodellato da queste tecnologie.

Poco più di un terzo degli intervistati ha affermato di avere già studiato e introdotto una precisa strategia di intelligenza artificiale. Il restante, i due terzi, hanno dichiarato di non averla.

Questo dato sembra essere coerente con l’alto livello di sperimentazione indicato nelle risposte relativamente al successo o al fallimento delle attuali iniziative giornalistiche che coinvolgono l’IA.

Le maggiori sfide legate alla sua adozione e i maggiori limiti citati dagli intervistati sono stati risorse, conoscenze e capacità. Oltre a queste, altrettanto significativa, risulta essere la resistenza culturale: la paura di perdere il lavoro, di cambiare abitudini consolidate e il modo di operare, un’ostilità generale verso le nuove tecnologie.

Altrettanto importanti risultano la mancanza di una strategia su tutta l’organizzazione (aziendale) e la mancanza di una visione manageriale strategica. Ma forse il fattore più grande e concreto è la mancanza di personale specializzato che, conoscendo la tecnologia e il suo uso, possa relazionarsi con successo con la redazione e accelerarne l’utilizzo e il beneficio derivante.

Il primo articolo scritto da una intelligenza artificiale

Proviamo a fare qualche ragionamento partendo da pochi mesi fa, quando l’edizione australiana del The Guardian ha pubblicato, sul suo sito, il primo articolo realizzato da un’intelligenza artificiale.

Il sistema di scrittura che lo ha generato si chiama Reportermate ed è un progetto open source (ovverosia un software non protetto da copyright, liberamente modificabile dagli utenti e liberamente utilizzabile) nato per creare un sistema di generazione automatica di contenuti.

A molti potrebbe sembrare un evento forse impensabile, ma, in realtà, non tutti sanno che sono già passati dieci anni da quando, nel 2009, venne scritto il primo articolo sportivo da un sistema di narrazione automatica basandosi esclusivamente sui dati della partita in esame.

Da quel giorno, a oggi, moltissime redazioni stanno già utilizzando l’intelligenza artificiale, o applicazioni basate su di essa, per creare storie ricche di dati.

La mattina del 17 marzo del 2014, erano le 6:26, un forte terremoto fa tremare Los Angeles e gran parte della California: soltanto un minuto dopo, nei computer del Los Angeles Times, era già scritto e pronto per la pubblicazione un articolo su quanto successo. Tre minuti dopo, dopo una scelta “umana” di pubblicazione, la storia va online.

Dal tempo trascorso tra l’evento e la disponibilità dell’articolo, sembra che l’attività di scrittura sia stata più rapida di quanto sia possibile umanamente fare, ed effettivamente è così.

L’articolo, apparso poi pubblicato a firma di Ken Schwencke, era stato generato in automatico da un algoritmo chiamato Quakebot, un software sviluppato un paio di anni prima: a ogni alert proveniente dai sistemi dello U.S. Geological Survey, se i valori si trovano sopra una certa soglia, il programma sa di dover estrarre i dati più rilevanti dal rapporto per collegarli a un documento, un template, già pre-scritto. Una volta completato il lavoro, questo viene inserito nel sistema di gestione dei contenuti del quotidiano in attesa di essere revisionato e, quindi, pubblicato da parte di un editor umano.

Nello stesso anno, dopo aver collaborato con Automated Insights – una start-up tecnologica che realizza uno strumento di generazione di linguaggio naturale – anche Associated Press diventa una delle prime media company ad adottare l’IA all’interno dell’ambito mediatico.

L’anno successivo, siamo nel 2015, fece scalpore l’annuncio che diede la stessa Associated Press quando disse che avrebbe applicato l’IA ai rapporti trimestrali di bilancio: dopo che, per anni, questo tipo di attività aveva richiesto molto tempo “umano”, adesso sarebbe stata una macchina a risolvere la questione in maniera completamente automatizzata.

Chi l’ha scritto?

Se siete dubbiosi in merito alla qualità dei testi che possono essere realizzati da un computer, il New York Times, ormai già quattro anni fa, aveva pubblicato un quiz online in cui si chiedeva, dopo aver letto singole frasi, di scegliere se quanto presentato era stato scritto da una macchina o da un umano. È un gioco che porta via qualche minuto e consiglio di farlo per rendersi conto in prima persona della difficoltà di comprendere chi può aver realizzato lo scritto e osservare la qualità dei risultati artificiali.

L’anno scorso l’agenzia di stampa Reuters ha annunciato il lancio di Lynx Insight, un sistema in grado di sfruttare un’analisi automatizzata dei dati per identificare tendenze e irregolarità così da suggerire storie ai propri giornalisti.

Si potrebbe ancora restare sorpresi dal fatto che media company come quelle citate o anche come il Washington Post o Yahoo! Sport già utilizzino tecniche automatiche per generare contenuti: Press Association, per esempio, dichiara che può creare fino a 30.000 storie di news al mese generate in maniera totalmente automatica.

Le narrazioni sono possibili tramite dei processi automatici che rientrano in quelli che vengono chiamati NLP (Natural Language Processing), NLU (Natural Language Understanding) e NLG (Natural Language Generation):

Il riconoscimento vocale è un componente fondamentale della NLP: gli algoritmi vengono utilizzati per comprendere il linguaggio naturale al fine di eseguire istruzioni e comandi
La comprensione del linguaggio naturale (NLU) è una componente minore dell’elaborazione nella sua interezza. Permette di trovare significati, eseguire analisi del sentimento (c’è un orientamento positivo o negativo in quello che si sta dicendo?), ecc.
La generazione del linguaggio (NLG) avviene, ad esempio, ogni volta che il mio assistente digitale mi risponde quasi come farebbe un altro essere umano.

Strumenti e meccanismi dell’intelligenza artificiale nel giornalismo

In ambito business queste famiglie di algoritmi vengono utilizzate per realizzare sommari, relazioni, descrizioni partendo esclusivamente da grafici, da report, da numeri.

Tipicamente, per utilizzare questi meccanismi, il primo passo è quello di definire il formato del contenuto desiderato: è evidente che un post per i social media dovrà avere un taglio, una struttura, uno stile e un linguaggio differente da un report finanziario o da una poesia.

Alcuni degli strumenti NLG sono disponibili sul mercato (ad esempio Quill di Narrative Science), mentre altri sono stati creati e vengono gestiti direttamente dalle aziende che li hanno sviluppati (ad esempio Heliograf del Washington Post).

Come in ogni ambito di applicazione dell’intelligenza artificiale, anche in questo – legato alle parole – gli algoritmi sono in grado di elaborare e realizzare contenuti in un tempo che nessun umano riuscirebbe ad avere (e l’esempio di Los Angeles ne è una prova concreta).

Così come è certamente utile la capacità di analisi dei dati per poterne estrarre sia la descrizione sotto forma di narrazione (“il risultato operativo è in linea con quello dell’anno precedente, con un volume di vendita …”), sia il messaggio che rappresentano (“la variazione del budget rispetto al trimestre precedente è di …”), queste tecniche permettono sia di coinvolgere ancora di più il lettore che sta osservando grafici e numeri, sia di fornire un più ricco approfondimento utile a una loro migliore comprensione.

Come cambia il mestiere del giornalista

Allo stesso modo, grazie a queste capacità, oggi i giornalisti possono iniziare a evitare, una volta completato un loro articolo, di scriverne un sommario di punti salienti, un riassunto o una forma ridotta per, ad esempio, effettuarne una differente pubblicazione su un differente media, demandando a programmi istruiti a risolvere questi compiti tutta questa serie di attività riuscendo, in questo modo, a concentrare tutto il tempo e l’attenzione sul contenuto principale.

Parlando più in generale, è chiaro che tutto ciò che potrà essere automatizzato verrà automatizzato e anche il giornalismo non sarà diverso da tutti gli altri settori e mercati che abbiamo intorno. Tuttavia, è comunque difficile pensare che l’IA possa diventare la chiave di volta del ruolo del giornalista (o dello scrittore).

Internet, i social media, la mobilità delle comunicazioni hanno già fornito da tempo nuovi strumenti e nuovi percorsi ma oggi le tecnologie di IA permettono un ulteriore salto in avanti.

Mi piace pensare fin da subito a macchine che possano supportare il lavoro editoriale grazie a capacità utili a controllare i fatti in maniera rapida e affidabile, correlare le informazioni in maniera efficiente, eseguire ricerche velocemente, rintracciare le ultime notizie, estrarre dati di valore.

Per semplificare, ma anche per pensare ad ambiti in cui applicare e “mettere alla prova” da subito tecnologie di IA, potremmo pensare, ad esempio, a tecnologie di “speech-to-text” per dettare un testo o per trascrivere un’audio, oppure tecnologie di traduzione automatica in grado di abbattere barriere linguistiche.

Se vuole rimanere all’avanguardia, ritengo debba restare al passo dei tempi anche andando a esplorare gli utilizzi che se ne possono fare, studiando tutte le possibili conseguenze per le redazioni (e per la società in generale).

La maggior parte degli intervistati dello studio citato all’inizio dell’articolo si trova ancora in una fase iniziale di presa di coscienza o di adozione dell’IA, anche a causa di una deliberata cautela nel loro approccio.

Ma, è altrettanto chiaro, in pochissimi hanno negato che potrà avere un ruolo significativo nel loro futuro e in quello dell’industria nel suo insieme.

I principali ambiti applicativi

I tre principali ambiti su cui è facile confrontarsi riguardano:

Raccolta di notizie: reperimento di informazioni, generazione di idee per storie, identificazione di tendenze, indagini, monitoraggio di eventi o di problemi, estrazione di informazioni rilevanti o contenuti
Produzione di notizie: creazione di contenuti, editing, packaging per diversi formati e piattaforme, creazione di testi / immagini / video, riqualificazione di contenuti per un target differente
Distribuzione delle notizie: personalizzazione, marketing, analisi e ricerche di pubblico, comprensione del comportamento degli utenti, monetizzazione / abbonamenti

Tecniche di moderazione automatica dei commenti, ormai sempre più ingestibili dalle persone delle redazioni di testate online (per le problematiche derivanti dai volumi – ovverosia per il numero di commenti e interazioni ricevute, sia per la necessità di non dover far attendere molto tempo per la loro pubblicazione), possono permettere un ulteriore e più forte coinvolgimento del pubblico aumentandone la fidelizzazione e l’engagement (come si dice su queste piattaforme).

I possibili bias dell’algoritmo in ambito editoriale

Anche in ambito editoriale, come abbiamo già avuto modo di discutere, tutti gli algoritmi possono avere una sorta di “pregiudizio” nel momento in cui dovessero essere allenati / istruiti con set di dati incompleti, parziali, poco coerenti: se dovessi addestrare un algoritmo al riconoscimento facciale ed evitassi di fornire – nella fase di addestramento – foto di una particolare etnia, è evidente che quel sistema non potrebbe essere in grado di identificarne i visi.

Questo significa, allo stesso modo, che se dovessi classificare in maniera poco corretta degli argomenti, gli algoritmi che verranno istruiti in questo modo, riporterebbero, evidentemente, la stessa anomalia nei contenuti prodotti.

Tutti i sistemi di intelligenza artificiale, in un certo senso, riflettono le intenzioni e le ipotesi delle persone che li creano, li addestrano e li usano ma, quello che veramente è importante, è l’essere consapevole di cosa vogliamo fare e ottenere, del pregiudizio e di come può essere gestito e ridotto al minimo.

Nel complesso c’è la sensazione che l’IA stia ottenendo un ruolo significativo e si stia dimostrando utile con il forte obiettivo di migliorare l’efficienza per poter liberare risorse allo scopo di aumentare la qualità dei risultati, siano essi contenuti o nuovi e migliorati servizi.

Oggi, senza alcun problema, l’Intelligenza Artificiale può già mettersi a sedere e prendere posto all’interno delle redazioni aiutando a risparmiare tempo su diversi fronti e aumentando velocità ed efficienza – anche aiutando le persone a stare al passo con il sempre maggior afflusso di dati (notizie, immagini, video, …).

Nella sostanza vedo un ruolo utile ad arricchire e affiancarsi alle persone per consentire ai giornalisti di concentrarsi su ciò che sanno fare meglio: scrivere con un tocco umano, fatto anche d’intuizione, cuore, spirito critico, ironia e giudizio. Come ho tentato di fare adesso anche io.