Nell’anno 2021 il rapporto tra giornalismo e tecnologia si sta rapidamente assottigliando. Con l’intelligenza artificiale troverà una vetta di convergenza.
AI e giornalismo, distinguiamo i concetti
Bisogna prima di tutto distinguere concetti differenti che hanno nomi diversi, in particolare tra Automated Journalism (Giornalismo Automatico), NLG Journalism (Natural Language Generation Journalism, ovvero giornalismo che impiega tecniche di generazione automatica del Linguaggio) ed Intelligenza Artificiale applicata al giornalismo.
Il giornalismo automatico è quella specializzazione dell’informatica che mira a sostituire del tutto i giornalisti umani per sostituirli con degli algoritmi in grado di prelevare dei contenuti e riscriverli secondo dei criteri stabiliti dall’uomo (Van Dalen 2012, Van Dalen, Arjen. 2012. The algorithms behind the headlines: How machine-written news redefines the core skills of human journalists).
L’NLG Journalism invece è quella specialità dell’informatica che mira ad utilizzare algoritmi di generazione del Linguaggio per aiutare gli esseri umani, o almeno la parte di loro che svolge la professione del giornalista, a generare contenuti aumentandone le capacità comunicative, ad esempio rendendo possibile la scrittura concettuale multi-lingua (Graefe 2016, Graefe, Andreas. 2016. Guide to automated journalism. Tow Center for Digital Journalism).
L’Intelligenza Artificiale applicata al giornalismo è invece un concetto più ampio ed onnicomprensivo. L’AI non è una “tecnica”, ma una “Scienza” e come tale non ha una limitazione di scopo o di dominio specifico quando si applica verso il giornalismo o verso un’altra disciplina propria dell’attività umana. L’AI in quanto tale si forma in ragionamenti esercitati da giganti come Shannon e Turing ed ha un legame strettissimo con il calcolo simbolico, con le traiettorie di volo degli storni e con l’essenza della Tteoria dei Numeri (disciplina matematica nata con Fermat, Euler, Gauss, Lagrange ed altri nel secolo XVII). In quanto tale, essa abbraccia anche le problematiche legate al giornalismo automatico e alla generazione automatica del linguaggio, ma non si limita a questi due aspetti.
Cosa può fare l’AI per il giornalismo
L’AI sta permeando e rivoluzionando il mondo che conosciamo, investendo qualsiasi attività umana, giornalismo compreso. Il giornalismo, o in generale l’attività della diffusione delle notizie mediante un processo di comunicazione può beneficiare in vari modi delle conquiste dell’AI.
Quando la comunicazione si propaga, lo fa come descritto da Shannon in un diagramma molto semplice che vede una “Sorgente dell’informazione” (un comunicatore o giornalista), un “Canale” (la stampa fisica, quella digitale o altri), ed un “ricettore dell’Informazione” (il lettore). Ciò che attraversa il diagramma appena descritto è un “Contenuto” (ad esempio un articolo di giornale).
Nella Teoria dell’Informazione il processo della comunicazione è descritto con varie formule differenziali che ne evidenziano proprietà differenti. L’efficienza della comunicazione è determinata da vari aspetti tra cui il Linguaggio scelto, il Rumore di Fondo che lo accompagna, la capacità del Ricevente di interpretare il messaggio, etc. L’insieme di questo processo viene matematicamente descritto ed analizzato in formule di propagazione. La comunicazione come un Onda può amplificarsi o restringersi in funzione delle proprietà che tutti gli elementi coinvolti nel processo caratterizzano e delle funzioni che essi applicano. A differenza delle onde fisiche, non abbiamo purtroppo una funzione ψ in grado di definire analiticamente ed in modo esatto questa propagazione, ma grazie all’AI, possiamo approssimarla con un grado di accuracy molto elevato ed in vari contesti come vedremo nei successivi paragrafi.
Giornalismo e tecnologie, vite parallele che si incontrano
Il giornalismo moderno si sviluppa nei secoli XVI e XVII, non certo per una coincidenza si concretizza e si diffonde in parallelo alla modernizzazione delle comunicazioni, in particolare traendo spinta dalla ramificazione del servizio postale e dalla diffusione del servizio telegrafico. Il legame tra la professione del raccontare i fatti e la tecnologia di diffusione delle notizie stesse è intrinseco ed indissolubile, difatti il giornalismo non ammetterebbe esistenza, se i contenuti da esso creati non potessero essere diffusi.
Negli anni ’40 del secolo scorso Shannon e Weiner ponevano le basi della Teoria dell’Informazione. Claude Elwood Shannon (1916- 2001, Professore del MIT e Scienziato presso i laboratori Bell) diede alla luce il celeberrimo “A mathematical theory of communication (Una teoria matematica della comunicazione), pubblicata nel 1948 sul n. 27 del Bell System Technical Journal”, ripresa e resa omogenea da Warren Weaver in “The mathematical theory of communication (La teoria matematica della comunicazione)”, era nata la Teoria dell’Informazione. Dopo 3 secoli di comunicazione semi-automatizzata a mezzo di segnali elettrici, Claude e Warren diedero una base matematica ed un senso analitico al processo della comunicazione visto dalla prospettiva di una macchina o automa.
A soli 10 anni di distanza, correva il 1950, un altro mostro sacro della Scienza pubblicava sulla rivista Mind un articolo sul problema dell’Imitation Game, si chiamava Turing per la scienza, Alan per i conoscenti. Sbocciava l’Intelligenza Artificiale ed era nata per restare ed evolversi. Sappiamo che nel 1943, al numero 463 di West Street, New York, Shannon e Turing avrebbero potuto vedersi per un Tè presso i Laboratori Bell. Le loro riflessioni cambieranno il mondo e ci porteranno alla attuale versione di Giornalismo ed Intelligenza Artificiale, due branche dello stesso processo cognitivo, quello della comunicazione (Pavlik 2000).
Individuare la tendenza
Il mondo della stampa è abituato a confrontarsi con gli indici di tendenza forniti da strumenti simili o assimilabili a Google Trends. Si tratta di strumenti che analizzano statisticamente una grande quantità di informazioni e forniscono uno spaccato sui topic che sono stati di tendenza nel Passato, eventualmente Passato molto vicino al tempo Presente. Ma come chiedere ad un AI di eseguire una previsione della tendenza al futuro?
Ovvero, come creare un modello che sia in gradi di anticipare di giorni o di ore il futuro Trend che leggeremo sugli strumenti statistici? Alcuni eventi sono e resteranno imprevedibili per il modello poiché condizionati da eventi esterni e non modellabili (eg: una nuova notizia virale di importanza mondiale determinata dall’ azione impulsiva di un soggetto specifico), ma quasi tutto il resto risulta invece analizzabile con tecniche derivate dalla classe di algoritmi XGBoost (Chen 2016, XGBoost: A Scalable Tree Boosting System). L’elaborazione di segnali deboli può rivelare dei cambi di tendenza, anche molto prima che essi si manifestino concretamente.
La famiglia XGBoost trova molte applicazioni nell’anti-frode e nell’analisi esplorativa delle anomalie, ma possiede al suo interno anche le indicazioni per fornire delle previsioni sui cambi di tendenza di una serie attuale.
Perché il software AI non è un giornalista: le prerogative umane
Cosa può fare il giornalista umano che la macchina non può fare e che – nell’attuale orizzonte tecnologico prevedibile – non potrà mai fare in base ai modelli statistici che utilizza?
Moltissime cose. Si può dire che non può fare il mestiere del giornalista nella sua essenza: trovare notizie.
Il che richiede:
- Senso di ciò che è rilevante per il proprio pubblico. Che è diverso da ciò che è rilevante in generale per Google in quel momento. Significa fare parte di una certa comunità (locale, nazionale, di settore…) per comprenderne aspirazioni e problemi.
- Senso di ciò che diventerà importante. Che è diverso da ciò che sembra importante in questo momento alla luce delle attuali ricerche Seo.
- Relazioni umane con le fonti, maturate in anni di rapporti, per cogliere da loro spunti, notizie, conferme a notizie sentite da altre fonti.
A questo si aggiunge, in subordine, la capacità creativa stilistica di suscitare interesse con la scrittura – citata in quest’articolo. Gli attuali software sembrano incapaci di suscitare emozioni quando creano musica, che manca di personalità se “robotica”; lo stesso si può pensare del giornalismo, che però non ha nella sua funzione specifica quella di emozionare o ispirare quanto quella di informare.
Resta che l’AI può aiutare il giornalista a:
- Complementare sue fonti e sua comprensione del settore con analisi delle fonti non strutturate e strutturate disponibili
- Elaborare testi semplici sulla base di dati oggettivi o semi lavorati in base a elementi disponibili (magari forniti dallo stesso giornalista), liberando tempo per attività più complesse
- Supportare nella produzione multimediale.
Fin qui abbiamo parlato solo di scrittura, ma giornalismo è anche organizzare una redazione per confezionare un giornale. Collaborazione, direzione: tutte cose per cui l’AI può dare supporto – come nella scrittura – ma che non può sostituire.
Come nel caso dei medici e degli insegnanti, bisogna stare attenti – come avvisa Frank Pasquale (2020) – a metafore che immagino la sostituibilità dell’uomo. Dietro di loro si cela per prima cosa un equivoco tecnologico (e tecnocratico) di ciò che di umano c’è in quei lavori; e in ultima istanza, di ciò che è umano.
Per questo motivo è sempre più urgente, secondo molti esperti, avviare un dialogo multi disciplinare intorno all’intelligenza artificiale. Per avere un progresso buono con l’AI non possiamo lasciarlo nelle mani dei tecnologi ma dobbiamo farli dialogare con esperti di altri settori e con la società civile in generale, con l’attenzione di giuristi, politica e autorità.
Alessandro Longo
Consiglio Agile all’editor, ovvero Co-Authoring
Ogni attore, sia esso un comunicatore o un ricevente, entra a far parte di un modello matematico complesso, ma ogni elemento ha il proprio stile, i propri obiettivi e le proprie motivazioni, dunque il modello che li descrive deve necessariamente far parte della famiglia Unsupervised. Come ogni modello AI che punti ad un accuracy superiore al 95%, il training risulterà determinate. Nello spazio del Giornalismo, sono particolarmente utili gli algoritmi generativi di introduzione genetica, al fine di ottenere una struttura abbastanza flessibile da accomodare qualunque genere di Comunicatore, di Contenuto e di Audience.
Il modello a Intelligenza Artificiale ottenuto non deve soltanto eseguire prediction accurate, ma deve fornire spunti human actionable al giornalista, sarà dunque anche opportuno che utilizzi tecniche di explanable AI al fine di fornire indicazioni puntuali al giornalista impegnato nella scrittura. Nel giornalismo le tecniche SHAP (Scott Lundberg, Su-In Lee, 2017, A Unified Approach to Interpreting Model Predictions, sono di particolare ausilio nella fase di co-creazione tra giornalista ed Intelligenza Artificiale.
Dettagli visivi
Nell’era del WWW le notizie non sono veicolate solo nella loro forma testuale, ma sono arricchite da immagini ed altri contenuti multimediali. Così come per le proprietà di tipo TEXT, anche quelle di tipo IMG non sono create tutte uguali. Ci saranno sempre immagini che il pubblico apprezzerà maggiormente, e contenuti che attrarrà meno la sua attenzione. Per consentire ad un AI di eseguire una selezione a favore dell’rditor è necessario trasformare questi contenuti in Features, le quali poi verranno trattate con algoritmi della classe DeepLearning CNN. In questo modo un AI può essere addestrata a valutare i contenuti visivi come farebbe una persona, come farebbe quindi il pubblico a cui è destinata la notizia.
Il Clustering CNN delle immagini è un tema in continua evoluzione, la sua formalizzazione (Joris Gu´erin, Olivier Gibaru, St´ephane Thiery, and Eric Nyiri, 2018, CNN features are also great at unsupervised classification) è il frutto del lavoro svolto dalla scuola canadese avviata dal possente Yoshua Bengio
Dove l’AI non può arrivare, almeno per ora
Nella comunicazione esiste una regione dove l’AI non ha competenza. Lo spunto creativo dell’editor che seleziona termini specifici, usa metafore e significanti ad-hoc per rendere dei significati al lettore che facciano presa, che lo coinvolgano dal subconscio, che lo entusiasmino o lo incuriosiscano nella lettura, è ancora un task per gli esseri umani.
Nessuna AI avrebbe potuto prevedere che il presidente Donald Trump avrebbe occupato le pagine della stampa per l’assalto al Congresso ad opera di persone con look Braveheart e corna sull’elmo, così come nessuna AI può scrivere un articolo informativo come lo svolgerebbe una grande firma del giornalismo.
Noi umani manteniamo pieno titolo sull’area della creatività e dell’improvvisazione. La scintilla che scaturisce dai nostri ricordi e dalle nostre emozioni non è ancora modellabile dal punto di vista matematico e non abbiamo visibilità di cambiamenti prossimi su questa fattispecie.
Prossimi aggiornamenti in arrivo
Il fermento intorno all’AI e la ricerca di efficienza spinta che si sta conseguendo nei settori impattati dalla stessa, stanno entrando anche nel meccanismo della comunicazione ed in particolare del giornalismo. Nelle più recenti challenge internazionali di AI, il tema è fortemente sentito e dibattuto, diverse aziende si stanno impegnando per offrire una soluzione che massimizzi i vantaggi traguardabili da un AI anche ai giornalisti. Ci dovremmo aspettare a breve un supporto bilaterale, che preveda l’utilizzo di AI spinto sia a vantaggio del comunicatore, ma anche a favore del ricevente.
Quando si pensa ad AI applicata al giornalismo, il senso comune si sofferma alla creazione di contenuti scritti e le nostre conoscenze SciFi carpite dalla tv ci portano immediatamente alla mente il processo di Automated Journalism. Abbiamo visto come questo sia solo un sottoinsieme e, per non perdere focus, non abbiamo trattato altri aspetti collegati ed adiacenti al processo di comunicazione quali, solo per citarne alcuni, generazione di contenuti audio/video collegati, selezione di immagini per la stampa ad alto contenuto emotivo, etc.
La prossima frontiera dell’AI applicata al giornalismo è rappresentata dalla presentazione di contenuti altamente Tailored per il lettore che li approccia. Si intravede un futuro dove l’AI esercita le sue capacità dapprima nella creazione dei contenuti tenendo il giornalista human-in-the-loop e poi interviene a favore del ricevente per trasformare il contenuto generato in forma personalizzata.
Nel prossimo futuro l’articolo che state leggendo potrebbe apparire contornato di figure e dinosauri se aperto da un ragazzo di 8 anni, nella forma originale per i lettori esperti di AI ed in una forma più discorsiva per i meno esperti. La distanza che ci separa da queste innovazioni è decisamente breve.
*Asc27 è la startup che ha vinto il WAIC di Shangai con Asimov, software per il giornalismo, con funzioni come quelle descritte in quest’articolo, supporto al trending, co-authoring, e possibilità di usare avatar umani che leggono in video il testo dell’articolo o trasformazione in podcast