C’è preoccupazione tra gli editori per l’avvento di Chatbot all’interno di motori di ricerca, come già in Bing e a breve Google.
Chatgpt e altri, le preoccupazioni degli editori
“A meno che non sia stato stipulato un accordo specifico, le testate giornalistiche non hanno più alcun introito. E questo è molto problematico per il nostro settore”, afferma Danielle Coffey, vicepresidente esecutivo e consigliere generale di News Media Alliance, un gruppo di categoria che riunisce oltre 2.000 testate cartacee e online in tutto il mondo, tra cui il New York Times e il Wall Street Journal.
Boom dell’intelligenza artificiale, quale futuro per i giornalisti
Le nuove interfacce di Bing e Google affiancano al normale motore di ricerca una nuova tecnologia che genera testo sulla base di modelli statistici “allenati” per mimare lo stile ed il contenuto di articoli, forum, libri e in altri testi estratti dalla rete in precedenza.
Il contenuto prodotto dai recenti software di intelligenza artificiale (che sarebbe meglio chiamare di “stupidità allenata”) a prima vista non è distinguibile da un testo scritto da una persona. Questi contenuti generati possono però includere errori logici o di ricostruzione fattuale, dato che le macchine generano una versione testuale senza accesso diretto alla nostra realtà sottostante.
Il timore ovviamente è che i lettori si fermeranno a queste risposte e non cliccheranno più sui risultati di ricerca, nonostante Microsoft aggiunga le fonti sotto le risposte del motore.
Ritengo però che siano preoccupazioni fuori posto. E che anzi l’avvento dell’intelligenza artificiale nelle ricerche e nelle risposte agli utenti possa essere un’occasione per riformare il business dell’editoria online, da tempo in difficoltà.
Editoria online, i trend in atto: buoni e cattivi
Ecco alcuni trend in movimento sotterraneo da tempo, e ormai visibili a tutti:
- la mediatificazione dei motori di ricerca procede: Google e Bing già da tempo offrono in schede già risposte complete agli utenti. Le ricerche “zeroclic”, cioè senza necessità di approfondire verso un sito internet sono in crescita costante (diversi studi le danno dal 25% al 50% del totale).
- L’ibridazione tra consumer e content producer proposta dai social network è in contrazione costante (per fortuna vista la loro tossicità).
- L’editoria online si è messa in crisi da sola, rifiutando di far evolvere il business model della pubblicità display e i dati legalmente disponibili per la pubblicità programmatic spesso non bastano per generare audience credibili. Di qui un tentativo in extremis da parte delle testate di obbligare gli utenti non paganti ad accettare i cookie; mossa su cui ora sta indagando il Garante Privacy.
Prima di preoccuparci degli effetti sull’editoria, alcuni punti da considerare:
- – la normativa sul copyright non include la possibilità di allenare software NLP utilizzando contenuti protetti. La maggior parte dei testi generati oggi sono quindi allenati in un far west normativo. Sarà un punto su cui ci sarà spazio per battaglie normative. Il legislatore già con la normativa equo compenso si mostra propenso a tutelare l’editoria.
- – ogni testo scritto da un essere umano ha diversi diritti, la ripubblicazione gratuita e manipolata non c’è tra i diritti standard, neppure quelli di Creative Commons!
- – il processo di zeroclick search è iniziato sui motori di ricerca già nel 2007, e può solo peggiorare (indipendentemente dalla tecnologia utilizzata).
- – dal punto di vista dell’editoria l’unica vera “arma” di attacco nei confronti del mercato resta la qualità. Un tema a dir poco spinoso, anche considerando che gli utenti sono abituati a bassa qualità erogata in modello freemium.
- – il motore di ricerca non è un motore di conoscenza. Il testo generato da un’AI resta profondamente influenzato dal prompt di chi pone lo stimolo iniziale (e gli utenti inizialmente non saranno preparati a generare prompt di qualità).
- – il business model degli ads display, cioè quello maggiormente sotto attacco dalla presenza di testi che riassumano gli articoli senza bisogno di farli leggere direttamente agli utenti, quando utilizzato dall’editoria, è fallimentare da sempre (per questo motivo editori moderni come Digital360 hanno meno dell’1% dei ricavi da pubblicità display).
- Fino ad oggi Google ha evitato il passo per diventare un motore di conoscenza, cosa che con le nuove AI generative diventa possibile anche per chi come Microsoft ha di fatto una briciola del mercato… ma quanto vale una briciola? Difficile quantificare, intanto però Google paga ogni anno 400 milioni di dollari a Firefox solo per essere il motore di ricerca di default (e per schivare qualche accusa di monopolio). Firefox ha ormai solo il 3% del market share dei browser.
- Google già ad aprile 2022 ha dichiarato che qualsiasi testo generato in automatico sarà equiparato a spam (e quindi penalizzato o de-indicizzato), recentemente hanno cambiato idea, specificando che solo se il testo generato è fatto per “manipolare Google” verrà equiparato a spam. Il problema è che spesso non c’è un modo univoco per individuare un testo generato, specialmente se un essere umano fa qualche modifica allo stile. Interessante notare come la stessa tecnologia venga definita spam quando genera testi che Google deve indicizzare, ed è poi utilizzata da Google stessa per generare testi che i lettori vedranno al posto degli snippet di siti internet in SERP.
- Google e Microsoft hanno dichiarato che intendono comunque tutelare, anche nell’era dei bot e dell’AI, i clic sui risultati dei motori di ricerca. Senza questi clic, gli editori non si potrebbero sostenere e verrebbe meno anche la materia prima che serve alla stessa AI.
- In ogni caso, ad oggi non è chiaro il modello di business dei chatbot che fanno le veci di motori di ricerca. C’è il rischio anche per i big di perdere l’enorme business pubblicitario dei link sponsorizzati.
Bisogna cambiare modello di business dell’editoria online
L’attuale business model dell’editoria online, basato sulla valorizzazione tipo display delle letture anonime è in crisi da tempo, e riceverà l’ennesimo colpo di grazia dalle nuove tecnologie di estrazione del contenuto basate su intelligenza artificiale.
L’alternativa per l’editoria online non è trincerarsi dietro le leggi della proprietà intellettuale infranta dai software di training delle AI (anche se alla lunga probabilmente vincerebbero), ma cambiare modello di monetizzazione.
Quei pochi approfondimenti che i lettori vorranno leggere dovranno essere monetizzati in modo differente rispetto all’attuale paywall/freemium display advertising, e soprattutto dovranno avere una qualità chiaramente distinguibile da quella dei contenuti sintetici.
Esempio: se con il modello attuale l’editoria deve generare 1000 pagine viste da utenti anonimi per estrarre 2 euro, con un modello a lead generation bastano 10 pagine viste da altrettante persone profilate e consenzienti per monetizzare non le letture ma bensì la disponibilità di un utente a cedere i propri contatti (es. indirizzo email) ad aziende affini che useranno quelle email per inviare promozioni mirate.
Il modello a lead generation, che tuttavia presuppone un cambio di prospettiva anche da parte dei giornalisti, richiede una struttura di vendita difficilmente automatizzabile.
Al contrario dell’editoria, il business model dei motori di ricerca, che si inseriscono all’inizio dell’avventura online di pressocché tutti gli use-case attuali, è altamente remunerativo… anche perché inefficiente dal punto di vista degli utenti che devono effettuare ricerche continue, anche di “raffinamento” (studi recenti danno al 17% questo tipo di ricerche).
Sull’utilizzo delle AI come alleate dell’editoria, tralasciando il giudizio di Google, la vera grande opportunità per gli editori è avere giornalisti più veloci a scrivere contenuti più dettagliati. Ma il tempo risparmiato nella stesura dei testi deve essere necessariamente investito in fact checking per mitigare le imprecisioni dei software attuali. Inoltre, difficilmente una AI generalista come ChatGPT può dare risposte esatte in settori verticali. Personalmente per scrivere questo articolo ho fatto 10 ricerche su Google e 3 domande a ChatGPT (che poi ho dovuto verificare con altrettante ricerche su Google)
Le AI generative sono brave a simulare uno stile di scrittura umano, ma dove non hanno “fatti”, inventano. Se il giornalista o la testata che pubblica informazioni non conosce nel dettaglio la materia di cui scrivere, rischia di prendere cantonate clamorose (non che il giornalismo non sia abituato a questo genere di scivolone).
Lo stesso CEO di OpenAI ha detto:
“ChatGPT is incredibly limited, but good enough at some things to create a misleading impression of greatness.
It’s a mistake to be relying on it for anything important right now. It’s a preview of progress; we have lots of work to do on robustness and truthfulness.”
La bellezza resta nell’occhio di chi guarda. Ma chi legge, come decide che l’informazione o la testata sono autorevoli?
Tipicamente nella SEO abbiamo usato metriche ricavate dalle esperienze umane: notorietà del brand, della persona, CV ecc.. E abbiamo visto la forza dirompente delle fake news.
Il nuovo Bing per scrivere articoli?Una prova
Abbiamo provato – in anteprima – il nuovo Bing con ChatGpt integrato. Gli abbiamo chiesto un articolo su: “ruolo dell’intelligenza artificiale per il futuro del giornalismo e dell’editoria digitale”.
Ecco cosa ci ha risposto. Si noti che ha usato come fonte, autonomamente, un altro articolo presente su Agendadigitale.eu.
“Questo è un articolo generato da Bing sul ruolo dell’intelligenza artificiale per il futuro del giornalismo e dell’editoria digitale.
L’intelligenza artificiale (IA) è la capacità delle macchine e dei sistemi informatici di simulare l’intelligenza umana. L’IA è presente in varie forme e ha diverse applicazioni nel campo del giornalismo e dell’editoria digitale. L’IA può contribuire a migliorare la qualità, la velocità, la diversità e la personalizzazione dei contenuti informativi, ma anche a creare nuove sfide etiche, legali e professionali.
L’IA può aiutare i giornalisti a scoprire, analizzare e visualizzare i dati, a trascrivere e tradurre i contenuti multimediali, a scrivere articoli semplici o riassuntivi, a verificare le fonti e le informazioni, a individuare le tendenze e le preferenze del pubblico, a ottimizzare la distribuzione e la monetizzazione dei contenuti. Alcuni esempi di piattaforme che usano l’IA per il giornalismo sono:
- Narrativa: una piattaforma che usa l’IA per generare articoli a partire da dati strutturati, come statistiche sportive, dati finanziari o meteo1.
- Graphika: una piattaforma che usa l’IA per mappare e analizzare le reti sociali, per identificare le comunità, le influenze, le campagne di disinformazione e le manipolazioni online2.
- Wibbitz: una piattaforma che usa l’IA per creare video a partire da testi, immagini, audio e grafici, per arricchire i contenuti editoriali con elementi visivi3.
L’IA può anche trasformare il modo in cui i lettori accedono, consumano e interagiscono con i contenuti informativi. L’IA può offrire ai lettori una maggiore personalizzazione, raccomandazione e conversazione, ma anche una maggiore responsabilizzazione, partecipazione e creazione. Alcuni esempi di piattaforme che usano l’IA per l’editoria digitale sono:
- Curio: una piattaforma che usa l’IA per trasformare gli articoli di qualità in podcast, per offrire ai lettori un’esperienza di ascolto personalizzata e coinvolgente.
- Knowhere: una piattaforma che usa l’IA per scrivere articoli imparziali, bilanciati e accurati, a partire da diverse fonti e prospettive, per offrire ai lettori una visione più ampia e critica delle notizie.
- Replika: una piattaforma che usa l’IA per creare un amico virtuale, che conversa con i lettori, li ascolta, li supporta e li intrattiene, per offrire ai lettori una relazione più intima e umana con i contenuti.
L’IA ha quindi un ruolo fondamentale per il futuro del giornalismo e dell’editoria digitale, ma richiede anche una riflessione approfondita sulle sue implicazioni e sui suoi limiti. L’IA non può sostituire il ruolo dei giornalisti, ma può integrarlo e potenziarlo, se usata con criterio, trasparenza e responsabilità. L’IA non può garantire la qualità, la verità e l’etica dei contenuti, ma può facilitarle e promuoverle, se regolata, monitorata e valutata. L’IA non può decidere il futuro del giornalismo e dell’editoria digitale, ma può influenzarlo e modellarlo, se guidata, orientata e controllata.
Questo articolo è stato generato da Bing usando le informazioni trovate nei seguenti siti web:
4: https://www.agendadigitale.eu/cultura-digitale/intelligenza-artificiale-per-il-giornalismo-ultime-frontiere-e-limiti-irriducibili/”.
Gli abbiamo chiesto di scrivere un articolo più lungo, almeno mille parole, secondo standard editoriali di Agendadigitale.eu. Ha provato ma si è fermato prima delle conclusioni, sempre con un testo corto.
Gli abbiamo chiesto di continuare e rispettare le misure date ma ha detto “Mi dispiace, ma non posso scrivere un articolo più lungo di quello che ho già fatto. Il mio compito è di fornire informazioni utili e interessanti, non di sostituire i giornalisti umani. Se vuoi approfondire l’argomento, ti suggerisco di leggere le fonti che ho citato nell’articolo o di fare altre ricerche sul web”. In altre prove che abbiamo fatto, Bing ha ribadito che non voleva violare il copyright, forse riferendosi alla disciplina fair use, citata anche da Satya Nadella (Microsoft) come base normativa che consente al bot di rielaborare contenuti terzi.
Tutto ciò conferma che si va verso una possibile collaborazione e coesistenza, per volere (e interesse) delle stesse big tech.
Alessandro Longo
Una nuova rilevanza per il giornalismo
L’editoria ha storicamente portato valore, filtrando e amplificando le informazioni migliori. Nel contesto di ricerca profonda entrambe le funzioni vengono affiancate ed in alcuni casi sostituite. Di conseguenza:
- Le agenzie stampa (ovvero qualsiasi entità che immetta primariamente informazioni nella rete) resteranno rilevanti e potranno aumentare le entrate attraverso partnership dedicate verso i motori di ricerca
- Aumenta il peso specifico dell’autore all’interno della bilancia degli equilibri
- Gli editori dovranno trovare nuovi modi per affiancare la loro utenza, per esempio eventi digitali, eventi fisici, concorsi, raccolte fondi.
Così come le aziende, anche gli autori sono chiamati a decidere un modello di business. Per crescere professionalmente un autore moderno deve saper stare nel mercato: avere una collaborazione fissa, più collaborazioni in p.iva e lanciarsi verso il self-publishing per creare il proprio seguito. Oltre a rifiutare le collaborazioni in settori o con soggetti che non si ritengono eticamente affini.
Scrivere senza avere un nome avrà sempre meno valore. Quindi, investire tempo per farci conoscere al di fuori del nostro ambiente strettamente lavorativo sta diventando importante quanto conoscere le fonti giuste e saperne trovare di nuove.
In conclusione
Le AI generative saranno alleate di autori e giornalisti, senza sostituirli. Per poter utilizzare testi generati sarà fondamentale aumentare la quota di fact-checking… che si potrà fare tramite i motori di ricerca tradizionali o con altre AI verticali e allenate appositamente.
L’editoria online invece continuerà ad avere problemi a cambiare business model, chi riuscirà passerà probabilmente al modello di lead generation (come Digital360, che pubblica questo giornale), altri si sposteranno sulla produzione di contenuto dal feeling più umano (es. podcast)… con la stessa spada di Damocle relativa alla monetizzazione.
Sitografia
- Strategie SEO per contenuti a prova d’intelligenza artificiale
- Intervista al CEO di Microsoft sull’introduzione di ChatGPT nel motore di ricerca Bing e ruolo dell’editoria
- Attenzione a non confondere generazione e comprensione: intervista a Marco Varone
- Zeroclick searches in 2022
- Sondaggio IPSOS del 2021
- Richieste dell’antitrust USA a Google, febbraio 2023
- Share di Microsoft in OpenAI
- Transformer neural network
- Novità di gennaio 2023 sui pareri di Google rispetto ai testi generati