Spesso ci troviamo in difficoltà nel tenere il passo con le trasformazioni profonde del nostro tempo causate dall’accelerazione tecnologica.
Ogni volta, cerchiamo di comprendere cosa stia accadendo, tentando di cogliere le implicazioni e gli eventuali impatti sociali. In questo scenario la data science può offrire un aiuto, per esempio descrivendo matematicamente il modo in cui si diffondono ed influenzano le opinioni sui social network.
È proprio questo l’oggetto di studio di una nuova ricerca dal titolo “The drivers of online polarization: fitting models to data”, di cui scriveremo nel dettaglio in seguito.
Il legame tra scienza e politica
È evidente che, quanto più la scienza diventa importante per la comprensione del mondo, tanto più si stringe il legame tra essa e la politica. Negli Stati Uniti, a partire dal 2018, è stato introdotto l’Evidence-Based Policymaking Act, proprio sulla scia di tale consapevolezza. Esplorando meglio le data-driven policy, anche grazie al programma International Visitor Leadership del governo degli Stati Uniti (IVLP) del 2023, in cui siamo stati coinvolti, dobbiamo ammettere che in Italia siamo ancora indietro.
E purtroppo non sempre è facile individuare gli interlocutori giusti per capirci di più. La cultura dei dati in Italia è ancora all’inizio. Paradossalmente si preferisce discutere di tematiche tecnologiche facendo riferimento ad approcci speculativi, poco abituati a leggere i dati e a fare ipotesi su di essi.
Troppi opinionisti pop e simil-influencer non aiutano il dibattito
Altre volte, invece, ci si rivolge a personaggi, magari dal piglio un po’ pop non per forza adeguatamente titolati ad essere dei veri esperti sul tema.
Usanza richiederebbe l’onestà intellettuale da un lato nella selezione dei professionisti, magari che siano legati alla produzione scientifica o all’esperienza industriale, per coloro che chiamano; dall’altro nella valutazione delle proprie competenze, per coloro che vengono impiegati. Ma questo ultimo punto, nel mondo dei personaggi, resta una pura utopia.
La realtà, infatti, è ben diversa: molto spesso negli ambienti delegati a fornire le norme, vengono date e accolte declinazioni superficiali ed ingenue delle rivoluzioni che stiamo vivendo, che si parli dei cambiamenti profondi nella diffusione delle informazioni, o della comprensione dell’intelligenza artificiale.
L’informazione e la scienza fanno business, lo vediamo anche nel moltiplicarsi di youtuber che vorrebbero fare divulgazione, ma finiscono per fare promozione di sé stessi, parlando di ogni argomento possibile, pur di mantenere attivi i loro followers, con un impatto pessimo sulla qualità dell’informazione.
Mappare il fenomeno della diffusione dell’informazione
Sir Arthur Conan Doyle diceva che è un errore capitale formulare teorie prima di avere i dati a disposizione. Al centro di Data Science and Complexity for Society dell’Università La Sapienza di Roma abbiamo costruito negli anni una notevole collezione di evidenze empiriche per arrivare sostanzialmente a mappare il fenomeno della diffusione dell’informazione in maniera puntuale.
In estrema sintesi, internet produce un quantità senza precedenti di dati e, in questo mare, le piattaforme di social networking si ritrovano ad essere il maggior veicolo di diffusione di informazione. Il problema è che il loro business model è basato sulla vendita di pubblicità; quindi, gli algoritmi di feed tendono a fornire agli utenti informazioni il più possibile piacevoli, con la conseguenza della formazione di echo chamber e di polarizzazione delle opinioni.
Ed è proprio in tale contesto, caratterizzato da un ecosistema informativo sempre più digitalizzato, che comprendere i meccanismi che guidano la formazione delle opinioni e la polarizzazione nei social media è di fondamentale importanza anche per impostare eventuali quadri normativi che non inseguano problemi definiti male o visioni distorte.
L’Echo Chamber Effect sui social media
Tra i tanti studi, sulla rivista scientifica statunitense PNAS (Proceedings of the National Academy of Science) nel 2021 ne pubblicammo uno dal titolo “The Echo Chamber Effect on Social Media”[1], un lavoro considerato al momento fondamentale nel panorama internazionale per l’esplorazione delle dinamiche descritte in questa sede. Le echo chamber, per chi non ricordasse, sono casse di risonanza in cui gli individui sono esposti a opinioni che rafforzano le loro idee preesistenti. Questo fenomeno può portare alla polarizzazione delle opinioni, con gruppi di persone che finiscono per avere punti di vista fortemente divergenti su questioni chiave.
Lo studio del 2021 si era concentrato sulla mappatura e sull’analisi delle echo chamber in vari social media, compresi Facebook, Twitter, Reddit e Gab. Tramite tecniche di analisi di data science, abbiamo studiato le casse di risonanza e misurato il grado di polarizzazione delle opinioni all’interno di esse. Abbiamo potuto capire come le echo chamber si formino ed evolvano nel tempo, inoltre a scoprire come influiscano nel loro sviluppo gli algoritmi di raccomandazione dei contenuti sui social media. Sulla base di questo riscontro empirico forte abbiamo pensato di essere arrivati ad un punto importante. Il fatidico momento in cui tutti i pezzi del puzzle si trovavano al loro posto. Il confirmation bias, l’effetto di repulsione causato dal debunking/fact-checking, l’emergenza delle echo chamber e la polarizzazione, e da quel momento avevamo anche il ruolo degli algoritmi. Tutto supportato da evidenze empiriche e quantificato.
È a questo punto che ci siamo azzardati a proporre un modello fisico che fosse in grado di riprodurre le dinamiche osservate in tanti anni di lavoro.
Quindi, raccogliendo dati per quasi 10 anni, oggi siamo finalmente in grado di proporre un modello che contenga tutti gli ingredienti che abbiamo osservato.
Un modello sulle dinamiche che intercorrono a influenzare le opinioni
Ed ecco quindi un nuovo lavoro che sta per essere pubblicato da Information Science (una rivista scientifica di informatica molto importante), dove proponiamo un modello sulle dinamiche che intercorrono a influenzare le opinioni con tanto di riscontro dei risultati ottenuti sui dati. Questo ultimo passaggio serve a misurare quanto il modello sia accurato nel rappresentare la realtà.
Dinamiche d’opinione di “fiducia limitata”
Partiamo dal modello classico di dinamiche d’opinione di “fiducia limitata”, o Bounded Confidence Model (BCM), che prevede che gli utenti possano interagire solo con altri che hanno idee non troppo distanti dalle loro:
“Due nodi sono in grado di influenzarsi a vicenda solo se la distanza tra le loro opinioni è inferiore a una determinata distanza.”[2]
Tuttavia, in aggiunta all’interno di questa nostra nuova versione, il modello considera il ruolo degli algoritmi dei social media, che tendono a mostrare agli utenti contenuti in linea con le loro preferenze, limitando così lo spettro di idee a cui sono esposti.
Il modello suggerisce, inoltre, che un particolare parametro, che regola il rafforzamento e l’indebolimento dell’influenza relativa dei vicini in un social network, può svolgere un ruolo cruciale nella riduzione della polarizzazione.
Figura 1. Modello della dinamica d’opinione con bias algoritmico.
In figura sono mostrati i tre parametri del modello che svolgono un ruolo nella dinamica del social network e, di conseguenza, hanno influenza sugli utenti che popolano la piattaforma. Si presume che ogni individuo abbia uno spettro d’opinione iniziale, chiamato raggio alfa (α), individuato dal social network e che ad ogni interazione con altri utenti, la sua opinione subisca un “aggiornamento”, visualizzato nelle figure b e d come spostamento beta (β). Per raggiungere l’obiettivo di far trascorrere più tempo possibile all’utente su di essa, la piattaforma mostrerà i contenuti di individui simili per preferenze, pertanto solo i link verdi, visualizzati nei pannelli a e c della figura, contribuiscono all’aggiornamento dell’opinione iniziale e vengono rafforzati da un fattore gamma (γ). In altre parole, a diversi valori del parametro gamma (γ), il quale regola il modo in cui si rafforzano o indeboliscono le connessioni tra le opinioni degli utenti, sono associati diversi livelli di polarizzazione, pertanto è proprio questo fattore la chiave del processo. Allo stesso tempo, tuttavia, un intervento su di esso potrebbe causare una minore efficacia sulla pubblicità targetizzata.
Lo studio ha evidenziato, inoltre, come su Facebook e Twitter si trovino opinioni molto polarizzate su argomenti specifici (rispettivamente vaccinazione e aborto), mentre Reddit e Gab presentano una distribuzione delle opinioni meno polarizzata a livello di comunità. È presumibile pensare che tale evidenza rifletta differenze significative nelle funzionalità di filtraggio degli algoritmi delle piattaforme.
Il modello proposto può simulare l’evoluzione a partire da diverse situazioni iniziali: da un contesto di pluralismo, in cui tutte le opinioni sono rappresentate; a uno di consenso, in cui si concentrano in una stretta area; ma può anche rappresentare situazioni di frammentazione e polarizzazione, in cui l’opinione pubblica è divisa in gruppi distinti.
Per testare l’efficacia del modello, abbiamo confrontato i risultati delle simulazioni con i dati reali raccolti da diverse piattaforme di social media, tra cui Facebook, Twitter, Gab e Reddit. E vediamo come le distribuzioni delle opinioni osservate su queste piattaforme siano replicate abbastanza accuratamente, come si mostra in Figura 2.
Figura 2. Valutazione dell’aderenza dei risultati del modello ai dati reali. Colonna di sinistra: distribuzioni di opinioni reali. Dalla seconda all’ultima colonna: la migliore approssimazione dei dati osservati fornita dai nostri modelli delle dinamiche d’opinione (seconda colonna) e da quelli concorrenti: Baumann (terza colonna) e de Arruda (quarta colonna).
Conclusioni
In conclusione, lo studio che abbiamo descritto non solo confronta le distribuzioni delle opinioni generate dal modello con quelle osservate nei dati reali, ma cerca anche di capire quali parametri siano importanti per replicare le distribuzioni reali. Grazie a questo lavoro è stato possibile ottenere una descrizione più dettagliata delle piattaforme di social media in termini di parametri del modello. Quindi è possibile fare analisi di scenario per prevedere quale configurazione finale di opinioni si otterrebbe variando i parametri del modello (che mimano fenomeni reali).
Forse la sensibilità rispetto alle data-driven policy che si trova altrove non è ancora così spiccata nel nostro paese, non mancano i tentativi di dare forma alla complessità del reale attraverso i dati, e non per via speculativa, che possono offrire spunti importanti per le decisioni politiche. Come non mancano le competenze per impostare ragionamenti sensati riguardo tematiche importanti provenienti dal mondo dell’innovazione che sempre di più investono la nostra vita quotidiana, dalla gestione delle piattaforme e dei flussi di informazione, ai risvolti lavorativi ed etici a seguito dell’ingresso dell’intelligenza artificiale.