Nel panorama tecnologico contemporaneo, la questione di genere assume un ruolo sempre più centrale, influenzando non solo le dinamiche umane ma anche quelle che riguardano la programmazione e l’uso delle intelligenze artificiali e dei robot. Questo interesse crescente ispira una riflessione profonda sul modo in cui la tecnologia può perpetuare o sfidare gli stereotipi di genere esistenti.
La voce femminile nei sistemi AI: questioni etiche, culturali e sociali
L’integrazione della voce femminile nei sistemi AI, come evidenziato dal caso controverso di ‘Sky’, la voce di ChatGPT, solleva questioni etiche significative e spinge a interrogarsi sulle implicazioni culturali e sociali che emergono quando i robot assumono caratteristiche tipicamente attribuite al femminile. In questo contesto, l’esplorazione storica del contributo femminile nella narrativa robotica rivela un’evoluzione da figure marginali a protagoniste attive, suggerendo una traiettoria che potrebbe informare futuri design inclusivi nella robotica. La discussione aperta dalla femminilizzazione dei servizi robotici invita dunque a una riflessione più ampia su come la tecnologia possa diventare uno strumento per promuovere la diversità e combattere pregiudizi secolari.
Emma, la voce del casello autostradale
Per introdurre meglio questa mia riflessione, parto da un evento personale. Al casello dell’autostrada ascolto la voce che mi chiede di inserire il biglietto e poi la carta o i contanti e penso che Emma è stata brava ad apparire tanto incorporea. Emma è la doppiatrice, la cui vita per un periodo si è incrociata artisticamente con la mia, che ha prestato a pagamento la sua voce all’automatismo che sostituisce il casellante. Una voce femminile, straniata eppure vagamente sollecita, distaccata ma non troppo, meccanica al punto giusto. Una voce di donna.
In Italia le Autostrade hanno scelto questo per noi utenti, la rappresentazione uditiva di qualcuno che ispiri il rispetto affettuoso dovuto a una donna, che suggerisca una certa professionale sottomissione, un’idea di servizio trasformata in onde sonore. Perché non un bravo doppiatore? Un annunciatore radio, uno di quei cazzeggiatori professionisti che chiacchierano a sproposito tra una canzone e l’altra nel tentativo di farci dimenticare che le canzoni non le abbiamo scelte né noi né loro, ma sono il risultato di una play-list figlia di un potere economico superiore, asservito a teoremi di marketing forse soggetti ad algoritmi meno sofisticati di chi è costretto ad ascoltarle. Beh, la voce non poteva che essere femminile, e non solo in Italia.
Scarlett Johannson e la controversia su ‘Sky’, voce di ChatGPT
Da un articolo del New York Times del 28 giugno 2024, a firma Amanda Hess, scopriamo che il mese scorso OpenAI ha rivelato aggiornamenti al suo chatbot artificialmente intelligente, affermando che ChatGPT sta imparando a sentire, vedere e conversare con una voce naturalistica che somiglia molto al sistema operativo disincarnato doppiato da Scarlett Johansson nel film di Spike Jonze del 2013 Her.
Disincarnato a chi? Scarlett Johansson pure in forma unicamente vocale è quanto di meno disincarnato esista nell’immaginario umano, non a caso il regista l’ha scelta per far innamorare il povero Joaquin Phoenix affetto da una perdita amorosa molto simile a quella sperimentata da Spike Jonze nel divorzio da Sophia Coppola dieci anni prima, quando la regista realizzava proprio con la stessa diva il film Lost in translation per riassorbire la medesima, seppur speculare, disfatta. Questo almeno si narra nella storia del cinema del secolo odierno.
Da una parte una donna che nello spaesamento giapponese si aggrappa a uno sconosciuto per riaversi da una storia troppo oppressiva con un uomo molto autocentrato, dall’altra la soluzione adottata da quell’uomo per vincere l’abbandono grazie alla malia di una voce femminile che dieci anni prima, idealmente, di quell’abbandono era stata artefice. E il nome Scarlett a legare tutto questo, con le tribolazioni e le contraddizioni e le vicissitudini squisitamente femminili della protagonista di Via col vento. Rossella Johansson, plagiata dall’algoritmo del chatbot più famoso del momento, predisposta a imperversare come rassicurante sedativo delle masse dedite a ricerche e scopiazzature, interazioni uomo/donna-macchina alla scoperta di nuovi universi interattivi. Che idea.
L’attrice aveva in verità negato il consenso. “La voce di ChatGPT, chiamata Sky, aveva un timbro roco, un effetto calmante e un tocco sexy. Era simpatica e schiva, sembrava pronta a tutto”, racconta Amanda Hess sul NYT. “Dopo il debutto di Sky, Johansson ha espresso disappunto per il suono ‘stranamente simile’ e ha affermato di aver precedentemente rifiutato la richiesta di OpenAI di dare voce al bot. La compagnia ha protestato dicendo che Sky era doppiata da una ‘attrice professionista diversa’, ma ha accettato di mettere in pausa la sua voce per rispetto alla Johansson. Gli utenti di OpenAI hanno avviato una petizione per riportarla indietro”. Miserie umane.
La voce, da Calvino all’AI
Nel racconto Un re in ascolto, incluso nella raccolta incompiuta Sotto il sole giaguaro di Italo Calvino pubblicata postuma nel 1986, l’autore sentenzia: “Una voce significa questo: c’è una persona viva, gola, torace, sentimenti, che spinge nell’aria questa voce diversa da tutte le altre voci”. Di rimando Hess scrive: “I chatbot non generano spontaneamente voci umane. Non hanno gola, labbra o lingua. All’interno del mondo tecnologico di Her, il robot Samantha sarebbe stato esso stesso basato sulla voce di una donna umana, forse un’attrice immaginaria che somiglia molto a Scarlett Johansson”, innescando così la moltiplicazione all’infinito da attrice a macchina, da macchina ad altra attrice, esasperando il vortice da disincarnazione a corporeità della voce staccata dall’immagine da cui è prodotta. E Calvino le risponde in anticipo: “Quella voce viene certamente da una persona, unica, irripetibile come ogni persona”. Parla esplicitamente della “vibrazione di una gola di carne” che introduce il “vocalico” quale forza indipendente dal “semantico”, come commenta Adriana Cavarero nel saggio del 2003 A più voci.
Umanizzazione e genere: come la femminilità viene programmata nei robot
La voce prescinde da quello che dice, assoluta e integra, esalta l’unicità come una impronta digitale acustica. Ma come un computer può riprodurre e creare impronte digitali con la facilità con cui realizza codici barre e QR Code, può pure imitare una voce calda, sensuale, indecisa se stare al gioco di un umano che le è inferiore, un umano cui è capitata in sorte una sola voce, la sua, distinguibile, personale, piacevole o sgraziata, con cui deve fare i conti tutte le mattine. Dunque la risonanza delle similarità continua a rimbalzare da umano a macchina e viceversa, di imitazione in imitazione, fino a che entrambi non si capirà, come per le migrazioni, che l’integrazione è l’unica prospettiva possibile. E il peggior rischio dell’integrazione è l’accorpamento in uno stereotipo.
Se, come scrive ancora Hess, “sembrava che OpenAI avesse addestrato il suo chatbot sulla voce di un’attrice senza nome che suona come un’attrice famosa che ha doppiato un chatbot cinematografico implicitamente addestrato su un’attrice irreale che suona come un’attrice famosa”, insomma se nell’eseguire la demo di ChatGPT, si ascolta una simulazione di una simulazione di una simulazione di una simulazione di una simulazione, l’integrazione è già avvenuta nel punto in cui si è persa la svolta dall’umano all’elettronico e dall’elettronico all’umano. Il segreto dell’integrazione è il disorientamento.
Etica e tecnologia: le implicazioni della femminilizzazione dei robot
Ma non è questa l’unica inversione che può spaesare tanto l’utente quanto il programmatore. Il sassofonista nella cui auto viaggiavo, anche lui amico della doppiatrice Emma che aveva registrato messaggi per l’antidiluviano sistema robotizzato dei caselli autostradali, diceva: «Pensa quanti insulti si prenderà dagli automobilisti incazzati», toccando il tasto dell’incapacità di reagire di una voce programmata per sole poche interazioni di carattere economico. Sottolineava con tono misogino l’opportunità offerta al cialtrone di sfogare liberamente la sua aggressività su di una voce femminile scorporata dalla sua individualità. Il gusto tutto fantozziano di rivalersi per le proprie frustrazioni su qualcuno più debole, inappropriato a difendersi, insensibile ma forse non del tutto (che gusto c’è a picchiare uno che non ne soffre).
L’aspetto misogino non va trascurato nella scelta di porre al servizio del cliente la voce di una donna empatica e compiacente, un po’ mamma, un po’ segretaria, un po’ fidanzata, modellata su un oggetto di conforto per tutti gli usi che nel film di Jonze fa le fusa direttamente nelle orecchie dei suoi utenti. Chi non si è divertito a dare della mentecatta all’assistente virtuale di Amazon, Alexa, o alla servizievole e inetta Siri di Apple scagli la prima pietra. Che sia per lusingare o offrirsi al ludibrio, non c’è niente di buono nella scelta sessista di femminilizzare gli assistenti vocali, esposti per ruolo alle ingiurie di esseri umani che pensano che “tanto non capisce”. Ma se davvero non capisce, perché mai dovrebbe esserci utile? Se non capisce forse la insulteremo meno se è femmina? O di più? È progettata come sfogo o come deterrente?
La conclusione cui giunge Amanda Hess dopo aver interagito con Cove, la voce maschile fornita tra le alternative da ChatGPT, che acusticamente le ha stimolato alla prima impressione l’immagine di un uomo bello, la dice lunga quanto a delusione. “Quando ho rivisto la trascrizione della nostra chat, ho potuto vedere che il suo discorso era artificioso e primitivo come quello di qualsiasi chatbot del Servizio Clienti. Non era particolarmente intelligente o umano. Era semplicemente un attore decente che traeva il massimo da un ruolo da niente”.
Impatti culturali della femminilizzazione dei sistemi AI
Forse risultando da una voce femminile l’effetto sarebbe stato meno deludente. Il “Sii affascinante e taci” di Baudelaire potrebbe trasformarsi in “Sii bella e dimmi qualsiasi cosa”. Forse è questo che ci si aspetta da una donna, e l’unica evoluzione in due secoli consiste nel far parlare la femmina purché sia bella, anziché farla tacere. Da un’assistente femmina non si pretende che sia brillante, ma unicamente entusiasta come la Jessie di TikTok che serve a venderti qualcosa ricordandoti nel retrogusto metallico che c’è del falso in Manciuria. O remissiva e sottilmente conturbante come Sky, la Johansson mancata la cui voce roca evoca una Pizia senza alcun Apollo a invasarla. A ben pensarci il corrispettivo semantico dell’invasamento divino sarebbe l’entusiasmo, ma la Cina non ha radici greche. E Oscar Wilde già sapeva che nei tempi moderni saremmo stati condannati a imbatterci in una Sfinge senza enigmi.