Siamo alle soglie di un cambiamento di paradigma importantissimo nel modo di interagire con internet, diverso da quello basato su interfaccia visive a favore di quelle vocali. Già oggi, il mercato dell’audio digitale – cuffie, auricolari, earpods – è quanto mai florido e nel futuro saranno sempre più presenti nelle nostre vite smart speakers, virtual assistant, connected cars e audio augmented reality. La ragione è presto detta: l’attenzione che dedichiamo agli schermi connessi ha raggiunto il picco, ma restano ancora da “conquistare” quelle due-tre ore al giorno che passiamo a muoverci, camminare, guidare, andare in bici fare le faccende domestiche. Un tempo fin qui per la maggior parte appannaggio della musica ma che ora si sta aprendo a nuove abitudini quali mandare messaggi vocali, ascoltare podcast, fare ricerche o fissare appuntamenti. A guidare l’evoluzione del settore, è proprio il mercato degli assistenti virtuali, ma anche i social network dovranno adeguarsi a questo nuovo scenario, con una versione audio che ci consentirà di ascoltare gli ultimi post mentre laviamo i piatti.
Obiettivo di questo articolo è di approfondire e analizzare il mercato dell’audio digitale, seguirne le evoluzioni e intervistare i principali player ed esperti del settore, ascoltando da loro la direzione che si sta prendendo.
La prossima frontiera del digitale
Dunque, la prossima frontiera del digitale è il tempo, ancora parzialmente inesplorato, che passiamo camminando, guidando l’auto, andando in bici o in moto. Di quando siamo in movimento, anche in casa. In questo tempo, le sirene del digitale sono più deboli. E si capisce perché! Quelle sirene per arrivare a noi devono uscire da uno schermo che, in quel lasso di tempo, facciamo fatica a guardare. Pur tuttavia tanta è la tentazione e il richiamo dei nostri social network o sistemi di messaggistica che spesso mettiamo a rischio la nostra incolumità per tornare sullo schermo, anche mentre siamo in movimento.
Quante ore passiamo davanti agli schermi connessi
A seconda di dove viviamo e di ciò che facciamo le statistiche cambiano ma, in media, passiamo poco meno di 10 ore davanti ad uno schermo “connesso”, assumendone contenuti: 3 ore guardando lo schermo di uno smartphone o tablet, 4,5 ore guardando quello di una tv, 1,5 quello di un laptop o altri device. Gli investimenti profusi dai vari media e content provider per conquistare l’attenzione degli utenti durante questo “screen time” sono talmente grandi che facciamo difficoltà a contarli. Facebook, CNN, Disney, Fox, Sky, Google, Netflix, Sony, Microsoft, Apple più tutti i mega brand e la marea di influencers e individui che producono contenuti (anche se non lo sanno). Tutti qui, nell’oceano dello screen che però sembra aver raggiunto il picco (molti commentatori anglosassoni parlano appunto di “peak screen”).
Al di là delle conseguenze sociali e cognitive di questa sovra-esposizione allo schermo (alcune ricerche mettono in relazione l’aumento della depressione e dei deficit cognitivi con quello dello screen time) esiste ancora un limite fisico a questa video abbuffata: il tempo dedicato a muoverci, camminare, guidare, andare in bici, fare sport, alle faccende domestiche resiste ed esiste come baluardo alla crescita dello screen time. Si tratta, in media, di circa 2-3 ore al giorno che oggi sono diventate un mercato molto interessante dove gli investimenti possono produrre un ritorno più che marginale.
La nuova vita (e mercato) dell’audio digitale
È infatti un territorio rimasto per decenni appannaggio di radio e musica, quest’ultima pur stravolta da nuove forme distributive. Mentre le radio sembrano essere state fino ad oggi impermeabili alla rivoluzione digitale (l’audience totale del mezzo radiofonico è rimasta sostanzialmente stabile negli ultimi venti anni).
Avrete però notato, negli ultimi anni, la crescita dei messaggi vocali o delle persone che effettuano ricerche vocali su Internet. Anche sul treno ormai è tutto un Hey Siri, Ok Google. E il mercato delle cuffie, degli auricolari, degli earpods non è mai stato così florido. Nel prossimo futuro diventeremo familiari con gli smart speakers, i virtual assistant, le connected cars e l’audio augmented reality. Faremo ricerche vocali, manderemo messaggi vocali, ascolteremo podcast e audiolibri in maniera ordinaria, chiederemo al nostro assistente virtuale di fissarci appuntamenti, le nostre cuffie gestiranno il rumore esterno e riceveremo continuamente notifiche vocali, anche i nostri social network avranno una versione audio che ci permetterà di ascoltare gli ultimi post mentre facciamo jogging.
Per chiarezza espositiva, mi riferirò ai diversi attori di questo mercato dividendoli nei tre settori della filiera: gli assistenti virtuali, i device e i contenuti. E, a ben vedere, è la battaglia sul fronte degli assistenti virtuali che sta guidando l’evoluzione del settore perché questi saranno dei veri e propri gateway per l’accesso al mondo digitale e anche fisico (ricordate siamo nell’era dell’internet delle cose) come lo sono stati i browser un tempo.
La posta in gioco
Se per effettuare le mie ricerche sul web, o effettuare i miei acquisti o prenotazioni, deciderò di usare uno (o più) assistenti virtuali allora sarà probabilmente questa scelta che determinerà i risultati che riceverò e i servizi che utilizzerò. Nonostante si presuma che non sarà una guerra dove “one wins all”, ovvero che in futuro gli utenti potranno utilizzare diversi assistenti in diverse situazioni, la posta in gioco è così grande che nessun big player può permettersi di non scendere in campo, quantomeno per difendere il proprio territorio e il proprio ecosistema.
L’obiettivo numero uno è dunque conquistare una posizione rilevante nella scelta del consumatore relativamente a quale assistente usare, o meglio quale piattaforma utilizzare per gestire il proprio tempo e i propri bisogni. Indipendentemente dal fatto che ci si trovi in macchina, a casa, in ufficio o in bicicletta. Siamo di fronte ad un cambio di paradigma importantissimo e si sta affermando un nuovo modo di interagire con internet, diverso da quello basato su interfaccia visive a favore di quelle vocali. In questo senso si comprendono gli investimenti enormi nell’intelligenza artificiale e nelle tecnologie di riconoscimento e sintesi vocale effettuati da player come Amazon, Apple, Google e Microsoft.
Gli smart speakers, come Amazon Echo e Google Home (e il prossimo Apple HomePod), in questo contesto, si “riducono” ad una tattica per velocizzare la conquista e il presidio di una posizione. Da qui il motivo per cui le stime convergono su una rapida penetrazione entro il 2020 ma un seguente altrettanto rapido tasso di sostituzione ad opera delle connected cars, degli smart watches, delle connected gaming consolle, dei vari wearables ed apparati della futura smart home. Che avranno incorporato uno o più virtual assistant da richiamare al momento opportuno.
I contenuti e servizi infine dovranno adeguarsi e adattarsi a questo nuovo sistema operativo, rendersi fruibili quindi (ove possibile) anche attraverso assistenti virtuali e in modalità audio. Se si prevede, infatti, che entro il 2020 il 50% delle ricerche web saranno vocali, allo stesso tempo si presume che i social network dovranno farsi ascoltare e non semplicemente inviare notifiche per richiamare gli utenti sullo schermo. Assisteremo prevedibilmente ad un adattamento di contenuti e servizi esistenti che potranno alterare in alcuni casi le posizioni finora consolidate: un esempio a caso, non è più semplice per Twitter fornirvi un servizio audio rispetto a Facebook? Allo stesso tempo, però, si potranno aprire spazi per nuovi contenuti che in qualche modo saranno più distintivi e potranno consentire a nuove imprese e start up di affermarsi con successo.