La Data quality è un processo e non un’attività singola, è la somma di diversi passaggi a cui i dati vengono sottoposti al fine di estrapolarne valore con ricadute positive sia sui costi, sia sulla spinta al business.
Abbiamo trattato l’argomento in un’ottica prettamente aziendale in questo articolo, ora è utile entrare in profondità citando peculiarità e prerogative delle soluzioni presenti sul mercato, scelte pensando a diverse architetture e ad aziende di diversa dimensione.
Cominciamo con il dire che, benché esistano soluzioni on premise e sul Cloud, sono queste ultime a dovere attirare maggiormente l’attenzione.
Come scegliere il giusto software di Data quality
La quantità dei dati raccolti da un’azienda aumenta con il passare del tempo e, con questa, aumenta anche l’impiego di risorse per analizzarli e crescono di numero gli obiettivi da perseguire grazie ai dati stessi. Questo assunto già dirige la scelta di un software di Data quality verso il Cloud, privilegiando quelle piattaforme che integrano strumenti per la qualità dei dati e che permettono la collaborazione di più persone (anche fisicamente dislocate in succursali diverse della medesima impresa).
Per scegliere la soluzione software migliore è utile identificare le necessità aziendali, partendo da:
· gli obiettivi da raggiungere grazie ai dati
· comprendere quali strumenti sono necessari valutando gli stessi obiettivi e la disponibilità di dati aziendale. Questo comporta una conoscenza di massima degli strumenti per la Data quality, è quindi utile coinvolgere persone non del tutto nuove all’argomento
· valutare le politiche di prezzo adottate dai diversi fornitori soltanto dopo avere fissato parametri di ROI, soprattutto quando si vuole usare i dati per scopi di marketing. Più che la spesa che si prospetta è necessario valutare la sempreverde ratio tra costi e benefici.
I tool e i software per la Data quality non sono tutti uguali e non hanno tutti il medesimo prezzo, non dovrebbe però essere soltanto quest’ultimo a pilotare la decisione finale, proprio perché uno dei vantaggi della cultura Data-driven è quello di aumentare produttività e precisione nel business. La Data quality non è una spesa, è un investimento.
Le funzionalità chiave dei software di data quality: una guida dettagliata
Tra le funzionalità auspicate che abbiamo citato nell’articolo citato e linkato sopra, ce ne sono tre che non devono mancare in nessun modo.
· Profilazione dei dati: è l’insieme delle funzionalità che determinano le caratteristiche e le condizioni dei dati che l’azienda possiede. Questa parte del processo di Data quality consente all’azienda di prendere le misure con i dati e i record specifici di cui dispone e consente di applicare (e se necessario sviluppare) standard e norme di conformità secondo le necessità dell’impresa stessa
· preparazione dei dati: è il processo relativo alla pulizia, alla standardizzazione, alla trasformazione e all’eventuale arricchimento dei dati. Operazioni necessarie per estrarre valore dai dati e per alimentare elaborazioni e algoritmi
· monitoraggio del ciclo di vita dei dati: detta stewardship, copre i dati dall’acquisizione all’archiviazione, passando per tutti gli step intermedi. Consente la governance dei dati, quindi anche l’applicazione di policy e il loro impiego nei processi aziendali
Dietro a ogni processo aziendale c’è prima di ogni altra cosa un esercizio organizzativo congiunto a cui devono prendere parte tutte le persone interessate, senza lesinare sul coinvolgimento di esperti laddove le risorse interne non fossero sufficientemente preparate.
Come utilizzare i tool di Data quality per migliorare la qualità dei dati aziendali
I dati così come sono possono non essere sufficienti. È necessario sottoporli a un percorso di pulizia, arricchimento e standardizzazione. Poiché tendono a provenire da diverse fonti e in diversi formati, questi vanno verificati, resi omogenei, ne vanno comprovate consistenza, puntualità e usabilità.
La qualità dei dati coincide con il valore che è possibile estrarne e, in un momento storico nel quale i dati abbondano e vengono generati in modo sempre più copioso, è impossibile prendere decisioni che fanno leva su informazioni non corrette o non all’altezza.
La qualità riduce i costi causati dall’impiego di dati sbagliati e permette di prendere decisioni sapendo di potere contare su modelli, considerazioni e osservazioni che i dati suggeriscono.
Data quality software: i tool supportano acquisizione e fidelizzazione dei clienti
I dati provengono da diversi canali e conoscere le abitudini e i gusti dei clienti è una carta vincente per offrire loro la migliore esperienza d’acquisto possibile. Non soltanto: tutto ciò può essere fatto anche in prospettiva, sapendo leggere le loro richieste quasi in tempo reale, grazie a tecniche predittive che ne anticipano i bisogni futuri. Tutto ciò non è possibile senza dati di qualità da inserire nei processi aziendali e può sembrare un compito poco impegnativo ma, riflettendo sul fatto che il flusso di dati è pressoché ininterrotto, gli aspetti fondamentali della Data quality diventano ancora più utili, se non persino necessari.
Data quality software per il marketing
Il discorso si avvicina molto a quello relativo all’acquisizione dei clienti e alla loro fidelizzazione. La creazione di campagne efficaci coincide con la capacità di un’azienda di segmentare il mercato e categorizzare i clienti. Operazioni che possono essere fatte al meglio soltanto con dati sufficienti dal punto di vista qualitativo e da quello quantitativo.
È soprattutto nell’ambito del marketing (che va dallo sviluppo alla vendita del prodotto) che un’azienda dovrebbe individuare dei Kpi e ragionare in termini di Roi. Una campagna pubblicitaria basata su dati non completi o non corretti ha un costo molto più alto rispetto alla medesima campagna dotata di informazioni solide, reali e attuali.
La data quality software per il settore sanità
Argomento molto vasto che merita approfondimenti maggiori. In quest’ambito, la Data quality si manifesta immediatamente proprio perché deve adeguarsi alle necessità più urgenti di ogni singolo paziente e, anche se si guarda alla sanità come l’insieme delle strutture e delle discipline, queste non possono essere scollate dalla realtà e dall’attualità, devono essere puntuali per spingere nel modo più immediato la transizione verso la sanità digitale la quale, per funzionare al meglio, deve potere contare su un traffico di informazioni multicanale e questo rimanda con prepotenza alla necessità di avere e generare dati di qualità e alla necessità di costante monitoraggio dei dati stessi.
Quando si parla di sanità occorre mettere un’enfasi particolare sulla compliance dei dati.
Data quality software e compliance
Compliance è una parola ampia che si presta a ogni comparto aziendale o sociale. Vale tanto per il marketing quanto per la sanità, anche se quest’ultima è particolarmente suscettibile.
I software di Data quality devono adempiere alla protezione dei dati secondo le norme nazionali e quelle sovranazionali, oltre ad avere sistemi di anonimizzazione e mascheramento delle informazioni le quali devono essere crittografate.
Non da ultimo devono adeguarsi in modo elastico ai cambiamenti normativi e prevedere procedure adeguate di Opt-in.
L’integrazione dei software di Data quality con altre soluzioni aziendali
Uno dei vantaggi offerti dalla Data quality è la possibilità di misurarne la qualità prima di immetterli nei sistemi in uso all’azienda. Monitorare i dati che provengono tanto dai software interni quanto dal web, dalle app per dispositivi mobili o da risorse Cloud è tutt’altro che scontato.
Rilasciare dati errati all’interno dell’azienda equivale a un’autorete con ricadute su tutti i comparti raggiunti dai dati stessi ed è proprio per questo motivo che i software di Data quality devono potere esaminare qualsiasi tipo di dato, in qualsiasi formato esso sia e qualsiasi sia la sua provenienza.
In aggiunta è necessario monitorare i dati all’interno dell’azienda per tutto il loro ciclo di vita e, anche per questo motivo, il tempo per i software aziendali che lavorano in modo isolato (al riparo da possibilità di collaborazioni) sta volgendo al termine. Tutto ciò rimanda sia a soluzioni Data quality in Cloud sia alla necessità di adottare, in futuro, software aziendali anche in base alla loro capacità di mettere i dati a disposizione di altre applicazioni.
Partendo anche da questo assunto, abbiamo provato sette software di Data quality, tenendo conto delle diverse necessità con cui un’azienda può essere confrontata.
Informatica Master Data Management
Una soluzione modulare che si adatta alle esigenze più disparate di piccole e grandi organizzazioni. La piattaforma Master Data Management consente di trasformare dati provenienti da fonti diverse, di rintracciare errori e duplicati e, grazie ad algoritmi AI e di Machine learning facilita l’integrazione dei dati nei processi aziendali.
Esistono due versioni della piattaforma, una sul Cloud e una on-premise, da installare su server aziendali. Il prezzo varia a seconda del modulo scelto, è però possibile vederlo all’opera.
Oracle Data Catalog
Piattaforma Cloud dedita alla gestione dei metadati e che permette quindi alle imprese di organizzare le informazioni in base alla propria filosofia di governance. Oracle Data Catalog facilita le operazioni di selezione dei dati e suggerisce quali azioni intraprendere per ottimizzarli. Una soluzione che può essere provata gratuitamente e che, per quanto riguarda le politiche di prezzo, rientra nell’abbonamento ai servizi Oracle Cloud Infrastructure.
OpenRefine
Tool gratuito che molti hanno conosciuto con il nome di Google Refine, OpenRefine è uno strumento molto valido per fare ordine tra i dati, pulirli e trasformarli in un formato diverso da quello di origine. Supporta grandi quantità di dati provenienti da qualsivoglia fonte e li elabora in locale, quindi sulla macchina dell’utente, offrendo così un vantaggio in più nel rispetto della privacy. È adatto anche alla riconciliazione dei dati provenienti da due dataset gemelli, cosa questa molto comoda per quelle aziende che hanno necessità di duplicare alcuni database.
SAP Master Data Governance
Un hub che funge da collettore di tutti i dati in possesso di un’azienda e permette la loro consolidazione partendo da regole di governance flessibili, mettendo a disposizione di chi ne fa uso una vasta libreria di modelli e policy da usare o modificare. Misura la performance dei dati e, oltre alla versione Cloud, ne esiste una da installare on-premise.
I prezzi partono da 56 dollari al mese per la versione in Cloud (50 euro circa) ed entrambe le versioni possono essere provate gratuitamente.
Collibra, The Data Intelligent Cloud
Strumento Cloud indicato a quelle aziende e organizzazioni che necessitano di identificare valore nei dati provenienti da diverse fonti. Collibra si concentra su organizzazioni di qualsiasi grandezza ma che hanno una spiccata cultura Data-driven e, per coadiuvare la transizione culturale all’importanza della Data quality, mette a disposizione anche un libro bianco a cui vale la pena dare un’occhiata. L’ampia libreria di Api è strutturata per favorire l’integrazione dei dati in qualsiasi applicativo.
Ha una spiccata vocazione per il marketing ma, grazie alla demo gratuita, è possibile valutarne le potenzialità.
Boardana
Dal Cloud per il Cloud, la soluzione offerta da Boardana fornisce un set di tool completo per la pulizia, validazione e l’arricchimento dei dati ed è, nella sua formula standard, già predisposta a interagire con le piattaforme web e di Cloud computing più diffuse, tra le quali CRM, Salesforce e la suite di Office 365. I prezzi variano a seconda delle necessità e vanno dai 9 dollari ai 50 dollari al mese laddove le formule gratuite offerte non dovessero essere sufficienti.
ImportOmatic
Nata per strizzare l’occhio alle onlus, ImportOmatic è una piattaforma che può essere usata da qualsiasi azienda che rileva e preleva dati da diverse fonti e, prima di importarli al proprio interno, necessita di applicare criteri per la pulizia e la standardizzazione delle informazioni. Gli strumenti per l’integrazione dei dati sono uno dei punti forti di questa soluzione, il cui prezzo è legato alle necessità del cliente e che, in ogni caso, può essere valutata richiedendo una demo.