Le aziende veramente basate sui dati ottengono risultati di business significativamente migliori rispetto a quelle che non lo sono. Secondo un recente white paper di IDC, le aziende con una solida strategia dei dati hanno ottenuto in media risultati due volte e mezzo migliori in molti parametri aziendali. In particolare, le aziende leader nell’utilizzo di dati e analisi hanno ottenuto un miglioramento dei ricavi tre volte superiore, hanno quasi tre volte più probabilità di abbreviare i tempi di commercializzazione di nuovi prodotti e servizi e più del doppio di probabilità di segnalare miglioramenti in soddisfazione del cliente, profitti ed efficienza operativa.

Per ottenere il massimo valore dai dati e dall’analisi le aziende devono avere una cultura basata sui dati che permei l’intera organizzazione, in cui ogni unità aziendale abbia pieno accesso ai dati di cui ha bisogno nel modo in cui ne ha bisogno.

Questo si chiama “democratizzazione dei dati”. Farlo bene richiede una raccolta di dati ponderata, un’attenta selezione di una piattaforma di dati che consenta un accesso olistico e sicuro ai dati e formazione e responsabilizzazione dei dipendenti affinché abbiano una mentalità incentrata sui dati. Oltre a gestire i rischi per la sicurezza e la conformità.

Partire da una solida base di dati

Prima di scegliere una piattaforma per la condivisione dei dati, un’organizzazione deve capire di quali dati dispone già e pulirli da errori e duplicati.

Gran parte della preparazione dei dati da condividere è un esercizio di normalizzazione dei dati”, afferma Juan Orlandini, chief architect presso Insight Enterprises. “I formati e le architetture dei dati sono spesso incoerenti e i dati possono essere incompleti. Questo può portare a trarre informazioni errate o fuorvianti da quei dati“.

Le organizzazioni spesso si rivolgono all’esterno per la normalizzazione dei dati perché, se eseguita in modo errato, può causare problemi di qualità dei dati, che diventano inutilizzabili.

Man mano che sempre più aziende utilizzano il cloud e lo sviluppo nativo in cloud, la normalizzazione dei dati è diventata più complicata.

I dati possono trovarsi in un database NoSQL, un database grafico o in altri tipi di database ora disponibili, e renderli coerenti diventa davvero impegnativo“, afferma Orlandini.

Selezionare attentamente la piattaforma

Nelle organizzazioni che non praticano la democratizzazione dei dati generalmente solo l’IT ha accesso ai dati e agli strumenti di data intelligence. Quindi, per rendere i dati accessibili a tutti, sono necessari nuovi strumenti e tecnologie.

Naturalmente, il costo è una considerazione importante”, afferma Orlandini, “così come decidere dove ospitare i dati e averli a disposizione in modo fiscalmente responsabile”. Un’organizzazione potrebbe anche chiedersi se i dati debbano essere mantenuti in locale a causa di problemi di sicurezza nel cloud pubblico.

Secondo Kevin Young, consulente senior di dati e analisi presso la società SPR, le organizzazioni possono prima condividere i dati creando un data lake attraverso Amazon S3 o Google Cloud Storage. “I membri di tutta l’organizzazione possono aggiungere i propri dati al lake affinché tutti i reparti possano usarli“, afferma Young. Ma senza un’adeguata cura, un data lake può finire per essere disorganizzato e pieno di dati inutilizzabili.

I data lake non sono l’unica opzione per creare un repository di dati centralizzato.

Data fabric

Un altro è attraverso un data fabric, un’architettura e un set di servizi che forniscono una visione unificata dei dati di un’organizzazione e consentono l’integrazione da varie fonti on-premise, cloud e dispositivi edge.

Un data fabric consente di combinare i set di dati senza la necessità di eseguire copie e può prevenire la creazione di silos.

Esistono molti software di data fabric, come IBM Cloud Pak for Data e SAP Data Intelligence, che sono stati entrambi nominati leader nel report Enterprise Data Fabric Q2 2022 di Forrester. Ma con molte opzioni disponibili, può essere difficile sapere quale scegliere.

La cosa più importante è analizzare e monitorare i dati”, afferma Amaresh Tripathy, leader globale di analisi presso la società di servizi professionali Genpact. “Le caratteristiche base di una piattaforma sono che dovrebbe essere automatizzata e visibile”. Inoltre, i dati dovrebbero essere facilmente accessibili da una piattaforma self-service che semplifichi il reporting dell’analisi dei dati, anche per le persone senza esperienza tecnica. “Come un portale in cui le persone possono vedere tutti i dati, cosa significano, quali sono le metriche, e da dove provengono”, dice Tripathy.

Non esiste uno strumento perfetto e spesso c’è un compromesso tra il modo in cui uno strumento esegue la derivazione, la catalogazione e mantiene la qualità dei dati. “La maggior parte delle organizzazioni sta cercando di risolvere tutti e tre i problemi insieme. A volte privilegiare un aspetto significa abbassare il valore di un altro”, aggiunge Tripathy. “Quindi un’azienda dovrebbe decidere cosa è più importante per le sue esigenze, stabilire quale strumento offre il miglior rapporto qualità-prezzo su quelle tre dimensioni, e quindi prendere la decisione appropriata“.

Data mesh

Quando si pensa a come condividere i dati, si può anche prendere in considerazione l’implementazione di un data mesh, che adotta l’approccio opposto al data fabric. Mentre il data fabric gestisce più origini dati da un singolo sistema centralizzato virtuale, un’architettura data mesh adotta un approccio decentralizzato e crea più sistemi specifici del dominio.

Con una rete di dati, le aziende possono garantire che i dati vengano gestiti correttamente mettendoli nelle mani di coloro che li comprendono meglio”, afferma Chris McLellan, direttore delle operazioni presso Data Collaboration Alliance, un’organizzazione no profit globale che aiuta le persone e le organizzazioni ad avere il pieno controllo di i loro dati. “Potrebbe essere una persona, come il responsabile delle finanze, o un gruppo di persone più vicine alle normative, al cliente e agli utenti finali”.

Alla base di questa architettura c’è il concetto di dati come prodotto“, spiega. “E un prodotto di dati è qualcosa che può essere posseduto e curato da qualcuno con esperienza nel settore”.

Il data mesh non è collegato a nessuno strumento specifico, quindi i singoli team possono scegliere quello che meglio si adatta alle loro esigenze e non si crea il collo di bottiglia dovuto al passaggio attraverso un team centrale.

Assistiamo a un decentramento non solo dell’IT o della distribuzione delle app, ma anche della gestione e della governance dei dati”, afferma McLellan, “il che è positivo perché i professionisti del marketing conoscono le leggi sulla protezione dei consumatori meglio del team IT, per esempio”.

Sebbene ci siano molti fornitori che vendono data mesh, Forrester avverte che è ancora un oggetto nuovo e presenta le sue sfide, inclusi i conflitti nel modo in cui è definito, le tecnologie che utilizza e il suo valore.

Formazione e gestione del cambiamento

Una volta definita un’architettura per la democratizzazione dei dati, i dipendenti devono capire come lavorare con i nuovi processi. “Alle persone possono essere forniti i dati giusti, ma anche se sono amministratori o contabili, non capiranno necessariamente come usarli”, afferma Orlandini di Insight. L’accesso ai dati non è di per sé sufficiente per rendere un’organizzazione guidata dai dati.

Alcune organizzazioni hanno avviato i propri programmi di formazione interni per garantire che i dipendenti capiscano come interpretare e gestire correttamente i dati.

Genpact, per esempio, l’anno scorso ha introdotto una iniziativa denominata DataBridge per aumentare l’alfabetizzazione dei dati in tutta l’organizzazione.

La nostra intenzione non era trasformare 100.000 cittadini in data scientist, ma fornire consapevolezza nel contesto di come svolgono il loro lavoro”, afferma Tripathy. Per esempio, una persona che esegue l’analisi degli incidenti non ha bisogno di imparare tutto sul rilevamento delle anomalie: ciò che deve capire è cosa significa per loro il rilevamento delle anomalie. “Potresti avere o meno tutte le competenze per esaminare i dati da solo, ma dovresti essere in grado di sollevare una domanda e cercare aiuto”, aggiunge. “Ed essere in grado di porre quella domanda nel modo giusto è l’aspetto della consapevolezza dei dati”.

Gettare le basi per la sicurezza e la conformità

Una corretta governance dei dati deve essere implementata fin dall’inizio per mantenere l’integrità dei dati ed evitare costose sanzioni.

I team di sicurezza e conformità devono essere parte della conversazione iniziale insieme ai responsabili IT”, afferma Orlandini di Insight. “È una grande sfida ed è un prerequisito che il management di un’azienda capisca esattamente cosa stanno offrendo di condividere e si assicuri che venga offerto alle persone giuste”.

Viviamo in un mondo altamente regolamentato in cui dobbiamo stare molto attenti“, sottolinea, “specialmente in settori come l’assistenza sanitaria e la finanza dove ci sono leggi che hanno gravi conseguenze se la persona sbagliata accede ai dati sbagliati“.

Esistono anche strumenti che aiutano le organizzazioni con il mascheramento e l’offuscamento dei dati per evitare di rivelare informazioni di identificazione personale. “Puoi iniziare a ottenere approfondimenti senza rivelare dati PII (Personally Identifiable Information), record HIPAA o nessuno di quei requisiti normativi disponibili“, continua. “Esistono anche strumenti con controlli di accesso basati sugli attributi in cui si etichettano i dati con tipi di attributi molto specifici, e consentono l’accesso solo ai dati con il giusto tipo di attributi associati”.

In questo modo, i dati vengono controllati automaticamente e resi disponibili in un cloud pubblico o in un ambiente ibrido, o anche in ambienti privati ​​dove possono essere messi in atto severi controlli di conformità.

Vantaggi a lungo termine

La democratizzazione dei dati non solo aiuta un’azienda ad accelerare le proprie pipeline di dati, ma consente alle persone di trovare nuovi modi per risolvere i problemi attraverso una migliore consapevolezza di come analizzare e lavorare con i dati.

Gartner afferma che, adottando la democratizzazione dei dati, le organizzazioni possono risolvere la carenza di risorse, ridurre i colli di bottiglia e consentire alle unità aziendali di gestire più facilmente le proprie richieste di dati. Democratizzando i dati, le organizzazioni possono migliorare il loro processo decisionale consentendo a più persone di contribuire all’analisi e all’interpretazione dei dati; aumentare la collaborazione tra i team; migliorare la trasparenza, poiché più persone hanno accesso alle informazioni e possono vedere come vengono prese le decisioni basate sui dati.

Maria Korolov e Alex Korolov