Cos’è DataOps? Un’analisi collaborativa e interfunzionale

DataOps è una disciplina emergente che riunisce i team DevOps con ruoli di ingegnere dei dati e scienziato dei dati per fornire gli strumenti, i processi e le strutture organizzative per supportare le aziende data-driven.

Infrastrutture

DataOps è una metodologia agile e orientata ai processi per lo sviluppo e la fornitura di analytics. Riunisce team DevOps con data engineer e data scientist per fornire gli strumenti, i processi e le strutture organizzative per supportare l’azienda incentrata sui dati. Michele Goetz, vicepresidente e analista principale di Forrester, definisce DataOps come “la capacità di abilitare soluzioni, sviluppare prodotti di dati e attivare i dati per il valore aziendale su tutti i livelli tecnologici, dall’infrastruttura all’esperienza”.

Obiettivi di DataOps

Secondo Dataversity, l’obiettivo di DataOps è semplificare la progettazione, lo sviluppo e la manutenzione di applicazioni basate su dati e analisi dei dati, cercando di migliorare il modo in cui i dati vengono gestiti e i prodotti vengono creati e di coordinare questi miglioramenti con gli obiettivi dell’azienda.

DataOps vs. DevOps

DevOps è una metodologia di sviluppo software che offre la fornitura continua al ciclo di vita dello sviluppo dei sistemi combinando team di sviluppo e team operativi in un’unica unità responsabile di un prodotto o servizio. DataOps si basa su questo concetto aggiungendo specialisti dei dati per concentrarsi sullo sviluppo collaborativo dei flussi di dati e sull’uso continuo dei dati in tutta l’organizzazione.

Principi di DataOps

adv

Come DevOps, DataOps prende spunto dalla metodologia agile. L’approccio valorizza la fornitura continua di approfondimenti analitici con l’obiettivo principale di soddisfare il cliente. Secondo il Manifesto DataOps, i team DataOps misurano le prestazioni dell’analisi dei dati in base alle informazioni fornite. I team di DataOps cercano inoltre di comprendere costantemente le esigenze dei clienti in evoluzione. Si auto-organizzano intorno agli obiettivi e cercano di ridurre l ‘”eroismo” a favore di team e processi sostenibili e scalabili.

I team DataOps cercano anche di orchestrare dati, strumenti, codice e ambienti dall’inizio alla fine, con l’obiettivo di fornire risultati riproducibili. I team DataOps riflettono regolarmente sul feedback fornito dai clienti, dai membri del team e dalle statistiche operative.

Le aziende oggi inseriscono sempre più il machine learning in una vasta gamma di prodotti e servizi e DataOps è un approccio orientato proprio a supportare le esigenze end-to-end del machine learning. L’approccio DataOps non si limita comunque a ciò, ma si adatta bene alle architetture di microservizi ed è utile per qualsiasi lavoro orientato ai dati, rendendo più facile sfruttare i vantaggi offerti dalla costruzione di un data fabric globale.

DevSecOps

DataOps in pratica

Per ottenere il massimo da DataOps, le aziende devono evolvere le proprie strategie di gestione dei dati per gestirli su larga scala e in risposta agli eventi del mondo reale mentre si verificano. Poiché DataOps si basa su DevOps, i team interfunzionali che si adattano a skill come operazioni, ingegneria del software, architettura e pianificazione, gestione del prodotto, analisi dei dati, sviluppo dei dati e ingegneria dei dati sono essenziali e i team DataOps dovrebbero essere gestiti in modi che garantiscano una maggiore collaborazione e comunicazione tra sviluppatori, professionisti delle operazioni ed esperti di dati.

Come costruire un team DataOps

La maggior parte delle aziende basate su DevOps dispone già del nucleo di un team DataOps. Dopo aver identificato i progetti che richiedono uno sviluppo ad alta intensità di dati, è sufficiente aggiungere al team qualcuno che abbia una formazione sui dati. Quella persona potrebbe persino essere un ingegnere dei dati piuttosto che un vero scienziato dei dati. Spesso, i team saranno costituiti da individui con skillset sovrapposti o gli individui possono assumere più ruoli a seconda delle competenze.

In progetti su larga scala, un particolare ruolo DataOps può essere ricoperto da più di una persona, ma è anche comune che alcune persone ricoprano più di un ruolo. Le capacità operative e di ingegneria del software possono sovrapporsi; i membri del team con esperienza di ingegneria del software possono anche essere qualificati come ingegneri dei dati. Spesso, i data scientist hanno capacità di ingegneria dei dati. È raro, tuttavia, vedere una sovrapposizione tra scienza dei dati e operazioni.

Secondo Goetz alcune delle principali aree di competenza dei team DataOps includono:

  • Database
  • Integrazione
  • Dati per elaborare l’orchestrazione
  • Implementazione della policy dei dati
  • Dati e integrazione dei modelli
  • Sicurezza dei dati e controlli sulla privacy

Indipendentemente dalla composizione, i team DataOps devono condividere un obiettivo comune: le esigenze guidate dai dati dei servizi che supportano. Con team di bravi ingegneri bisogna impostare bene gli obiettivi. Una volta raggiunto un obiettivo comune come la risoluzione di un problema, il team si organizza molto spesso per risolverlo.

La difficoltà arriva quando persone diverse vedono aspetti diversi del problema. Gli “operativi” sono preoccupati dell’affidabilità e che si ottenga un risultato entro un certo tempo. La persona che si occupa di scienza dei dati tende invece a concentrarsi sull’accuratezza della risposta. Già qui possono nascere un po’ di divergenze, ma se i due stanno cercando di risolvere lo stesso problema e sono disposti a scendere a compromessi, è decisamente la soluzione migliore.

Ruoli DataOps

Secondo Goetz, i membri del team di DataOps includono:

  • Specialisti dei dati che supportano il panorama dei dati e le best practice di sviluppo
  • Ingegneri dei dati che forniscono supporto ad hoc e di sistema per BI, analisi e applicazioni aziendali
  • Principali ingegneri dei dati, ovvero sviluppatori che lavorano su prodotti e risultati finali rivolti ai clienti

 

Se questo articolo ti è stato utile, e se vuoi mantenerti sempre aggiornato su cosa succede nell’industria ICT e ai suoi protagonisti, iscriviti alle nostre newsletter:

CWI: notizie e approfondimenti per chi acquista, gestisce e utilizza la tecnologia in azienda
CIO:
approfondimenti e tendenze per chi guida la strategia e il personale IT
Channelworld: notizie e numeri per distributori, rivenditori, system integrator, software house e service provider

Iscriviti ora!