I team delle operazioni IT gestiscono server, reti, infrastruttura cloud, esperienza utente, prestazioni delle applicazioni e sicurezza informatica, spesso lavorando indipendentemente l’uno dall’altro. Il personale è il più delle volte oberato di lavoro, gravato da avvisi di ogni genere e fatica costantemente per risolvere problemi che coinvolgono più domini.

AIOps, un fiorente campo di tecnologie e strategie che sfruttano l’intelligenza artificiale nelle operazioni IT, punta a risolvere le sfide affrontate dai team operativi IT riducendo i falsi positivi, utilizzando il machine learning per individuare i problemi prima che si verifichino, automatizzando la riparazione e adottando un approccio olistico dell’azienda.

Secondo un sondaggio di ottobre sui leader IT condotto da ZK Research e Masergy, il 65% delle aziende sta già utilizzando AIOps e il 94% afferma che AIOps è “importante o molto importante” per la gestione delle prestazioni della rete e delle applicazioni cloud. Inoltre, l’84% vede AIOps come un percorso verso un ambiente di rete completamente automatizzato e l’86% prevede di avere una rete completamente automatizzata entro i prossimi cinque anni.

Sebbene AIOps sia ancora un modello operativo molto giovane, sta già dimostrando il suo valore. Secondo un sondaggio di Enterprise Management Associates pubblicato quest’estate, il 62% delle aziende vedeva un ROI “molto alto” dagli investimenti in AIOps e il resto affermava di aver raggiunto il pareggio o che era troppo presto per dirlo.

Ma il percorso verso AIOps non è sempre agevole. Più della metà degli intervistati al sondaggio EMA ha infatti affermato che AIOps era “difficile” o “molto difficile” da implementare. Gli ostacoli più comuni segnalati dalle aziende includono costi, qualità dei dati, conflitti all’interno dell’IT, sfiducia nell’AI, mancanza di competenze e sfide di integrazione.

Mancanza di una strategia chiara prima dell’adozione

Le organizzazioni IT di oggi operano sotto pressione e può sembrare che non ci sia abbastanza tempo per una preparazione metodica. “Le organizzazioni sono generalmente a corto di tempo e con risorse limitate”, afferma John Carey, managing director presso AArete, una società di consulenza gestionale globale.

Troppo spesso, i progetti di intelligenza artificiale iniziano come esperimenti che si trasformano in opportunità. “Avete bisogno di una strategia”, dice Carey. “Il passaggio a AIOps deve essere accurato e pianificato.” Implementare una soluzione tecnologica senza prima definire chiaramente la sfida che si sta cercando di risolvere è un problema secolare per l’IT, concorda Donncha Carroll di Axiom Consulting Partners. Carroll consiglia alle aziende di dedicare del tempo per descrivere nel dettaglio la natura del problema che intendono risolvere e l’impatto che ciò avrà sull’attività. Se non lo si fa, il rischio è di ritrovarsi con una soluzione tecnologica più dannosa che altro.

Infatti, secondo il sondaggio EMA, anche se le aziende sono state universalmente positive riguardo i loro investimenti in AIOps, uno sbalorditivo 80% è alla ricerca di una nuova piattaforma e metà di esse ha intenzione di cambiare entro il prossimo anno. Le ragioni principali? Stanno cercando maggiore flessibilità, scalabilità e intelligenza artificiale, machine learning e analisi più avanzate. Cambiamenti così drastici sottolineano il fatto che le aziende spesso dimenticano di considerare il quadro più ampio per garantire che la soluzione scelta possa servire l’azienda a lungo termine. “È importante pensare allo sviluppo di una strategia completa e quindi implementarla in base ai casi d’uso”.

Dati scarsi o incompleti

Secondo il sondaggio EMA, i problemi relativi ai dati sono il secondo ostacolo più grande al successo dell’implementazione di AIOps, dopo i costi. L’intelligenza artificiale e il machine learning vivono e muoiono sui dati di addestramento. Ma i sistemi operativi legacy di un’azienda potrebbero non raccogliere dati sulle prestazioni in modo coerente. Potrebbe anche mancare di aspetti critici o riportare informazioni contraddittorie.

“Oggi il mercato è in una fase di prima generazione” afferma Gregory Murray, direttore della ricerca di Gartner. “Stiamo analizzando i dati che abbiamo perché sono i dati che abbiamo”. Qualcosa di simile è successo con i dischi rigidi. Da anni ormai, i dischi rigidi dispongono di strumentazioni e analisi che prevedono il guasto dell’unità e sono dotati esattamente della telemetria di cui hanno bisogno per fare tali previsioni.

“Al di fuori di questo caso d’uso, non avete bisogno di quei dati”, afferma Murray. La stessa cosa accadrà con AIOps. Man mano che il settore implementa la tecnologia AIOps, impareremo di più su quali dati devono essere effettivamente raccolti. “La promessa è di una maggiore accuratezza e precisione una volta che si iniziano a generare set di dati adatti allo scopo”, afferma.

Quando i dati sono disponibili, potrebbero non essere necessariamente in un formato che renda un buon set di dati di addestramento. Ad esempio, le aziende potrebbero voler sapere se una particolare modifica causerà problemi in base ai server e alle applicazioni interessate, afferma Jorge Machado, partner di McKinsey & Co. Per eseguire questa analisi, la descrizione scritta della modifica è un fattore critico.

“Se fosse scritta male, l’esecuzione dell’elaborazione del linguaggio naturale su quel testo non vi darebbe alcun spunto interessante”, afferma Machado. Cosa ancora più importante, i set di dati critici sono spesso incompleti. Ad esempio, un’azienda potrebbe voler collegare un evento ad applicazioni, reti o server pertinenti. “Ma nessun cliente ha un database di gestione delle modifiche perfetto”, afferma Machado, che aggiunge come questi problemi richiedano un lavoro significativo per essere risolti.

Copertura inadeguata

Per ottenere tutti i vantaggi di AIOps, le aziende devono portare il maggior numero possibile di sistemi sotto il suo ombrello, dato che un problema in una parte dell’ambiente può avere effetti a cascata in un’altra. Un problema di rete potrebbe effettivamente essere un problema di sicurezza informatica o un problema di user experience potrebbe essere causato da un server di database lento.

“Man mano che sempre più aziende migrano al digitale, aumentano le interdipendenze nelle applicazioni”, afferma Machado. “Se un’applicazione ha prestazioni insufficienti, è probabile che causi problemi in altri sistemi”. Ci sono molti ostacoli per superare queste difficoltà. Uno è il costo di un tale sistema e l’altro è la sfida dell’integrazione di far funzionare insieme tutte le fonti di dati rilevanti. Ci sono inoltre aspetti organizzativi che devono essere affrontati. “In definitiva, la frammentazione organizzativa determina la frammentazione degli strumenti”.

partnership Yale Tech Data Digitate

E non si tratta solo di silos IT. AIOps ha bisogno di input da altre aree del business per essere efficace. Ad esempio, se un’azienda ha un importante lancio di prodotto o una nuova campagna di marketing in corso o offre un grande sconto, potrebbe causare un picco di chiamate a un data center, mandare in tilt un sito web e portare a un crash del sistema.

“È necessario connettere non solo le prestazioni dell’applicazione e del server, ma anche gli eventi provenienti dal lato business”, continua Machado. “Le implementazioni AIOps di maggior successo che abbiamo visto hanno casi d’uso multi-dipartimentali” concorda Will McKeon-White, analista di Forrester Research. “Non solo quelli relativi all’IT, come la sicurezza informatica, ma anche le connessioni al di fuori dell’IT, come il marketing”.

Un sistema AIOps che raccoglie dati di monitoraggio degli utenti in tempo reale può diventare un servizio aziendale condiviso, afferma McKeon-White, e non solo qualcosa che aiuta ad automatizzare l’IT. “Questi sono i casi d’uso di maggior successo che abbiamo visto.”

Pagare il doppio

Un altro problema che può causare conflitti organizzativi interni è quando i singoli team o reparti hanno i propri set di strumenti preferiti e non vogliono rinunciarvi. “Sbarazzarsi di altre soluzioni di monitoraggio può essere un incubo in molte organizzazioni”, afferma McKeon-White.

Le aziende spesso scendono a compromessi, mantenendo i loro sistemi esistenti e aggiungendo una piattaforma AIOps in aggiunta a ciò. Ma questo può creare duplicazioni di funzionalità e accrescere le sfide di integrazione, oltre ad aumentare le spese. “Le organizzazioni stanno pagando una cifra significativa per questi strumenti e non ottengono il valore di cui hanno bisogno”.

Per risolvere questo dilemma, alcune aziende si stanno rivolgendo ad AIOps integrati in sistemi specifici di dominio. I sistemi di monitoraggio delle prestazioni delle applicazioni, ad esempio, utilizzano sempre più l’intelligenza artificiale e il machine learning per individuare i problemi. Anche i grandi fornitori di cloud stanno aggiungendo soluzioni di monitoraggio e automazione intelligenti, così come i fornitori di database e i fornitori di piattaforme di sicurezza informatica.

È un modo relativamente semplice per ottenere alcune funzionalità AIOps, ma a scapito della possibilità di ottenere una visualizzazione delle operazioni multidominio e multicloud. L’utilizzo delle funzionalità integrate è anche più rapido rispetto alla creazione o all’implementazione di una piattaforma AIOps completa, un progetto che in genere richiede 16 mesi o più, afferma Bradley Shimmin, capo analista per piattaforme AI, analisi e gestione dei dati presso Omdia.

“Raccogliere tutte quelle fonti di informazioni, tutti quei segnali provenienti da così tante fonti diverse (cloud, API di sensori applicativi, sensori su dispositivi fisici) richiede integrazione”, afferma Shimmin. “Questa è una sfida che le aziende devono affrontare da decenni”.

Manca il quadro generale

Le piattaforme specifiche del dominio possono fornire l’automazione nativa delle loro funzionalità e rendere gli strumenti di intelligenza artificiale trasparenti per gli utenti. Ma mentre il mantenimento dei silos evita le sfide di integrazione, le aziende non vedranno il pieno potenziale di AIOps.

“Se state cercando di fare qualcosa come l’analisi della causa principale per un aumento della latenza, dovete essere in grado di parlare con il sistema di rete e con il server delle applicazioni per avere una visione completa di tutti i diversi domini”, afferma Shimmin. Alla fine, un singolo provider cloud potrebbe offrire una gamma completa di funzionalità AIOps, cosa che potrebbe rivelarsi molto utile per le aziende che utilizzano un unico provider cloud. Ma non è qualcosa che si realizza dall’oggi al domani.

Inoltre, la maggior parte delle aziende è multicloud, afferma Simmon. In effetti, il sondaggio EMA mostra una netta preferenza per avere un’unica piattaforma AIOps interdominio. Delle aziende che hanno affermato che i loro sforzi AIOps sono stati “estremamente positivi”, l’80% utilizzava un’unica piattaforma. Delle aziende che non utilizzavano una piattaforma AIOps, il 57% ha avuto “un marginale successo”. Non sorprende quindi il fatto che, mentre solo il 46% delle aziende in generale utilizza una singola piattaforma AIOps, il resto ha intenzione di adottarne una o utilizza più di una piattaforma.

Cambiamento culturale

Infine, molte aziende stanno scoprendo che i propri dipendenti diffidano dei sistemi di intelligenza artificiale o sono riluttanti ad abbracciare un simile cambiamento. Nel sondaggio EMA, anche presso le aziende che hanno riportato il più alto livello di successo con AIOps, il 22% degli intervistati ha affermato che “la paura o la sfiducia nei confronti dell’IA” è stata una delle principali sfide per le loro iniziative AIOps, insieme alla “mancanza di competenze”.

La gestione di AIOps richiede infatti anche un diverso insieme di competenze rispetto alla gestione IT tradizionale. Le skill orientate all’intelligenza artificiale richiedono più ingegneria dei dati e la capacità di modellare algoritmi di intelligenza artificiale.

Le piattaforme AIOps si stanno evolvendo rapidamente al punto da poter prendere automaticamente decisioni operative per le aziende, come reindirizzare il traffico, riallocare le risorse e avviare nuove istanze. Quando non vengono impostate con attenzione e attenzione, tuttavia, le cose possono facilmente andare storte e, più comunemente, si possono commettere errori costosi.