Hewlett-Packard Enterprise (HPE) ha annunciato l’acquisizione di Pachyderm, una startup californiana specializzata in software open source di “reproducible AI” per semplificare lo sviluppo di applicazioni di Artificial Intelligence su larga scala (AI-at-scale). Più precisamente Pachyderm – che è nata nel 2014, e ha sede a San Francisco, con una sessantina di addetti in 4 paesi – propone una piattaforma che automatizza la preparazione dei “training dataset” utilizzati per istruire le reti neurali a individuare i pattern di interesse in grandi volumi di informazioni.

I training dataset devono essere preparati per questo utilizzo, eliminando duplicazioni ed errori e omogeneizzando i formati in modo da ridurre le risorse di elaborazione necessarie. Questo lavoro di preparazione è svolto con workflow automatizzati chiamati “data pipeline”, e Pachyderm appunto offre una piattaforma software che facilita lo sviluppo di “data pipeline”, e che può girare sia sulle principali piattaforme di public cloud, sia su infrastrutture on-premise delle aziende.

HPE aveva già investito in Pachyderm circa un anno fa, attraverso la sua divisione di venture capital HPE Pathfinder. Nella sua storia, Pachyderm ha raccolto circa 28 milioni di dollari di finanziamenti, in vari round.

HPE ha precisato che la transazione, i cui termini finanziari non sono stati resi noti, non è soggetta all’approvazione delle autorità di regolamentazione, per cui dovrebbe concludersi entro gennaio.

L’obiettivo dell’acquisizione, specifica HPE in un comunicato, è di integrare il software di Pachyderm nelle proprie soluzioni di supercomputing e AI – in particolare HPE Machine Learning Development Environment – per automatizzare la produzione di pipeline riproducibili di machine learning per applicazioni AI di larga scala, e permettere così di costruire modelli AI più accurati accorciando i tempi tra le fasi di POC e produzione.

“Man mano che i progetti AI diventano più grandi e impiegano data set sempre più complessi, i data scientist hanno bisogno di soluzioni AI riproducibili per massimizzare i risultati delle iniziative di machine learning e ottimizzare i costi di infrastruttura, e per assicurarsi che i dati siano affidabili e sicuri in qualunque fase del loro percorso di AI”, dichiara nel comunicato Justin Hotard, executive VP e general manager HPC e AI di HPE. “Il software di reproducibile AI di Pachyderm migliora la capacità dell’attuale offerta di AI su larga scala di HPE di automatizzare e accelerare i progetti di AI, e apre maggiori opportunità nella AI generativa di immagini, video e testi”.

Le capacità di AI su larga scala (AI-at-scale), spiega HPE, sono decisive per i casi d’uso dell’AI che comprendono elaborazioni su immagini, video e linguaggio naturale che si stanno moltiplicando in vari settori, tra cui trasporti, biologia, difesa, servizi finanziari e manifatturiero. IN quest’ambito, l’integrazione delle tecnologie Pachyderm in HPE comporterà benefici di:

– Data Lineage: visibilità sull’origine del dato e del suo percorso nel processo di machine learning

– Data Versioning: capacità di tracciare diverse versioni del dato per risalire a creazioni e cambiamenti

– efficienza nel data processing incrementale: capacità di aggiornamento delle applicazioni AI attraverso la sola elaborazione dei dei dati che hanno subito variazioni nel tempo, senza la necessità di rielaborarli tutti.

Nel comunicato, HPE cita anche un caso utente, quello della AI Factory di Lockheed Martin, un progetto di AI su larga scala che integra il software di Pachyderm e l’HPE Machine Learning Development Environment, insieme ad altre soluzioni.

L’annuncio dell’acquisizione di Pachyderm arriva dopo che a fine dicembre HPE aveva smentito ufficialmente con una dichiarazione di un portavoce al sito CRN le voci di trattative in corso per l’acquisizione di Nutanix, riportate anche da Bloomberg.