Brocade ha di recente ha stretto una partnership con CERN openlab, il laboratorio tecnologico, realizzato in collaborazione tra il più importante centro di ricerca scientifica al mondo e le più importanti aziende che operano in campo ICT.

Lo scopo dell’openlab è di accelerare lo sviluppo delle soluzioni altamente tecnologiche necessarie alla gestione degli esperimenti e alla raccolta, archiviazione ed elaborazione dei dati raccolti. Brocade, che era già fornitore tecnologico del CERN, sarà coinvolta soprattutto nell’evoluzione a lungo termine dell’architettura di rete del centro.

Vista l’enorme mole di dati raccolti durante ogni esperimento, la rete deve essere efficiente, scalabile e flessibile. L’approccio scelto è quindi basato sul “New IP” e su un framework di applicazioni di Software Defined Networking per ottimizzare il routing del traffico dati in entrata e in uscita. Brocade inoltre realizzerà interfacce utente potenziate per permettere ai ricercatori di visualizzare tabelle e rappresentazioni grafiche in tempo reale e informazioni storiche sul traffico di rete.

(foto: © 2010-2015 CERN)
(foto: © 2010-2015 CERN)

La soluzione SDN sarà basata su OpenFlow e utilizzerà il Brocade SDN Controller e l’applicazione Brocade Flow Optimizer per migliorare le prestazioni della rete ed evitare congestioni in modo proattivo. La soluzione utilizzerà anche i router Brocade MLXe e gli switch ICX, abilitati a OpenFlow.

La presenza di ricercatori e tecnici italiani è forte al CERN, si sa. Non sorprende più di tanto il trovare due italiani anche nelle posizioni chiave relative a questo progetto. A capo dell’openlab troviamo infatti Alberto Di Meglio, genovese di 48 anni laureato in ingegneria aerospaziale e Ph.D in ingegneria elettrica ed elettronica, mentre il team di ingegneria della rete è guidato da Edoardo Martelli, classe 1969 di Cento, in provincia di Ferrara con un master in Informatica conseguito all’Università di Bologna.

Li abbiamo contattati chiedendo loro di spiegarci più in dettaglio come funziona openlab, quali sfide tecnologiche sta affrontando e che tipo di arsenale informatico abbiano messo in campo per vincerle. Ecco cosa ci hanno raccontato.

CWI: Che cos’è il CERN openlab e quali servizi fornisce al CERN e al progetto Large Hadron Collider?

Alberto Di Meglio: Il CERN openlab è una collaborazione tra ingegneri del progetto LHC (acceleratore, esperimenti e infrastruttura di calcolo) e società leader mondiali nei settori delle tecnologie dell’informazione.

Alberto Di Meglio, Head of CERN openlab
Alberto Di Meglio, Head of CERN openlab. (foto: ©CERN openlab)

Il nostro obbiettivo è di definire quali saranno i requisiti tecnici nei prossimi 3-5 anni e definire progetti di ricerca e sviluppo per capire come le tecnologie informatiche evolveranno e per spingerle nella direzione giusta per l’LHC.

Un tipico progetto CERN openlab è composto di un supervisore del CERN, esperti di una o più società, personale dedicato al progetto, una serie di obiettivi e una durata prefissata da uno a tre anni per raggiungerli.

Ai progetti tecnici affianchiamo un servizio di comunicazione e organizzazione di eventi e un programma educativo molto competitivo dedicato a studenti di materie tecniche e scientifiche aperto a università di tutto il mondo.

Dobbiamo capire i requisiti tecnici nei prossimi 3-5 anni e definire progetti di R&D per capire e spingere l’evoluzione delle tecnologie informatiche nella direzione giusta per l’LHC

Quest’anno il nostro programma di Summer Students ha ricevuto quasi 1600 richieste per 40 posti disponibili. La collaborazione aperta tra scienza e industria è uno degli strumenti più importanti per avanzare le tecnologie a beneficio di tutti. Non solo nella fisica delle particelle, ma anche in campi come le scienze biologiche, la medicina e la ricerca ambientale, dove CERN openlab contribuisce in misura crescente.

CWI: Quali sono le sfide tecnologiche più importanti che affrontate? Quanti dati vengono raccolti e archiviati tipicamente in un esperimento?

ADM: Per prepararci alla Fase V del CERN openlab (2015-2017) abbiamo identificato sei aree maggiori di ricerca. Le aree vanno dall’acquisizione dati ad altissima velocità, allo sviluppo di software ottimizzato per piattaforme di calcolo multi-core, dal data storage al cloud computing, ottimizzazione e sicurezza delle reti, data analytics e machine learning applicate all’analisi fisica e alle operazione dell’acceleratore.

0804041_22-A5-at-72-dpi
(foto: © 2010-2015 CERN)

I dati generati alla velocità di 1 PB/s vanno digitalizzati, filtrati, ridotti, analizzati, immagazzinati e condivisi con centinaia di centri di ricerca

I detector dei quattro esperimenti LHC generano oggi collettivamente dati alla velocità di 1 petabyte per secondo (PB/s). Questo flusso incredibile di dati va digitalizzato, filtrato e ridotto, analizzato, immagazzinato e condiviso con centinaia di centri di ricerca nel mondo.

Durante la prima fase dell’LHC, gli esperimenti hanno prodotto più di 25 PB di dati all’anno, composti di dati grezzi, risultati delle analisi e simulazioni. I progetti del CERN openlab aiutano a capire come permettere nei prossimi anni la gestione di quantità di dati da cinque a dieci volte superiori.

CWI: Che tipo di infrastruttura è stata messa in piedi per gestire un carico simile?

(foto: © 2010-2015 CERN)
(foto: © 2010-2015 CERN)

Edoardo Martelli: Dopo il primo filtraggio, i quattro detector inviano i dati da analizzare al centro di calcolo, a cui sono collegati con una rete capace di 260 Gbps. Il centro di calcolo dispone di 190 PB di storage su disco e 155 PB su nastro, su cui vengono salvati i dati provenienti dai detector.

I dati sono poi in parte analizzati in loco dalla server farm che dispone di 150.000 core CPU, mentre la parte restante è analizzata nei centri di calcolo degli istituti partner intorno al mondo, ai quali il CERN è collegato con un insieme di reti la cui capacità aggregata è di 650 Gbps.

La rete del centro di calcolo è composta da 500 switch collegati con linee a 10 e 40 Gbps a 20 router, i quali sono interconnessi da 46 linee a 100 Gbps.

Il centro di calcolo è gestito con Openstack per la creazione di Virtual Machine che vengono assegnate ai quattro esperimenti per l’analisi dei dati. La rete è gestita da un software sviluppato al CERN, capace di configurare i parametri di routing e sicurezza di tutti i dispositivi di rete.

Che benefici vi aspettate di ottenere dall’utilizzo delle tecnologie SDN di Brocade?

EM: I prodotti Brocade sono già perfettamente integrati nel software di configurazione della rete sviluppato dal CERN, il che consente di modificare in autonomia e sicurezza la configurazione della rete, semplificando tutti i processi di gestione.

Il progetto Openlab in collaborazione con Brocade vuole sviluppare un sistema intelligente di gestione del traffico nella rete perimetrale del CERN, basato su Openflow e SFlow. Lo scopo è di avere la capacità di modificare il comportamento della rete in tempo reale, in base al traffico che in un dato momento la sta attraversando.

Per esempio, se è in corso un grosso trasferimento di dati LHC con un sito remoto, lo si può spostare su un collegamento ad alta capacità che non impatti i firewall. Oppure traffico indesiderato o potenzialmente pericoloso può essere scartato o limitato, e allo stesso tempo inviato ai sistemi di Intrusion Detection per un’analisi più approfondita.