L’archiviazione a lungo termine richiede un approccio molto diverso rispetto al backup e al ripristino, in cui il throughput e la deduplica sono le principali preoccupazioni. L’archiviazione richiede la conservazione per lunghi periodi di tempo di dati senza che questi si danneggino, in modo che quando vengono recuperati siano esattamente ciò che erano 10 o 20 anni fa.

Per la maggior parte delle organizzazioni che raggiungono una certa dimensione, il nastro magnetico LTO (Linear Tape Open) è la scelta migliore per questo tipo di archiviazione. Ma per le aziende che non possono giustificarne il costo o credono che il nastro sia solo un ingombrante ricordo del passato, ci sono tre alternative praticabili: storage oggetti nel cloud, archiviazione su disco in locale e supporto ottico.

Archiviazione nel cloud

Lo storage a oggetti è progettato specificamente per l’archiviazione a lungo termine, poiché i checksum utilizzati per identificare ciascun oggetto possono essere utilizzati anche per verificare che il suo contenuto non sia cambiato. Il sistema può rieseguire il checksum e confrontarlo con il checksum precedente utilizzato come identificatore univoco (UID) dell’oggetto. Ciò consente una verifica costante dell’integrità dei dati, anche decenni dopo la loro memorizzazione.

È anche un metodo poco costoso. AWS, Azure e Google offrono tutti 100 TB di dati in cold storage per circa 100 dollari al mese; in questo modo potreste avere due copie dei vostri dati con due fornitori per circa 200 dollari al mese. Supponendo che stiate solo caricando dati senza l’intenzione di recuperarli mai, sarebbe molto conveniente. Se mai doveste recuperarli, sarà invece un metodo costoso, ma probabilmente ne varrà la pena.

Tenete presente che pagherete due commissioni: una tariffa get per ogni oggetto e tariffe per la larghezza di banda per gigaByte. Se cancellate l’archivio in anticipo, potreste pagare anche altre commissioni perché il prezzo si basa sulla conservazione dei dati per molto tempo. Assicuratevi quindi di sapere cosa pagherete se e quando recupererete effettivamente i dati.

Unità disco locali

Se intendete utilizzare dischi locali per archiviare dati, sono disponibili tre scelte: array di dischi standard, destinazioni disco deduplicate e storage a oggetti in locale.

Gli array di dischi standard e i sistemi di archiviazione collegati alla rete tendono a essere progettati per i dati primari e hanno un costo più elevato che riflette tale destinazione di utilizzo. Pertanto, la maggior parte delle aziende li considera troppo costosi per l’archiviazione a lungo termine.

I sistemi di dischi deduplicati possono aiutare a ridurre il costo dei backup, ma l’archiviazione a lungo termine è qualcosa di molto diverso. Nel tempo finirete per archiviare dati completamente nuovi per il sistema di deduplicazione e il rapporto di deduplicazione crollerà. Pertanto, il costo di un sistema disco di destinazione finirà per essere più di un sistema disco standard perché state pagando un extra per un rapporto di deduplica che in realtà non state ottenendo a causa della natura dei dati.

Sia i sistemi di disco standard che quelli deduplicati hanno anche il problema che il disco non è l’ideale a conservare i dati per più di cinque anni. Proprio come l’archiviazione degli oggetti nel cloud, i sistemi di storage a oggetti in locale possono aiutare controllando costantemente l’integrità dei dati su ciascun sistema e sostituendo i dati danneggiati con dati validi archiviati in un sistema disco diverso. Tuttavia, i dischi tendono ancora ad essere più costosi rispetto al semplice utilizzo del cold storage nel cloud. Ecco perché, in conclusione, il disco di qualsiasi tipo non tende ad essere la scelta migliore per l’archiviazione a lungo termine.

Disco ottico

Sono disponibili tre opzioni di dischi ottici: DVD e Blu-Ray standard registrabili, DVD-R archival grade e M-disc.

I dati scritti su DVD e Blu-Ray dovrebbero conservarsi in modo ottimale per decenni. I cosiddetti DVD-R archival grade utilizzano doppi strati riflettenti e un rivestimento extra per prevenire i graffi e costano 10 volte i DVD-R tradizionali. Il supporto M-disc è specificamente progettato per la conservazione a lungo termine e utilizza uno strato inorganico progettato per durare 100 anni. Sono costosi, ma rappresentano circa il 25% del costo di un DVD-R archival grade per gigabyte. La maggior parte delle moderne unità ottiche può scrivere su tutti e tre i tipi di supporto.

I dischi DVD a singolo strato hanno una capacità molto ridotta, inferiore a 5 GB. I Blu-ray hanno invece una capacità di 25 GB o 50 GB (singolo o doppio strato). M-disc è invece disponibile nei tagli da 25 GB, 50 GB e 100 GB. La memorizzazione dei dati su questi dispositivi è piuttosto lenta rispetto a quella su nastro o disco, poiché il processo di esecuzione di un cambio di fase su un supporto fisico richiede più tempo.

È anche importante sottolineare che il supporto ottico ha un low uncorrected bit error rate (UBER) molto basso, con la maggior parte che si attesta a 10-10. Per i dischi SATA (Serial Advanced Technology Attachment) l’UBER è 10-14 e per il nastro LTO-9 è 10-19. Ciò significa che il supporto ottico non scrive i dati in modo affidabile come il disco o il nastro SATA.

Ho parlato con alcune società di media e intrattenimento che, in aggiunta alle copie LTO, utilizzano i dischi ottici per creare copie di archiviazione a lungo termine di film e altri contenuti video. Secondo queste aziende il disco Blu-Ray sarà più facile da leggere tra 50 anni rispetto a un nastro LTO. In effetti, un lettore Blu-Ray odierno può leggere senza problemi CD e DVD più vecchi anche di vent’anni, il che significa che è molto più compatibile con supporti di generazioni precedenti rispetto alla tipica unità a nastro, la cui compatibilità di solito si spinge fin solo a una o due generazioni prima.

Le aziende che desiderano utilizzare i dischi ottici come archiviazione a lungo termine dovrebbero prendere in considerazione le librerie ottiche. Sono proprio come le librerie a nastro, ma con unità ottiche anziché unità nastro e offrono una fornitura quasi illimitata di storage a lungo termine senza troppi interventi manuali.