Backup e ripristino dei dati in HPC e Big Data

Bacula: Imbattibile negli ambienti HPC e di supercalcolo.

I centri HPC sono ampiamente impegnati a modernizzare la loro infrastruttura IT per soddisfare le esigenze di domani che arrivano rapidamente. I loro centri IT devono affrontare una sfida continua per adattare e migliorare le loro operazioni IT, per rimanere flessibili e offrire le più recenti capacità di performance. Per ottenere questi miglioramenti, sono necessari – e vengono attualmente adottati – nuovi e diversi approcci alla sicurezza, all’efficienza e alle prestazioni.

“Tra quelli valutati, Bacula Enterprise è stato l’unico prodotto che ha funzionato con HPSS out-of-the-box senza lo sviluppo del fornitore, ha fornito l’accesso multiutente (BWeb), ha avuto una crittografia conforme agli standard federali di elaborazione delle informazioni, non ha avuto un modello di licenza basato sulla capacità ed è stato disponibile entro il budget” NASA.

In conformità con il suo pedigree Open Source, Bacula Enterprise supporta perfettamente i filesystem conformi a Posix, aiutandola ad evitare il vendor lock-in. Inoltre, è possibile utilizzare ogni filesystem che può essere montato su un host Linux o Windows, compresi i filesystem paralleli e clusterizzati come Lustre o Quobyte. I file system POSIX sono il sistema di archiviazione più comune in uso oggi e forniscono un’ampia gamma di funzioni IO che le applicazioni possono utilizzare, compreso l’accesso a livello di byte. Tuttavia, l’elevato numero di funzioni IO comporta una certa complessità, sia per l’applicazione che per il file system. Bacula aiuta gli utenti HPC a ridurre in modo significativo la complessità, essendo file system-agnostico. Ecco un elenco non esaustivo di filesystem utilizzati dai clienti di Bacula Systems:

ext 2|3|4
xfs
ReiserFS
BeeGFS
GlusterFS
GFS
GPFS
Hadoop *
HPSS
Lustre
Quobyte
Swift *

*richiede un modulo Bacula Enterprise (plugin)

In quanto soluzione di backup e ripristino HPC di comprovata efficacia e dalle prestazioni particolarmente elevate, Bacula è in grado di gestire grandi volumi di dati con facilità. Con l’aumento della necessità di soluzioni HPC e di ulteriori miglioramenti tecnologici, le organizzazioni stanno rivolgendo la loro attenzione ad aree come le soluzioni HPC ibride. Bacula prevede che i miglioramenti della tecnologia e dell’innovazione nello spazio HPC aumenteranno, soprattutto in aree specifiche come il cloud ibrido, l’edge compute, le tecnologie dei container e gli approcci alla sicurezza. Mentre i team IT lavorano duramente per creare un equilibrio tra le soluzioni HPC on-premises e il cloud, Bacula offre un modo per proteggere e recuperare questi interi ambienti da un’unica piattaforma.

Leggi il documento Bacula whitepaper che tratta le considerazioni sul backup e sul ripristino per questo settore:

I 10 punti salienti del whitepaper

  1. Complessità dell’ambiente IT nel settore della ricerca
  2. Ambienti IT tecnici & esigenti
  3. Rispetto degli RPO e RTO
  4. La necessità di livelli di sicurezza particolarmente elevati
  5. Recupero di Bare Metal
  6. La necessità di de-rischiare l’implementazione
  7. Cloud ibrido nel settore della ricerca
  8. Capacità stand-alone e “air-gapping”
  9. Tecnologie container nel settore della ricerca
  10. Come fa la NASA a beneficiare di Bacula
  11. Evitare il vendor lock-in


Per gli ambienti HPC che hanno petabyte di dati da archiviare, il nastro può ancora essere l’opzione migliore per l’archiviazione a lungo termine e il rispetto degli RPO. È anche molto efficace per quanto riguarda i requisiti di conservazione e la conservazione dei supporti. Le unità a nastro LTO-08 e LTO-9 di oggi hanno specifiche impressionanti, tra cui velocità di trasferimento fino a 400 MB/sec. nativi e capacità di archiviazione fino a 18 TB di capacità grezza e fino a 45 TB di capacità compressa. Bacula Enterprise è ideale per gli amministratori di nastri, perché non concediamo mai licenze in base al volume di dati e offriamo funzionalità uniche come il supporto ACSLS. Bacula supporta le librerie a nastro di tutti i principali produttori mondiali e fornisce tutte le operazioni di gestione della libreria a nastro. Supporta inoltre l’accesso dell’utente con nome all’ACSLM, il blocco dell’unità nastro e del volume in un ambiente ACSLS condiviso, la query e la gestione dei blocchi, la mappatura statica della posizione dell’unità nastro e la mappatura dinamica della posizione del volume.

La compatibilità particolarmente ampia di Bacula con le tecnologie HPC sta contribuendo a un cambiamento positivo nelle tecnologie e negli strumenti per automatizzare i processi e applicare una governance coerente in un laboratorio federale/nazionale HPC o in organizzazioni di ricerca. Ad esempio, Bacula offre un’integrazione nativa con tecnologie come Hadoop, Docker, Kubernetes, SAP Hana, GPFS, ecc. Bacula supporta oltre 33 sistemi operativi diversi!

Man mano che un numero sempre maggiore di agenzie governative e di ricerca HPC passa all’utilizzo di Bacula, emerge chiaramente un modello di esigenze da parte di queste organizzazioni e le ragioni per cui avviene il passaggio. Il libro bianco di Bacula Systems ‘Data Backup and Recovery in Federal and National Research Agencies‘ illustra le considerazioni e i vantaggi dell’utilizzo di Bacula Enterprise, conforme a FIPS 140-2, come sistema centrale di backup e ripristino dei dati all’interno delle organizzazioni di ricerca, e come fa a facilitare una parte specifica, ma critica, nell’approccio aziendale di queste organizzazioni alla modernizzazione digitale.

Divisione dei file di backup di grandi dimensioni

Questa funzione di Bacula esegue il backup di un gran numero di file con una velocità e un’efficienza ottimali, suddividendo il carico di lavoro in una serie di lavoratori (processi di backup simultanei). Large Backup File Split di Bacula consente di risparmiare molto tempo negli ambienti HPC quando si tratta di set di dati molto grandi. Può funzionare con qualsiasi tipo di file system e il backup viene gestito automaticamente da Bacula. Questo è applicabile a qualsiasi caso d’uso di file server o NAS.

Un’altra attrattiva dell’automazione di questo processo da parte di Bacula è la sua capacità di ridurre la possibilità di errore umano, oltre ad essere completamente dinamico, il che significa che non è necessario alcun processo di aggiornamento della configurazione, a prescindere da eventuali modifiche della struttura o delle dimensioni del set di dati di destinazione.

Questo strumento può essere particolarmente utile quando ci sono molti utenti che causano una struttura di cartelle complessa e molti file diversi. Questo tipo di struttura di file può essere letteralmente utilizzata da tutti (ad esempio, pubblico/privato, utenti interni all’azienda, situazioni di dati condivisi, ecc.) Maggiori dettagli sono disponibili nel libro bianco HPC di Bacula.

Contattaci subito per incontrare gli esperti senior di Bacula allo stand n. 1585 della SC23 a Denver, Co, dal 12 al 17 novembre!