Category: EMC

Apr 03

EMC Geek: il blog di tecnologia di EMC Italia 2014-04-03 18:02:00

Il software-defined block storage di EMC

Nel panorama dei software-defined storage sta suscitando un grandissimo interesse EMC ScaleIO, si tratta di una soluzione puramente software che, indipendentemente dall’hardware su cui è installato, consente di realizzare una Storage Area Network trasportata via ethernet oppure infiniband.


ScaleIO realizza la convergenza tra i server e lo storage in un unico strato architetturale, con relativi vantaggi di elasticità e scalabilità dello storage, sia dal punto di vista capacitivo che dal punto di vista prestazionale, potendo sfruttare lo storage interno dei nodi, sia esso di tipo magneto-ottico che  flash (comprese le schede PCIe SSD).

In virtù del proprio design architetturale, ScaleIO può crescere fino a migliaia di nodi in cluster, ma può anche ridursi in modo flessibile e completamente online,  poiché implementa i meccanismi di ribilanciamento e riprotezione del dato automatici, qualora un singolo componente o un intero nodo del cluster fosse rimosso dal cluster, per motivi di rinnovo tecnologico oppure a causa di guasti hardware. La scalabilità del prodotto è decisamente superiore se confrontato con altre soluzioni di questa categoria (ad esempio lefthand o nutanix) o soluzioni mono-piattaforma come per esempio VSAN. ScaleIO inoltre è disponibile sia in ambienti virtuali (con il supporto di hypervisor come Vmware, Microsoft, Citrix e KVM) sia degli ambienti fisici con il supporto di Windows e Linux e consente di costruire cluster misti sia per configurazione dei server e sia per il loro sistema operativo.

Come funziona ?

ScaleIO ha sviluppato un protocollo client/server estremamente leggero in termini di uso di CPU, ed è in grado trasportare LUN SCSI via rete ethernet o infiniband, con il controllo e la gestione dei metadati in modo estremamente intelligente e veloce.

Il software di ScaleIO si sviluppa in tre ruoli fondamentali che comunicano via TCP/IP:
Meta Data Manager (MDM) : punto di gestione e monitoraggio che mappa la topologia dallo storage fisico ai dei volumi logici

ScaleIO Data Server (SDS)  : si occupa di leggere e scrivere da e verso lo storage locale e di presentare le LUN ai client

ScaleIO Data Client (SDC ) : driver che mappa ed utilizza i volumi (LUN) presentate dal back-end ScaleIO


A seguito di alcuni test di performance condotti in un architettura a 9 nodi i risultati di questa piattaforma sono impressionanti:

  • più di 505 mila operazioni al secondo
  • trasferimenti si dati pari a 7.7GB al secondo !

Altri test effettuati con configurazioni più potenti di quella evidenziata sopra hanno prodotto risultati nell’ordine dei diversi milioni di IOPS!

Funzionalità di oggi e di domani
Questa soluzione software implementa diverse funzionalità a valore aggiunto tra cui il controllo di banda in fase di ribilanciamento o ricostruzione dei volumi, il limitatore di operazioni al secondo a livello di singoli volumi (QoS), l’encryption at-rest e le snapshot in lettura e scrittura che rendono ScaleIO un prodotto quasi paragonabile al feature-set di prodotti storage hardware-defined ben più consolidati in casa EMC. Nuove funzionalità sono all’orizzonte di ScaleIO…..state sintonizzati!


Per saperne di più visitare:  EMC ScaleIO

Marco Galanti – Advisory System Engineer
Twitter: @MarcoGalants

Continue reading

Mar 14

EMC Recoverpoint: RPO zero anche su asincrono!

Il Dilemma: Sincrono o Asincrono ?

Chiunque intenda affrontare la tematica del Disaster Recovery si trova davanti ad un bivio: come effettuare la replica dei dati? sincrona o asincrona?
Alcune aziende hanno la fortuna di disporre di ben tre siti: Primario o sito di produzione, Secondario o sito con copia sincrona (spesso chiamato anche campus, o sito di business continuity) e Terziario o sito con copia asincrona (per molti noto come replica geografica). Quest’ultima soluzione è senza dubbio la più completa, ma non la più economica sia in termini di costi di realizzazione che di costi ricorrenti e di esercizio. La maggior parte delle aziende ha due siti per cui si trova a risolvere il dilemma. Alla base di questa scelta sta il compromesso tra la L’obiettivo di RPO (quanti dati posso perdere al massimo in caso di disastro), quanto ritardo le mie applicazioni possono tollerare sulle operazioni di scrittura.
A questo si aggiunge la distanza che il sito di DR debba avere in modo da fornirmi sufficienti garanzie. Ricordo un ex collega che alla domanda “a quale distanza deve essere posto il nostro sito di DR” rispondeva “deve stare su una differente zolla della tettonica”.

EMC Recoverpoint e Axxana Phoenix

Ancora una volta EMC Recoverpoint mette in evidenza le sue unicità rispetto ai software di replica tradizionale, ma in questo caso grazie ad una soluzione sviluppata insieme ad un partner tecnologico. Axxana è una societa’ israeliana non a caso come l’azienda che sviluppò Recoverpoint prima dell’acquisizione da parte di EMC (Kashya). Axxana Phoenix è una soluzione rivenduta da EMC come prodotto EMC Select e totalmente integrata con la gestione di Recoverpoint. Nasce dall’idea di un ingegnere areonautico che si ispira agli FDR (flight data recorder) conosciuti volgarmemte con nome di “scatola nera”. Partendo da questo concetto gli israeliani inventano L’Enterprise Data Recorder. Per spiegare di cosa si tratta riprendiamo brevemente l’architettura Recoverpoint (per maggiori dettagli si faccia riferimento al post Recoverpoint su questo BLOG).
Come è possibile vedere dalla figura seguente, Recoverpoint utilizza una tecnica di replica basata su journal, dove alcune transazioni vengono mantenute in una cache sul sito primario, prima di essere raggruppate, deduplicate, compresse e spedite al sito di DR.

In caso di replica asincrona, come nella slide precedente l’RPO, la maggiore perdita dati che si possa avere, è relativa a quei dati che sono ancora memorizzati sulla cache di recoverpoint del sito primario. Axxana è un sistema di “mirroring” di questa cache su un sistema storage autoconsistente, autoalimentato, autoraffreddato ed a prova di bomba (nel senso letterale del termine). Nella figura successiva l’achitettura complessiva ottenuta da EMC Recoverpoint + Axxana Phoenix

Vengono introdotte tre componenti aggiuntive: il collector, la blackbox ed il recoverer.
Il collector di occupa di intercettare le I/O ricevute dagli appliance Recoverpoint ed inviarle verso la black box in modalità sincrona. Questo ulteriore split delle I/O introduce una latenza inferiore ad 1 msec, tipicamente microsecondi, quindi assolutamente trascurabile per qualsiasi applicazione.
La blackbox contiene la replica del dato su dischi SSD.
Infine, l’appliance Recoverer, sito sul secondario, entra in gioco solo in caso di DR o test di DR, e coordina tutte le attività di ripristino.
Questa architettura è attuabile con tutti i tipi di splitter supportati dalle ultime release di Recoverpoint: VMAX, VNX, Clariion, VPLEX, Vblock.
Abbiamo parlato di sistema “a prova di bomba” in quanto la blackbox Axxana resiste alle seguenti situazioni avverse:

  • Esposizione diretta alle fiamme (1100 gradi Celsius) per oltre un’ora
  • Fino a 6 ore di esposizione a 250 gradi Celsius
  • Pressione in immersione fino a 10 metri di profondità
  • 40G di shock fisico
  • Ad un crollo con peso incidente di oltre 2300Kg
  • e molto altro. Esistono filmati con i test effettuati su youtube come http://www.youtube.com/watch?v=hu1cmiQjsto

Sostanzialmente quindi Axxana mette al sicuro una copia (sincrona) dei dati “in flight” di recoverpoint (tipicamente massimo 3-4GB anche negli ambienti recoverpoint piu’ complessi, spesso nell’ordine delle centinaia di MB). L’integrazione nativa con Recoverpoint, consente all’interno della GUI EMC di stabilire quali Consistency Group debbano essere protetti con RPO zero, tramite una semplice checkbox su “use PHOENIX protection”, come è possibile vedere nello screenshot seguente. Questo perchè potrebbero esserci applicazioni che non necessitano di RPO zero, ma su cui sia preferibile avere un RTO (Recovery Time Objective) piu’ stringente.

Come recuperare il dato dopo il disastro

In caso di disastro o semplice indisponibilità del primario, prima di procedere alla riattivazione della copia di DR, sarà possibile recuperare dalla blackbox le transazioni che ancora non erano state inviate al secondario. La GUI  consentirà di scegliere anche quali CG recuperare per primi (è disponibile anche un modulo di integrazione con VMware SRM). Il recupero della cache di Recoverpoint puo’ avvenire attraverso diverse modalità, a seconda dell’entità del disastro, che vanno dall’utilizzo della LAN/WAN (se ancora utilizzabile), all’uso dei modem cellulari 3G/4G interni al box, fino al caso estremo dell’estrazione fisica dell’unità.

I vantaggi e le unicità della soluzione di Recoverpoint + Axxana sono evidenti:

  • Nessuna perdita di dati: Axxana + Recoverpoint garantiscono un RPO=0 a qualsiasi distanza grazie all’appliance che è in grado di proteggere i dati della cache non ancora replicati.
  • La protezione totale dei dati (RPO= 0), è garantita anche durante periodi di carico di picco rispetto alla banda disponibile e durante un eventuale fault di collegamento WAN. Benefici della replica sincrona, con un infrastruttura asincrona. 
  • Nessun problema di latenza – Axxana abilita i benefici della replica sincrona anche usando un’infrastruttura di tipo asincrono, che non influisce sulle prestazioni dell’applicazione.
  • Risparmio sui costi: RPO zero su asincrono significa potenzialmente due siti invece che tre. Il Business case torna “a mani basse”.

Qui sotto trovate link alle soluzioni citate in questo post:

http://www.emc.com/storage/recoverpoint/recoverpoint.htm
http://www.emc.com/collateral/software/solution-overview/h7159-axxana-so.pdf
http://www.emc.com/third-party-products/business-continuity-disaster-recovery.htm

 Cristian Gavazzeni

Continue reading