premessa. - miriade · datacenter cloud: web-scale, hyper-converged, hyper-scale. quando gli...

4
Premessa. Questo documento vuole descrivere approfonditamente le analisi e i criteri di valutazione di alcuni prodotti di storage sul mercato, esaminati allo scopo di acquistarne uno nuovo per migrare le VM dell'infrastruttura di virtualizzazione del servizio informatico. L'avvio del procedimento di acquisto è da imputare ad alcune gravi criticità nello storage in uso (acquistato appena due anni prima) che pregiudicavano la continuità di servizio delle attività informatiche istituzionali e ritenendo incerto e non risolutivo il metodo dello scale-up del sistema. Durante il periodo di indagine e nella scelta finale sono stati coinvolti il responsabile dell' U.O.C. Servizio Informatico dell' Ulss 5 Ing. Giorgio Roncolato e il collega Ing. Nicola Povoleri. Un ringraziamento particolare va al Dott. Matteo Durighetto, Data Scientist in Miriade, per il contributo indispensabile all' indagine. Il mio ruolo in azienda è quello di coordinatore della attività che riguardano le infrastrutture informatiche hardware e software: networking wired e wi-fi, storage, computing, server e software virtualization, security (client, server, perimetrale) e software di infrastruttura (routing,dhcp, dns, ntp, autenticazione, posta). In tutti gli ambiti ho acquisito un livello di conoscenza adeguato per la conduzione e lo sviluppo dei sistemi in sinergia con i colleghi e i consulenti. Molte delle note segnalate hanno un contenuto matematico scientifico di tipo accademico, ma con frammenti, a volte comprensibili in particolare nelle conclusioni che bel complesso aiutano ad orientarsi. A distanza poco più di due anni dall'ultima indagine il mercato dello storage è profondamente trasformato, affollato di vendor vecchi e nuovi con prodotti, nomi e acronimi talora sconosciuti. Nella precedente relazione ho esposto una sintesi degli avvenimenti che, a mio parere, hanno cambiato un settore da anni considerato stabile e maturo e che in questo documento proverò ad approfondire ricordando il ruolo fondamentale del software in licenza GPL. U.O.A. Servizio Informatico Via Trento, 4 - 36071 Arzignano (VI) Resp. del Procedimento: dott. Giorgio Roncolato Tel: 0444/479663 Fax: 0444/479654 Resp. Istruttoria: Alessandro Fascina e-mail: uoc. servizio.informatico @ulss5.it Revisione 1.0 del 5 febbraio 2016 C.F.e P.I. 00913220240 U.O.C. Servizio Informatico Analisi del prodotti di archiviazione dei dati sul mercato e selezione della migliore soluzione per l'infrastruttura di virtualizzazione del datacenter del sistema informatico: note tecniche.

Upload: others

Post on 22-May-2020

14 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Premessa. - Miriade · datacenter Cloud: web-scale, hyper-converged, hyper-scale. Quando gli storage non sono embedded in hardware esterni dedicati, ma negli host standard e virtualizzati

Premessa.Questo documento vuole descrivere approfonditamente le analisi e i criteri di

valutazione di alcuni prodotti di storage sul mercato, esaminati allo scopo di acquistarneuno nuovo per migrare le VM dell'infrastruttura di virtualizzazione del servizio informatico.L'avvio del procedimento di acquisto è da imputare ad alcune gravi criticità nello storage inuso (acquistato appena due anni prima) che pregiudicavano la continuità di servizio delleattività informatiche istituzionali e ritenendo incerto e non risolutivo il metodo dello scale-updel sistema. Durante il periodo di indagine e nella scelta finale sono stati coinvolti ilresponsabile dell' U.O.C. Servizio Informatico dell' Ulss 5 Ing. Giorgio Roncolato e ilcollega Ing. Nicola Povoleri. Un ringraziamento particolare va al Dott. Matteo Durighetto,Data Scientist in Miriade, per il contributo indispensabile all' indagine.

Il mio ruolo in azienda è quello di coordinatore della attività che riguardano leinfrastrutture informatiche hardware e software: networking wired e wi-fi, storage,computing, server e software virtualization, security (client, server, perimetrale) e softwaredi infrastruttura (routing,dhcp, dns, ntp, autenticazione, posta). In tutti gli ambiti hoacquisito un livello di conoscenza adeguato per la conduzione e lo sviluppo dei sistemi insinergia con i colleghi e i consulenti. Molte delle note segnalate hanno un contenutomatematico scientifico di tipo accademico, ma con frammenti, a volte comprensibili inparticolare nelle conclusioni che bel complesso aiutano ad orientarsi.

A distanza poco più di due anni dall'ultima indagine il mercato dello storage èprofondamente trasformato, affollato di vendor vecchi e nuovi con prodotti, nomi eacronimi talora sconosciuti. Nella precedente relazione ho esposto una sintesi degliavvenimenti che, a mio parere, hanno cambiato un settore da anni considerato stabile ematuro e che in questo documento proverò ad approfondire ricordando il ruolofondamentale del software in licenza GPL.

U.O.A. Servizio Informatico Via Trento, 4 - 36071 Arzignano (VI)Resp. del Procedimento: dott. Giorgio Roncolato Tel: 0444/479663 Fax: 0444/479654 Resp. Istruttoria: Alessandro Fascina e-mail: [email protected] 1.0 del 5 febbraio 2016 C.F.e P.I. 00913220240

U.O.C. Servizio Informatico

Analisi del prodotti di archiviazione dei dati sul mercato e selezione della migliore soluzione per l'infrastruttura di virtualizzazione del datacenter del sistema informatico: note tecniche.

Page 2: Premessa. - Miriade · datacenter Cloud: web-scale, hyper-converged, hyper-scale. Quando gli storage non sono embedded in hardware esterni dedicati, ma negli host standard e virtualizzati

Parte prima: evoluzione storica dello storage.

La diffusione capillare di tecnologiedi virtualizzazione dei server, ed inparticolare l'evoluzione tecnologica virtuosadi ESXi di Vmware, ha incoraggiato iresponsabili IT a migrare i dati gestiti daDBMS, CMS, DMS, ecc, anche noto comeTier 1 Storage, dalle LUN SAN/iSCSI/NFSdirettamente all'interno dei vmdk ottenendouna prima astrazione, de facto, dellostorage.

Nel 2012 Google annuncia di avercompletato la transizione della propriainfrastruttura di rete in termini di “SoftwareDefined Network” (SDN)1 innescando ladiffusione del concetto “Software Defined”in altri settori come quelli del DataCenter(SDDC) e dello Storage (SDS). Poiché l'SDN non ha avuto la diffusione sperata neinostri datacenter, reti locali e campus, vienea mancare quel minimo comundenominatore di esperienza maturata dall'uso nel tempo. Al contrario si sa bene, purtroppo, come implementare una rete configurando vlan L2, uplink trunk, lacp, SpanningTree, rip, ospf, acl L3/L4, dhcp snooping, ecc.,ecc. La promessa attesa era la trasformazione di ciò che conosciamo in termini nuovi secondo quanto ONF2 propone come concetto di SDN: un framework per gestire l'infrastruttura di rete che consenta di essere programmabile, configurabile, agile, amministrabile centralmente, basato su

standard e neutrale rispetto ai produttori di apparati. Cosa rappresenta l'SDS in concreto parlando di storage?

1 http://www.nextplatform.com/2015/06/19/inside-a-decade-of-google-homegrown-datacenter-networks/ 2 ONF https://www.opennetworking.org/sdn-resources/sdn-definition

U.O.A. Servizio Informatico Via Trento, 4 - 36071 Arzignano (VI)Resp. del Procedimento: dott. Giorgio Roncolato Tel: 0444/479663 Fax: 0444/479654 Resp. Istruttoria: Alessandro Fascina e-mail: [email protected] 1.0 del 5 febbraio 2016 C.F.e P.I. 00913220240

Illustrazione 2 Fonte: Intel

Illustrazione 1 Fonte: WMware

Page 3: Premessa. - Miriade · datacenter Cloud: web-scale, hyper-converged, hyper-scale. Quando gli storage non sono embedded in hardware esterni dedicati, ma negli host standard e virtualizzati

Se nel mercato enterprise il cliente medio è indeciso cosa scegliere tra storage SANo NAS, aziende come Google, Amazon, Facebook e Microsoft competono in sfide maiaffrontate prima, gestire PetaByte di dati in modoveloce, affidabile, sicuro e, soprattutto, economico.Nessuno di loro si affida ai big vendor sul mercatopreferendo la via dell'innovazione tramite soluzionihardware e software custom. Google con ilprogetto Google File System (GFS) ha avuto ilruolo di pioniere in questo scenario creando nuovearchitetture e coniando concetti come web-scale,hyper-scale, hyper-converged.

Parallelamente a tutti questi processi apartire dal 2009 arrivano sul mercato i primi dischiSSD in tecnologia flash con interfaccia SATA/SAS(prima erano solo in PCIe) che permettono laprogettazione di storage “classici” ad alteprestazioni. Per rendere accessibili questi nuoviprodotti alcuni produttori creano una nuovacategoria di storage Hybrid-Array con mix di dischimagnetici e flash. Gli storage All Flash Arrayintroducono il termine di “frullatore”, ossia storagecon alcuni ordini di grandezza di performancesuperiori agli storage tradizionali, che “macinano”migliaia di IOPs qualunque cosa venga inserita.Con l'introduzione di nuove tecnologie SSD i prezziper GB diventano sempre più convenienti eprobabilmente Amazon diventa il più grandevendor di flash storage.

L'offerta di storage con dischi/schede flashsoddisfa pienamente alcuni settori IT /ad esempiofinanza) dove alti valori di IOPs e bassissimalatenza sono condizioni necessarie per ottenere benefici immediati. Spesso però vengonovenduti in architetture tradizionali mutuate da quelle consolidate con sistemi di protezionein RAID5 e architetture di crescita di tipo scale-up. Quando ex collaboratori di Google,Amazon o Facebook fondano proprie start-up, iniziano ad apparire soluzioni di storageche portano nel mercato enterprise aziendale tecnologie fin'ora appannaggio esclusivo deidatacenter Cloud: web-scale, hyper-converged, hyper-scale. Quando gli storage nonsono embedded in hardware esterni dedicati, ma negli host standard e virtualizzati inhypervisor si conia il termine di Virtual SAN.

U.O.A. Servizio Informatico Via Trento, 4 - 36071 Arzignano (VI)Resp. del Procedimento: dott. Giorgio Roncolato Tel: 0444/479663 Fax: 0444/479654 Resp. Istruttoria: Alessandro Fascina e-mail: [email protected] 1.0 del 5 febbraio 2016 C.F.e P.I. 00913220240

Illustrazione 3 Fonte: Amazon

Page 4: Premessa. - Miriade · datacenter Cloud: web-scale, hyper-converged, hyper-scale. Quando gli storage non sono embedded in hardware esterni dedicati, ma negli host standard e virtualizzati

Riepilogando, ecco alcuni termini e per i sistemi storage in circolazione:- tradizionale: un host con un OS (o un firmware ), un filesystem e software dicomplemento che rende disponibile ad host e client uno spazio di archiviazione.Normalmente utilizza dischi magnetici con interfaccia SAS o SATA aggregati tra loro viamoduli software o estensioni del filesystem.- All Flash Array: i dischi sono tutti in tecnologia flash memory con interfacce di accessoUlltra Dimm, NVMe, PCIe, SSD SAS o SATA di tipo SLC. MLC, eMLC, TCL, 3D TCL.- Hybrid Array: i dischi sono un mix di SSD e magnetici con tecnologie di gestione dellivello in base a diversi criteri come performance, hot/cold, long term, ecc.,ecc.- Virtual SAN: un sistema di storage virtualizzato, in grado di accedere ai dischi locali edesporre all' hypervisor un datastore. Può avere caratteristiche scale-out.- Scale-up: possibilità di scalare verticalmente la capacità dello spazio di archiviazione, adesempio aggiungendo cassetti di dischi.- Scale-out: possibilità generica di scalare orizzontalmente la capacità dello spazio diarchiviazione, ad esempio aggiungendo un nodo in rete.- Hyper-scale: possibilità di scalare orizzontalmente di diversi ordini di grandezza unostorage, ad esempio 10.000 nodi - Hyper-converged: un sistema di storage Virtual SAN specializzato nel massimizzare leprestazioni cercando di mantenere assieme nell' host di esecuzione i dati nei vmdk di ognisingola VM.- Web-scale: un sistema progettato per avere caratteristiche hyper-scale e hyper-converged, ma con proprietà di sicurezza del dato nell'ordine di PetaByte e checonsentano una gestione del guasto di un disco o di un nodo autonoma- Big Data: sistemi per la gestione di estese quantità di dati da analizzare con tecniche emetodologie specifiche. Non adatti a gestire ambienti di virtualizzazione.- Cloud: un sistema storage esterno all'azienda con tutte le tecnologie più avanzate pergestire moli di dati immense, con ridondanza geografica a livello mondiale. Si accede inmolti modi diversi, ma di preferenza tramite un canale sicuro su rete pubblica Internet.- Software Defined Storage: un sistema che declina i concetti esposti per il softwaredefined Network. Si può ipotizzare come un framework centralizzato per la gestione“contro l plane” per storage eterogenei delegati a meri “data plane” dei dati (EMC ViPER).- Data Aware: un sistema caratterizzato da moduli integrati di software di analisi e auditdei dati.

U.O.A. Servizio Informatico Via Trento, 4 - 36071 Arzignano (VI)Resp. del Procedimento: dott. Giorgio Roncolato Tel: 0444/479663 Fax: 0444/479654 Resp. Istruttoria: Alessandro Fascina e-mail: [email protected] 1.0 del 5 febbraio 2016 C.F.e P.I. 00913220240