Artikel top billede

(Foto: Computerworld)

Den store storage-kamp: Flash vs. disk

Denis Vilfort er den højst placerede dansker i EMC og lever af at fortælle om fordele og ulemper ved henholdsvis flash og diskdrev. Mød ham her til en snak om ikke bare storage, men også hans personlige vej ind i it-branchen.

Af Jakob D. Lund, Alt om Data

Denne artikel er oprindeligt bragt på Alt om Data. Computerworld overtog i november 2022 Alt om Data. Du kan læse mere om overtagelsen her.

Amerikanerne kan godt lide at kalde deres inspiratorer for ‘Evangelists’ – med den underliggende religiøse tone, der ligger heri. Evangelisterne prædiker på virksomhedens vegne om den teknologi, de gerne vil promovere. En sådan Evangelist er danske Denis Vilfort fra EMC.

Endda Chief Evangelist. Denis Vilfort besøgte EMC Forum 2013 i slutningen af 2013, hvor han fortalte publikum om, hvorfor storage-branchen bevæger sig mod mere og mere flash, og hvorfor det er en god ide. Efter en meget levende og underholdende præsentation mødte Alt om DATA Denis Vilfort til en snak om iværksætteri, POS-systemer til pladebranchen og selvfølgelig flash.

Begynd med at fortælle, hvordan du fik interessen for it og teknik.
“Det hele startede med, at jeg var træt af at gå i skole og nok lidt svær at have med at gøre. I fritiden byggede jeg forstærkere sammen med en kammerat. Vi spurgte min onkel, som lige havde fået en ny forstærker, om vi ikke nok måtte åbne den og kigge indeni. Det var han ikke meget for.

Han havde lige fået den, og den havde kostet mange penge. Men vi fandt ud af, at der inden i låget sad en lille konvolut med diagrammet. Det nappede vi, skaffede alle komponenterne og byggede selv en forstærker. Det var nok deromkring interessen begyndte,” fortæller Denis Vilfort.

“Senere begyndte computere at blive interessant. Jeg købte en Oric-1; det var en basic hjemmecomputer, man sluttede til tv’et. Den kunne ikke gøre noget, så den skulle programmes, og det måtte jeg jo så lære mig selv. Det var, mens jeg læste på Handelshøjskolen på Frederiksberg.

Så fik jeg et studiejob som butikskontrollant. Vi skulle køre rundt til butikker i hele Storkøbenhavn og sørge for, at der ikke var nogen, der stjal noget. Min chef havde et problem. Der var ca. 200 kunder og ca. 50 kontrollanter. Kontrollanterne skulle have betalt deres kørselsomkostninger, og det kunne godt være dyrt, hvis man skulle køre fra den ene ende af Storkøbenhavn til den anden. Så sagde han til mig: “Denis, her er et kort, og her er et hjul, der måler, hvor langt man kører. Regn de mest optimale ruter ud mellem kontrollanter og kunder.

” Det var dumt arbejde, og det gad jeg ikke. Så jeg tog i stedet en stor lineal og lagde et koordinatsystem over kortet, og så brugte jeg Pythagoras til at finde ud af, hvad fugleflugtlinjen var mellem de forskellige kontrollanter og kunder.

Så lagde jeg det hele ind i et computerprogram, jeg selv havde lavet, og så sorterede den det automatisk. Jeg kaldte programmet for DICAP (Distance Calculation Program). Det var det første professionelle programmeringsarbejde, jeg nogensinde lavede,” siger Denis Vilfort.

“Nogle få år efter startede jeg min egen virksomhed. Min onkel havde en stor pladeforretning i Amager Centret og ville gerne have hjælp til lagerstyringen. Jeg havde før solgt plader, så jeg kendte lidt til branchen. Dengang foregik lagerstyring ved, at man havde en lille plastiklomme bag på pladen med et kort i. Når man havde solgt den sidste plade, røg kortet ned i en stak. Næste dag ringede man så til pladeselskabet og bestilte flere plader.

Den proces ville min onkel gerne have digitaliseret. Dengang kunne man jo ikke bare købe software, så jeg var nødt til at programmere hele lortet selv. Det gav mig min første og eneste kunde,” siger Denis Vilfort. “Da jeg senere emigrerede til USA solgte jeg systemet til ham, så han kunne køre videre.”

Storage må ikke blive flaskehals

Denis Vilfort rejste til USA i 1987 uden ret meget på lommen, men med en drøm om at bygge både familieliv og karriere op derovre. Han fik hurtigt job som teknisk supporter i en virksomhed, der lavede revisionssoftware. Men efter kort tid fandt ledelsen ud af, at han kunne programmere og præsenterede ham for en udviklingsopgave.

“Firmaet havde en kørende salgsstyrke, og salgschefen kunne ikke finde ud af, hvad folk egentlig lavede, når de kørte rundt. Han var sikker på, at de fes den af. Så han ville have et program på deres laptop, hvor de løbende rapporterede, hvad de lavede. Det system lavede jeg. Det sjove var, at jeg baserede det på det system, jeg havde lavet til min onkel i pladeforretningen. Jeg brugte den samme database engine,” siger Denis Vilfort.

I 1989 fik han job i Silicon Valley i et tidligt laptop-firma GRiD Systems. Senere gik karrieren slag i slag med stillinger hos IBM, Sun og Oracle. Denis arbejdede også for mindre start-up-virksomheder, inden han endelig havnede i EMC i 2009. Her har han lige siden arbejdet med storage, og hvordan storage-systemet kan være med til at hjælpe virksomheder og institutioner med deres business pains.

“Et hvilket som helst storage-system har to vektorer og kun to. Den ene er, at systemet skal have den rette kapacitet. Den anden er, at systemet skal være i stand til at understøtte det antal transaktioner, det bliver bedt om. Hvis ikke systemet kan lave transaktionen, sidder brugeren og venter, og så bliver storage-systemet en flaskehals. Det går ikke.

På den anden side nytter det heller ikke noget, hvis ikke man kan gemme nok på sit storage-system,” siger Denis Vilfort og forklarer, at der er nogle, der tror, at det hjælper at putte større drev i storage-systemet for at få transaktionerne til at gå hurtigere. Men større er ikke lig med hurtigere.

“I de 13 år, vi har haft 15.000 rpm på almindelige diskdrev, er de ikke begyndt at køre hurtigere. Det er samme hastighed som for 13 år siden. Men serverne er blevet mere end 100 gange kraftigere i samme periode.

Så man kan kort sagt håndtere mere og mere data på en computer, men man kan ikke få det ind og ud af storage-systemet hurtigt nok. Og det er derfor, vi siger, at det er nødvendigt, at hele industrien skifter fra diskdrev til flash, som er 50 til 100 gange hurtigere,” siger Denis Vilfort.

Han siger, at man selvfølgelig er nødt til at bringe økonomi ind i snakken om diskdrev vs. flash og fortæller, at flash koster 18,58 dollar per gigabyte, mens samme kapacitet på et diskdrev kun koster 47 cent. Diskdrev er altså mere end 40 gange billigere end flash.

“Alle forretninger lider under det samme problem, når det kommer til storage. Der er en del af deres data, der er aktive, og så er der en del af deres data, der er inaktive. Typisk er det 5 pct., der er aktive, og som der bliver arbejdet med, mens de resterende 95 pct. bare skal være der, for det kunne jo være, at der en dag blev brug for dem.

Det nye i forhold til den situation er, at man kan bruge det, vi kalder Fully Automated Storage Tiering – FAST – til at kigge på data. Systemet gør det, at det hele tiden vurderer om data laver noget, og hvis ikke de gør det, flytter de dem fra flash til de meget billigere diskdrev. Når man flytter data, hvad sker der så med flash-drevet?

Det er klar til at tage nye data ind, så man kan genbruge kapaciteten om og om igen. Så det kan godt være, at flash koster næsten 20 dollars per gigabyte, men hvis man kan genbruge det fire gange om året eksempelvis, så er prisen jo helt nede på 5 dollars per gigabyte,” siger Denis Vilfort.

Ikke flere LEGO-klodser

Hvad kendetegner den periode, vi er i lige nu rent it-mæssigt?
“Folk er så småt begyndt at tænke over at investere i projekter igen. Det der lagersystem, de ønskede sig, før krisen satte ind. Måske er det nu, de skal investere i det… Men de der happy days fra før krisen, de kommer ikke igen. Den tid er forbi. Det er et generelt krav i hele it-branchen, at virksomheder i dag skal levere mere på lavere budgetter. Der er et meget større fokus på omkostninger,” siger Denis Vilfort.

“Og så synes jeg også, at der er en tendens til, at man i gamle dage gav en masse LEGO-klodser til it-afdelingen, og så byggede de det hele selv. I dag vil virksomhederne hellere have noget, der kører med det samme ogmed en meget lille indsats fra virksomheden selv. De har ikke tid, og det bliver for kompliceret, hvis de skal gøre det selv. Jeg tror, at vi vil se en udvikling, der peger mere og mere i den retning.”

Har du et godt storage-råd til de danske virksomheder?
“What got you here, won’t get you there. Den gamle storage-strategi, som har fungeret fint for virksomheden indtil nu, vil helt sikkert ikke være den strategi, der bringer jer fremad. Der er ingen tvivl om, at flash er det nye diskdrev, og at diskdrev er det nye tape. Diskdrev er godt til arkivering, det dur ikke til at køre noget i realtid. Store operationer bygger på en masse små. Derfor gælder det om at få de små til at gå hurtigt,” afslutter Denis Vilfort.

EMC lancerede for nylig storage-arkitekturen, XtremIO, som kun er baseret på flash. XtremIO bygger på en arkitektur med lineær skalerbarhed, inline-deduplikering og databeskyttelse, der er seks gange mere effektiv og fire gange hurtigere end traditionel RAID-lagring. Ifølge analysehuset IDC vil markedet for All-Flash-platforme vokse de kommende år og flash spås til at omsætte for mere end 1 milliard dollars frem mod år 2015.

“Vi ser en efterspørgsel på flash-løsninger, der kommer af dagens hårde workloads i datacentret, både de virtuelle og de fysiske. Med XtremIO imødekommer vi det hurtigt stigende marked med en specialiseret løsning, der leverer forudsigelig ydelse på en arkitektur, der gør det muligt for virksomheden at vokse lineært efter behov,” siger Lars B. Andersen, Senior Systems Engineer hos EMC i Danmark.

Teknologien bag XtremIO
Der er fire vigtige funktioner, der adskiller XtremIO fra øvrige flash-platforme:

• Inline-deduplikering gør, at kun den unikke data gemmes på disk. Beslutningen om, hvilken del af informationen, der skal gemmes, afgøres direkte i hukommelsen inden skrivning. Resultatet er, at data spredes på alle diske og tager en brøkdel af diskpladsen samt forlænger levetiden til flashdisken.

• XtremIO’s Metadata-funktion lader systemet udnytte random access-tilgangen til flash og placerer data hvor som helst i løsningen uden at kræve back-end-cleaning (også kaldet garbage collection). Dette gør, at XtremIO får op til 50 pct. bedre performance, 10 gange hurtigere svartider, og op til 10 gange længere levetid på flash sammenlignet med løsninger, der bruger garbage-collection.

• XtremIO Data Protection (XDP) er en flash-specifik algoritme, der beskytter mod ssd-fejl, og som samtidig giver op til seks gange mere brugbar kapacitet end traditionel raid-lagring. XDP tillader slutbrugeren at bruge 100 pct. af kapaciteten på XtremIO og samtidig beholde maksimal performance (til sammenligning kun 60-80 pct. på andre all-flash-systemer). Desuden giver de effektive XDP-algoritmer op til fire gange længere levetid end datacenterløsninger, som bruger raid.

• Shared In-Memory Metadata gør det muligt for systemet at klone data hurtigt, der allerede findes i platformen. I et VDI-miljø vil de virtuelle maskiner eksempelvis skabes op til 20 gange hurtigere.

XtremIO baseres på byggeklodser kaldet X-Bricks. Hver X-Brick har 10 TB kapacitet, og i 2014 kan de leveres med 20 TB kapacitet. XtremIO-platformen leverer op til en million random IOPS med over 250 TB effektiv kapacitet i én samlet XtremIO cluster med deduplikering.

At Big Data vil føre til bedre forretningsstrategier, mener 62 pct. af nordiske virksomheder. Men kun 19 pct. mener, at ledelsen har tillid til området. Det viser en ny stor undersøgelse fra EMC, hvor 489 it-beslutningstagere fra Norden (Danmark, Sverige, Norge og Finland) har tilkendegivet deres holdning til Big Data og den nuværende it-transformations betydning for deres virksomhed.

Undersøgelsen tegner et billede af et erhvervsliv, der kan se en forbedring af beslutningsprocesser som følge af Big Data, men som ikke har taget skridtet fuldt ud endnu. 62 pct. af de adspurgte svarede eksempelvis, at beslutningerne i deres virksomhed kunne blive forbedret ved bedre udnyttelse af Big Data.

Men kun 19 pct. mente, at deres ledelse stoler på viden fra Big Data, når de tager større forretningsbeslutninger. 18 pct. svarede, at de allerede havde opnået en konkurrencemæssig fordel som resultat af Big Data-analyse.

“Vores undersøgelse viser, at virksomhederne i Norden så småt er begyndt at se den forretningsmæssige værdi af Big Data. Men når kun 18 pct. siger, at de har oplevet konkurrencemæssige fordele, viser det med al tydelighed, at vi stadig har en stor opgave foran os i at få synliggjort den forretningsmæssige gevinst, som blandt andet Big Data-teknologierne kan give virksomhederne”, siger Peter Perregaard, adm. dir. for EMC i Danmark.

Andre hovedpunkter fra undersøgelsen:

• 43 pct. af virksomhederne har ingen nuværende planer om at implementere Big Data teknologi.

• Selvom budget (56 pct.) er den vigtigste faktor for generelle forretningsbeslutninger, er den største grund til ikke at indføre Big Data-teknologi, at der ikke er en klar business case eller fastslået ROI (53 pct.).

• Kun 59 pct. mener, at deres organisation har det rette niveau af kompetencer og viden til at kunne gennemføre forretningsprioriteterne succesfuldt.

• 56 pct. mener, at den største barriere ved at skulle gøre op med forretningsprioriteringerne er kulturen i virksomheden.

EMC’s undersøgelse inkluderede svar fra it-ledere, it-arkitekter, dataforskere samt storage-/infrastruktur-ansvarlige fra større virksomheder i Danmark, Sverige, Norge og Finland.