Artikel top billede

(Foto: Computerworld)

Datamængderne eksploderer: Nu kommer Peta og Yotta

Datamængden er eksploderet og som med universets udvidelse, går det hurtigere og hurtigere. Gigabyte og terabyte er om få år ikke længere tilstrækkelige betegnelser, men hvad kommer så?.

Af Natasja Broström, Alt om Data

Denne artikel er oprindeligt bragt på Alt om Data. Computerworld overtog i november 2022 Alt om Data. Du kan læse mere om overtagelsen her.

Hver dag producerer hvert eneste individ på kloden 10 GB data. Om fire år er mængden vokset til 30 GB. Tallene er fra it- og netværksfirmaet Cisco, og læser man ned gennem deres hjemmeside, er udviklingen stort set den samme over hele linjen: Mængden af data vokser eksplosivt år for år. For eksempel måles trafikken på internettet ikke længere i terabyte, men i zettabyte.

Studser du over, hvad zetta betyder, er du næppe den eneste, men du kan lige så godt komme i gang med at opgradere din digitale ordbog. Med de nuværende fremskrivninger bruger vi om få år ikke længere gode gamle megabyte og gigabyte. Fremtiden tilhører nemlig betegnelser med fornavne som peta, exa, zetta og yotta.

Udvikling skyldes flere forhold. Blandt andet det voksende ”Internet of Things” (internet-forbundne enheder), udrulning af hurtige fiberforbindelser og øget forbrug af streaming, videoovervågning og deling af data på sociale medier som YouTube. Vi får kort sagt flere dataforbrugende smartphones, pc’er, tablets og smarte tv’er. Vi får bedre internetforbindelser, og vi producerer, deler og henter flere og flere data.

Ifølge det amerikanske erhvervsmagasin Forbes vil mængden af akkumulerede digitale data vokse fra nuværende godt fem zettabyte data til 44 zettabyte i 2020. Det svarer til 44 milliarder gigabyte.

Terabyte er snart for småt

De fleste af os har nok stiftet bekendtskab med storebroren til gigabyte (GB), nemlig terabyte (TB). Vores harddiske, NAS’er, servere og lagre i skyen er alle på vej mod TB-klassen. I praksis kan du gemme 1500 cd’er eller 130.000 fotos på 1 TB.

Samtidig bombarderer Hubble Space Telescope hvert år blandt andre NASA og det Europæiske Rumagentur, ESA, med 10 TB data. På 10 år bliver datamængden så stor, at forskerne skal et trin op til petabyte (PB), hvilket svarer til cirka 1000 TB eller det samme, som 1,5 millioner cd’er kan rumme. Sandsynligvis har de allerede gang i flere servere, som kan rumme adskillige flere PB data. I 2015 havde Københavns Universitet til sammenligning 2000 servere fyldt med i alt 10 PB data.

Selv om det lyder imponerende, vil virkeligheden overhale hardwaren indenom, for vores data har det med at vokse i både størrelse og mængde. Ikke alene producerer og deler vi mere og mere. Vi digitaliserer analoge samlinger, for eksempel biblioteker, og lægger på nettet, og vi suger data hjem i stuen med nye muligheder som VR (virtual reality) og streaming af billedmateriale i 4K UHD. Sidstnævnte kræver håndtering af op til 20 GB, mens du ser filmen.

Vil du være med på bølgen, kræver det jævnlig udskiftning af routeren til altid nyeste standard, gode kabler, en god leverandør og enheder, der kan håndtere det øgede data-pres. Ifølge Cisco vil 30 procent af den globale videostreaming i 2021 være i 4K UHD.

Sådan skal tallene forstås

Den mindste enhed i computerverdenen, når det handler om data, er bit (b). Der går otte bit på en byte (B). Derfra er det blot at sætte et præfiks på, for eksempel kilobyte (KB), som i princippet er 1000 byte, men i praksis 1024 byte, da man i computere benytter et binært talsystem (totals-system), og 210 giver lidt mere end tusind ligeud.

Mega(byte) Symbol: M Betydning: Græsk for stor (megalos) Tal: 10242 byte

Giga(byte) Symbol: G Betydning: Græsk for gigant (gigas) Tal: 10243 byte

Tera(byte) Symbol: T Betydning: Græsk for fire (tetratos) Tal: 10244 byte Peta(byte) Symbol:

P Betydning: Græsk for fem (pente) Tal: 10245 byte

Exa(byte) Symbol: E Betydning: Græsk for seks (exi) Tal: 10246 byte

Zetta(byte) Symbol: Z Betydning: Græsk for syv (epta) Tal: 10247 byte Yotta(byte) Symbol:

Y Betydning: Græsk for otte (octo) Tal: 10248 byte

Forskning øger forbruget

Ud over eget udstyr stiller fremtiden også krav til producenternes kapacitet. Hos Netflix knokler serverne for at behandle 1,3 PB om dagen, mens Facebooks servere pt. rummer 300 PB data. Data er ikke kun underholdning, men også undervisning, trafikregulering og forskning. Alene VR-trafik vil vokse 20 gange frem til 2021, mens datamængden af den globale online-overvågning af trafikken nærmer sig 1000 PB om måneden. Det svarer til 1,5 milliarder cd’er, hvilket kræver en meget lang hylde.

Naturligvis findes der en betegnelse for næste trin på skalaen: exabyte eller EB. Skulle Netflix få lyst til at fylde serverne med 4K-film, ville en enkelt server med en kapacitet på 1 EB kunne rumme 11 millioner film i det højopløste format. Igen – det lyder imponerende, men tænk på, at i 2021 vil den samlede mængde ip-trafik nå 278 EB om måneden. Når vi passerer tallet 1000 EB, er vi oppe på næste trin, som hedder zettabyte (ZB).

Opfinder nye talnavne

Ifølge Cisco er vi alle så forbundne og internforbrugende i 2021, at vi årligt vil sende, forbruge og producere ikke mindre end 3,3 ZB. Betegnelsen er den sidste i rækken, når det handler om reelle, anvendte størrelser, for efter ZB kommer yottabyte (YB), og i skrivende stund er 1000 ZB eller 1 YB stadig en teoretisk størrelse. Der findes altså ikke et lager endnu, som kan rumme 1 YB.

Mere svævende bliver det efter YB. Uoffi-cielle titler er i omløb på nettet, men endnu ikke optaget i SI (det internationale metersystem). Derfor er det ikke afgjort, om 1000 YB skal hedde brontobyte (BB), og 1000 BB skal hedde geopbyte (GB). Der er heller ingen rød tråd i, hvad navnene betyder, men bronto skulle efter sigende henvise til den 33 ton tunge brontosaurus. Geopbyte kan blive et problem i forhold til det allerede anvendte gigabyte (GB), så andre navneforslag er xenna, weka og vendeka; henholdsvis græsk for ni (ennea), 10 (deka) og 11 (endeka).

Den endelige beslutning afhænger af, om navnet er internationalt unikt og ikke støder sammen med bestemte ord i nationale sprog, og at det har latinske eller græske aner. Ligesom vi kender det fra for eksempel kilo (græsk: tusind), centi (latin: hundred) og mega (græsk: stor).