Artikel top billede

(Foto: Computerworld)

Sådan får virksomheder større robusthed over for it-nedbrud

Mange virksomheder oplever dyre nedbrud, fordi deres it-robusthed ikke er stor nok under stor trafik, fastslår McKinsey Digital, som selv foreslår syv løsninger på udfordringen.

Af Aksel Brinck, Alt om Data

Denne artikel er oprindeligt bragt på Alt om Data. Computerworld overtog i november 2022 Alt om Data. Du kan læse mere om overtagelsen her.

Der er masser af eksempler på virksomheder, hvor it-infrastrukturen bryder sammen på grund af tekniske fejl, når trafikken i netværket er stor. Mange virksomheder tager ikke it-robustheden alvorligt, før de selv bliver ramt og lider alvorlige økonomiske tab. Det fastslår McKinsey Digital i et blogindlæg.

McKinsey peger på flere eksempler, hvor modstandsdygtigheden svigtede. Det ene handler om manglende robusthed i finanssektoren. I januar 2021 loggede investorer over hele USA på mæglerplatforme, da aktierne i GameStop steg kraftigt. Midt i tumulten kunne millioner af kunder imidlertid ikke få fat i deres kontooplysninger og foretage handler. Mange mæglerplatforme gik ned under presset.

McKinsey foreslår at fokusere på syv specifikke punkter for at undgå alvorlige nedbrud. De kalder det ligefrem et manifest.

1 Løs til rejser, ikke til applikationer. I stedet for at fokusere på at afhjælpe kritiske aktiver, såsom applikationer og infrastruktur, som løsningen på it-fleksibilitet, bør organisationer se på hele kunderejsen og løse det svageste led.

2 Tag en risikobaseret tilgang. Mange organisationer betragter fleksibilitet som et it-infrastrukturproblem. I stedet bør organisationerne tage en tostrenget, risikobaseret tilgang. De skal for eksempel spørge, hvilke kunderejser der påvirker indtægterne. Eller de skal tage en kvantificerbar bottom-up-tilgang, der beregner risikoprofilen for en teknologikomponent såsom et tredjeparts API-opkald.

3 Udnyt data om it-drift. It genererer masser af data, men mange organisationer kan ikke konsekvent bruge dem til indsigt, opdagelse og kapacitetsplanlægning på grund af forskellige værktøjer og mangel på færdigheder. Løsningen er blandt andet kunstig intelligens.

4 Design til stormen, ikke til blå himmel. Traditionelt gennemfører it-organisationer kapacitetsplanlægningsøvelser og lægger måske 50 procent oven på topvolumen. Bølger i digital trafik i størrelsesordenen 300 til 500 procent kan dog forårsage massive afbrydelser. For at løse dette problem skal organisationerne opbygge infrastrukturfunktioner, såsom containeriserede applikationer, for hurtigt at kunne udvide kapaciteten.

5 Vedtag en teknisk tankegang. Førende organisationer investerer i kapacitetsopbygning ved at ansætte nyt talent, genudskifte den eksisterende arbejdsstyrke inden for DevOps-automatisering og vedtage SRE-funktioner (site-reliability-engineering). Disse investeringer hjælper teams med at implementere moderne praksiser såsom kontinuerlig integration og kontinuerlig levering (CI/CD) til automatisering af softwarelevering.

6 Undgå heltekultur. Virksomhedskulturer, der understøtter kvalitets- og konsistensstandarder, er mere modstandsdygtige, fordi de ser på en krise som en læringsmulighed. I næsten alle organisationer er der en håndfuld mennesker, der ved, hvordan man gør alt, er meget lydhøre over for andre og generelt er de mest hjælpsomme mennesker i rummet. Dette scenarie kan imidlertid faktisk hindre modstandsdygtighed, fordi for mange ansvarsområder kun er delegeret til et få mennesker.

7 Bliv proaktiv, ikke reaktiv. Fejl er uundgåelig. Virksomheder kan og bør identificere it-svagheder, inden de bliver systemdækkende. Automatiser kontroller, så de faktiske problemer ikke kommer som en overraskelse.

Læs hele indlægget om it-robusthed fra McKinsey er.