Zombie-servere kan gemme sig mellem antivirus og servere i venteposition

75 ud af de 516 servere i ovenstående graf er overflødige, men det er ikke let at udpege med sikkerhed, hvilke servere der blot bruger strøm uden at være nødvendige.
Op mod 30 procent af de fysiske servere i et datacenter kan vise sig at være overflødige, men det er ikke let at finde frem til de servere, der blot æder strøm uden at gøre nytte.

Servere, der ikke skal bruges, men stadig står tændt i datacentret, koster i både strøm, licenser og gulvplads. Derfor giver det mening at finde dem og skille sig af med dem. Men det er ingen let opgave.

Ser man alene på parametre som CPU-aktivitet eller netværkskommunikation, så kan det være svært at skille de ægte zombie-servere fra dem, der måske står klar til at blive brugt en gang i kvartalet, når der er ekstra pres på økonomisystemet.

Det påpeger Nikolai Joukov og Vladislav Shorokhov fra ModelizeIT i et paper, der blev fremlagt på en workshop for bæredygtige datacentre afholdt af Usenix før påske.

Hvis man ser på en servers forbrug af CPU og disk, så vil mange servere se ud til stort set ikke at være i brug. I et datacenter med 516 Windows-baserede servere lå 90 procent af serverne det meste af tiden med en CPU-udnyttelse på under 10 procent.

Det er heller ikke nok blot at kortlægge, hvilke servere der taler sammen. Selv en server, der ikke længere gør nogen nytte, vil stadig kommunikere med andre servere i infrastrukturen som eksempelvis antivirus, backup og licensstyring.

Overvågning over tid kan afsløre ubrugte servere

I stedet foreslår Nikolai Joukov og Vladislav Shorokhov, at man ser nærmere på, hvordan en server indgår i datacentertopologien, men hvor man supplerer med viden om de kendte funktioner af infrastrukturservere. Så kan man eksempelvis se, at en server ganske vist kommunikerer med andre servere, men kun med dem, der har en infrastrukturfunktion.

Det forudsætter overvågning over længere tid, og der vil stadig være både falske positiver og negativer. Eksempelvis kan servere, der kommunikerer med servere uden for datacentret vise sig at være unødvendige, men fordi man ikke kender de eksterne serveres funktion, vil de ikke blive detekteret som ubrugte servere med denne metode.

De mest almindelige falske positiver viste sig i praksis at være servere, der blev brugt til eksempelvis test eller var på vej til at blive taget i brug.

Der kan også være unødvendige servere, der smutter mellem sprækkerne, hvis de eksempelvis kommunikerer med en databaseserver, og man ikke ved, at lige netop den database, der tilgås på databaseserveren, ikke er én, der bruges i produktion.

Samlet set mener Nikolai Joukov og Vladislav Shorokhov, at deres fremgangsmåde er bedre end de eksisterende værktøjer, fordi de i datacentret med de 516 servere fandt 90 procent af de ubrugte servere, og mindre end 10 procent af det samlede antal servere blev fejlagtigt upeget som unødvendige, hvilket var bedre end metoden med at se på ressourceforbrug.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk

Følg forløbet

Kommentarer (4)

Brian Hansen

Troede vi var kommet over det punkt via virtualisering?

Derudover så håber jeg da ikke man har udokumenterede servere, fysiske som virtuelle, i sit datacenter :)

Søren Jensen

Derudover så håber jeg da ikke man har udokumenterede servere, fysiske som virtuelle, i sit datacenter


Serverne kan sagtens være dokumenteret, men er dokumentationen up-to-date?
Hvis serverne bruges til mere end en funktion, så kan det være svært for den enkelte admin at vide om den stadigvæk bliver brugt.

Den sikre måde at vide om en server bruges, er ved at slukke den. Hvis der er nogen som brokker sig eller hvis noget ikke virker efterfølgende, så blev den sikkert brugt
:-D

Brian Hansen

Serverne kan sagtens være dokumenteret, men er dokumentationen up-to-date?
Hvis serverne bruges til mere end en funktion, så kan det være svært for den enkelte admin at vide om den stadigvæk bliver brugt.


Vi har flere servere som IT afdelingen faktisk ikke har ansvaret for, andet end sørge for der kommer opdateringer ud og backup. Det kan f.eks. være udviklings-servere.
Så ville jeg typisk kontakte den afdeling der står med ansvaret, og mener de den bliver brugt, så bliver den nok brugt, det er faktisk slet ikke op til mig at vurdere :)

Eller så ja, en forholdsvis nem test er bare at slukke skidtet og se om nogen hyler op. Har før set eksempler på "firmaets vigtigste server!!!!" være slukket i flere måneder før nogen lagde mærke til det ;-)

Poul-Henning Kamp Blogger

De fandt 90% af zombierne, dvs. 67.5 ud af 75.

De gav falsk alarm på 10% af alle serverne, dvs. 51.6 server.

Ikke ret imponerende.

(Jvf. vores snak om vigtigheden af at forstå statestik og sandsynlighedsregning)

Log ind eller opret en konto for at skrive kommentarer