- Log ind eller Opret konto for at kommentere
- Anmeld denne kommentar
I et tidligere job brugte vi meget servere fra IBM. Fine maskiner men det tager minimum 5 minutter at nå igennem BIOS inklusiv scanning efter SCSI enheder som det slet ikke er muligt fysisk at montere i maskinen.
Tanken må have været at det ikke er en vigtig parameter. Man kan sætte junior sysadmin til at installere operativsystem, så who cares? Det skal jeg fortælle dig: Det gør direktøren når du må fortælle ham at vi er nødt til at lave et reboot mere og at det tager i hvert fald 5-10 minutter bare fordi. Alt imens at forretningen er nede. Det hjælper i hvert fald ikke i en stresset situation.
I mit nuværende geschæft bruger vi almindelige bambus servere som kan boote på under et halvt minut. Nu er det routere og switche der er problemet. Linjekortene i vores hovedrouter kan være 15 minutter om at komme online efter en genstart. WTF?! Hvis der har været et router crash, så er det da med at komme online igen hurtigst muligt og ikke om 15 minutter, hvad f*** tænker de på?
Vores GPON access switche er omkring 5 minutter om at starte men det er på en tom opsætning. Jo flere kunder der er på switchen, jo længere tid før alle er online. Den er ude af i stand til at "starte" kunderne parallelt og i stedet sker det sekventielt. Da der kan være op til 512 kunder på en enkelt switch, så kan det tage en rum tid før den sidste kunde er online igen.
Hvorfor kan de ikke se, at selvom det er rigtigt at vi ikke render rundt og rebooter i tide og utide, men når det sker, så er det uacceptabelt med ekstra nedetid bare fordi en eller anden klaphat ikke fatter at køre nogle processer parallelt?