Er platformsfolk (stadig) klaphatte ?

I forbindelse med vores ESO projekt er jeg ved at genoplive vores lille cluster fra den første prototype vi lavede, nogle ganske OK maskiner som er fem-seks år gamle.

Det er ikke meningen at den ny prototype skal køre på de gamle maskiner, vi skal bruge en ramme GFLOPS mere, men vi vil gerne have det gamle cluster til forskellige ad-hoc tests osv.

Hver gang jeg kommer i kontakt med moderne serverhardware undres jeg over hvad fanden platformsfolken er for nogen klaphatte?

Med platformsfolkene mener jeg dem der skriver BIOS, firmware til controllere, "managementkort" og alt det andet skrammel der omhyggeligt sørger for at en reboot tager mange minutter.

Når man sælger "enterprise-grace" hardware, ville jeg egentlig have troet at det var en konkurrenceparameter hvor hurtigt man kunne få en maskine i luften, men det er det tydeligvis ikke, det er meget vigtigere at vise en kavalkade over leverandørens logo igennem tiden.

Meget af tiden går med at vente på at de talrige "Tryk CTRL-ALT-VENSTRE-FODPEDAL for Religiøs EkseGese™" prompts forsvinder og hvis maskinen har to forskellige netkort skal man naturligvis have god tid til at overveje om man ikke netop dennegang har lyst til at bruge begge netværkskortsleverandørens af små klodsede barnehænder sammenklaskede konfigurationsprogramer til at ændre opsætninger som ikke har været relevante siden vi skiftede fra gult til twisted-pair ethernet.

Og gud nåde og trøste dig om du formaster dig til at prøve at opdatere firmwaren på disse maskiner.

Mit råd: Sæt en hel dag af til opgaven, sæt et skilt på døren "Må ikke forstyrres, opdaterer Firmware!", luk døren udefra og gå i stedet ud i naturen og nyd det gode vejr.

På den måde ved du i det mindste at serveren stadig virker og du slipper helt for hajerne.

Det mest frustrerende er at intentionerne er sådan set gode nok, men exekveringen er helt ude i hampen.

Den server jeg sloges med igår har alle mulige smarte faciliteter.

Managementkortet tillader at man kan se konsollen i sin browser og man kan reboote, power-cycle og alt muligt andet.

Man kan lave et virtuelt CD-ROM drev fra konsollen i browseren og man på den måde boote en server i langtbortistan fra en ISO fil på sin laptop.

Management kortet også et 8GB SD kort hvorpå man kan lave virtuelle USB-sticks, således at man altid kan have en rescue-boot klar.

Det burde derfor have været fuldstændig trivielt for mig at opdatere BIOS'en uden at skulle ned i Force's maskinrum.

Men konsollen i browseren kræver Java og så vidt jeg kan se bruger den Java til at emulere et eller andet Internet-Explorer-Monopol-crap.

Det siger sig selv at man skal igennem bunkevis af sikkerhedsadvarsler, for hvad ved platformsfolk om sikkerhed og kryptering.

Det virtuelle CD-ROM drev har jeg aldrig fået til at virke, trykker man på knappen får man en konsolbesked om at "VM started" og et sekund senere "VM stopped" og det var så det...

Og 8GB SD kortet har en begrænsning på 2GB partitioner mens ISO filen fra leverandøren er 3.7GB.

(Muligheden for at hente filerne direkte fra leverandørens FTP server er ikke indenfor rækkevidde, maskinerne er firewallet kompetent og skal ikke ud på nettet.)

Fordi det hele er noget rod, har leverandøren lavet et "samlet platformsværktøj" som det tager næsten 10 minutter at starte oveni den tid det normalt tager at boote maskinen.

Når man har startet det kan man, på lidt under 3 minutter, få en oversigt over alle firmware versioner i maskinen.

Det siger sig selv at når man endelig får listen, passer beskrivelserne af disse stykker firmware ikke med dem leverandøren bruger på sin supportside.

Og hvilken version tror du selv er den nyeste: "1.10" eller "1.021" ?

Hvis man downloader noget fra leverandørens supportside, får man enten en .EXE fil eller en Linux ".BIN" fil, der viser sig at være et bash-script der skal køres som root, under X11.

I begge tilfælde er der åbenbart tale om en "samlet platformsapplikation" med hvilken man kan lave en ISO fil som man kan boote.

Når den engang er bootet, får man en applikation der kan opdatere de forskellige stykker firmware og hvis man er heldig virker maskinen stadig bagefter.

Hvordan man får det "samlede platformsværktøj" til at bruge to minutter på at lave en checksum af en fil på en megabyte fatter jeg slet ikke, men det har sikkert noget at gøre med "responsive design" og MD5 der bliver udregnet med en style-sheet funktion.

For det skal naturligvis altsammen være grafiske brugergrænseflader med F1-Hjælp, papirklips og frem for alt leverandørens logo så stort og prangende som muligt, fordi det er helt klart UX-oplevelsen vi fokuserer mest på når vi prøver på at få et system i luften igen klokken nul-dybsort om natten.

Meget af skramlet er Linux og selvom det er bedre end enhver form for Windows, burde nogen forlængst have fyret det hold der kom frem til at man først skulle vente en krig på at komme ind i BIOS-opsætningen for derefter, når man beder om at konfigurere harddisk-controlleren, at skulle vente en revanchekrig på at boote en indlejret Linux.

…en indlejret linux der laver et hemmeligt håndtryk som enabler en USB-controller på harddisk-controlleren så man via browseren kan udføre js-kode fra harddisk-controllerns indlejrede Linux over en ethernet-over-USB forbindelse og på den måde, meget "brugervenligt", kan bede om at få de to diske spejlet.

Alt det her pis kunne være klaret over en enkelt seriel-forbindelse, fysisk eller virtuel, der aldrig så andet end ASCII-tegnene 0x0a, 0x0d og 0x20-0x7e, det kunne være overstået på sekunder frem for timer, f.eks ved at lave et globalt mode-bit der vælger om maskinen skal konfigureres eller faktisk skal lave noget lige nu, og det kunne have været robust, fejltolerant og tillidsvækkende.

Men det er tydeligvis ikke det platformsfolk får deres løn for...

Og jeg vil slet ikke begynde at tænke på om der er noget malware eller spyware, der ved at hvis man skriver den rigtige værdi i et bestemt register, dukker der en Ethernet-over-USB forbindelse op til en forældet BusyBox Linux fuld af skod-PHP som kører på disk-controllerens CPU.

For det siger sig selv om firmwaren er opdateret til det seneste man kan finde på leverandørens hjemmeside, er der jo ingen der har sagt at det er nutidig software der er tale om.

Når jeg hører ordet "Enterprise" ruller jeg min sovepose ud...

phk

Kommentarer (26)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Troels Henriksen

Hørt! Moderne bærbare er også noget rod, omend på den anden måde: De er så integrerede at man ikke har mulighed for at ændre noget. Hvis vi er villige til at gå på kompromis med ydelseskapacitet og den slags, hvad er så den mindst sindssyge platform nutildags? Forstået som at der ikke kører (for mange) skjulte styresystemer, og at kompleksiteten ikke er blevet skruet helt i vejret i et misforstået forsøg på "brugervenlighed". Der er selvfølgelig microcontrollere og småsystemer (f.eks. Arduino) hvor der ikke er plads til så meget vanvid, men hvor langt kan man nå? En moderne x86-forbrugerdesktop virker også rimelig. Der er selvfølgelig spionsystemet i CPUen, men der er ikke så meget af enterprisens "value-add" derudover.

Hans Nielsen

Hvis vi er villige til at gå på kompromis med ydelseskapacitet og den slags, hvad er så den mindst sindssyge platform nutildags


Hvis vi skal tænke lidt ud af bokse :-)

Raspberry PI, også er du ikke gået på kompromis hvis du holder dig til Linux og ikke Windows. Den er ikke modulær, men meget billigt.
Godt nok ikke bærbar, men du kan have enhed i bukselomme, og evt bruge et laser tastatur der fylder som en ligther. Den kan køre på 3 stk 3AAA bat.

Hvis du køber en version 3, så kan du bruge BT tastatur mus, og koble op trådløs. Og hvis dit TV/Monitor har en udgang med USB power, så behøves du bare et stik der til, og et kort hdmi kabel. SÅ har du en monitor/TV med indbygget SMART TV, som får opdateringer, og ikke bare holder op med at virke.

Du kan så skifte SD kort alt efter hvad du laver :-)

Her er tastaturet jeg tænker på

https://www.24hshop.dk/mobiltilbehor/iphone-tilbehor/iphone-ovrigt/virtu...

Troels Henriksen

Raspberry PI, også er du ikke gået på kompromis hvis du holder dig til Linux og ikke Windows. Den er ikke modulær, men meget billigt.

Sidst jeg rodede med en Raspberry Pi havde den et bizart setup hvor GPUen agerede bootloader ved at indlæse en binær blob. Er de kommet ud over det? Jeg er ret ligeglad med hvor lille maskinen er; jeg vil bare have en hvis virkemåde er forudsigelig frem for "brugervenlig".

Maciej Szeliga

...til at foretagender som Google, Facebook og Amazon kikker på små simple maskiner til deres datacentre?

Hvis du alligevel skal køre det på mange separate tråde så kan det muligvis også splittes til 1000 ARM maskiner i stedet for 100 x86 servere.
Jeg går ud fra at det skal køre BSD så om det er ARM eller x86 er vel underordnet?

Povl H. Pedersen

er der nok af. Også helt nyproduceret.
Se eksempelvis overvågningskamera fra HIKVision, selv et helt nyt kamera kræver en gammel Internet Explorer med ActiveX for at for at markere nogle firkanter på en baggrund. Noget der har været trivielt i mange mange år.
Så det er ikke kun servere. Det er alle mulige steder. Det ser ud til at IT industrien er ved at blive invaderet af inkompetente spillere. Jeg ved ikke om det er fordi der er usædvanligt få folk under 40 år der kan tænke, eller om de der kan tænke har valgt andre brancher. Men det er inkompetencer der tegner IT industrien i disse år, med relativt få undtagelser.

Andrew Rump
Andrew Rump

Hvad LAVER maskinen i al den tid??


Ingenting! Den venter på det hardware, som du skulle have (købt og) sat på (ifølge en eller anden (salgs)persons overbevisning), svarer.
En del protokoller, f.eks. SCSI har en ret lang timeout - mener det er 15 sekunder og da nogle operativ systemer (læs: bl.a. Windows) ikke kan mounte drev efter at det er booted, så må hardwaren sørge for at det alt sammen er i luften inden du kommer videre.

Benny Lyne Amorsen

Disse ting er ligefremt proportionale med prisen:

a) Opstartstid
b) Antal spændende fejl som "ingen har set før"
c) Proprietære og/eller forældede teknologier som er nødvendige for at få dimsen til at virke

Efter min erfaring gælder det alle typer elektronisk udstyr, helt fra brødristere over kaffemaskiner til servere og netværksudstyr.

(Og ja, det piner mig stadigt at min brødrister er 3 sekunder om at boote. Men den er så flot...)

Benny Lyne Amorsen

Hvis du alligevel skal køre det på mange separate tråde så kan det muligvis også splittes til 1000 ARM maskiner i stedet for 100 x86 servere.


Hvis opgaven primært er floating point eller har brug for meget hukommelsesbåndbredde, så er x86 meget svær at slå. ARM er ikke i nærheden af x86 på disse to punkter, målt per watt.

Endnu mere grelt bliver det hvis ens workload kan bruge de forskellige SIMD-instruktioner som Intel og AMD har tilføjet, og man har tid til at håndkode til formålet. Det giver godt nok en afhængighed af arkitekturen, men x86 fjerner sjældent noget som én gang er tilføjet.

Forhåbentligt kommer ARM med en dag.

Claus Juul

Jeg gætter på at det er noget hp udstyr, jeg kan i hvert fald genkende mange elementer.

Lige nøjagtig hp burde kunne gøre det bedre, da de gennem kontollere alt deres hardware for kompatibilitet.

Du har ret det burde være lettere at få opdateret alt sit grej, fx ved at et program henter info om alle komponenter i maskinen, tilbyder dig at forbinde til internettet og hente de relevante pakker, eller generer en liste, så man fra en anden maskine kan hente de relevante pakker OG kun de relevante pakker og ikke alle pakker og til både Linux og windows.

Baldur Norddahl

Det man mest har brug for under en krise, hvor man desperat forsøger en reboot uden at være helt sikker på om det hjælper, og vel vidende at systemet er nede midt i spidsbelastning, er klart at vente 300 til 600 sekunder på at scanne det ikke monterede SCSI array. Hvis jeg havde en dime for hver gang jeg er løbet ud til bilen, fordi serveren tydeligvis ikke kommer op igen, blot for at få et opkald om at nu kom den alligevel.

Så blev jeg netværksmand og fandt ud af at det er helt normalt at vente i en halv time på at en router konvergerer. Alt imens man er nede.

Henning Svane

Alle tre producenter er lige forfærdelig.
De er lavet ud fra den ide at dem der skal sætte dem op intet ved om server, som måske også er rigtigt, så disse forfærdelige boot DVD'er der kan fikse alt er et mareridt.
Man får den opfattelse af ingen af dem ved noget som helst om at bygge en server og de har købt nogle stumper de så har smidt sammen.
Kan nævne at Intel server (Deres egne) og Supermicro er betydelig hurtigere til at starte og har nogenlunde de samme IPMI faciliteter. Men ja de fleste bruger Java og det er noget massivt skrammel. Specielt da de oftest ikke følger med de utallige Java opdateringer.
De er ved at skifte over til HTML5 hvilket jeg håber snart slår igennem.
Og ja jeg gætter også på Dell pga. de 8GB.
HP booter for øvrigt endnu langsommer end Dell.

Claus Juul

Der er et rygte om at Microsoft sky tjenste anvender whitebox servere, der kan genstarte på 15-30 sekunder.
Det er måske den vej Force skal vælge at gå, men det kræver nok et par reserve servere i tilfælde at fejl, jeg gætter på at HP/Lenovo/Dell osv. har deres lange preboot sekvens for at sikre at de forskellige hardware dele er i orden ok klar til at performe, hvilke MS måske lidt er ligeglade med da de har så mange og vælter en fysisk boks, losser hypervisior bare loadet over på nogle andre servere.

Hans Nielsen

Hvis nu hardware en i orden, som at den kan køre 24/7-365 og man formentlig køre i et virtualiseret miljø. Så er problemet vel ikke så stort ?

Har kun erfaring for de 2-5 server jeg har kørende. Men efter jeg skrottet Windows som "basis" program og brugte VMware, så har jeg ikke haft brug for at slukke eller resette hardware.

Flemming Frandsen

Jeg har fra tid til anden grund til at vente på at en HP server booter og det er godt nok det værste rod, særligt fordi man ved at alt maskinen laver i de 15 minutter hvor den piller sig selv i navlen er værdiløst.

Som jeg lige husker det så er boot sekvensen noget i stil med:
* Sort skærm i 20-50 sekunder hvor intet sker.
* Første "vi starter lige BIOS'en"
* Den store farvelade+logo skærm hvor vi lige skal se om alle temperatur sensorerne er der, som tager for evigt, medens system BIOS'en kigger efter om man skulle trykke på en magisk knap.
* Diverse IO korts BIOS'er som lige skal sige "tryk F8 for dette eller F9 for hint"
* Boot menu

Først herefter starter bootloaderen og så går der 30 sekunder inden OS'et er oppe at køre, som i øvrigt inkluderer initialisering af alt det hardware som BIOS'en lige har brugt 10 minutter på at få til at virke med DOS i 1985.

Jeg kunne godt ønske mig en alternativ BIOS til HP maskiner som bare booter mit OS uden at gøre noget som helst andet, det virker glimrende i ikke-HP maskiner med HP controllere i hvor BIOS'en bliver slået fra på kortet.

Log ind eller Opret konto for at kommentere