SAN-fejl giver EPJ-problemer på Århus Universitetshospital
Fejlen, der bare ikke må ske, skete for nylig på Århus Universitetshospital, Skejby, hvor en fejl i EPJ-driftens storagesystem betød, at EPJ-systemet på hjertemedicinsk afdeling i flere timer var ramt af katastrofalt lange svartider.
Sygehuset anvender et netværksbaseret storagesystem (SAN) til opbevaring af data.
»Vi har haft et nedbrud i en komponent i vores SAN, der betød, at vores EPJ-system i perioder havde meget lange svartider,« siger it-chef på Århus Universitetshospital, Skejby Lars Knudsen til Version2.dk.
It-chefen oplyser, at sygehusets EPJ-system er Oracle-baseret og kører på Sun Solaris-servere. Storagesystemet er et SAN fra EMC, hvor det angiveligt var en path-komponent, der stod af. Han understreger, at ikke andre af sygehusets systemer var ramt af problemerne.
It-teknisk afdelingsleder Per Jørgensen fra Århus Universitetshospital, Skejby oplyser, at systemet på grund af planmæssig justering var ude af drift i nogle timer, men bekræfter, at der desuden var tale om ekstremt lange svartider på op til to minutter.
Per Jørgensen oplyser endvidere, at problemet efter al sandsynlighed har ligget i en softwarekomponent, der styrer flere simultane paths (stier) til storageområdet.
»Det tog relativt lang tid at lokalisere fejlen, for vores overvågningsystemer kunne ikke se, at der var nogle fejl, så vi forfulgte de forkerte årsager, men vi har to HBA'er, der skal sikre en redundant opkobling, og det var tilsyneladende softwaren, der håndterer flere samtidige adgange til storagesystemet, der gav anledning til problemer, og dem kunne vi først se, da vi var meget langt nede på controller-niveau i operativsystemet,« siger han.
Per Jørgensen oplyser dog, at der endnu mangler en sidste systemtest til at påvise, at det er path-komponenten, der har forårsaget problemerne.
Nedbrud i hardwaren er ellers ikke noget, som Århus Universitetshospital, Skejby er vant til.
»Efter hvad det er mig bekendt, er det første gang i EPJ-driftens historie, at vores EPJ-system har været nede, som følge af hardwareproblemer, så det er ikke noget, vi har set før, men man hører jo også om CSC og IBM, der har nedbrud, så det kan jo forekomme,« siger it-chef Lars Knudsen.
Kommentarer (2)
Har IBM og CSC ikke sørget for at alle vi som administrere "mindre it systemer" har fået et os et "get out of jail card" ved at man bare henviser til at det jo også kan ske for IBM og CSC... Og ja jeg har også prøvet at for hele systemet til crashe pga en hardware fejl... Og nej jeg har ikke været nød til at benytte et get out of jail card, da system leverandøren har taget skylden pga hardware fejl.
Der er så meget politik omkring EPJ-systemer at jeg tror det er fornuftigt at påpege at "andre kan heller ikke garantere 100% stabilitet".

