georg strøm bloghoved

Hundrede års systemer

Hvor lang tid har vi egentlig brug for data? Det er et spørgsmål som jeg støder ind i cirka en gang om året.

Nu taler jeg ikke om arkivering for historikere. Her vil det selvfølgelig være rart, hvis vore digitale data kan læses om fem tusind år, ligesom vi i dag kan læse tekster fra det gamle Ægypten. Det største problem er imidlertid de data som fortsat skal anvendes. Som skal være komplette, og hvor det skal være muligt at søge og anvende dem.

Indenfor medicin, er det ikke helt ved siden af at tale om, at data skal være tilgængelige op til hundrede år efter de blev skabt.

I 1918 kom den spanske syge. En influenzaepidemi som kostede 50 millioner døde. Flere end hele første Verdenskrig. Når læger i dag vil stoppe dødbringende epidemier af influenza, har de brug for prøver fra den, for næsten hundrede år siden. Dengang var prøverne registreret på papir. I dag er de registreret i computersystemer, og det kan i fremtiden være umuligt at identificere en prøve der er mærket med en kode, uden adgang til de data om den, der er lagret i en computer.

Tandlægers journaler er stadigvæk det vigtigste middel til at identificere personer som er fundet døde. Derfor er der brug for optegnelser fra en afdøds tandlæger fra det meste af hans eller hendes liv. Her kan det være nødvendigt at kunne søge i data som er over 50 år gamle.

Det skaber en række udfordringer. For det første må data ikke gå tabt rent fysisk. En tandlæges journal skal altså bevares selvom klinikken lukker, og data fra forskningsprojekter skal gemmes efter at selve projektet er sluttet. Dernæst skal de forskellige data overføres til nye medier, efterhånden som de gamle forfalder, og der skal sørges for sikkerhedskopier.

Desuden er der brug for automatiske procedurer til sletning af overflødige data. Det er i første omgang let og ret billigt at gemme data, så alt bliver gemt, men det bliver nok i praksis alt for dyrt at gemme alle medicinske data fra et helt århundrede. Lagermedier bliver stadig billigere, til gengæld kan sådan noget som højkvalitetsscan af præparater producere langt større datamængder end vi i dag er vant til at håndtere.

Derefter skal det sikres at de forskellige data ligger i formater som kan læses en gang i fremtiden. For halvtreds år siden lå data på magnetbånd eller papirstrimler. Vi kan måske finde en læser til dem som stadig fungerer i dag. For hundrede år siden, var det noget med elastikpenne og papir. De kan stadig læses af mennesker, så de er måske lettere tilgængelige end vore dages elektroniske data er om hundrede år.

Med mindre der sker en indsats for at sikre, at vore dages dataformater langt ud i fremtiden, og at der bliver udviklet software til fremtidens platforme, som kan søge i de gamle journaldata. Det er jo ikke nok at kunne læse data, det er også nødvendigt at kunne finde, præcis hvad man leder efter.

Der er principielt to muligheder. Enten skal vi stille krav til dataformater og til de strukturer der bruges til at finde data, allerede i dag, eller også kan vi en gang i fremtiden være nødt til at gøre en langt større indsats for at genskabe læsere til dataformater og software som kan søge i dem. Under alle omstændigheder bliver vi nok nødt til at overveje hvordan vi kan lave hundrede års systemer.

Kommentarer (5)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Carsten Sonne

EU Forskningsprojektet Keeping Emulation Environments Portable (KEEP) sigter at bevare den kulturelle arv. Praktikaliteter omkring tandlægedata ol. hører dog næppe under den hat.

  • 0
  • 0
Torben Mogensen Blogger

Hvis blot et medie laves holdbart nok, vil det vedblive at være muligt at læse det. Selv om der ikke findes mange hulkortlæsere tilbage, er det en smal sag at hælde en stak hulkort i en scanner med arkføder og "læse" kortene fra de scannede billeder.

Magnetiske medier holder ikke evigt, og de mest brugte optiske medier (CD, DVD og BluRay) har også begrænset levetid. Men man kan godt gemme information i god datatæthed og næsten ubegrænset levetid (forudsat ordentlig opbevaring). F.eks. kan man med laser brænde mikroskopiske huller/kratere i metalfolie. Hvis folien blot opbevares i inaktiv gas, kan den holde nærmest evigt.

Dataformaterne skal selvfølgelig være dokumenterede. Bedst er det, hvis hvert dataarkiv indeholder dokumentation om sine egne formater i et ekstremt simpelt format (f.eks. ASCII uden komprimering), så der ikke er tvivl om, at dokumentationen kan læses. Det ville f.eks. være tåbeligt, hvis dokumentationen om PDF formatets struktur kun forefandtes i PDF.

  • 0
  • 0
Johan Reventlow

I Statens Arkiver, hvor jeg har min daglige gang, arbejder vi en del med denne type problemstillinger, og har netop blandt andet fokus på at stille krav til de dataformater vi modtager fra de danske myndigheder af hensyn til den fremtidige arkivbruger.

Vi har, i fællesskab med det Kgl. Bibliotek og Statsbiblioteket lanceret websitet http://www.digitalbevaring.dk, der løbende skal opbygges til at være et knudepunkt for viden fra de større danske bevaringsinstitutioner om emnet.

Hvis man interesserer sig for problemstillinger omkring digital langtidsbevaring, så er der bestemt god viden og informationer at finde dér :)

  • 0
  • 0
Log ind eller Opret konto for at kommentere
IT Company Rank
maximize minimize