Emulering skal redde den danske digitale kulturarv

Det Kongelige Bibliotek er i et kapløb med tiden om at bevare danske digitale kulturarv, inden forældede lagermedier og uddød hardware helt forsvinder.

På udviklingskonsulent Jakob Moesgaards skrivebord på Det Kongelige Bibliotek i København ligger en strømforsyning og et gammelt, lettere adskilt 5¼" floppydrev forbundet med en lille printplade, der gør det muligt at tilgå det noget nær antikke lagerformat via hans computers USB-port. Det er ikke en køn løsning – men den virker.

Årsagen til hardwaren er, at en kendt dansk forfatter har indleveret 50 floppy-disks med digte og dokumenter til Det Kongelige Bibliotek, som gerne skal bevares for eftertiden.

Udfordringen er imidlertid ikke blot fysisk, men også, at teksterne på disketterne er skrevet i det forlængst uddøde tekstbehandlingsprogram DSI-tekst og gemt i det i dag utilgængelige filformat TBD.

»Jo mindre udbredt et filformat har været rent internationalt, desto vanskeligere er det at tage hånd om – især når vi først støder på det mange år efter, at det er udfaset. Vi kan så forsøge at konvertere filerne, men må konstatere, at vi så mister danske specialtegn, opsætning på siden og alt sådan noget,« fortæller Jakob Moesgaard, som tager imod sammen med sin kollega, it-konsulent Claus Jensen.

Det bevaringsværdige afhænger af perspektiv

Det Kongelige Bibliotek samarbejder med Statsbiblioteket i Aarhus om at sikre den digitale danske kulturarv. En opgave, der dels indbefatter bevaring af pligtafleveret materiale (alle danske udgivelser fysisk som digitalt skal afleveres i to eksemplarer til biblioteket), indleveret digitalt materiale af interesse fra privat/kulturpersoner samt Netarkivet, der løbende indsamler materiale fra over en million danske domæner.

»Hvad der er bevaringsværdigt, handler jo om perspektiv. For nogle er gamle busplaner bevaringsværdige og kan bruges i forskning om 100 år. Så som udgangspunkt forsøger vi at gemme det hele ud fra den tanke, at det ikke nødvendigvis er op til os i 2015 at afgøre, hvad der er vigtigt i 2040 eller 2070,« siger Jakob Moesgaard.

Som sådan arbejder Det Kongelige Bibliotek derfor ikke med acceptable tab af data, men samtidig er medarbejderne nødt til at foretage prioriteringer i forhold til, hvilket materiale de tager fat i først.

Således ligger der for eksempel tusindvis af disketter med løsbladsværker til lovtekster, der er kommet ind via pligtafleveringen, og som er en udløber af en gammel praksis med at udsende løsblade til lovsamlinger. Det er materiale, som ifølge Moesgaard i et vist omfang allerede er taget hånd om af Folketingets Bibliotek og andre steder og derfor bliver nedprioriteret i forhold til ting, som er unikke eller kun findes i få eksemplarer.

Læs også: Katalog på Den Sorte Diamant med forældede browsere og plugins skal sikre den digitale kulturarv

Digitale medier går i fysisk opløsning

»Virkeligheden kan godt overhale idealet. Hvis for eksempel et værk er blevet brændt på en cd-rom i slutningen af 1990’erne, og vi på nuværende tidspunkt ikke har haft den i hænderne og nået at overføre data, så er der en stor sandsynlighed for, at data simpelthen er forsvundet. Det er vilkårene. Men vi forsøger at iværksætte procedurer, der sikrer os mod, at ting henstår, indtil de pludselig går i opløsning,« siger Moesgaard.

I den aktuelle sag med den danske forfatters 50 floppy-disks er der allerede flere af disketterne, som har så mange dårlige sektorer, at det ikke har været muligt at indlæse materialet, som derfor indtil videre må betragtes som tabt.

Men Jakob Moesgaard ser frem til inden for en nær fremtid at kunne tage værktøjer som for eksempel Kryoflux i brug, der i stedet for at læse magnetiske medier på sædvanlig vis snarere aflæser selve magnetfeltet, så en kopi kan gemmes på et mere stabilt medie, indtil der er tid eller økonomi til at restaurere indholdet.

Data skal frigøres af de fysiske medier

»Når vi først har fået data af mediet, så er jeg lidt mere tryg. Det kan ske, at når vi migrerer indholdet til et bedre filformat, eller et format der måske fylder mindre, at for eksempel sidehenvisninger eller lignende forskubber sig. Deri ligger selvfølgelig også et tab af information, men det er på et andet plan, end at alt er gået tabt,« siger Claus Jensen.

Det er derfor praksis for Det Kongelige Bibliotek, ligesom det er internationalt, at bevare materialet i sit originale format, selvom det konverteres.

Det sker ifølge Claus Jensen også, fordi bevaringsinstitutioner ikke i samme omfang som tidligere ser migrering af materiale som løsningen på alting, men også i høj grad kigger på emuleringsmiljøer, der kan simulere den oprindelige hardware.

Det Kongelige Bibliotek ser det nemlig ikke som sin opgave at vedligeholde et decideret hardwarebibliotek, og det skyldes blandt andet, at det ikke anses som en reel mulighed at vedligeholde hardwaren, fortæller Claus Jensen.

Perspektivet for bevaring rækker længere end tilgængeligheden af reservedele, og der er en større sandsynlighed for, at hardwaren kan genskabes engang i fremtiden, end at den kan holdes funktionel i flere hundrede år. Derfor satses der i højere grad på emulering.

Emulatorer skabes af entusiaster

»Emulering er en måde at gengive originalmaterialet på så autentisk som muligt, men så handler det selvfølgelig om, hvor god emuleringen er. Hvor godt den for eksempel gengiver de oprindelige farver,« siger Claus Jensen.

En stor del af arbejdet med at udvikle emulatorer foregår blandt entusiaster og privatpersoner, der især er drevet af nostalgi omkring computerspil, fortæller Jakob Moesgaard.

Det betyder, at især computere som for eksempel Commodore 64 og ZX Spectrum er bredt understøttet med emulatorer, mens det bliver noget vanskeligere, når der er behov for mere esoteriske filsystemer eller computere – og specielt hvis der er tale om rent danske systemer som f.eks. Piccoline-computerne, som blev udviket af Regncentralen i 1984-1989, og som kørte på programmeringssproget Comal-80.

»Det er selvfølgelig vigtigt, at vi også tager hånd om de systemer, som der ikke er så stor entusiasme om,« siger Moesgaard, der dog føler sig tryg ved, at det internationale samarbejde omkring digital bevaring, som Det Kongelige Bibliotek også bidrager til, kan løfte opgaven.

Samtidig hænger det naturligt sådan sammen, at jo mindre udbredt et system har været, desto mindre materiale bliver der indleveret i de formater.

»Nok handler emulering om at gøre materialet uafhængigt af hardware. Men vi må ikke glemme specifikationerne for, hvordan materialet oprindeligt blev afviklet. Der er en del projekter internationalt, som arbejder på, hvordan systemkrav og afviklingsmiljøer beskrives og sørger for at opbygge databaser med forskellige typer software, så vi for eksempel kan emulere en 386 med den rette mængde RAM og styresystem, som kan bruges til at afvikle det materiale, der har været på det tidspunkt,« siger Jakob Moesgaard.

Læs også: (gen)Oplev den nu 30 år gamle Windows 1.01 i din browser

Cloud-løsninger gør det svært at bevare data for eftertiden

I fremtiden forudser Claus Jensen, at den tiltagende brug af cloud-baseret software og lagerløsninger kan få stor betydning for bevaring af digitalt materiale. Ikke kun vil softwaren blive sværere at emulere, når den ikke eksisterer i en offline-version, det bliver også sværere at indsamle materialet i en form, hvor for eksempel et tekstdokuments ændringer og kommentarer følger med.

Jakob Moesgaard mener også, at det bliver en stor udfordring at bevare materiale udgivet til tablets, når berøringsfølsomme skærme på et tidspunkt går af mode – ligesom bevægelsesspil til Nintendo eller Microsoft Kinect er svære at bevare på en autentisk måde, hvis de engang i fremtiden skal emuleres med en mus.

Endelig fastslår både Claus Jensen og Jakob Moesgaard, at behovet for dokumentation ikke skal undervurderes, for om 70 år er det på ingen måde givet, at brugerne overhovedet ved, hvordan de skal ’mounte’ et drev eller navigere omkring i DOS.

»Vi havde et lille forsøg for et års tid siden med en gruppe unge mennesker, og de havde virkelig vanskeligt ved at indlæse og afvikle programmer i DOS. De forsøgte helt naturligt at klikke på ting på skærmen, og de var helt lost. Og det bliver kun værre og værre,« slutter Claus Jensen.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (4)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Torben Mogensen Blogger

Dansk Datahistorisk Forening har meget gammelt hardware, som de forsøger at vedligeholde, så det kan køre det gamle software. De kunne f.eks. tidligere i år vise Comal80 på et bredt udvalg af hardware, lige fra RC7000 til Commodore Amiga og moderne PC'er.

Måske kunne det Kongelige Bibliotek spørge DDF om hjælp, når de skal hente data fra gamle medier i gamle formater?

Men ellers giver jeg dem ret i, at emulering er den mest fremtidssikrede metode til at bevare ældre software -- det er ikke kun tekster skrevet i DSI-tekst, der er interessante, men også DSI-teskt som kørende system. Man kan på kort sigt vedligeholde gammelt udstyr, men det holder ikke (bogstaveligt talt) i længden. Men man skal passe på, at emuleringerne ikke er implementeret på systemer, der senere igen får behov for emulering osv., for hvert niveau af emulering koster betragteligt i ydeevne. Så længe computeres ydeevne stiger eksponentielt er det ikke noget problem, men det holder ikke evigt (jvf. diskussioner om holdbarheden af Moores lov).

Løsningen må være at skrive emulatorerne i et enkelt og præcist defineret programmeringsssprog med en enkel grænseflade til skærm, tastatur, og ydre enheder, sådan at dette sprog kan implementeres på fremtidige computere uden behov for emulering. F.eks. kan en skærm repræsenteres som et bitmap, hvor de enkelte pixels kan sættes og læses.

  • 3
  • 0
Anders Vind Ebbesen

Tilbage i 2013 hjalp folk fra Datahistorisk Forening med at redde DSI filer vha. Kryoflux (og lidt andre hacks): http://datamuseum.dk/2013/03/torsdagsaktive-20130314/

For et år siden fortalte grundlæggeren af DSI i øvrigt sin og firmaets historie ude i foreningen: http://datamuseum.dk/2014/11/historien-om-dsi-tekst/

I starten af i år afholdte foreningen et større COMAL-arrangement. Her er nogle af de maskiner, som kørte COMAL den dag:
http://datamuseum.dk/foto/20150228c/DSC04924
http://datamuseum.dk/foto/20150228b/20150228091413_G

Blandt oplægsholderne var dem der implementerede første version af COMAL (under instruks af Børge Christensen) og folk som var med til at få COMAL til at køre på Amiga, unix, Amstrad, osv. osv.: http://datamuseum.dk/2015/01/invitation-til-markering-af-40-aaret-for-co...

Og WordWork - et filbehandlingsprogram som vist ikke engang Google kender til - er for nyligt kommet op at køre på en SPC/1 fra Dansk Data Elektronik: http://datamuseum.dk/2015/09/torsdagsaktive-d-10-september-2015/

Så der er masser af folk i DK, som kunne bistå det Det Kongelige Bibliotek med ekspertviden om systemerne og programmerne.

Det oplagte spørgsmål er selvfølgeligt: Burde DKB ikke betale nogen for at udvikle de fornødne emulatorer, da man næppe via international samarbejde får foræret emulatorer af de "obskure" danskproducerede maskiner?

  • 1
  • 0
Log ind eller Opret konto for at kommentere