AutoArkæologen

Jeg havde egentlig håbet af GitHub havde meldt sig ind i de 20 århundrede, men man kan åbenbart ikke bruge 'æ' i et repostory-navn, så mit seneste projekt heder "AutoArchaeologist".

Jeg fortalte i mit forrige blogindlæg om den Commodore-900 UNIX maskine der kunne have forandret verden i 1985, men istedet havnede i en kælder hvorfra den senere kom til vores samling.

Vi har naturligvis lavet kopier af harddisken og gemt dem behørigt i vores bitarkiv.

Der ligger de trygt og godt og ... temmelig ubrugeligt, for alle andre end det ca. dusin ejere af overlevende CBM900 computere der er her på planeten.

Vi har samme problem med en masse andre data-medier og jeg har i nogen tid søgt en måde hvorpå vi kunne "udgrave" og præsentere dem for resten af verden.

Resultatet af anstrengelserne er det føromtalte "AutoArchaeologist" projekt.

Det er sådan set en meget simpel konstruktion: Man laver en "udgravning", man hægter nogle "artifakter" på den og man vælger nogle "specialister" der skal kigge på tingene og slipper dem løs.

En af de tilgængelige specialister er 'V7_Filesystem', der kan genkende et klassisk UNIX filsystem og lave en 'presentation' i form af en ls -lR-lignende liste og producerer nye afledte artifakter for alle filerne i filsystemet.

En anden specialist er "Ascii' der genkender tekstfiler og nu kan enhver med en browser se hvilke fortunes CBM-900 kom med.

Det er et trivielt første eksempel men jeg har skrevet ret mange 'specialister' allerede og endnu flere er på vej.

I princippet kan man grave lige så dybt man vil[1], f.eks kunne man lave 'specialister' der disassmblerede CBM-900 programmerne, eller udtrak grafik fra C64-spil osv.

Vores GIER hulstrimler er på vej på samme måde, den har et noget specielt tegnsæt, og hele RC3600 samlingen af data-medier er også på vej, inklusive listning af COMAL save-filer.

Autoarkæologen er skrevet i python3, som har har vist sig at være et utroligt godt sprog til denne slags databehandling, f.eks tager V7_Filesystem kun 367 linier kode.

Et artifakt er defineret som en unik sekvens af bytes, så hvis man har den samme fil på flere data-medier vil det automatisk blive opdaget og vist i 'Derivation' sektionen, det kan man f.eks se med stat.h filerne på CBM900 disken.

Bortset fra de artifakter man starter med, er alle artifakter afledt fra andre artifakter, enten direkte, f.eks med en disk-partitionerning der opdeler en disk-artifakt i flere partitions-artifakter, eller som med et filsystem, der tager nogle bestemte spredte sektorer ud af partitions-artifaktet og presentere dem, minus nogle overskydende bytes, som et nyt artifakt.

Til artifakter kan 'specialisterne' knytte noter, kommentarere og beskrivelser. Noterne samles i et index, således at man f.eks kan søge direkte efter filer med en bestemt egenskab.

Jeg synes det er blevet rigtig godt og det kommer ihvertfald til at hjælpe os i Datamuseum.dk, men jeg håber naturligvis at andre også vil lege med, det kunne f.eks være et glimrende værktøj til at skabe overblik over hvad man har på sine gamle disketter...

phk

[1] Pro-Tip: Stop i god afstand før Balroggen.

Kommentarer (4)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
#1 Palle Raabjerg

Spændende!

Jeg er lige startet som systemadministratør på Carolina Rediviva for lidt over en måned siden, på deres afdeling for digitalisering (indscanning og digital arkivering af gamle bøger og andet materiale fra deres samlinger). Jeg havnede i en diskussion om indsamling og bevaring af data-materiale, noget som man åbenbart er begyndt at vise mere interesse for på biblioteket. Det er ikke en del af mine opgaver lige nu, men det kan sagtens være det er noget jeg ender med at involvere mig lidt i!

Første prioritet her er også at få en slags bit-arkiv i gang, kunne jeg forstå, lidt som det i har på Datamuseum. Derefter skal man finde ud af hvordan man vil publicere, eller på anden måde gør det tilgængeligt på en fornuftig måde (i lys af data-formater, eventuelle ophavsrettigheder, osv). Og AutoArchaeologist ser ud som noget jeg måske lige skal smide ind i diskussionen, til når vi kommer så langt :D

Men en del af problemet er at når det kommer til stykket, så er vi et bibliotek, så vi har f.eks. konservatorer som specialiserer i oldgamle bøger, men vi har ikke som udgangspunkt megen udrustning eller ekspertise til data-arkæologi. Jeg kan sikkert selv være lidt behjælpelig, men jeg er ikke direkte ekspert. Jeg påpegede dog at Uppsala Universitet (som vi er en del af) har Update-klubben, som sikkert også kan medvirke til at hjælpe os i gang: http://www.update.uu.se/

Ud over det, så findes der også http://www.datamuseet.se/. Det ser ud til at være organiseret mere som et traditionelt museum. Hvor meget de roder med data-arkæologi og bit-arkivering ved jeg ikke lige, men antageligvis kunne vi også finde hjælp at hente der.

Har du i dit virke med datamuseum.dk eventuelt fået kendskab til andre foreninger i Sverige som er dedikeret til datahistorie?

  • 4
  • 0
#2 Poul-Henning Kamp Blogger

Har du i dit virke med datamuseum.dk eventuelt fået kendskab til andre foreninger i Sverige som er dedikeret til datahistorie?

Jeg har ikke rigtigt overblik over hvad der sker i Sverige.

Jeg ved at vi har kontakt med både "IT-ceum" som http://www.datamuseet.se/ tilsyneladende hedder i den fysiske verden, men også med nogle private foreninger som f.eks Dalby Datormuseum der hedder http://www.datormuseum.se/

Der er vist nok også nogen i Uppsala, muligvis www.abc80.net ?

  • 4
  • 0
Log ind eller Opret konto for at kommentere