Adobes PDF-ekspert: Sådan ser fremtidens arkivstandard ud

Hvis et digitalt dokument også skal kunne læses om 80 år, er man nødt til at tænke sig grundigt om. Læs hvorfor Adobe ikke mener, at nye versioner af PDF/A-standarden er noget problem.

»Da jeg begyndte på universitetet for 20 år siden, skrev jeg masser af interessante ting på min computer. Men de er tabt for eftertiden, fordi jeg skrev i WordPerfect 5.0 og gemte dokumenterne på en floppydisk. Fem år senere gemte jeg sager for det hollandske politi i PDF-format, og dem har jeg intet problem med at åbne i dag.«

Eksemplet stammer fra Colin van Oosterhout, der er Adobes PDF-ekspert og har titel af Senior Business Development Manager.

Netop langtidopbevaring af digitale dokumenter er en udfordring for både offentlige og private virksomheder, og Colin van Oosterhout er da også i København for at diskutere strategier og dokumentformater med Digitaliseringsstyrelsen.

Hans anbefalinger vil utvivlsomt indbefatte PDF-varianten PDF/A, der er udviklet særligt med henblik på langtidsopbevaring af digitale dokumenter.

»PDF/A-standarden gør på sin vis et dokument mere kedeligt. Hvis der for eksempel er et link til en hjemmeside i dokumentet, siger standarden, at man ikke skal kunne klikke på det. Og det giver god mening, for hvor mange af dagens hjemmesider tror du, vil eksistere med den samme URL om 80 år,« siger Colin van Oosterhout, da Version2 besøger ham på Adobes københavnske kontor med udsigt til havneløbet.

PDF/A sikrer blandt andet, at alle brugte skrifttyper i dokumentet er indlejret og at dokumentet ikke er låst med et kodeord, som ingen længere kan huske. På den måde søger standarden at sikre, at al nødvendig information for at kunne se og læse et givent dokument præcis som det blev skabt, er indlejret i filen.

»PDF er som sådan et meget rigt format. Du kan indlejre billeder, hyperlinks, CAD-tegninger, musik og videofilm - men hvis du gør det, er der ingen garanti for, at dine efterkommere kan læse dokumentet om 80 år,« siger Colin van Oosterhout til Version2.

PDF-formatet blev oprindelig udviklet af Adobe, men specifikationen blev overdraget til standardiseringsorganet ISO i 2008. PDF/A blev ratificeret som ISO-standard i 2005.

PDF/A udvikler sig dog stadig. Varianten PDF/A-1a fra 2005 tillader tagging eller opmærkning af dokumentet med metadata, så dokumenter, der er 'født' digitale, kan bevare så meget som muligt af den indlejrede information og funktionalitet.

Varianten PDF/A-1b ligeledes fra 2005 har fokus på at sikre den visuelle repræsentation af et givent dokument og er f.eks. god til dokumenter med indscannede dele.

»Begge varianter er gode til arkivering, men ikke særligt velegnede til fortsat sagsbehandling. Så det er kun, hvis man har tænkt sig at gemme noget væk, at de er smarte,« siger Colin van Oosterhout.

Samtidig løfter han sløret for den nye PDF/A-2 specifikation, som baserer sig på PDF 1.7.

»Den tillader blandt andet jpeg2000-kompression og har også mulighed for gennemsigtighed, så man blandt andet kan lave sticky notes. Endelig inkluderer den også 'PDF collection' - at man kan samle flere PDF'er i en logisk orden, for eksempel hvis du har en e-mail med flere vedhæftninger, der skal arkiveres,« siger Colin van Oosterhout til Version2.

Adobe brygger såmænd også på en PDF/A-3 version, som ud over de nævnte ting giver mulighed for at samle ikke-pdf'er som vedhæftninger i PDF collection-containeren.

Men er det ikke et problem, at en standard, der skal holde i århundreder udkommer i nye versioner i tide og utide?

»Det er en god ting, at PDF/A udvikler sig. PDF/A specifikationen er offentlig, så du kan altid selv lave din egen reader til at læse dokumentet. Og alle nye versioner vil altid være fuldt ud bagudkompatible, så forskerne om 100 år får ikke problemer med at jonglere rundt med både PDF/A-1a og PDF/A-2,« siger Colin van Oosterhout.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (5)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
#1 Aputsiak Niels Janussen

Problemstillingen er reel nok, men eksemplerne var lidt spøjse. I det første eksempel indgår WordPerfect 5 og floppydisk, mens det andet eksempel blot kræver et program som læser PDF/A. For sjov skyld måtte jeg ud på nettet og finde en ældre WordPerfect-fil og teste om LibreOffice kunne åbne den. Det gik fint med LibreOffice 3.5.3.2. Test-filen: http://en.libreofficeforum.org/node/2621

  • 3
  • 0
#5 Erik Martino Hansen

Ja forskellen i hans eksempel er nærmere floppy vs. nyere lagermedier end Wordperfect vs. PDF. Dog vil jeg give ham at på længere sigt eller filer i formater der ikke har Open Source implementationer er det rigtigt relevant. Fx CAD tegninger.

  • 0
  • 0
Log ind eller Opret konto for at kommentere