Arkivering: Forslugent filformat koster kommuner dyrt

Statens arkiver gemmer kommunale ESDH-dokumenter i det pladskrævende TIFF-format. Kommunerne betaler for lagringen pr. gigabyte.

Når dokumenterne i kommunernes systemer til elektronisk sags- og dokumenthåndtering (ESDH ) skal arkiveres for eftertiden, hedder filformatet TIFF. Også selvom de allestedsnærværende PDF-filer fylder meget mindre end en tilsvarende TIFF-fil og ofte inkluderer muligheden for at søge i dokumentets tekst ? noget som TIFF-filer skal have en tilhørende tekstfil for at kunne.

Det er Statens Arkiver, der står bag formatkravet, som har eksisteret siden 2000 og gælder, uanset om kommunerne selv gemmer dokumenterne eller vælger at aflevere dem til Statens Arkiver. I sidstnævnte tilfælde opkræver Statens Arkiver en afgift på 43 kr. om året pr. gigabyte.

Alene sidste år blev 2,5 terabyte elektroniske data indrapporteret til Statens Arkiver, hvilket altså sikrede virksomheden en årlig merindtægt for opbevaring på omkring 100.000 kr.

Specialkonsulent i Kommunernes Landsforening Mads Ellehammer konstaterer, at TIFF var det bedste bud på en filstandard i 2000, og at kommunerne blot kan tage TIFF-tvangen ad notam.

»Men betalingsspørgsmålet interesserer os naturligvis, og med den valgte betalingsstruktur har filstørrelsen stor betydning,« siger han. KL vil af samme grund genforhandle lagringsprisen og reglerne for, hvor meget der skal arkiveres.

De fleste kommuner scanner i dag posten ind i TIFF-format for at leve op til kravene, når materialet en gang skal arkiveres. Men blandt andre Fujitsu arbejder på at tilbyde en integreret PDF-løsning, hvor kravene til serverplads er markant lavere.

»Lagerplads er dyr i drift, og en PDF-løsning vil som minimum halvere pladskravet, både hos kommunen og, siden hen, hos Statens Arkiver,« siger teamchef i Fujitsu, Karsten Timmann.

Ude i kommunernes it-afdelinger er man heller ikke i tvivl om, at TIFF-tvangen ikke er den billigste løsning.

»Vi stiller os undrende over for, at man har valgt et meget pladskrævende format, når man samtidig opkræver et beløb pr. gigabyte for at opbevare kommunernes data,« siger eDoc-administrator i Næstved Kommune, Christian Søndergaard Poulsen.

Statens Arkiver arbejder på at revidere reglerne for tilladte filformater. Jan Dalsten Sørensen, der er chefkonsulent og daglig leder af Statens Arkivers digitale arkiveringsenhed, fortæller, at arkivarer grundlæggende er konservativt indstillede, men at man bestemt godt kunne forestille sig den særlige PDF/A-standard indarbejdet i de regler, der forventes at træde i kraft i 2010.

»Fra arkivarens synspunkt har TIFF-formatet dog nogle indlysende fordele. Det er en ikke-proprietær standard, og formatet gemmer data på en ikke-tabsgivende måde, hvilket er vigtigt, når vi løbende konverterer vores datasamling til fremtidens standarder. Almindelige PDF-filer (ikke PDF/A, red.) er udelukket, da det er den sikre vej til at miste data,« siger Jan Dalsten Sørensen.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (8)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Morten Krogh Andersen

Hvor er komprimering blevet af i denne problemstilling? Og hvor er indsigten i filformater?
Ovenstående er lidt for meget Computerworld/Ekstrablads-journalistik, efter min smag.
Og hvorfor sammenlignes to filformater, som begge ikke fortæller noget om det egentlige billedformat?
http://en.wikipedia.org/wiki/Portable_Document_Format
http://en.wikipedia.org/wiki/Tagged_Image_File_Format.

Æv, det blev lidt surt, dette her, men jeg synes artiklen er for overfladisk.

  • 0
  • 0
Gustav Brock

Helt ærligt, 100.000 kr. for at lagre et års materiale.
Hvor er proportionerne henne? Det er jo næsten gratis, og det vil da på ingen måde kunne betale sig at omlægge noget på landsplan for at spare halvdelen, 50.000 kr.

Når hertil lægges, at prisen på lagerplads falder voldsomt i disse år, og de 46 kr. pr. GB derfor burde falde løbende, er bare tanken om en omlægning dødfødt.

Endelig er TIFF da et glimrende format. Tabsfrit og ekstremt udbredt samt forståeligt for alle relevante applikationer.

/gustav

  • 0
  • 0
Henrik Carlsen

Bare fordi diskene er der, skal hvert et komma gemmes. Hvem tror at forskere i fremtiden gider pløje en fantastlillion bytes igennem. Jeg frygter de gemte datamængder bliver så store at selv Google ville blegne.

Man burde foretage en objektiv sortering baseret på hvad man med fordel kan køre statistik på. Mister man derved data der senere kunne bruges, er det bare ærgerligt. Man må skille snot fra godt og noget ryger altså i svinget!

  • 0
  • 0
Morten Krogh Andersen

Er det noget Statens Arkiver står for? Så vidt jeg kan se er det en optional del af formater; dvs. at komprimering ikke er tvunget.

Mht. til billedformatet, så er det ikke særligt brugbart at få at vide at der benyttes (evt. lzw komprimeret) tiff, når nu tiff blot er en container, som f.eks. kan indeholde et jpg billede.

  • 0
  • 0
Niels Dybdahl

TIFF og PDF standarderne understøtter mange kompressionsmetoder. De understøtter begge CCITT Gruppe 3, CCITT Gruppe 4, LZW, JPEG.

"TIFF baseline" understøtter ikke CCITT Gruppe 4, LZW eller JPEG, men understøtter dog Packbits og CCITT Gruppe 3.

Hvad PDF/A understøtter aner jeg ikke.

Hvis de scannede sider gemmes med 1 bit/pixel, så er den bedste kompression uden tvivl CCITT gruppe 4, som giver ca halvt så store filer som CCITT gruppe 3 og LZW, som begge giver ca halvt så store filer som Packbits.

Hvis de scannede sider gemmes som contone er LZW eller JPEG bedre. bemærk at JPEG også understøtter tabsfri komprimering.

Iøvrigt er det tosset at gå efter en "tabsfri" gengivelse. Det er langt bedre at støv/støjfiltrere de scannede billeder først.

Jeg har selv været med til at udvikle et arkiveringssystem til avissider, hvor vi valgte at gemme i PDF med CCITT gruppe 4 kompression og lægge OCR-genereret tekst ind bag de scannede billeder, så filerne også var søgbare.

At udtale at PDF filer skulle være den sikre vej til at miste data er også ret langt ude synes jeg. Men TIFF er udemærket hvis man ikke har brug for at gemme tekst i filerne

Niels Dybdahl

  • 0
  • 0
Log ind eller Opret konto for at kommentere