Sådan sikres den danske filmskat digitalt i 100 år

En spillefilm kan bestå af 100.000 enkeltfiler, hvis den skal opbevares i et format, hvor intet går tabt for eftertiden. Derfor har Filmarkivet to båndrobotter til at håndtere en samling på foreløbig 400 terabyte.
Arkivleder Jacob Trock fra Filmarkivet med én af de tusindvis af gamle filmruller, som ligger i kølerummene. Illustration: Jesper Stein Sandal

I kølerummene ligger kopier og originaler af både 'I Tyrens Tegn', 'Cirkeline' og 'Sådan virker bilen II'. Men det er de færreste, der kan få glæde af de gamle filmstrimler, der i visse tilfælde kun findes i ét eksemplar og kun kan afspilles i film- eller videoapparater, der er lige så sjældne. Når Filmarkivet i Glostrup derfor digitaliserer de gamle film, handler det også om at kunne gøre dem tilgængelige for et større publikum.

»Digitalisering har en klar rolle i forhold til bevaring, men også i forhold til formidling og at gøre materialet tilgængeligt,« forklarer arkivleder Jacob Trock fra Filmarkivet til Version2.

Filmarkivet hører under Det Danske Filminstitut og står både for at opbevare gamle film og videobånd, men også for at indsamle nye og gamle produktioner og lagre dem digitalt.

Filmarkivet har til det formål anskaffet sig to Storagetek-båndrobotter, som sammen med et arkivsystem fra Oracle rummer det digitale arkiv, der i øjeblikket fylder cirka 400 terabyte. Alt det digitaliserede materiale ligger i mindst tre kopier i henholdsvis de to båndrobotter i Glostrup og i en køleboks i fjernlageret i Hillerød.

Derudover eksisterer en del af materialet også i kopier på Filmarkivets servere. Det gælder eksempelvis filmtrailere og film, der skal distribueres til bibliotekernes filmtjeneste Filmstriben. Dermed er det ikke usædvanligt, at en film i praksis findes i fem eksemplarer.

Et kig ind i den ene af Filmarkivets to båndrobotter, hvor arkivets digitale samling ligger. Illustration: Jesper Stein Sandal

Må arkivere i forskellige formater

Filmarkivet varetager også en rolle i forhold til pligtaflevering af offentligt materiale. Derfor får arkivet også indleveret nye film, som ankommer i et digitalt format, der er særligt udformet til at bevare filmene i den bedste kvalitet.

Formatet, DCDM, består af en stor mængde individuelle filer. Hvert billede i filmen ligger således som en selvstændig billedfil i et format uden tab. Tilsvarende ligger lydsporene som filer sammen med metadata, undertekster og en masse andre informationer, som indgår i en film. En film kan således bestå af 100.000 filer og fylder typisk op mod to terabyte, hvis den afleveres i den fulde udgave med en opløsning på 2K, som i dag er den mest brugte i biografer.

Når biograferne går over til 4K, vil hver film således fylde fire gange så meget. Dertil kommer nye lydformater som eksempelvis Dolby Atmos, som med 64-128 kanaler får mængden af lydinformation til at vokse.

DCDM er dog det bedste scenarie målt på kvaliteten. I praksis ankommer tingene ofte i andre formater, hvor der er brugt komprimering.

»Vi får ting ind til pligtaflevering i forskellige formater, så vi lægger os ikke fast på ét. For eksempel bruges DCP til biografdistribution. Der findes flere forskellige DCP-formater, og i starten brugte man også et JPEG 2000-format, som ikke var 'standard-standard'. Men vi er ikke enormt paniske med hensyn til formater. Alt sidder på skuldrene af tidligere formater, og reelt bygger det på 4-5 grund-codecs,« forklarer Jacob Trock.

I DCP-formatet sker der en komprimering med et kvalitetstab, som får filmen til blot at fylde typisk mellem 350 og 450 gigabyte. På den måde har biograferne hidtil fået udleveret filmene på harddiske. Nu er de imidlertid ved at gå over til netværksbaseret distribution, som også vil åbne for, at filmene kan distribueres i højere opløsning.

Dårlig bevaring af lyd

Billederne er imidlertid ikke det eneste sted, der kan ske tab. Ofte modtager Filmarkivet materiale, hvor kun det analoge lydspor på filmene er bevaret. Og hvis lyden oprindeligt er designet til surround-systemer, kan den efterfølgende være mikset ned til stereo, fordi mange glemmer at skrue op for centerkanalen, når de mikser ned til stereo fra 5.1 surround.

»Folk har været fantastisk dårlige til at bevare filmens lydside. Og vi kan eksempelvis ikke afkode Dolby-lyden,« forklarer Jacob Trock.

Formaterne til arkivering af film er også nødt til at udvikle sig løbende. Det gælder eksempelvis, når filmproducenter introducerer nye teknikker som eksempelvis 3D eller film med ekstra høj framerate.

De nuværende formater til arkivering er dog designet til at kunne tage højde for sådan en udvikling, også selvom skiftet fra delvist analog filmproduktion til ren digital er gået hurtigt.

Digital filmproduktion har gjort det lettere at aflevere en kopi til Filmarkivet, nu da arkivet kan håndtere de digitale formater, og det kommer indimellem også filmselskaberne til gode.

»Cirka én gang om året har vi en ny spillefilm, hvor de har haft et crash, og deres digitale masterkopi er defekt, og dem kan vi hjælpe. Harddiske er et godt arbejdsværktøj, men de er ikke gode til bevaring,« fortæller Jacob Trock.

Filmarkivets værksted fyldt med afspillere til forskellige videobåndformater og film. Illustration: Jesper Stein Sandal

Stort arbejde med metadata

Langtfra alt materialet i Filmarkivet er spillefilm, som ankommer grydeklart til arkivet. Arkivet indsamler også informationsvideoer fra det offentlige, reklamefilm, videooptagelser fra virksomheder og en masse andet, som ofte blot ankommer på videobånd.

De i visse tilfælde obskure båndformater kan Filmarkivet se igennem i et særligt værksted, der er fyldt med videomaskiner, som kan klare alt fra Super VHS til Type C. Men selve arbejdet med at overføre videoerne til et digitalt format er outsourcet.

»Det kræver, man har nogle gode maskiner, som er godt vedligeholdt og giver et rent signal,« forklarer Jacob Trock.

De analoge videosignaler behandles først analogt for at få billedet til at fremstå så godt som muligt, og med mindst et dusin forskellige typer videobånd har Filmarkivet valgt at lægge opgaven i hænderne på et specialiseret laboratorium i Holland. I Sverige og Norge har man oprettet sine egne laboratorier, men ifølge Jacob Trock giver det kun økonomisk mening, hvis man kan digitalisere mere end 120 timer pr. år.

Det er ikke muligt med de nuværende midler, som er afsat til driften af Filmarkivet. Ud over selve digitaliseringsarbejdet og driften af arkivet er der nemlig en stor opgave med at tilføje metadata til materialet.

»Logistikken kræver meget manpower. Halvdelen af tiden bruger vi nok på metadata, så vi eksempelvis registrerer, hvilket specifikt bånd der er digitaliseret fra, og hvem der har gjort det,« forklarer Jacob Trock.

Restore fra ældste kopi

I alt har Filmarkivet cirka 50.000 titler i sin samling, og databasen med det digitale arkiv rummer cirka 14.000 objekter, som hver især kan bestå af op til 150.000 filer.

Det hele ligger lagret på LTO6-bånd. Da datamængden er stor, og meget af materialet ikke tilgås hver dag, giver et båndarkiv god mening, da harddiske ville kræve mere vedligeholdelse og strøm.

Data på båndene bliver tjekket med en MD5-checksum, hver gang der laves en kopi, eller en fil flyttes for at sikre, at filen er intakt.

Selve arkivsystemet er også nødt til at fungere lidt anderledes end eksempelvis et almindeligt backupsystem, hvis noget går galt, og data skal genskabes.

»Hvis vi skal lave en restore, så skal vi have fat i den ældste udgave af filen, hvor et normalt backupsystem vil tage fat i den nyeste,« forklarer Jacob Trock.

8,5 petabyte om året

Det er dog ikke, fordi arkivet står ubrugt hen. På årsbasis bliver der hentet otte petabyte fra arkivet, og det tal vil formentlig vokse i takt med, at der kommer nye kanaler til at få adgang til det digitaliserede materiale.

Filmene hentes eksempelvis til filmfestivaller eller fremvisninger i Cinemateket, men også som udlån til blandt andet skoler via Filminstituttets portal filmcentralen.dk. De får dog ikke den op til to terabyte store originalversion af en spillefilm, men må nøjes med en kopi i dvd eller Blu-ray-kvalitet.

Filmarkivet arbejder selv på en ny tjeneste, hvor filmklip, der ikke er beskyttet af ophavsret, vil blive kombineret med geografiske oplysninger om, hvor og hvornår de er optaget. På den måde vil danskerne kunne klikke sig ind på eksempelvis Samsø og se historiske klip. Det er også tanken, at brugerne skal kunne dele de historiske klip via sociale medier.

I det projekt er det meste af materialet gamle sort-hvid-film, der er digitaliseret fra celluloid-filmstrimler, men meget af det nye materialer ankommer digitalt som filer.

Det fungerer fint, når der er tale om strukturerede formater som DCDM eller DCP, men bliver straks mere problematisk, når materialet stammer fra private produktioner.

»Vi skal sortere meget fra og smider måske to tredjedele ud, når vi får en privat samling. Det er ressourcekrævende at sortere, og nu er der en tendens til, at vi lader teknologien bestemme, så vi for eksempel bare gemmer alle vores digitale fotos i én mappe,« siger Jacob Trock.

Når arkivet allerede står med et stort sorteringsarbejde i dag, kan den udfordring altså blive endnu større, når fremtidige samlinger skal bevares. Det er de færreste, der strukturerer deres råmateriale, som blot får lov til at ligge som filer med fortløbende generiske navne og ingen metadata, ud over hvad kameraet har registreret.

Reoler med videobånd i mange forskellige formater står i store kølerum i Filmarkivet. Illustration: Jesper Stein Sandal
Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (19)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Mads Buch

Er dette ikke en applikation hvor torrent ville være perfekt?

Der må ligge store mængder data der ikke er beskyttet af ophav. Ved disse filer kunne man crowdsource bevaring ved at lade alle hente sig en kopi.

Man kunne også crowdsource bevaring ved filer der er beskyttet af ophav. Der ville man kunne kryptere filerne og håbe at folk vil donere nogle gigabytes til formålet

  • 0
  • 0
torben dalum

I artiklen står der at arkivet er på 400TB, det lyder godt nok ikke af meget. Skulle der ikke nærmere have stået 400 Petabyte, de båndrobotter ser ud til at have flere hundrede bånd, hvis ikke tæt på tusind. 800 bånd per robot giver 400 PB, ser det ikke meget rigtigt ud ?
Der bliver skrevet at en film typisk fylder 2 TB, så ville der jo kun kunne være 200 film, jeg vil gætte på der er flere.

  • 1
  • 0
Jesper Stein Sandal

Hej Torben

Tallet skulle være korrekt. Det er svært at se på billedet, men der er faktisk ikke så mange bånd i robotten, men der er plads til rigtig mange.

Når de 400 TB stikker lidt ud i forhold til en filmstørrelse på 2 TB, så skyldes det, at det kun er få film, der afleveres i det fulde format. Meget af det, der digitaliseres fra samlingen, er dokumentarer, der er kortere og ikke har samme høje opløsning som en ny biograffilm. Desuden er det foreløbig blot cirka 1 procent af samlingen, der har været penge til at digitalisere indtil videre.

Mvh.
Jesper Stein Sandal

  • 6
  • 0
Kasper Hovgaard

DCDM (Digital Cinema Initiative Distribution Master) formatet er helt ukomprimeret. DCP er det dertil hørende - tabsfrie - kompressionsformat. Begge er fri for patenter. Containerformatet er normalt MXF (European Broadcasting Unions foretrukne wrapper).

Jeg ved, at EU's PREFORMA program støtter projektet "MediaConch", som forsøger at definere en ny filmarkiveringsstandard baseret på FFV1 formatet - i en Matroska container. Valget er nok delvist afstedkommet af analyser som denne:
http://download.das-werkstatt.com/pb/mthk/info/video/comparison_video_co...

FFV1 og Matroska anvendes hér:
http://en.wikipedia.org/wiki/FFV1#List_of_institutions_known_to_use_FFV1

Men verdens filmarkiver synes delt i to "religiøse lejre":
1) De, som vægter kombinationen af åbne standarder og performance højest.
2) De, som insisterer på industrielle ISO-standarder og standalone hardwareunderstøttelse.

Danmark har altid tilhørt sidstnævnte kategori. Faktisk er det direkte nedfældet i arkivloven, at bestemte formater skal benyttes. Benytter man Statens Arkivers officielle værktøjer, kan man slet ikke få lov at aflevere video i andre formater end MPEG2+LPCM (MPG) eller MPEG4/H.264+AAC (MP4). Dette omfatter dog selvsagt ikke filmarkiver, men selv hér har man (alt for) længe sværget til det stadig licensbehæftede og helt forældede JPEG2000 format.

  • 6
  • 0
Kasper Hovgaard

Tak. Then I stand corrected. Jeg henholdt mig til, hvad jeg havde læst og hørt fra Statens Arkiver:
https://www.sa.dk/wp-content/uploads/2014/10/Vejledning-aflevering-dokum...
https://www4.sa.dk/media(3277,1030)/Bek._1007_af_20._august_2010_om_arki...
... Jeg tror, at det er ret usædvanligt i international sammenhæng, at anvendelse af specifikke filformater direkte er krævet i lovteksten. Generel kutyme er vist, at man ikke stiller formatkrav, men blot kræver, at formatet er læsbart og ikke kræver et licensbehæftet værktøj at åbne.

Stadsarkiverne arkiverer ofte på DVCPRO bånd eller lignende, hvis den lokale serverkapacitet er for lille - men dét kan vist ikke betragtes som ønskværdigt i metadatamæssig og tilgængelighedsmæssig henseende.

Hér er en anden diskussion, som antyder, at der stadig er en stærk uvilje mod at benytte åbne standarder (scroll ned til de sidste to indlæg): https://groups.google.com/forum/#!topic/archivematica/HulV96gJ0go

  • 0
  • 0
Jacob Trock

Tallet er korrekt. Og hvis du læste Politiken I går, kan du læse at kun 1% af vores filmarv er digital bevaret/sikret. vi har over 14.000 records I vores arkiv som startede op 2012 og for alvor I 2014. Men mange af disse filer er til formidling (små filer).

  • 0
  • 0
Jacob Trock

Statens Arkiver arkiverer (så vidt jeg ved)kun komprimerede versioner til bevaring. Film I sin oprindelige opløsning varetages I dag kun af Filmarkivet I det omfang vi mangter.
Matroska er fra mit POV lidt af en vildbasse at have I sit arkiv, idet det er et format(codec) alle piller ved og derfor næsten umuligt at håndtere på den lange bane, idet formatet er så fleksibelt at det giver udfordringer I forbindelse med migrering(Filkonvertering)

  • 1
  • 0
Jacob Trock

Grunden til JPEG2000 ikke anvendes er igen at formatet ikke rigtig er implementeret I branchen (Postproduktion). Vi har som udgangspunkt valgt det format/Codec der er mest anvendt I branchen til masters (de facto standard) og pt er det ProRes. Den dag JPEG2000 er standard i branchen, er vi klar til at tage dette format til os. Allerede nu modtager vi I dette format, men sjældent.

  • 0
  • 0
Kasper Hovgaard

Matroska er fra mit POV lidt af en vildbasse at have I sit arkiv, idet det er et format(codec) alle piller ved og derfor næsten umuligt at håndtere på den lange bane, idet formatet er så fleksibelt at det giver udfordringer I forbindelse med migrering(Filkonvertering)

Dén logik udelukker vel pr. definition alle åbne standarder? Men industriformater opdateres vel også løbende - eller (endnu værre) udfases helt, uden at koden frigives. En MP4-fil kan både være MPEG4 part 10 eller MPEG4 part 14 (udvidet metadata understøttelse), og så er der hele spørgsmålet om hvilke profiler, der er anvendt.

Fidusen ved MKV er netop, at den tillader alle formater. Derfor er det ikke nødvendigt at konvertere noget som helst - heller ikke, hvis man på et tidspunkt skulle få brug for at hive lyd eller video UD af containeren igen. Metadata i en MKV-fil er i et binært XML format. Jeg har svært ved at øjne det "vildbasse"-agtige i dét? Tværtimod er det vel mere seriøst end at konvertere til noget tabsgivende?

Jeg gad nok vide, om de arkiver, som har benyttet FFV1 og MKV nogensinde har fortrudt deres beslutning? Jeg tvivler.

  • 2
  • 0
Svend Ghani Nordby

Det er også værd at bemærke at ACES standarden netop (endeligt) er vedtaget. Se https://www.oscars.org/science-technology/sci-tech-projects/aces
https://github.com/ampas/aces-dev/tree/v1.0

ACES baserer sig på en række SMPTE standarder samt open source formater som OpenEXR og OpenColorIO. Desværre mangler audio delen pt stadigt arbejde, men det er intentionen at ACES skal kunne bruges hele vejen fra post til arkivering.

  • 2
  • 0
Jacob Trock

I givet fald skal de som anvender Matroska være rimelig ferm og konvertere alt modtaget til sit eget fast definerede codec. Men hvis du spørger high-end transkode-leverandører fra Telestream og lignende, vil de nok tage sine forbehold med Matroska. Det er den tilbagemelding jeg får på IBC I Amsterdam fra dem. Stor sympati for åbne standarder, men arkiver har det bedst I et monokulturelt miljø så konvertering og migrering kan håndteres så sikkert og tabsfrit som mulig.

  • 0
  • 0
Jacob Trock

Jeg skal blot lige henvise til: http://blogs.loc.gov/digitalpreservation/2015/01/all-in-the-apple-prores... idet Library of Congres også hælder til ProRes til arkivering. og det er egentlig min opfattelse at flere er på vej fra åbne standarder til mere låste properitære formater. Det samme for documenter hvor PDF også er blevet et bredt anvendt arkivformat frem for TIFF 6.0.

  • 0
  • 0
Kasper Hovgaard

... idet Library of Congres også hælder til ProRes til arkivering. og det er egentlig min opfattelse at flere er på vej fra åbne standarder til mere låste properitære formater.


ProRes er ret beset tabsgivende. Den eneste reelt tabsfrie komprimering i "Apple-pakken" er netop det forældede JPEG2000 format. FFV1 er i ALLE henseender et teknisk bedre alternativ.

Skal man være lidt grov, kunne artiklens budskab koges ned til:
"De fleste af os kan bedst li' at arbejde med Apple-grej, og vi gider ikke forsøge at presse Apple til at understøtte andre (bedre) standarder, end de formater, de selv har lyst til - heller ikke selv om vi er storkunde og aktivt promoverer deres produkter."

Det er klart, at åbne standarder aldrig vil få en chance, hvis ikke kunderne mere aktivt og organiseret presser leverandørerne for at understøtte dem men blot retter ind og definerer deres egne standarder efter den aktuelt benyttede soft- eller hardware. Det er jo f.eks. derfor, at vi stadig lever med håbløst forældede formater som JPEG og JPEG2000.

Denne arkivar opsummerer forskellene i faglig contra politisk observans:
https://groups.google.com/d/msg/archivematica/HulV96gJ0go/_d4GH_toc0EJ

Jeg krydser fingre for, at PREFORMA initiativet vil kaste mere brugervenlig software af sig, som i hvert fald nogle i arkivverdenen vil benytte. De kommercielle leverandører vil nemlig fortsat modarbejde åbne standarder. Microsofts understøttelse af MKV og FLAC i Windows 10 er dog en god nyhed.

  • 2
  • 0
Log ind eller Opret konto for at kommentere