ODF, OOXML hvor er datalogerne ?

Der er en ting der undrer mig:

Når nu vi har en debat om ODF kontra OOXML, hvorfor er der så ingen af vores akademiske datalogimiljøer der kommer med en strengt faglig vurdering af de tekniske kvaliteter af de to forslag ?

Er det ikke netop den slags opgaver forskere i datalogi burde kunne løse for samfundet ?

For det kan da ikke passe at vi tager stilling alene ud fra hvem vi spiller golf med og hvor mange sider der er ?

Skyldes det datalogiske indsparks fravær at:

A) indholdets datalogisk kvalitet ingen betydning har i praksis ? (Svært at forestille sig hvis det er skal være tekstbehandlingens "endlösung")

B) Datalogerne føler sig for fine til den slags arbejde ?

C) Danske dataloger er så inkompetente at ingen vil have at de blander sig ?

phk

Poul-Henning Kamps billede
Poul-Henning er selvstændig systemprogrammør, kernekoder, Varnish-forfatter, data-arkæolog og brokkehoved uden særlig portefølje.

Kommentarer (52)

Kristian Larsen

Man kunne også forestille sig at de er mere bidt af "nyt vildt scriptsprog" eller hvad de nu laver.

Og du har helt ret, man forestiller sig netop dem give indspark i denne sammenhæng og iøvrigt også andre.

Man kan jo ikke forestille sig miljødebat uden alle mulige og umulige faggrupper blander sig.

Andreas Ryge

Det er næppe scriptingsprog der fylder datalogers hverdag. Det er typisk mere abstrakte problemstilling som TSP.

add A: Ordet "praksis" har afgørende betydning her. Dataloger er teoretisk funderet og mit gæt ville være, at så længe formatet rent faktisk er åbent og kan det det skal, betyder det mindre om det er det ene eller det andet.

add B: Jeg tror ikke dataloger føler sig for fine, men men måske snarere at det ligger uden for deres kompentenceområde. Mon ikke det kan sammenlignes med at bede arkitekter blande sig i debatten om bygningen af et vist skur :-)

add C: Tja, inkompetente er vel så meget sagt. Jeg mener jo at det ligger uden for datalogers kompetenceområde.

Hvornår er beslutningstagere i øvrigt begyndt at lytte til eksperter?

Georg Sluyterman

Andreas Ryge skrev: "(...) og mit gæt ville være, at så længe formatet rent faktisk er åbent og kan det det skal (...)".

Formatet er jo netop /ikke/ åbent...
(aabenstandard.dk / definitionen for B 103).

Mikkel Meyer Andersen

Jeg studerer datalogi på fjerde semester (AAU), og i løbet af vores uddannelse har vi endnu ikke - og får efter nuværende studieordning heller ikke - rørt noget ala det omtalte. Det har mere været softwarearkitektur/-design, programmeringssprog (syntaks/semantik og pragmatik i form af kurser i OOP, parallellitet, compilerkonstruktion osv.), algoritmik, datastrukturer, kompleksitet osv. Naturligvis har vi været lidt inde på standarder, men ellers sker mere gennem praktisk erfaring fra studiejob og i projekterne.

For at være lidt grov, er det jo ikke verdens mest interessante job at læse en standard igennem og kommentere den, da det er forholdsvist nemt, hvis man har sin grundlæggende viden/erfaring i orden. Det er i hvert fald ikke det majoriteten af forskerne bruger deres tid på. Der er dog sandsynligvis dataloger i industrien, der har til opgave at gøre sådan noget, men graden af kvalitet i deres vurdering - tror jeg - hænger mere sammen med erfaring end et datalogistudium.

Det er jo ikke så svært at gennemskue sådan noget. Ellers må man drage en analog til et levnedsmiddelfirma, der laver deres opskrifter open source, men hvor mindst en af ingredienserne deri kun fås hos dem selv.

Kort sagt: det er ikke så svært at vælge mellem to standarder med en god gang erfaring - det er straks mere kompliceret at skulle lave en eller vurdere én individuelt. Dermed også sagt, at der findes folk, der er langt mere kompetente til at vurdere dokumentstandarder end dataloger.

Karsten Nyblad

Enig.

Hvis universiteterne skulle på banen, skulle det nok nærmere være handelshøjskolerne. Der beskftiger man sig også med virksomhedernes brug af IT, og de burde have en mening om man skal bruge standardiserede løsninger eller ej. Endelig kunne man også tænke sig, at statskundskab kunne have en mening om værdien, af at staten er drivende kraft i at skabe et marked for standardiserede produkter.

Niels Elgaard Larsen

Dataloger bruger LaTeX.

Det appelerer ikke rigtig til dataloger at starte med at læse 7000 siders dokumentation.

Der er alligevel ingen politikere, der lytter til os. Sml med fx Infosoc, softwarepatenter og terrorpakken.

Måske er det meget godt, for hvor habile er datalogerne overhovedet?:

http://www.first.dk/
http://studentpartner.dk/aboutsite.aspx
http://www.nat.ku.dk/index.asp?page=sider/presserum/Pressemeddelelserark...
http://www.bootcamp.flexlearn.nu/
http://www.dtu.dk/Moed_DTU/weblog/Haiyan_Wu.aspx

Poul-Henning Kamp

Hvis ikke ODF og OOXML er datastrukturer, hvad pokker er så ?

Hvis datalogi ikke handler om kvaliteten af de datastrukturer vi bruger til at holde samfundet sammen med, så er datalogi ikke pengene værd...

Poul-Henning

Jesper Lund Stocholm

> For det kan da ikke passe at vi tager stilling
> alene ud fra hvem vi spiller golf med og hvor
> mange sider der er ?

Det er godt med lidt selvransagelse, PHK, for selv du kan jo næsten ikke kommentere OOXML vs. ODF uden at omtale de famøse 6000 sider. For her har du jo naturligvis fat i en pointe - hvorfor er der ikke nogen, der har bedt kompetente folk om at vurdere formaterne ifht hinanden - og evt konsekvensen af bagudkombatilititet i OOXML? Her mener jeg virkeligt, at Ingeniøren og version2 har sovet i timen (deler de journalister?). Ingeniøren specielt er jo sjældent sent ude med oversigtssider over ting som vindmøller, harddiske, mikroprocessorer og lignende - hvor er den grundige behandling af ODF og OOXML? Stort set alle Ingeniørens læsere vil blive påvirket af valget af standard(er), så interesseniveauet /er/ allerede højt. Der bliver ovenfor foreslået at tage kontakt til Handelshøjskoler for at få noget ekspertise, hvilket lyder som en god idé. DTU (og specielt CTI) har jo også flere ansat, der ikke beskæftiger sig med andet end standardisering. Hvorfor har Ingeniøren ikke spurgt dem?

Andelen af debattørerne i "krigen" imellem ODF og OOXML, der ikke har læst hele OOXML-standarden er vel i størrelsesordenen 99% (jeg selv inklusive), og som du peger på, så ender diskussionen dermed i ingenting, da vores præmisser for diskussionen ikek er ens. Forhåbentlig kan debatten i aften ved PROSA bidrage til, at vores præmisser for diskussionen bliver mere lig hinandens - og til at vi dermed kan begynde at diskutere noget vigtigt ifht ODF/OOXML og ikke antallet af sider i den ene eller hvorvidt det er godt eller skidt med flere forskellige slags stikkontakter i et hus.

Andreas Ryge

Enig. Det er i høj grad datastrukturer, men den egentlige problemstilling handler vel i bund og grund om åbenhed og adgang til information. Det er en problemstilling der har eksisteret længe før digital lagring.

I middelalderen brugte den katolske kirke store resource på at tilbageholde information og viden der kunne svække deres magt. For mig at se, er der ingen forskel: Det handler i bund og grund om, at virksomheder ønsker "hemmeligheder" der kan styrke der position på markedet. Det behøver man ikke at være datalog for at kommentere på.

Den tekniske løsning er, for mig at se, mindre vigtig (jeg er pragmatiker), så længe den sikrer fri adgang til information.

Peter Makholm

Jo, i designet af et dataformat er der en datalogisk relevant diskussion vedrørende dataformat, men er den ikke overstået når både ODF og Microsoft Office-XML basalt set vælger sammen mod for dataformat: XML.

Er det datalogisk relevant at Microsoft vælger at genopfinde SVG istedet for bare at lave de nødvendige udvidelser?

Er det datalogisk relevant at Microsoft vælger at kode en række flag som bitfelter istedet for pæne XML-attributter?

Er det datalogisk relevant at Microsoft foreslår en standard hvor deres eget navn er hardkodet som namespace?

Er det datalogisk relevant at Microsoft vælger at bruge et 'EnableWord97CompatibilityLayer17"-flag uden at beskrive præcist hvordan det skal fremvises?

Er det datalogisk relevant at Microsoft vælger at lave en undtagelse til det kalendersystem vi andre bruger?

Er "problemet" måske ikke bare at dataloger er mere forsigtige med at udtale sig om områder de ikke har nogen autoritet på end scient.pol'er og cand.polit'er er?

Poul-Henning Kamp

Ordet "datalogi" betyder "læren om data".

Traditionelt har dataloger beskæftiget sig meget med begreber som "best practice" og hvorledes vi mennesker opfatter og interagerer med computere og data.

Typisk sad datalogerne i den afdeling der hed "System & Metode" og deres job var at finde bedre måder og værktøjer, i modsætning til at blive bedre til at bruge de existerende værktøjer.

Er det så ikke datalogisk relevant om man genopfinder det varme vand eller om man genbruger en existerende standard ?

Er det ikke datalogisk relevant om man har en formel beskrivelse på 600 eller 6000 sider ?

Og hvis ikke dataloger kan give en faglig, datalogisk, sammenlignende vurdering af to konkurrerende dataformater, som dataformater beset, hvad fanden skal vi så bruge dem til ?

Poul-Henning

Joakim Recht

Som datalog vil jeg da gerne lige pege på, at gennemlæsning af 6600 sider, og derefter en systematisk sammenligning og relatering til andre muligheder, er noget af en opgave. Jeg synes da at den er ganske relevant at få udført, men er det ikke en anelse naivt at tro, at nogen ville gøre det frivilligt?
Det er straks noget andet, hvis nogen rent faktisk har sagt nej til at gennemføre en systematisk analyse, men umiddelbart lyder det ikke som om at nogen har fået et konkret tilbud på at lave det.

Peter Makholm

"[D]eres job var at finde bedre måder og værktøjer, i modsætning til at blive bedre til at bruge de existerende værktøjer."

Netop. Det er datalogernes opgave opgave at finde bedre metoder og værktøjer, ikke at afgøre om det det ene XML-format er bedre end det andet XML(lignende)-format.

Karsten Nyblad

Jeg tror, det egentlige problem er, at forskerne på de datalogiske afdelinger traditionelt hellere har villet sidde og nørkle med finde matematiske teorier, logik og basis programmel, mens de har set ned på ting som brugerinterfaces, IT projektledelse, IT i organisationerne og IT i samfundet. Derfor er forskerne ikke klar til at gå ind i sådan en diskussion.

Skulle man måske fravriste naturvidenskabsfolkne kontrollen med datalogistudierne?

Poul-Henning Kamp

Idag har vi et binært proprietært format.

Det vil vi erstatte med noget bedre.

Der er to forslag som begge påstår at de er bedre.

Det må være en klokkeren datalogisk opgave at finde ud af hvilket et der er bedst.

Hvis du, som eksponent for danske dataloger ikke mener det er et job for dataloger, så kan jeg godt forstå at DIKU fattes studerende, for så er det da en uddannelse til at være irrelevant.

Poul-Henning

PS: Nej, ODF er måske en standard på papiret, men i praksis har det ingen betydning, så opgaven er korrekt formuleret: at erstatte Microsofts proprietære binære filformat med noget bedre.

Esben Bach

Det lyder lidt somom nogle antager at alle Dataloger ved alting om IT - det er jo ikke rigtig tilfældet, og som det er påpeget flere gange så er der mange dataloger (især de fastansatte på univeristeterne) der er mere til matematiske modeller mm.

Dog burde der også være nogen der ved noget om filformater, der sidder ihvertfald nogle stykker på AAU (hvor jeg befinder mig lige nu). Ingen af dem har dog som opgave at kigge på ODF vs OOXML da ingen gider betale for at få det undersøgt. Så det handler nok om at nogle firmaer/råd whatever burde betale for en undersøgelse - der skal nok sidde en enkelt eller flere dataloger der syntes det er interesseant, men der er bare så mange ting der er interesseant så hvorfor stoppe det man laver for at gå igang med det her?

Jesper Lund Stocholm

> Så det handler nok om at nogle firmaer/råd
> whatever burde betale for en undersøgelse

Jeps - spørgsmålet er blot, hvem der skal bestille denne undersøgelse.

(Videnskabs)ministeriet: Nej, for så får de skudt i skoene, at de er i lommen på Microsoft

IBM: Nej, får så får de skudt i skoene, at de meler deres egen kage.

Gartner/IDC: Nej, for de får så skudt i skoene, at de er i lommen på Microsoft.

Microsoft: Aehm ... nej :-)
OpenOffice: Ahem ... nej :-)

... find selv på flere. Det er lidt svært at finde kilder, der ikke er "belastede".

Til gengæld ville det være oplagt for Ingeniøren at bestille denne undersøgelse. Ingeniøren har stor tillidsfaktor og er ikke belastet af fraternisering af den ene eller den anden lejr.

Arne, Rolf, Henning ... hvorfor kommer I ikke i gang?

Jesper Lund Stocholm

Når man tænker på debatklimaet i denne sag (specielt når videnskabsministerens argumenter - gode eller dårlige - skydes ned med kommentarer som, at han jo tror på astrologi), så kan jeg godt forstå forskere, der takker nej til et tilbud samt at videnskabsministeriet vurderer det som spild af penge, da den ikke vil blive taget alvorligt.

Men det er jo et kæmpe problem, når diskussionen omkring Danmarks valg af udvekslingsformat kæmpes imellem debattører, der ikke har grundlaget i orden. Jeg mangler fx svar på disse ting i diskussionen:

  1. Hvorfor er spec for OOXML på 6000 sider, når ODF's er på 600?
  2. Er der en 1-1 mapning imellem features i ODF og OOXML eller kan den ene "mere eller mindre" end den anden?
  3. Findes der (historiske) konkrete erfaringer med implementering/anvendelse af standarder, hvor dele (fx pga bagudkompabilitet) ikke kan implementeres af alle - altså om det reelt har nogen betydning med "EnableExcel95FeatureXX"-elementerne.

Når jeg fremhæver disse dele er det fordi diskussion af dem udgør stort set hele debatten om ODF/OOXML - men der er tilsyneladende ikke rigtigt nogen, der kan give svaret på det. René Løhde forsøgte på sin blog at give bud på 1) og 2), men hans argumenter blev skudt ned med kommentarer om, at kan jo ikke kan tage en corporate bloggers ord for gode varer. Tråden på hans blog er i øvrigt et trist eksempel på, hvordan man kan blive svinet til som blogger.

Jeg mener stadig, at det ville være oplagt for Ingeniøren at sætte dette arbejde i gang. Det er naturligvis ikke så sexet som tegninger af hangarskibe eller nye jagerfly - til gengæld er det relevant for en meget stor del af alle ingeniørers daglige arbejde.

Karsten Nyblad

"Jeg mener stadig, at det ville være oplagt for Ingeniøren at sætte dette arbejde i gang. Det er naturligvis ikke så sexet som tegninger af hangarskibe eller nye jagerfly - til gengæld er det relevant for en meget stor del af alle ingeniørers daglige arbejde."

Og jeg kan ikke se, hvorfor mit kontigent skal gå til en samfundsopgave. Sådan en undersøgelse kan hurtigt komme til at koste et millionbeløb, og de penge kan bruges meget bedre under valgkampen til at minde folk om, hvilke partier der har stemt for jobkarteller.

Jesper Lund Stocholm

> Og jeg kan ikke se, hvorfor mit kontingent skal gå til en samfundsopgave.

Nej - det er korrekt, men verden ser trist nok lidt anderledes ud. Medierne (når de optræder som maghavernes vagthunde) har jo en helt klar opgave i at holde dem til ilden og sikre, at beslutningerne på Christianborg bliver truffet på bedst muligt grundlag. Hvis medierne skulle afholde sig fra at afdække den ene eller anden problemstilling, så ville de jo aldrig få skrevet noget.

Jeg har en helt klar forventning om, at de penge jeg giver for aviser - omend det er Ingeniøren eller morgenaviser - går til at lave dybdeborende arbejde og ikke sparke alt til hjørne med argumentation som "Det er ikke vores opgave at afdække dette emne, da det burde være en samfundsopgave". I denne situation og i denne komplicerede debat, mener jeg desværre ikke, at Ingeniøren lever op til sit ansvar.

Dennis Krøger

"René Løhde forsøgte på sin blog at give bud på 1) og 2), men hans argumenter blev skudt ned med kommentarer om, at kan jo ikke kan tage en corporate bloggers ord for gode varer."

Som MS tech evangelist er det hans JOB at lave reklamer i form af blogs o.lign. hvorfor i alverden skulle man lægge andet end lysten til løn i hans ord?

Jesper B. Rosenkilde

Inden du går amok og siger alle dataloger er komplet ubrugelige, phk, hvis de ikke kan sammenligne to formater. Så spørg lige dig selv hvad er en datalog?

Nu er jeg selv Datalogistuderende på efterhånden lidt for mange semestre, og kender derfor en del andre dataloger. Der er ingen dataloger der er ens. Datalogers kompetencer ligger i øst og vest, der er nogle der rodder med matematiske modeller for parallelitet og tid, nogle roder med modeler og meta-modeler for softwareudvikling, nogle rodder med design af brugerinterfaces, nogle rodder med database og en masse andet. Fælles for dem er det at de har indset at datalogi er et alt for stort område, til man kan have ingående viden over det hele. Derfor har de valgt at specialisere sig inden for deres interesseområde, og producere god forskning, hvilket er deres job. Så er der jo datalogerne ude i industrien, men efter min opfattelse så er det de færreste af dem der bruger deres datalogiskebaggrund til ret meget.

Der har været flere forslag om at man skal gå til handelshøjskolerne med problemet, og det synes jeg egentlig lyder som en god ide. Evnt. i samarbejde med nogle softwareingeniøre, informatikere eller lignende som teknisk ekspert.

Når man nu prøver at lave en stadard der skal drive samfundet de næste mange år, skal man nok overveje det kraftigt inden man tørre lorten af på datalogerne. Hvis man absolut vil have en datalog, så er spørgsmålet ikke om en datalog skal bruges, men hvilken datalog.

Held og lykke med at find lige netop den datalog du mangler.

Jesper Lund Stocholm

Fordi der i kommentaren (in)direkte ligger en anklage om, at René Løhde ikke har en snert af personlig og faglig integritet, da han er ansat ved Microsoft. I tråden (som jeg læste den) var der slet ikke noget, der kunne retfærdiggøre den udtalelse. De var uenige - javel - men det skyldtes mest, at de ikke var enige om deres diskussions basis.

Men omvendt kunne jeg så forvente en vis form for konsekvens overfor andre debattører. Jeg mangler fx at se PHK tilsvine Leif Lodahl på samme måde som han gjorde det med René Løhde. Leif reklamerer jo også med hans virksomhedsmæssige tilhørsforhold og argumenterer også på baggrund af dette ... men man er åbenbart kun en luder, hvis man arbejder for Microsoft.

Jørgen Elgaard Larsen

For nu at svare på Poul-Hennings oprindelige spørgsmål i artiklen:

Jeg mener bestemt, at emnet ligger indenfor datalogien. Det er blandt andet derfor, jeg interesserer mig for det.

Men der er ikke tradition for, at universitetsforskere påtager sig den slags analyseopgaver. Universitetsansatte forskere bedriver forskning og undervisning. De har ikke tid til at påtage sig et sådant analysearbejde, medmindre det er forskningsmæssigt relevant. Og ministeriet kan ikke pålægge forskerne at påtage sig den slags opgaver, fordi universiteterne har forskningsfrihed.

Det er ikke noget, der begrænser sig til datalogi: Man beder ikke universitetsforskere i matematik/statistik om at indsamle statistik, man beder ikke biologi-forskere om at komme med miljøvurderinger, og universiteternes geofysikere laver ikke vejrudsigter. Til det formål har man selvstændige enheder (Danmarks Statistik, DMU, DMI). Der skelnes altså mellem forskning og praktisk anvendelse.

Det ville være rart, hvis der var en tilsvarende institution befolket af dataloger. Det tætteste man kommer er vel Teknologirådet, som faktisk har udtalt sig tidligere i debatten. Men deres kapacitet er begrænset, og åbenbart er de ikke blevet bedt om at lave en teknisk analyse af formaterne.

Når man hører universitetsforskere udtale sig i medierne, er det som regel fordi medierne hiver fat i dem. I så fald udtaler de sig som regel i generelle vendinger. Selvfølgelig er der også nogle tågehorn, der bare skal lufte deres personlige kæpheste.

Den fagligt funderede debat er derfor begrænset. Dels er der organisationer, der har en så stor økonomisk interesse, at de kan betale folk for at lave analyser - men disse vil i sagens natur være partiske. Dels er der dataloger m.m. der analyserer på frivillig basis - og de har som regel ikke tid til at lave en grundig analyse af så stort materiale.

Jeg falder i den sidste kategori. Mit analysearbejde er mest baseret på stikprøvelæsning og sammendrag - samt på min professionelle vurdering som generalist.

På den tekniske side må jeg konkludere, at de to formater er nogenlunde ens, omend ODF virker mere rent. Det taler til ODFs fordel, at de genanvender en del eksisterende standarder, som man må forvente, at der findes biblioteker, der kan behandle. Dermed er det sandsynligt, at denne standard er nemmere at implementere.

Som generalist kan jeg lægge vægt på, at det vil være det bedste, hvis man kun vælger én standard frem for to.

Desuden har jeg den ikke-faglige opfattelse, at åbne standarder er bedre for samfundet som helhed. Dette bygger jeg dels på personlige erfaringer, dels på WTOs udtalelser om monopoler på standarder.

Datalogi handler også om andet end rå teknik.
Derfor kan jeg med rette kalde min analyse datalogisk faglig, selvom den ikke baseret på en grundig, teknisk sammenligning. I stedet bygger den på:

a) En preliminær analyse, der viser, at de to
standarder på et overordnet teknisk plan er nogenlunde ens.

b) En analyse af betingelser og procedure omkring standardarderne, som viser, at OOXML ikke er en åben standard.

c) En faglig vurdering, der siger, at b) er vigtigere end a). En grundig teknisk analyse ville kun være relevant, hvis alt andet var lige.

At bede om en teknisk analyse af de to formater er som at bede om en undersøgelse af bremserne på to biler, hvoraf kun den ene kan køre. Bremseundersøgelsen kan være fin nok, men det er spild af tid.

Mvh

Jørgen Elgaard Larsen
IT-Politisk Forening

Stefan Kreisberg

Een ting er hvad dataloger kan og vil udtale sig om, noget andet er hvad de benytter - det giver jo også en hvis form for "præference". F.eks. har jeg aldrig oplevet at et proprietært format var velkomment på DIKU. Helt oplagt at Jørgen Elgaard Larsens indlæg kommer til rette netop med bremsesammenligningen. Det nyligste kursus jeg har taget hedder det bogstaveligt talt (jeg citerer ordret fra kursets hjemmeside): "Submissions must be either plain text (ASCII or ISO-Latin-1 only; no Unicode), or PDF. Please make sure that the file is indeed printable at DIKU. Absolutely no MS Word (.doc) files or other proprietary formats will be accepted."

Det siger vel lidt om vores præferencer hvis der er nogen der vil fiske efter dem ?

:-)

Poul-Henning Kamp

Men Stefan,

hvorfor er DIKU "format fascister" ? Er der fordi I er en bunke højpandede kontrære smagsdommere, eller er det fordi I har nogle datalogisk begrundede årsager ?

Hvis der er datalogiske årsager burde de så ikke frem i lyset, hvad enten ministeren betaler eller ej ?

Nu hvor alle sektorforskningsinstitutterne er blevet lagt sammen med universiteterne kan I jo ikke bare sige "ikke vores job", kan I ?

Og selvom i mener at kunne forsvare den position på papiret, vil I så have det godt med det ?

Jeg er glad for Jørgen Elgaard Larsens indlæg, det nærmer sig et svar, men han er godt nok meget berøringsangst med hensyn til "ude i samfundet" synes jeg...

Poul-Henning

Dennis Krøger

"Fordi der i kommentaren (in)direkte ligger en anklage om, at René Løhde ikke har en snert af personlig og faglig integritet, da han er ansat ved Microsoft."

Han har ikke mistet sin personlige og faglige integritet ved at være ansat ved Microsoft (MS har bestemt mange dygtige folk).

  • Men når man er evangelist (uanset for hvilket firma) har man solgt sin personlige og faglige integritet på enhver techblog, hele jobbet går ud på at skabe interesse for sit firma's teknologier/formater/standarder/whatever.
Niels Elgaard Larsen

Jesper

==

2. Er der en 1-1 mapning imellem features i ODF og OOXML eller kan den ene "mere eller mindre" end den anden?

Jeg spurgte Jørgen Bardenfleth, MS om det i dag i folketinget. Hans svar var nej. Hans eksempel var at dynamiske referencer til kilder indlejret i MS dokumenter ikke kunne repræsenteres i ODF.
Jeg går ud fra at han mente sådan noget som når man har et søjlediagram, hvor data kommer fra en database, der kan opdateres.

Nogen af argumenterne blev lige lovligt teoretiske (selv for en datalog som mig ;.)

fx.

DOC -> OOXML (mulig ifølge MS)
DOC -> ODF (ikke mulig ifølge MS)

ODF -> OOXML (?)
OOXML -> ODF ikke mulig ifølge MS, følger af 1+2)

Det er de fire relvante konverteringer.
Men i betragtning af, at man jo har hørt om problemer med
DOC -> DOC'

tror jeg, at der er behov for en mere praktisk tilgang.

Jørgen Elgaard Larsen

Hej Poul-Henning

Jeg mener nu ikke, at jeg er specielt berøringsangst med hensyn til "ude i samfundet", især ikke i betragtning af, at jeg har deltaget i udarbejdelsen af IT-Politisk Forenings høringssvar om netop dette emne.

Mit tidligere indlæg her forklarer blot universiteternes nuværende rolle i samfundet (selv sidder jeg i det private erhvervsliv). Jeg kunne godt tænke mig, at universiteterne generelt beskæftigede sig mere med samfundet, men der er desværre ikke tradition for den slags. Man ser heller ikke bygningsingenørprofessorer fra DTU udtale sig uopfordret om, hvorfor en motorvejsbro er styrtet ned, eller hvilken slags bro, man evt. skal bygge til Bornholm. Man hører kun deres mening, hvis journalister spørger dem.

Grunden er, at det ville være hamrende useriøst at komme med den slags uopfordrede meldinger som forsker. Hvis man skal udtale sig som forsker, må man have forsket i det pågældende område. I tilfældet med broen indebærer det geologiske undersøgelser, indsamling af data, komplekse beregninger og modelleringer osv. - flere mandeår. Det er noget andet, når en journalist spørger. Så kan en forsker slippe afsted med at sige "jeg har nu altid godt kunne lide hængebroer...", fordi alle ved, at det ikke bygger på en grundig analyse.

Hvis en professor på DTU brugte al sin tid på at sidde og regne på broer mellem Bornholm og Vanløse, ville mange nok blive utilfredse - ikke mindst de studerende.

Om dataloger:

Når mange dataloger er "formatfascister", skyldes det især deres erfaringer. Mange dataloger har prøvet at skulle arbejde med data i udokumenterede, proprietære formater. Ofte må man ty til reverse engineering for at en løse problemet. Det er et kedeligt, dyrt og unødigt arbejde, og man ærger sig over det dårlige håndværk (manglende dokumentation), man er tvunget til at beskæftige sig med. Især er det frustrerende at skulle opfinde den dybe tallerken igen og igen, når man ved, at der står en stak af dem lige ved siden af.

Desuden er dataloger som personer interesseret i at bruge den software, som passer bedst til deres situation. Det betyder, at vi prøver mange produkter, og ofte skifter til nye. Derfor er vi klar over, hvor meget det betyder at anvende simple, åbne formater, som alle programmer kan forstå. Ellers kunne vi ikke lave andet end at konvertere vores data.

Alle IT-brugere har prøvet at bruge timer på at få udskrevet et dokument, som kommer fra et andet produkt - eller bare en anden version af det produkt, man bruger. Det har dataloger også prøvet. Forskellen er, at datalogerne ved, at det kunne være undgået, hvis man havde benyttet sig af simple, åbne standarder. Hvornår har man f.x. sidst haft problemer med at skrive en almindelig tekstfil (text/plain, ISO Latin 1) ud?

Især når man samler data fra mange kilder, er det vigtigt at benytte en fælles, åben standard.

Som du kan forstå, er det ikke håndgribelig videnskab, men erfaring, der tæller. Vi véd det bare. På samme måde som en trafikplanlægger bare véd, at det er smart, hvis man bliver enige om, hvilken side af vejen, man skal køre i. Eller stærkstrømsingeniøren, der bare véd, at der er smart, hvis alle bruger samme spænding i stikkontakterne. Det bygger ikke nødvendigvis på en tilbundsgående analyse af fordele og ulemper, men på basal erfaring og best practises.

Det er bare svært at bruge som argument i den offentlige debat, når nogen spørger, om ikke det ville være smart at køre i både højre og venstre side af vejen. Mindst 99% af alle trafikforskere har aldrig lavet en tilbundsgående undersøgelse af den mulighed, med forsøg i stor skala. Alligevel véd de bare, at det er en skidt idé.

Mvh

Jørgen Elgaard Larsen

P.S. Ja, Eskild, jeg nyder Douglas Adams's værker.

Poul-Henning Kamp

Takket være forskellige finurlige formuleringer i Biblen har der kørt en lavt mumlende diskussion i folkeskolen om hvordan man kan undervise i kristendom uden at forkynde den.

Meget interessant spørgsmål i denne sammenhæng.

Jeg er sådan set helt ligeglad med Rene's jobbeskrivelse, det er hans ansættelsesforhold der gør hans input suspekt.

Præcis lige som input fra openoffice.org er suspekt.

Den slags hedder kildekritik.

Grunden til at de to inputs ikke er lige suspekte er at de skal vægtes efter afsenderes respektive interesser og "past performance".

Microsoft er dømt for at lyve, stjæle og misbruge deres monopolsituation og har tjente milliarder på at gøre det.

Det værste jeg har hørt openoffice.org beskyldt for er generel inkompetente og de mangler konstant penge fordi de ingen har.

Med andre ord, jeg er en lille smule skeptisk overfor hvad openoffice.org har at sige men jeg antager per default at Microsoft er ude på at tage røven inkl. bukserne og pengepungen på os.

Når Rene så ovenikøbet følger firmaets evangelium til ord og punktum, uden at udvise det mindste tegn på selvstændig tankevirksomhed, så er der ikke mere at tale med ham om.

Det er ligesom at diskutere religion med Jehovas Vidner eller Scientology: spild af tid.

Poul-Henning

Jesper Lund Stocholm

> Når Rene så ovenikøbet følger firmaets evangelium
> til ord og punktum, uden at udvise det mindste
> tegn på selvstændig tankevirksomhed, så er der
> ikke mere at tale med ham om.

Det er ærgerligt, at du ikke var til debatmødet i går i PROSA - jeg fik nemlig det modsatte indtryk.

Jesper Lund Stocholm

> Fortæl mig så hvad hans job er, udover at skabe
> interesse om MS teknologi, og hvis vi er enige om
> det, fortæl så hvordan det IKKE ødelægger al form
> for troværdighed i en diskussion om MS tech/andres
> tech?

I tidernes morgen var jeg ansat ved Microsoft i min studietid. Jeg var i begyndelsen ansat i et såkaldt "ShowTeam", hvor min opgave sammen med andre var at tage rundt til partnere og kunder og fortælle om hvilke produkter Microsoft havde på bedding (i den tid, konkret Windows 2000 server familien). Det var altså en jobbeskrivelse som jeg tror matcher jobbeskrivelsen for en MS-evangelist (dog uden så meget teknisk indhold). Vi kom så ud til arrangementet og gennemgik en præsentation af produktet og var derefter til rådighed for spørgsmål.

Det er ikke mit indtryk, at jeg optrådte utroværdigt eller at tilhørene opfattede mig som utroværdig - selvom der stod "Microsoft" på min skjorte ... det var jo ligesom en del af præmissen. Jeg tror derimod, at jeg ville være blevet opfattet som utroværdig, hvis jeg udtalte mig uden refleksion over produktet eller ignorerede andre produkters bedre features eller egne produkters uhensigtsmæssigheder. Glem heller ikke, at også Microsoft-ansatte er mennesker og har nøjagtig de samme behov for at kunne se sig selv i øjnene som alle andre. At sammenligne med Jehovas vidner er for langt ude. I mine to år ved Microsoft mødte jeg ikke én eneste, der havde et religiøst forhold til butikken som sådan.

Det ville ødelægge troværdigheden, hvis jeg i mine foredrag havde svaret på produktkritik at "Produkt X er guds givet og det ypperligste der nogensinde er lavet - og nogensinde bliver lavet". Jeg kan blot ikke se, at det på nogen måde er tilfældet her. Der er nogle, der uenige med andre (jeg er fx tilhænger af 2-standard-tanken - men kan se både fordele og ulemper ved begge standarder). Det er blot trist, at min kritik af dele af ODF medfører insinueringer af, at jeg har deponeret min hjerne på det hellige Windows-alter ... det kunne faktisk ikke være længere fra sandheden.

Det er naturligvis i orden, at du mener at et tilhørsforhold til et eller andet ødelægger troværdigheden - men det er useriøst, hvis du kun håndhæver din holdning overfor de, der modsiger ODF eller advokerer for OOXML.

Dennis Krøger

Endnu engang, jeg er ikke så bekymret over for tilhørsforholdet, men evangelist er mere end produkt fremviser, opgaven er at "sprede ordet", bland andet på blogs, og andre digitale medier. Dermed er hans artikler direkte en del af jobbet, og dermed er de at opfatte som ren reklame.

Henrik Kramshøj

Når man melder klart ud hvilke formater man vil modtage er det for at give afsenderen en mulighed for at kommunikere effektivt. Effektivt fordi så gider jeg se på det ...

Jeg har defineret en e-mail politik som er revideret flere gange - på basis af min brug af computere og de applikationer jeg har til rådighed.

Min politik er som sådan ikke baseret på de tekniske kvaliteter i filformaterne, men mere praktisk løsninger på problemet med at kommunikere.

Ved at kræve at folk skal aflevere i lukkede formater tvinger du afsenderen til enten at købe en applikation som de måske ikke af egen drift mener at have brug for. Alternativet er at man piratkopierer den pågældende applikation - hvis overhovedet kan afvikle den på det operativsystem man benytter.

Så for mig stopper diskussionen egentlig her, en åben standard kan accepteres, en lukket kan ikke.

Dette gælder for "det offentlige" som jeg nødigt ser tvinge os til at piratkopiere eller bruge penge på software vi ikke ønsker. For alle andre, firmaer eller privatpersoner må selvfølgelig fortsat vælge frit hvad de ønsker at bruge.

Mvh

Henrik, datalog cand.scient ;-)

PS
Dem der nærlæser min e-mail politik vil dog opdage at jeg ikke mere ønsker at modtage OpenOffice filer - hvilket skyldes at jeg synes OpenOffice på Mac er langsom og dårlig. NeoOffice vil så blive foreslået, men det er næsten værre og grimmere. LaTeX for the win!

Lasse Nielsen

> A) indholdets datalogisk kvalitet ingen betydning har i
> praksis ? (Svært at forestille sig hvis det er skal være
> tekstbehandlingens "endlösung")

Det er måske også udtalelser som denne der gør det svært for dataloger at tage diskussionen seriøst.
Jeg tror ikke på at nogen af formaterne er gode nok til at kunne opfylde alle vore fremtidige behov, uændret. Altså skal der ændringer til undervejs, nok mest tilføjelser. Specifikationer som disse er jo kun en opsamling af vores nuværende behov (eller, mere sandsynligt, som de var for et par år siden).

Hvis man først accepterer at standarden ikke er endeligt og fuldstændig, så tror jeg mest på ODF, selvom det måske ikke er helt så detaljeret specificeret i hjørnerne, og måske har en enkelt feature mindre end OOXML. Det er en standard der skal vedligeholdes, og derfor er det bedre at den er systematisk og godt designet, end at den er "feature-komplet" i forhold til eksisterende formater.

På den anden side er det et alvorligt problem for indførslen af formatet hvis man ikke kan konvertere alle eksisterende dokumenter til det nye format med et acceptablt resultat. For selvfølgelig bliver det aldrig perfekt.

Mere grundlæggende datalogisk synes jeg at det er en helt forfejlet tilgangsvinkel at diskutere XML-formaterne. Det vigtige er den bagvedliggende begrebs- og datamodel. Hvis man kan blive enig om en sådan, så kan man lave alle de XML-formater man vil, gode som dårlige, til at udveksle data med. Så er jeg ligeglad med om et format har en dårlig kodning af sine bit-felter. Det vigtige at diskutere er om disse bit-felter overhovedet bør være der og hvordan de skal fortolkes.

En anden vigtig detalje er om modellen adskiller indhold fra formattering. Det er en lektie vi har lært fra HTML: en model der blander form og indhold er sværere at bruge og vedligeholde dokumenter i, end en der adskiller dem.
Igen tror jeg ODF har fordelen.

Det er ikke et problem om OOXML har sine bitfelter gemt på en usmart måde. Det er et problem at der er bitfelter hvis betydning er givet ved "opfør dig lige som Word v. XX", og ikke i forhold til hvad det betyder for formattering af dokumentet. Både fordi det bliver sværere at læse, forstå og implementere specifikationen i sig selv, og fordi det misser chancen for at adskille de formatteringsvalg der var brugt i Work v. XX og bruge dem enkeltvis i andre situationer. Det er altså ren dovenskab at lave sådan en bit. Det tyder på en bagvedliggende model der kommer fra et specifikt program (hvilket heller aldrig har været nogen hemmelighed).

Microsoft har løst opgaven "Lav et åbent format for Office-dokumenter". Formatet er åbent. Det kan gemme (MS-)Office-dokumenter. Det var aldrig et krav at det skulle være et godt og/eller generelt format.

Så, der fik du en, halvinformeret, mening.
Hvis man så troede at det gjorde en forskel for den endelige beslutning ...
/L

Leif Lodahl

PHK og andre, gider I ikke bare nøjes med at smide mudder på hinanden ?

Fordi jeg er aktiv deltager i en sammenslutning (som ingen penge har), skulle vel ikke gøre mig mere suspekt end andre ? Microsoft er part i denne sag og har selvfølgelig ret til at udtale sig. Og det har jeg også. -Uden at blive svinet til, vel at mærke. Der er en debat igang, og hvis ikke parterne i sagen skulle udtale sig, hvem skulle så ?

Så gider I ikke lige smide mudderet i en anden retning ? , tak.

Det er rigtigt at vi ikke har nogen penge. Og det er vi faktisk ret stolte af. Så kan der nemlig ALDRIG blive sat spørgsmålstegn ved vores hensigter.

Med venlig hilsen

Leif Lodahl
Native-Language coordinator DA.OpenOffice.org
Mail: lodahl@openoffice.org
Blog: http://lodahl.blogspot.com/

Pjerrot Luna

Konklusionen fra dokuementet i Therese Hansens link er:

<<Upon examining the formats it is difficult to ascertain any technical reason why Microsoft Office documents cannot be saved and interchanged using ODF with one hundred percent reliability. ODF has the features that will deal with all Microsoft Office’s quirks, even ones like “footnoteLayoutLikeWW8”. However, OOXML in its current state cannot handle any applications except Microsoft Office.>>

Læs selv på: http://tinyurl.com/38fr34

Torben Mogensen

Jeg vil starte med at indrømme, at jeg ikke har læst nogen af de to "åbne" standarder, så mine kommentarer er (som man vel kan forvente på Internetforaer) baseret på generelle observationer uden specifik ekspertviden, andet end det en datalogiuddannelse med specialisering i programmeringssprog og automatisk programbehandling har givet mig.

En ting, som jeg har savnet i debatten, er overvejelser om hvad man skal bruge et åbent dokumentformat til.

Flertallet af dokumenter, som offentlige institutioner sender til hinanden og til borgerne eller får tilsendt af borgerne er afsluttede dokumenter, som modtageren blot skal kunne læse, udskrive og evt. klippe fra, når der svares på en forespørgsel. Der er ikke behov for redigering af dokumenterne, og faktisk er det ofte ønskeligt at dokumenterne ikke er nemt redigerbare (man ønsker ikke mulighed for uautoriserede ændringer inden evt. videresendelse). Endvidere bør dokumenterne ikke fylde mere end nødvendigt af hensyn til modtagere, der ikke har højhastighedsnet.

Til et sådant formål er både ODL og OOXML vildt overkill. Her kan man udmærket bruge et sidebeskrivelsesformat i stil med PDF eller PostScript.

Der, hvor man har brug for et mere detaljeret format, er når flere institutioner samarbejder om at udvikle et dokument, således at modtageren kan rette i det modtagne dokument og sende det tilbage til afsenderen, som kan rette videre osv. Her er der behov for et format, der har semantisk struktur, dvs. hvor det at noget er et afsnit eller kapitel med en overskrift er mere end bare et valg af skriftsnit, skriftstørrelse og linieafstand, og hvor en krydsreference ikke blot er et sidenummer, men en formatuafhængig reference. Det er for et sådant arbejdsdokument ikke vigtigt, at tingene står præcist på samme måde på skærm og papir hos de forskellige personer, der arbejder med dokumentet -- bindingen mellem den semantiske struktur og det visuelle layout kan være forskelligt hos de forskellige deltagere.

Her kan PDF o.lign. ikke være med. Jeg kender ikke ODF og OOXML godt nok til at vide i hvor høj grad de kan håndtere dette, men det er ikke min pointe. Min pointe er, at der er behov for to standarder for dokumentudveksling, men det er ikke et spørgsmål om to konkurrerende formater, men derimod to formater, der har hvert sit formål: Et format til at udsende færdige dokumenter og et andet format til at udveksle arbejdspapirer.

Vedrørende valg mellem ODF og OOXML, så vil størrelsen af OOXML standarddokumentet være grund nok til at vælge ODF. En tidligere kollega, som arbejder i rumindustrien fortalte mig forleden, at dokumentationen for den internationale rumstation er 5000 sider. Og det er ikke fordi dokumentationen skøjter over detaljer og lader ting være uspecificerede (den slags er man ikke vant til i rumindustrien). Så at et format til opbevaring af kontordokumenter behøver flere sider til sin dokumentation tyder på, at formatet er alt for kompliceret til det formål, det skal opfylde. Selv de omkring 600 sider, som ODF standarden angiveligt fylder, virker lidt i overkanten. Når en specifikation er på 6000 sider er det endvidere praktisk taget umuligt at afgøre om en implementering opfylder specifikationen. Det vil medføre indbyrdes ukompatible implementeringer, der hver for sig påberåber sig den samme standard. Og dermed er formålet med en fælles standard ikke rigtigt opfyldt.

MVH,
Torben Mogensen (lektor på DIKU)

Pascal d'Hermilly

Citat Torben:
"Til et sådant formål er både ODL og OOXML vildt overkill. Her kan man udmærket bruge et sidebeskrivelsesformat i stil med PDF eller PostScript."

I hele forløbet har alle været enige i at de dokumenter der blot publiceres bliver udgivet i PDF format.
De dokumentformater man debaterer er dem som skal bruges mellem de offentlige instanser og udaftil når der skal arbejdes videre med dem. F.eks. hvis du fik tilsendt en formular fra kommunen som skulle udfyldes og returneres.

Det der er vigtigt at debatere er hvorvidt vi skal have ét format (ODF) eller to formater(ODF og EOOXML). Chancen for at vi får kun EOOXML er nærmest lig nul.

Grunden til at debatten om ét eller to formater er vigtig, er at hvis man vælger kun ODF kan man presse Microsoft til at implementere ODF og dermed konkurrere ligeligt mod de andre spillere på markedet. Det ønskes fordi Microsoft i dag har en meget dominerende position på markedet. Fortiden har vist problematikker i monopoler.

Hvis man derimod vælger både ODF og EOOXML, så får vi næsten helt sikkert en situation hvor at 90% af det offentlige opgraderer til Office 2007 og Microsoft fortsætter med at have den dominerende position. Microsoft har derfor ikke nogen grund til at understøtte ODF helhjertet. Samtidigt er dokumentationen til EOOXML så omfattende(6000sider) og MS Office specifik at der reelt ikke er andre end Microsoft selv der vil kunne implementere den fuldt ud. Ergo ingen reel konkurrence.

Problematikken(forsimplet) virker enkel nok, men politikkerne har svært ved bestemme sig. Bl.a. fordi der lige er kommet en Rambøll rapport ud som siger, at det kommer til at koste 180 millioner* at skifte til ODF. Samtidigt rejser Microsoft naturligvis rundt og siger at helvede bryder løs og alting går i stykker hvis man kun vælger ODF.

Hvis jeg skulle vælge for os, blev det klart ODF som også Belgien og rygterne svirrer omkring Norge(http://tinyurl.com/2vtweg) har valgt.
Det er det eneste som kan skabe ordentlig konkurrence, hvilket vil gøre kontorpakkerne både billigere og bedre.

Mvh

Pascal d'Hermilly
Medlem af IT-Politisk forening,
http://www.it-pol.dk

*) Det er dog uheldigt at den kun rækker de næste 5 år, hvilket er der hvor vi kan begynde at spare penge på ODF.

Log ind eller opret en konto for at skrive kommentarer