
Nyt værktøj til OOXML-arbejde
I den sidste tid har én af de personer jeg følger på Twitter haft nogle lidt mystiske beskeder. Disse kunne være:
Citat:
Total=97 Passed=56 Failed=41. Damn. #nooxml
eller
Citat:
Total=139 Passed=105 Failed=34. Better. #nooxml
Til sidst blev jeg tilpas nysgerrig til at jeg spurgte ham, hvad han snakkede om. Det viste sig, at det var test-cyklusser for hans projekt NOOXML eller Native Office Open Xml.
Fra præsentationssiden står der:
"Inspired by WebKit we started the Native Office Open XML (NOOXML) Project. NOOXML is a library written in C/C++ suitable to run on mobile devices as well as a service in the cloud"
... og hvis man kigger på deres test-filer, så ser det meget lovende ud - i hvert fald, hvis man kigger på deres sammenligninger imellem Microsoft Office, NOOXML, OOo og Google Docs. Faktisk slår NOOXML (eller leverer et mindst lige så godt resultat som) OOo i alle tilfælde - bortset fra baggrundsfarver i tabeller.
Nu er dette jo blot endnu et værktøj, der leverer understøttelse for OOXML, så i sig selv er det jo ikke vanvittigt interessant. Det interessante bliver dog tydeligt, når man kigger på, hvem værktøjet er lavet af. Herren hedder Florian Reuter.
Florian Reuter har i det sidste årti mange år været udvikler på OOo - først helt tilbage da OOo hed StarOffice, dernæst hos Sun og sidst hos Novell. Florian har repræsenteret Sun og Novell i ODF TC i en årrække og tillige repræsenteret Novell i ECMA TC-45. Hos Novell arbejdede han primært med OOXML-import-filtrene i GO-OO. Med andre ord findes der vel ikke mange, der har haft fingrene så dybt i både ODF og OOXML som Florian.

(billede af Florian taget ved et ISO/IEC SC34-møde i Prag 2009)
For et par år siden blev Florian træt af at knokle med OOo-udvikling og blev freelancer. Siden da har der været helt stille omkring ham - og han var næsten forsvundet fra Jordens overflade.
Indtil nu.
For det viser sig, at Florian har gået og bakset med et lille hygge-kode-projekt ved navn "NOOXML".
Som man kan se på sitet, har de som sagt ovenfor lavet en række tests af deres rendering af OOXML-funktionalitet, og det er imponerende så godt det er blevet og så langt de er nået - ikke mindst i forhold til sammenligninger med import-filtrene i OOo og Google Docs.

(Fra venstre: Microsoft Office 2007, NOOXML, OOO og Google Docs)
Microsoft er jo blevet kritiseret vidt og bredt for, at de ikke har frigivet deres Open XML SDK som OSS endnu, og NOOXML er nok det nærmeste vi kommer et uafhængigt værktøj til behandling af OOXML-data, der ikke er fra Microsoft og samtidig ikke integreret i en kontorpakke. Derfor bliver det spændende at følge udviklingen af værktøjet. Deres mål i WebKit er nok en slags "When you shoot at the Moon, aim at the stars"-ting, men det bliver spændende at følge projektet og se, hvordan det ender med at blive brugt. De har tidligere haft en Firefox OOXML viewer baseret på NOOXML, men den er pt. ikke tilgængelig fra sitet.
Kildekoden er endnu ikke blevet frigivet, men de regner med en alpha-release til oktober.
Jesper Lund Stocholm er seniorarkitekt hos konsulentfirmaet CIBER. Han er formand for udvalget i Dansk Standard, der vedligeholder og udvikler dokumentformaterne ODF og OOXML i dansk regi, og han deltager aktivt i det internationale arbejde med formaterne i ISO.
Follow @jlundstocholmKommentarer (2)
Hej Jesper,
Kender du dette værktøj?
http://www.oxygenxml.com/ooxml_office_2007.html
Hvad jeg kan forstå, kan det validere både OOXML og ODF, samt tilbyder editering af begge formater. Hvad jeg endvidere kan læse mig frem til, skulle det være i stand til at flette dokumenter, både OOXML og ODF. Har jeg endvidere forstået det korrekt, skulle det også kunne flette mellem OOXML og ODF.
Værktøjer tilbyder også convertering af ovenstående formater.
Hej Michael,
Undskyld at jeg først har set dit indlæg nu. Vi bloggere får ikke automatisk at vide, når der kommer svar på ét af vores indlæg og derfor overså jeg det.
Hvad jeg kan forstå, kan det validere både OOXML og ODF, samt tilbyder editering af begge formater.
Jeg er før blevet anbefalet at kigge på netop oXygen, men har aldrig fået det gjort ... nu var det måske på tide.
Der er dog et par ting, som er vigtige at holde fast i:
"Validering" er udelukkende schema-validering (og med de oprindelige ECMA-schemas, ser det ud til). Man skal bestemt ikke negligere schema-validering, men der er langt det nemmeste og siger reelt ikke voldsomt meget om dokumentets validitet i det hele taget. Som du måske ved, så har jeg leget med at lave en OOXML-validator, der også tager hensyn til semantiske krav i spec [0], og selve schema-valideringen er reelt kun et par liniers kode. Resten af koden er semantiske krav.
"Editering" er jo ikke "formatet" i sig selv - dvs oXygen har ingen anelse om, hvad "fed skrift" betyder i OOXML. oXygen kan redigere i de XML-filer, som OOXML- og ODF-dokumenter består af.
Hvis målet er at kunne arbejde med OOXML- og ODF-filer på XML-niveau, så er oXygen dog et vanvittigt dyrt værktøj. Her synes jeg sagtens man kan klare sig med de værktøjer, der kommer med fx OpenXML SDK og så - som jeg - et ZIP-værktøj og en almindelig XML-editor.
:o)
Jeg kan i øvrigt ikke se, hvordan det kan flette dokumenter fra OOXML og ODF eller konvertere dem?

