W3C vækker mikrodata til live igen

Nu skal HTML gøres mere maskinlæsbar.

W3C har for første gang i flere år udgivet et nyt udkast til den potentielle webstandard HTML Microdata, som efter planen skal være en udvidelse til HTML5.

Det nye udkast er baseret på arbejde, som den Google-ansatte Ian Hickson havde ansvaret for mellem 2010 og 2013. Men støtten til Microdata API blev fjernet fra Safari (WebKit) og Chrome (Blink) i 2013 på grund af manglende interesse.

Siden har specifikationen ‘levet’ hos WHATWG, men det er uklart, hvor mange af de nye ændringer som er foregået i regi af den organisation.

Og nu er interessen altså tilsyneladende vækket på ny.

Udviklingen er interessant for dem, der gerne vil stille sine data til rådighed gennem en hjemmeside. For eksempel hvis man ville hente dagens pollental fra DMI.

Skilles ud fra HTML5

Oprindeligt var det planen, at HTML Microdata skulle være en del af HTML5, men meget af det, der i sin tid blev foreslået som en del af HTML5, blev skilt ud som separate specifikationer eller HTML5-udvidelser længe før, HTML5 blev færdig.

Tanken bag specifikationen er at gøre det enklere at gøre HTML-mærkede data maskinlæsbare ved hjælp af specifikke labels i HTML-elementerne.

I en længere tekst, som i artikler som denne, kan være vanskeligt for software at adskille, hvad der f.eks. er person- eller produktnavne, datoer, adresser eller lignende, da man ikke nødvendigvis skriver oplysninger på samme strukturerede måde, når man primært skriver til menneskelige læsere, som når man skriver for, at software skal kunne læse selve indholdet.

Itemscope

Et eksempel hentet fra specifikationsudkastet kan ses nedenfor:

<div itemscope>
<p>Name: <span itemprop="name">Amanda</span></p>
<p>Band: <span itemprop="band" itemscope> <span itemprop="name">Jazz Band</span>
(<span itemprop="size">12</span> players)</span></p>
</div>

Ved hjælp av itemscope-attributtet giver man softwaren, som læser HTML-dokumentet, besked om, at det aktuelle HTML-element rummer et dataelement (item) med et eller flere navne/værdi-par.

I eksemplet udgør div-elementet et sådant dataelement, og dette indeholder to navne/værdi-par, name og datetime.

Det første navne/værdi-par hedder altså name og har værdien Amanda.

Det næste navne/værdi-par hedder band, men værdien af dette er et nyt dataelement, som består af to navne/værdi-par, name og size.

Typer

Man kan også give hvert dataelement én eller flere typer ved hjælp af attributtet itemtype og en URL, som i sig selv fortæller, hvilken type dataelement der er tale om, for eksempel:

itemtype="http://example.org/animals#cat"

Intet af det, der er markeret som itemscope vil blive tolket som mikrodata. Det samme gælder også HTML-elementer, som omgiver hele eller dele af værdierne i navne/værdi-parrene. Der kan for eksempel stå:

<div itemscope>
 <p>Name: <span itemprop="name"><strong>A</strong>manda</span></p>
</div>

uden at dette ændrer, at værdien af name er Amanda.

Det understreges også i specifikationsudkastet, at HTML Microdata er kompatibel med JSON, og at dataene kan ekstraheres fra dokumentet og over i et JSON-format ved hjælp af en forholdsvis enkel algoritme.

De to redaktører af det nye udkast til HTML Microdata arbejder begge for selskaber med store søgemaskiner. Chaals McCathie Nevile er ansat i Yandex og Dan Brickley i Google.

Denne artikel stammer fra digi.no.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (0)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Log ind eller Opret konto for at kommentere
IT Company Rank
maximize minimize