Billedbehandling

(eller: image processing, digital billedbehandling).

Den meget omfattende disciplin, som beskæftiger sig med manipulation af billeder på digital form.

Digitale billeder kan stamme fra et væld af forskellige kilder. Originalbilledet er i dag ofte et traditionelt fotografi - diapositiv, papirbillede eller farvenegativ - som ved hjælp af en scanner digitaliseres med en given opløsning. En anden kilde kan være et videokamera, koblet til en såkaldt framegrabber, som omformer det analoge TV-signal ved hjælp af hurtige A/D-convertere til pixelværdier i et RAM-lager. Herudover findes kameraer, hvis lysfølsomme element er CCD-arrays (se forklaring under CCD). I sådanne kameraer digitaliseres billedet direkte på optagelsestidspunktet; denne teknik vil formodentlig på et tidspunkt helt erstatte traditionelle kameraer, som anvender analoge film. Billeder kan også stammer fra røntgenapparater og medicinske skannere, eller være genereret syntetisk.

Digitale billeder er normalt rektangulære, dvs. opdelt i rækker (linier) og søjler af billedelementer kaldet pixler (for picture elements). En pixel har forskellige attributter tilknyttet, normalt i form af ét eller tre tal, der angiver farven og lysstyrken i det givne punkt af billedet. Antallet af pixler i hver linie og antallet af linier i billedet er bestemmende for den opløsningen og dermed for den detaljerigdom, som kan findes i billedet; jo flere pixler, des finere detaljer. Der eksperimenteres med andre former, f.eks. billeder opbygget af sekskantede pixler ligesom en tavle fra en bikube.

Billeder med genkendeligt indhold kan bestå af så få som 50 x 50 pixler. Først når pixelantallet når op omkring 300 x 200, bliver kvaliteten af normale billeder acceptabel. Ved 800 x 600 er opløsningen bedre end den kvalitet, som kendes fra TV. Opløsninger på 1.280 x 1.024 eller mere benyttes ved DTP og CAD-systemer, hvor meget fine detaljer skal gengives. Til sammenligning kan nævnes, at almindelige fotografiske film (24 x 36 mm) ofte kan opløse 100 linier pr. mm hvilket svarer til 7.200 x 4.800 pixler.

Ud over antallet af pixler i et billede er antallet af bit pr. pixel af stor vigtighed. Dette afgør nemlig, hvor mange forskellige farveværdier et givet billede kan indeholde. Det nødvendige antal bit for en god repræsentation af et originalbillede varierer stærkt med billedets natur.

Det er ofte muligt at benytte farvepaletter. I stedet for at lade pixelværdien angive farven og lysstyrken direkte, angiver den nummeret på en farve i paletten. I et system med eksempelvis 8 bit pr. pixel indeholder paletten 256 forskellige farver. Disse farver kan imidlertid være angivet med langt flere end 8 bit og kan derfor være langt mere nuancerede. Eksempelvis benyttes i VGA 18 bit pr. farve (6 bit til hver af komponenterne rød, grøn og blå) i paletten, hvorved der bliver mulighed for at vise i alt 262.144 forskellige farver med et sådant system, men stadig væk kun 256 forskellige farver ad gangen.

Paletter giver således mulighed for et bredere farvevalg. En anden meget vigtig egenskab ved paletter er, at deres indhold på grund af deres ringe størrelse kan udskiftes overmåde hurtigt. Derved opnås, at farverne i det viste billede udskiftes med samme hastighed. I systemer uden palet kan farverne i et billede kun ændres ved, at værdierne af samtlige pixler analyseres og eventuelt udskiftes.

Hvor mange bit pr. pixel som er nødvendigt, afhænger af den konkrete anvendelse. For blot at vise tekst og simpel grafik som f.eks. diagrammer er 1, 2 eller 4 bit pr. pixel ofte fuldt tilstrækkeligt. Drejer det sig imidlertid om digitale farvefotografier, vil 8 bit pr. pixel oftest være utilstrækkelig, selv i kombination med en palet. Benyttes 16 bit pr. pixel, vil kun subtile overgange mellem farvenuancer kunne udvise generende spring. Ved 24 bit pr. pixel eller mere (se 24-bit grafik) overstiger antallet af farver, der kan vises, det antal farver, som kan skelnes af det menneskelige øje. Det skal nævnes, at en forbedret farvegengivelse ofte kan opnås i systemer med få bit pr. pixel, men da på bekostning af rumlig opløsning. Dette sker ved anvendelse af dithering eller andre halvtoneteknikker.

Et digitalt billede med god rumlig opløsning samt god farvegengivelse vil - som det fremgår - indeholde meget store datamængder, ikke sjældent af størrelsesordenen 18 Mbyte, hvilket svare til et standard Photo CD-billede i højeste opløsning. Behandling af sådanne billeder er derfor almindeligvis meget ressourcekrævende, både når det gælder lagerkapacitet, processorkraft og båndbredde under transmission.

Digitale billeder kan indlægges i databaser, hvilket giver mulighed for en meget fleksibel håndtering. Herudover kan sådanne billeder behandles med henblik på forbedring af billedkvaliteten i langt højere grad og langt lettere end analoge fotografier.

Billedbehandlingens primære formål er 1) at forbedre kvaliteten af billeder og 2) at udtrække information ved hjælp af billedanalyse.

Billedforbedring kan igen opdeles i to grupper: En gruppe, omfattende metoder, der ændrer individuelle pixelværdier uden at skelne til de objekter, som er afbildet, samt en gruppe af metoder, hvor de afbildede objekter manipuleres.

[[Image:billd-1.gif|center|thumb|350px|Til venstre et fotografi af to mælkekartoner tagetmed et digitalt kamera. Til højre et histogram over antallet af de forskellige pixelværdier i billedet. Vandretteakse er pixelværdien med 0, 1, ... til venstre og den maksimale værdi 255 tilhøjre, lodrette akse er antallet. Billedet er mørkt og støjfyldt, derfor er størstedelen af pixlerne til højre, og antallet danner en blød kurve]] [[Image:billd-2.gif|center|thumb|350px|Til venstre billedet fra op over dels med den korrekte 'aspect ratio' 4:3, dels med hver enkelt pixels værdi ændret systematisk til en højere værdi, således at resultatet er en udjævning af histogrammet. Derved bliver en række detaljer i den mørke baggrund synlige. Til højre histogram for billedet]] Af metoder, hørende til den første gruppe, kan nævnes:

  • Simpel beskæring (cropping), der har til formål at fjerne uinteressante dele af billedet.
  • Forstørrelse og formindskelse, således at antallet af pixler i billedet ændres. Denne såkaldte resampling kan enten foretages ved pixelreplikering (samme pixelværdi gentages et antal gange både vandret og lodret) eller pixeludtynding (et antal af pixlerne fjernes), eller det kan ske ved benyttelse af interpolationsmetoder. Disse er i modsætning til de simple replikerings- eller udtyndingsmetoder ganske beregningstunge, men resultatet er almindeligvis langt bedre.
  • Justering af kontrast og farveindhold. Dette kan ske ved at udsætte pixelværdierne for simple lineære ændringer, eller det kan ske ulineært, eksempelvis ved histogramændringer. Benyttelsen af sådanne teknikker kan give forbløffende resultater, når det drejer sig om fremhævelse af detaljer i et billede.
  • Filtrering af billedet, for at opnå udglatning (lavpasfiltrering), skarphedsforøgelse (højpasfiltrering) eller fjernelse af ekstreme pixelværdier, der f.eks. skyldes støj (salt-og-peberfiltrering). Filtreringer af disse typer foretages ved at erstatte hver pixelværdi med værdier beregnet ud fra pixelværdierne i et lille område omkring den. En anden type filtreringer er baseret på billedtransformationer; disse kan i nogle tilfælde være meget ressourcekrævende. Der er mange transformationer i brug. Eksempler er fouriertransformationen, som opløser et billede i to-dimensionale cosinus- og sinusfunktioner; den diskrete cosinustransformation (DCT), som bruger to-dimensionale cosinusfunktioner; og Walsh-, Hadamard- og Haar-transformationerne, som bruges til at repræsentere et billede ved wavelets. Alle disse transformerer det originale billede (benævnt det spatiale domæne) over i et parameterdomæne, hvor det er mere bekvemt at foretage diverse billedbehandlingsoperationer. Det forbedrede billede opnås ved at anvende den omvendte transformation. F.eks. kan man ved fouriertransformationen ved at ændre på de vægte (fourierkoefficienter), hvormed disse funktioner indgår i det givne billede, forstærke eller undertrykke mønstre i billedet. Det er også muligt at fjerne uskarphed, der skyldes at kameraet bevægede sig eller havde en forkert indstilling af afstanden.

Metoder, som manipulerer objekterne i et billede, befinder sig på et langt højere abstraktionsniveau. Det primære problem er, blandt de tusindvis af pixler i et billede, at udpege dem, som tilhører et givet objekt. Dette kan simpelt ske ved interaktivt at udpege objektets konturer, eller ved at computeren selv finder frem til objekterne. At foretage denne såkaldte segmentering automatisk er ganske kompliceret og langtfra altid sikker. Når objekterne på den anden side er blevet vel afgrænset, er behandlingsmulighederne mange: De kan fjernes, flyttes, kopieres, forstørres, formindskes, ændre farve, form. Med sådanne metoder kan virkeligheden, som den fremgår af billedet, ændres vilkårligt meget, hvilket enhver billedforbruger bør være sig bevidst.

Billedanalyse har til formål, mere eller mindre automatisk, at udtrække informationer fra billeder. Også her spiller segmentering en vigtig rolle, idet den relevante information oftest er repræsenteret ved de afbildede objekter, snarere end ved de enkelte pixelværdier. Når objekterne er identificeret, kan de udmåles; deres indbyrdes relationer kan fastlægges; konklusioner kan drages. En meget vigtig industriel anvendelse af automatisk billedanalyse er det såkaldte robot-syn, som sætter maskiner i stand til at udføre arbejde på objekter af varierende størrelse og orientering.

Se billedfiltrering og mønstergenkendelse.

Forfattere: 
Henrik Graversen
Casper Thomsen
Tine Havkrog Jensen