Tegn

(eller: character, karakter).

Tegn omfatter: store og små bogstaver, cifre fra 0 (nul) til 9 (ni), diakritiske tegn, interpunktionstegn og specialtegn til at styre kommunikation og udskrift. Ikoner kan ligeledes betegnes som en særlig type tegn.

Tegn repræsenteres i computerens lagre ved bitstrenge, ofte af en længde på 8 bit (en byte). Tolkningen af bitstrengen sker i henhold til tegnsætstandarder. De kendteste er ISO 646 (ASCII), LATIN-1 (ISO 8859/1), Codepage 850, EBCDIC samt ISO 10646 (UCS). Disse tegnsætstandarder definerer hver et tegnsæt, der omfatter forskellige delmængder af det samlede udvalg af tegn.

Tegn (bitstrengen) har en binær talværdi, der kan sorteres i en nummerorden. Laveste værdi har styretegn, efterfulgt af aritmetiske operatorer samt tal. Derefter følger store bogstaver, små bogstaver og til slut specialtegn, herunder nationale tegn. Alle 7-bit tegnsætstandarder er opbygget med denne værdiorden.

Det skriftsnit (den font), hvormed tegnet fremtræder på dataskærme eller printere, er bestemt af elektronik i den enkelte ydre enhed og således på dette punkt frigjort fra tegnsætstandarden (se glyf). Skriftsnit kan ligesom tegn indeholde information. Det er f.eks. tilfældet med skriftsnittet OCR, hvor en nøje standardisering af det enkelte tegns form muliggør en maskinel genkendelse.

Forfattere: 
Klaus Hansen
Casper Thomsen