Hvor svært kan dét være?! (960/N)
I de gode gamle dage var softwarekvalitet meget nemmere: Enten gik hullerne hele vejen igennem, eller også gjorde de ikke:
Vi har et antal hulkortlæsere i Datamuseum.dk som vi med forskellige grader af held kan få til at køre nogenlunde.
Men nogen langtidsholdbar plan er det ikke og derfor var et indlysende projekt at skrive et stykke software så man kunne køre hulkortet igennem en scanner og "læse" det fra billedet.
Som overskriften antyder er det ikke helt så ligetil som man, herunder jeg, kunne forvente.
Med hulkortet ovenfor begik jeg den fejl at indstille scanneren til et hulkorts nominelle størrelse, med det resultat at jeg ikke kan identificere kanterne af kortet og derudfra bestemme hvor hullerne burde være.
Med det pågældende kort kan man nogenlunde fuske sig frem til en god læsning, fordi der er huller i begge i to yderste kolonner. Hvor det ikke er tilfældet er kanterne meget vigtige.
Her er et kort der er nogenlunde nemt:
Man kan ikke bare kigge på om der er mørkt eller lyst omkring hullernes idealpositioner, for folk skrev ting på hulkort:
Hulkort behøver ikke være hvide, det her var canvasbrunt og har derfor meget dårlig kontrast og for det ikke skal være løgn, er der et stort fedt påtryk:
Påtryk kan være meget besværlige, tyske universiteter var f.eks ikke nær så fedtede med tryksværte som NEUCC:
Dette hulkort er formodentlig det absolut værste eksempel jeg har kunnet finde.
Det er utroligt nok muligt at se hullet hvis man hiver i gråtonerne:
Men ét er manuelt at fedte med kortet, noget helt andet er at gøre det bare nogenlunde automatisk, dét kort har jeg måtte give op overfor.
Ikke at det er svært at skrive et program der klarer netop dét hulkort, det svære er at skrive et program der også klarer de andre 12919 hulkort lige så godt.
I praksis, for os i Datamuseum.dk, er der et meget nemt work-around: Scan både forside og bagside af hulkortet: Bagsiden er næsten altid helt blank og de to scan kan automatisk holdes op imod hinanden for at opdage fejllæsninger.
phk
PS: Rædselskortet er fra denne tyske samling af repræsentative hulkort

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.
Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.
Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.
Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.