Jak jsme testovali

Test produktů pro optické rozlišování textů je samozřejmě založen na řadě různých typů dokumentů, které mají ...


Test produktů pro optické rozlišování textů je samozřejmě založen na řadě
různých typů dokumentů, které mají za úkol důkladně prověřit schopnosti
programů reagovat na různé typy písem, uspořádání textů, přítomnost grafiky a
typ zařízení, které příslušný dokument vyprodukovalo.
Z těchto důvodů byl k rozpoznávání předložen běžný dokument psaný
neproporcionálním písmem, který byl jednou vytisknut pomocí 9jehličkové
tiskárny v režimu draft, zatímco podruhé na laserové tiskárně. To zároveň mělo
představovat i ekvivalent elektrického psacího stroje. V obou případech šlo o
prostý text se 2 odstavci, zarovnaný pouze k levému okraji a psaný jediným
řezem písma. Jako celek obsahoval 1 442 znaků, nepočítaje mezery.
Dalším prototypem předlohy byl běžný obchodní dopis, který samozřejmě obsahoval
firemní logo, textové informace zapsané v proporcionálním fontu, menší tabulku
s parametry popisovaného zařízení a samozřejmě podpis odesílatele. V tomto
případě bylo možné rozpoznat maximálně 2 147 znaků.
Čtvrtou předlohou se stala stránky z knihy encyklopedického charakteru s
poměrně krátkými texty, ovšem oboustranně zarovnanými a bohatě prokládanými
ilustracemi. Text navíc obsahoval i názvy pocházející z němčiny a kladl tedy
zvýšené nároky na rozpoznávání jazyků. Celkem tato předloha obsahovala 1 632
znaků.
Pátým typem byl novinový článek, respektive jeho výřez ve formátu A4 se 4
sloupci textu, dělením slov, oboustranným zarovnáním, velkým nadpisem a
vloženou grafikou. Zde bylo sledováno samozřejmě mimo přesnosti i správné
označení toku textu. Předloha tohoto typu byla zcela nejdelší a obsahovala
celkem 6 097 znaků.
Dalším testovacím nástrojem se stala tabulka s ceníkem, která měla za úkol
prověřit schopnost zpracovat takovouto předlohu. Celkem tabulku tvořily 4
sloupce kvalitně tištěného textu, obsahujícího jak písmena, tak i číslice.
Celkem tabulka obsahovala 1 642 běžných znaků.
Poslední 2 předlohy tvořila shodně faxová zpráva, ovšem jednou odeslaná se
standardním rozlišením faxu, zatímco podruhé v režimu s jemným rozlišením.
Samotný obsah tvořil již výše uvedený příklad obchodního dopisu, takže i
tentokrát obě předlohy obsahovaly 2 147 znaků.
Všechny testovací obrazce kromě faxových byly při testu rozpoznávacích
schopností jednotlivým aplikacím předkládány v podobě naskenovaných souborů s
rozlišením 300 dpi v monochromatickém režimu, čímž byly zajištěny vždy shodné
podmínky pro následné zpracování. Faxové soubory pak byly uloženy přímo ve
formátu, jak přišly do elektronické pošty.
Všechny programy byly testovány na shodném počítači, který byl vybaven
procesorem Intel Pentium II s frekvencí 333 Mhz, operační pamětí 128 MB, dvěma
SCSI disky Fujitsu o kapacitě 2 GB a grafickou kartou Diamond Fire GL 100Pro,
zapůjčeném společností Datrontech. Jako skener byl použit výrobek
Hewlett-Packard 4c v základním provedení. Na počítači byl předinstalován
operační systém MS Windows 95 OSR2.1.
Hodnocení kvality rozpoznávacího procesu bylo založeno na spočítání správně
rozpoznaných znaků. Během vyhodnocování byly tedy z převedeného textu vyjmuty
všechny nesprávné znaky. Vyjmuty byly i znaky, které sice byly rozpoznány
správně, ovšem následoval nebo předcházel je jiný nesprávný znak, který vznikl
např. oddělením části rastru přerušením čáry původního znaku. Zbývající písmena
byla potom sečtena a vytvořila základ pro stanovení percentuální úspěšnosti
rozlišení.
Měření času potřebného pro zpracování jednotlivých předloh bylo v našem případě
spíše orientační, neboť jako hlavní kritérium byla stanovena přesnost
zpracování. V rámci slovních hodnocení se pak lze setkat s výbornou kvalitou
převodu, která představovala hodnoty od 99 % výše, dále velmi dobrou v rozmezí
od 95 do 99 %, dobrou mezi 80 a 95 % a pak některými dalšími nižšími úrovněmi.
Možná se některému uživateli budou zdát kritéria přísná, avšak hodnoty
vycházely ze zkušeností a obecných poznatků, že opravování zle rozpoznaného
textu bývá mnohdy zvláště pro zběhlou písařku složitější než jeho plné přepsání.
8 1745 / ram

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.