CharacterEyes LE 3.0 CZ

Druhý z testovaných produktů je standardně k dispozici jako doplněk skenerů UMAX. Jedná se o velice jednoduchý nástro...


Druhý z testovaných produktů je standardně k dispozici jako doplněk skenerů
UMAX. Jedná se o velice jednoduchý nástroj v tzv. Lite verzi, který je ovšem
možné za doplatek povýšit na profesionální verzi. Instalační soubory jsou tedy
většinou umístěny na doprovodném CD--ROM disku.
Nároky systému jsou poměrně skrovné, neboť si vystačí pouze s procesorem od 386
nebo vyšším, 8 MB RAM a alespoň 6 MB volného místa na pevném disku. Není-li
instalována kontrola pravopisu, pak lze disponovat pouze 4 MB volné kapacitu
disku. Samozřejmě nesmí chybět operační systém Windows 95 nebo NT 4.0. Produkt
však během instalace činí zásahy do systémových souborů a tak je lépe počítač
restartovat.
Úvodní obrazovka programu má svou pracovní plochu rozdělenu do 2 částí, kde
vlevo jsou umístěny ovládací a editační nástroje, pravá část pak patří
náhledové části. Samozřejmě i tentokráte je možný vstup dat jak ze souboru, tak
i ze skeneru. Protože však produkt doprovází skener, je celkem pochopitelné, že
základním vstupním bodem je právě skener. Z podporovaných datových typů pro
vstup ze souboru je v této verzi možné nalézt pouze soubory typu TIF a PCX.
Pokud je jako vstupní zařízení zvolen skener a je aktivována volba "Nastavení",
pak v dialogovém okně lze určit např. rozlišení pro skenování (200, 300 a 400
dpi), parametry pro jas a kontrast snímané předlohy a samozřejmě velikost
snímaného okna. Tentokráte však je možné pomocí ovládacích prvků a schémat
přesně zadat polohu a velikost snímané oblasti (obr. 3). Další vlastnosti,
které mohou skener ovlivnit v jeho činnosti (např. vybavení automatickým
podavačem apod.), jsou již v režii používaného rozhraní TWAIN. Velmi užitečnou
volbou se opět v hlavním okně může stát funkce "Srovnávat", která má za úkol
zajistit pootočení šikmo nasnímané předlohy.
Pokud není jako další z možností v ovládací části hlavního okna aktivována
volba "Automaticky", pak je uživateli dána šance na vlastní analýzu a označení
ploch, přerovnání pořadí jejich zpracování, vyjmutí nežádoucích oblastí z
procesu, inverze obrazu a jeho rotace. Pro snazší orientaci je i zde k
dispozici možnost úpravy pohledu na předlohu zvětšením, tentokráte jsou k
dispozici celkem 3 kroky vpřed i vzad. Co však tato verze programu zcela
postrádá, je výběr oblasti s obrázkem, který by byl podobně jako u OCR602 během
procesu vyseparován. Ať již jsou kroky před zpracováním předlohy jakékoli,
důležitými z hlediska kvality zpracování textu jsou 2 volby v roletovém menu
hlavního okna. Ty totiž zajišťují v rámci rozpoznávaného textu dodržování
formátování a rovněž spouští během převodu jazykovou analýzu.
Pokud ale volba automatického zpracování je zaškrtnuta, pak bez dalších dotazů
proběhne analýza ploch a zpracování předlohy do textu. Tento proces je
samozřejmě opět indikován (obr. 4) a barva pohybujícího se sloupce prozrazuje
aktuální pracovní činnost. Výsledkem pak je zobrazení okna speciálního
textového editoru, který pracuje v jediném režimu a kombinuje zobrazení
převedeného textu spolu s možností náhledu na původní podobu v předloze. Tato
předloha je vyvolána poklepáním na některý ze znaků, přičemž je zobrazeno
odpovídající slovo v grafické podobě (obr. 5). Prostým přepsáním nepatřičného
znaku pak lze chybu opravit. Aby byla orientace jednodušší, je standardně
povolena v editoru funkce označování "podezřelých slov", která jsou pak barevně
zvýrazněna. Zároveň editor disponuje i funkcí pro vyhledání dalšího takového
slova, čímž se značně urychluje pohyb po dokumentu.
Důležitou funkcí je ovšem možnost rozšiřování slovníku, protože kterékoli slovo
lze označit jako správné, což je v následujících textech již bráno v úvahu.
Protože však nejde v tomto případě o pouhý zobrazovač, je možné upravovaný text
i základním způsobem formátovat, tisknout přímo z tohoto prostředí a samozřejmě
ukládat. Podporovaných výstupních formátů je celá řada a i když je možné zvolit
ten správný formát ještě v rámci hlavního okna programu, lze i při ukládání
textu změnit původní rozhodnutí nebo napravit omyl, a to včetně jména souboru.
To je standardně generováno při vstupu dat ze souboru přesně podle jeho názvu,
s extenzí odpovídající formátu. Z nabízených způsobů uložení tedy lze zvolit
různé verze textových souborů v kódování ASCII i ANSI, podporovány jsou přímo
textové editory Ami Pro (2.0; 3.0) MS Word verze 4, 5 a 6.0 pro DOS, do verze
7.0 pro Windows, nechybí formát RTF, soubor pro Write, WordPerfect do verze 6.1
a WordStar až po 7.0. Z dalších typů souborů lze uvést tabulkové kalkulátory
Lotus 1-2-3, MS Excel, databázové systémy dBase a rovněž soubor HTML pro
publikování na Internetu.
Výsledky našich testů samozřejmě detailně opět ukazují doprovodné tabulky a
grafy. Stručně však lze poznamenat, že i v tomto případě lze narazit na potíže.
Podobně jako u předchozího produktu, není v silách této verze zpracování
předlohy, pocházející z jehličkové tiskárny, byť opět analýza oblastí dopadla
na výtečnou. Diametrálně odlišný je výsledek u textu z laserové tiskárny. Zde
byly při zpracování způsobeno pouze 3 chyby, což je vynikající. Automatická
analýza však kupodivu nedopadala tak dobře a text byl neustále členěn na menší
celky. Téměř výborně si však produkt vedl při zpracování obchodního dopisu, a
to tentokrát včetně označení oblastí. Poněkud horších výsledků v analýze však
dosahoval během zpracování knižní předlohy s ilustracemi, při zásahu obsluhy
však z hlediska rozpoznání textů zaváhal jen v několika případech. Test
zpracování novinového článku naopak potvrdil tvrzení výrobce, že v této
vývojové verzi si již dokáže produkt se sloupcovým textem poradit. Nejenže
správně určil všechny textové oblasti a vyhnul se obrázkům, ale i během
zpracování dosáhl vynikajícího výsledku.
V závislosti na výstupním textovém formátu je také myšleno na dělení slov u
takovýchto textů a pokud byl zvolen některý z textových editorů, bylo dělení
samozřejmě korektně zpracováno. Při pokusu o rozpoznání tabulky však při
automatické detekci oblastí překvapuje poněkud vysoký počet označených ploch a
výsledky by se daly označit spíše jen za velmi dobré. Naopak, naprostým krachem
skončil pokus o zpracování faxové zprávy ve standardním rozlišení, ačkoli
označení oblasti bylo zcela v pořádku. Program si však velmi dobře opět vedl u
faxů s jemným rozlišením, kterých naštěstí je v dnešní době asi většina.
8 1743 / ram









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.