OCR602 2.0

K tomuto produktu vede nejsnazší cesta prostřednictvím instalace kancelářského balíku 602proPC Standard, kde je testov...


K tomuto produktu vede nejsnazší cesta prostřednictvím instalace kancelářského
balíku 602proPC Standard, kde je testovaná část OCR602 při běžném postupu
automaticky předvolena v rámci sekce Desktop. Nároky na vybavení počítače a
operační systém jsou samozřejmě dány požadavky balíku jako takového procesor
Pentium se 16 MB paměti, na pevném disku volných asi 50 MB a operační systém
Windows 95 nebo NT 4.0.
Po spuštění se uživateli zobrazí poměrně jednoduché okno, které poněkud
nezvykle neobsahuje žádné rozletové menu, ale je kompletně ovládáno ikonami. Na
rozdíl od většiny ostatních nástrojů OCR je prvotní vstup z grafického souboru.
Důvodem je zřejmě předurčení produktu pro převod textů z faxových zpráv
doručených v rámci poštovního klienta Mail602. Mezi podporovanými datovými typy
proto nechybí FAX, TIF, BMP, PCX ani DCX. Vstup dat ze souboru však není
jediným možným, a rovněž je počítáno s přítomností skeneru.
Vstupní dialogové okno je proto vybaveno i další dvojicí tlačítek "Načíst ze
scanneru" a "Nastavení". Přičemž druhé z nich samozřejmě slouží hlavně pro
ovlivnění parametrů skenování, ale vztahuje se částečně i na vstup ze souboru.
V prvních částech dialogového okna lze totiž specifikovat, který ovladač TWAIN
bude pro snímání použit, případně jestli bude použito vlastního rozhraní, zda
jde o ruční či stolní typ skeneru, jestli předlohu bude třeba sejmout jako
negativ, jaká má být úroveň jasu a konečně i to, zda je skener vybaven
automatickým podavačem dokumentů.
Lze také zvolit i rozměr snímané plochy, přičemž kromě řady předdefinovaných
hodnot lze určit i vlastní. Pokud sledovaná oblast textu leží jinde než u
levého horního rohu, lze ohraničující rámeček na symbolické ploše předlohy
posunout myší. Umístění výběru je však pouze intuitivní, a jistě by prospělo
alespoň zobrazení souřadnic levého horního rohu, aby nebylo nutné činit pokusné
průchody skeneru. Poslední část dialogu může ovlivnit oba typy vstupu a souvisí
s automatickým otáčením předlohy s krokem 90 stupňů. Dále je zde k dispozici
volba pro zvětšování obrazu pro fax, k jejímuž vlivu se ještě vrátíme v dalším.
Poslední možnosti již souvisejí spíše s vlastním rozpoznáváním textů a jde o
aktivaci funkce automatického výběrů oblastí, spolu s detekcí tabulek.
Pokud v rámci konfiguračního okna nebyla předvolena i funkce okamžitého
rozpoznávání textu ihned po načtení předlohy, pak je zobrazen obsah grafického
souboru a další postup je plně v rukou uživatele. Automatický výběr textů sice
zajistí ohraničení příslušných oblastí, avšak pomocí ikon v horní části okna
lze ovlivňovat jejich skutečné umístění, velikost, pořadí pro zpracování i typ.
Typem se rozumí buď textová oblast, nebo grafika. K dispozici jsou výhradně
obdélníkové tvary, takže v případě různě formátovaného textu je nutné volit
vhodnou kombinaci těchto oblastí. Pokud jsou některé oblasti označeny jako
obrázky (obr. 1), jsou během zpracování ukládány do samostatných souborů typu
TIF. Samozřejmě i nyní je ještě možné zinvertovat celý obraz, otočit jej a pro
detailnější zobrazení případně zvětšit, byť pouze jednokrokově. Mezi tlačítky
lze nalézt i symbol faxu, který slouží právě k aktivaci funkce "Zvětšení pro
fax". Pokud totiž předloha nemá na šířku více než 1 728 bodů, což odpovídá
standardnímu faxu, pak lze touto funkcí výrazně zlepšit kvalitu rozpoznání
textu, zvláště při nízkých rozlišeních, která odpovídají faxovým přístrojům.
Po dokončení úprav oblastí již je možné pomocí jednoho z hlavních tlačítek
vyvolat převod na text. Ještě před tím však lze opět aktivovat dialogové okno
pro nastavení parametrů. Jeho první 3 části jsou sice identické jako u
nastavení parametrů při snímání, ale přibývají zde další 3, vážící se již
výhradně na zpracování textu a výstup. První určují parametry převodu z
hlediska znaků (všechny znaky nebo jen číslice), jestli má program sám
automaticky reagovat na velikost písma nebo zda bude předepsána pevná výška
fontu, případně jde-li o proporcionální nebo o neproporcionální typ písma. A
pokud není předloha právě "nejčistší", lze zvolit úroveň filtrace skvrn. Ty
jsou charakterizovány slovy malá/běžná/velká a je jen na zkušenosti obsluhy,
aby zvolila vhodné označení. Při převodu vícestránkových dokumentů může být
také využito buď společného převodu všech stran najednou, nebo po jednotlivých
kusech.
Ke zvýšení úspěšnosti rozpoznávání textu mohou výrazně přispět další parametry
nastavení v části okna nazvané korektury. V nabídce jsou konkrétně korektury
závorek a číslic ve slovech, malá a velká písmena, důsledné rozlišování znaků
jako 1 a I, 0 a O. Lze aktivovat i funkci pro automatické nahrazování řetězců,
kde má uživatel možnost zadat odpovídající si dvojice a usnadnit si tak práci
při snímání textů ze starších dokumentů, kde je nutné změnit ve všech výskytech
např. název firmy nebo jméno jednatele.
Nejvýznamnějším bodem je asi možnost zapnutí jazykové korektury. Ta je založena
na instalovaných slovnících textového editoru a dokáže během rozlišování
odhalit "překlepy" během rozlišování textu, stejně jako při klasickém psaní,
případně i doplnit nerozpoznaný chybějící znak ve slově. Úplně poslední část
souvisí s nastavením vůči výstupnímu textovému souboru. Lze zvolit jednak název
a umístění souboru, výstupní formát a samozřejmě i kódovou stránku. Z
výstupních formátů jsou k dispozici běžný text v různých podobách, formátovaný
text typu RTF, soubory pro Text602 a WinTex602 (3.95, 5.0), nechybí však ani
formát pro MS Word (1.x, 2.x, 6.x) a Write. Podporované kódové stránky pak jsou
ASCII, kódování češtiny dle Kamenických, Latin 2 a Windows 3.1 EE, přičemž k
libovolnému typu souboru je možné přiřadit libovolné kódování znaků.
Pokud jsou všechny parametry nastaveny dle přestav obsluhy, můžeme spustit
vlastní převod. Opticky zvýrazňovaný průchod vybranými oblastmi předlohy
následně doprovází výstupní okno s rozeznaným textem. Jde vlastně o jakýsi
speciální textový editor, který se standardně nachází v tzv. náhledovém režimu.
Kurzor má podobu plošky a při označení vybraného znaku je zobrazena část
předlohy spolu s tlačítky, umožňujícími jeho korekci nebo smazání (obr. 2). Pro
snadnější orientaci jsou znaky, kterými si program OCR602 nebyl zcela jistý,
barevně odlišeny, stejně tak jako slova, která neobjevil ve svém slovníku.
Bohužel však nová správná slova do slovníku zařadit nelze a je nutné následně
využít funkcí textového editoru WinText602.
Druhým režimem výstupního okna je tzv. editační režim. Kurzor se změní na známý
tvar z textových editorů a lze přímo dopisovat potřebné znaky, slova apod. V
obou režimech je možné kdykoli znovu aktivovat automatické korektury, ale je
dobré spustit je pouze na počátku úprav textu, protože ten je vždy upraven s
ohledem na původní předlohu a dle "názoru" slovníku. A tak se všechny doposud
vykonané úpravy výstupního textu samozřejmě ztratí. Režim editoru nabízí i
některé další základní funkce, např. vyhledávání v textu, statistiku
rozpoznávání atd. Přesto, že název i typ výstupního souboru již bylo možné
určit dříve i v této části programu, lze pomocí položek roletového menu původní
rozhodnutí změnit. Trochu matoucí pro začínající obsluhu však je, že na
pracovní ploše jsou umístěna obě okna, jak s grafickým náhledem, tak i výstupní
editor, avšak zavření editoru ukončí program jako celek. Pokud je tedy potřeba
pokračovat, je nutné buď ikonkou skeneru, nebo volbou "Další převod" uzavřít
pouze okno editoru a vrátit se do základního stavu pro výběr další předlohy.
Důležité je, že v okamžiku uzavírání okna editoru se automaticky také ukládá
rozpoznaný text do předvoleného souboru. Naštěstí přitom nedochází k
přepisování původního obsahu, ale vždy je nový text připojen k předchozímu.
Takže ani opomenutí neznamená ztrátu předchozích dat.
Výsledky reálných testů je možné vidět v přiložených tabulkách a grafech.
Zklamáním bylo, že si program vůbec nedokázal poradit s předlohou z jehličkové
tiskárny, tisknutou v režimu draft, byť byla použita kvalitní páska. Přičemž i
při automatickém režimu volby oblastí byl text "odhalen" zcela správně. Naproti
tomu vynikajícího výsledku jak z hlediska rychlosti, tak i kvality, dosáhl u
shodného textu, ovšem zpracovaném na laserové tiskárně. Poněkud hůře již dopadl
při rozpoznávání běžného obchodního dopisu, kde se úspěšnost pohybovala okolo
tří čtvrtin znaků. Ve všech předchozích případech se dalo plně spolehnout na
samočinný výběr oblastí. Jinak tomu již bylo při získávání z textu z knihy, kde
samočinný výběr oblastí nebyl příliš spolehlivý. Navzájem se totiž oblasti
překrývaly, nebyla korektně označena grafika apod. Pokud však byl výběr
korigován ručním zásahem, poradil si program se zpracováním textu již velmi
dobře. Podobně lze charakterizovat i zpracování novinových textů, kde největší
chybou bylo rozčlenění hlavního nadpisu podle textových sloupců umístěných pod
ním. Naopak, i přes zapnutou volbu k rozlišování tabulek nebyly výběr oblasti
ani výsledky při zpracování tabulky přesvědčivé. Poměrně dobré výsledky byly
zaznamenány u zpracování faxů. Zvláště v případě faxu standardní kvality bylo
výrazně lepšího rozlišování dosaženo s funkcí "Zvětšení pro fax". Bez ní totiž
nebyl rozpoznán žádný znak, s ní pak více než polovina textu.
8 1741 / ram









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.