Recognita 4.0 Plus

Protože se tento program řadí mezi uznávanou elitu v oblasti, je jak již bylo řečeno do testu zařazen pouze pro srovn


Protože se tento program řadí mezi uznávanou elitu v oblasti, je jak již bylo
řečeno do testu zařazen pouze pro srovnání možností. Druhým důvodem je, že se
jedná o absolutní novinku, neboť na náš trh se dostal teprve před několika
týdny. Důležitým parametrem bude pro mnohé i cena, neboť k pořízení plné verze
je třeba počítat s investicí asi 30 tisíc korun.
Pokud se však uživatel rozhodne pro toto řešení, musí disponovat počítačem s
instalovanými Windows 95 nebo NT 4.0, s procesorem alespoň 486DX, 8 MB operační
paměti pro Windows 95 a 16 MB pro NT 4.0 a minimálně 15 až 25 MB volného
diskového prostoru. K získání předloh je samozřejmě možné použít skener a
podporována jsou zařízení s rozlišením 300/400 dpi prostřednictvím rozhraní
TWAIN. V požadavcích je i další vybavení jako VGA, CD-ROM apod., ovšem to dnes
již patří k běžnému standardu.
Instalace
Snadná instalace z dodaného CD-ROMu se pouze dotazuje na některé konfigurační
parametry jako je jazyk rozhraní programu, použitý skener, podporované výstupní
formáty, instalované slovníky a konečně integrace do některých aplikací. Na
rozdíl od předchozích verzí 3.x však není tentokráte použito ochrany produktu
prostřednictvím hardwarového klíče.
Po instalaci a spuštění objeví uživatel, obeznámený předchozími produkty, řadu
změn. Tak předně jde o vlastní rozhraní aplikace, které získalo vzhled blížící
se aplikačnímu balíku MS Office 97. V současnosti je k dispozici i české
rozhraní tohoto produktu, což opět v mnohém ulehčuje orientaci v řadě nabídek a
funkcí. Důležitá je možnost měnit pomocí konfiguračního nástroje jazyk
rozhraní, pokud byl příslušný modul nainstalován. Stejně jako jiné programy
tohoto určení si i Recognita zachovává možnost vstupu dat jak prostřednictvím
skeneru, tak i ze souboru. Ze souborových formátů jsou k dispozici standardní
TIF a faxový AWD pro MS Fax, dále jsou to formáty JPG, PCX, DCX, IMG a BMP.
Přepínání vstupů a konfigurace vůbec je řešena buď názornými ikonami, nebo
položkami v hlavním roletovém menu.
Při prvním spuštění probíhá činnost dle původního základního nastavení. A to
představuje po vstupu dat okamžitou analýzu předlohy z hlediska jednotlivých
oblastí a rovněž převod na text. Pokud tento proces proběhne, je pracovní
plocha rozčleněna do několika oblastí (obr. 7). V levé části je možné nalézt
přehled jednotlivých sejmutých stran, seznam a stav s nimi provedených operací.
Pravou a také větší část pracovní plochy zabírá jednak náhled na aktivní
stránku spolu a analyzovanými oblastmi a také výsledná textová podoba. Je zcela
přirozené, že je možné hraniční čáry jednotlivých oblastí dle vlastní potřeby
posouvat, případně v náhledové části zvětšovat či zmenšovat pohled na předlohu.
K dispozici jsou 4 úrovně zvětšení, což opět přispívá k případné přesnější
manipulaci s oblastmi. Kromě toho je možné aktivovat funkci "sokolího oka",
které ukazuje celou stranu a barevně vyznačí aktuální výřez v náhledu. Snadno
se tak lze přesouvat pomocí myši na konkrétní požadovanou pozici.
Nastavení parametrů
Stejně jako u předchozích produktů lze ovlivňovat podobu jednotlivých oblastí.
Ani tentokrát však nejsou k dispozici nepravidelné tvary, což vyvolává nutnost
vhodné kombinace obdélníků pro zajištění správného výběru. S tím samozřejmě
souvisí i správné určení pořadí pro zpracování. Velice příjemné je, že není
nutné při změně pořadí oblastí procházet vždy od první po poslední, ale lze
poklepem ve vhodném pořadí prohodit i libovolné 2 z nich.
Abychom se však ještě vrátili k typu oblastí, lze i pomocí kontextového menu
přiřadit poli různé vlastnosti. Tak především je to typ fontu, který může být
tzv. "Omnnifont" nebo pocházet z maticové tiskárny. Lze předpokládat, že pole
obsahuje rukou psaná čísla, čárové kódy, optické znaky nebo grafiku. Dále je
možné určit, zda budou rozpoznávána pouze čísla nebo všechny znaky dle jazykové
analýzy a konečně to, zda jde o běžný text nebo tabulku. V případě tabulky je
pak možné pomocí další z voleb ovlivňovat uspořádání a podobu jednotlivých
sloupců i řádků.
O tom, že všechny tyto možnosti mají skutečně vliv na výsledek práce, se lze
přesvědčit v hodnocení testu. Bez ohledu na použitý typ datových oblastí a
jejich umístění je samozřejmě možné uložit aktuální nastavení ploch do souboru
na disku a zajistit si tak naprosto shodné podmínky pro zpracování dalších
dokumentů stejného typu, což může být opět výraznou pomůckou např. při
zpracování formulářů apod.
Pokud jsou oblasti již dle přání uživatele, bylo by již možné zahájit převod na
text, ovšem lze ještě nastavit celou řadu parametrů, kterými se dá ovlivnit
kvalita výstupu. Tak především je to jazyková analýza. Ta je k dispozici celkem
v 5 úrovních v protiváze k rychlosti zpracování předlohy. Prakticky to tak
znamená buď rychlý průběh bez jazykové analýzy, nebo naopak maximální přesnost
výstupu, avšak za cenu jistého zpomalení. Dále je možné již klasicky nastavit
znakovou sadu příslušné země a v základní nabídce nechybí ani čeština. Významné
je, že znakových sad může být vybráno i více současně, což dovoluje zpracovávat
i vícejazyčné texty s názvy měst, jmény apod. Přitom však jedna ze sad je
samozřejmě tou základní a je zvýrazněna. Celkově je v rámci všech jazykových
doplňků podporováno až 107 různých jazyků světa.
Dále lze zvolit tréninkový soubor, k němuž se ještě vrátíme, a uživatelský
slovník. Ani v tomto produktu nechybí možnost kontroly textu dle slovníku a v
základní nabídce se nachází 16 verzí, včetně češtiny. I tady je možné blíže
specifikovat chování k některým znakům, automaticky nahrazovat zadané výrazy
jinými, zajistit spolupráci se zadaným tréninkovým atd. Při zpracování velmi
rozsáhlých dokumentů je možné v další části nastavení zajistit např.
přeskakování prázdných stran, možnost zohlednění oboustranných předloh, nebo
zda je dokument produktem faxového přístroje.
V rámci dialogového okna pro nastavení parametrů lze ale na-lézt i další široký
seznam různých parametrů, který může podobně jako v předchozích případech
ovlivnit chování skeneru, velikost a umístění zpracovávané plochy, přičemž lze
i přesně číselně specifikovat polohy rohů. Některé takto do jednoho
víceúrovňového okna sdružené parametry je možné ovlivňovat i řadou ikon na
nástrojových lištách programu, případně kontextově citlivým menu.
Rozpoznávání textu
Pokud je uživatel spokojen, může aktivovat rozpoznávání textu. To se samozřejmě
řídí jeho nastaveními a konfigurací. Výsledkem však je naplnění okna
integrovaného textového editoru rozpoznanými znaky či textem. Při použití
jazykové analýzy a korektoru jsou samozřejmě neznámá slova označena barevným
podkladem. Z menu pak lze vyvolat funkci kontroly překlepů a nová slova
zařazovat do uživatelského slovníku. Velice důležitou možností je i spolupráce
s funkcí tréninku. S jejím využitím totiž lze naučit rozpoznávací algoritmus
některým znakům a zvláště pak důležité jsou i tzv. "slitky" z více písmen.
Dialogové okno pro učení se (obr. 8) dovoluje při zpracování slitků i redukci
výběru a skutečně správné rozpoznání znaku.
V případě, že však vlivem nepozornosti došlo k chybě, není ještě nic ztraceno,
neboť editor tréninkového souboru zobrazuje všechny aktuální opravy a je možné
kteroukoli z nich buď vyřadit, nebo korigovat. V každém případě se tak nabízí
možnost dosažení téměř absolutní přesnosti v rozlišování znaků, ovšem záleží
pouze na "pedagogických" schopnostech obsluhy. V kombinaci s korektorem
pravopisu a ukládáním oprav do uživatelského slovníku, respektive tréninkového
souboru, lze nejen dosáhnout vysoké přesnosti, ale i vytvářet několik variant
odpovídajících si souborů pro jedno téma a typ předlohy.
K samotnému oknu textového editoru je třeba poznamenat, že jde o celkem dobře
vybavený nástroj pro formátování textu, a to nejen z hlediska fontu a jeho
řezu, ale i ve schopnostech zarovnávání textů apod. Tím lze zároveň navázat na
předchozí kroky při zpracovávání předlohy a upozornit, že kromě prostého textu
je editor schopen zobrazit i plné formátování a to včetně rámečků u
zpracovávaných tabulek. Stejně tak je možné i příslušné formátování zaznamenat
do výstupních souborů a záleží pouze na zvoleném datovém typu. Těch je v tomto
případě při plné instalaci nepřeberné množství celkem 137 typů a verzí a asi
málokterý uživatel nenajde vhodný typ, neboť použít lze výstup pro mnoho
textových editorů, tabulkových procesorů, databází, výstup pro Internet, různé
verze běžných textových souborů atd. U některých z nich pak lze doplňkovými
volbami zajistit uložení pouze textu nebo 2 úrovně dodržení formátování. Kromě
výstupního textu je však možné uložit i rozpracovaný dokument a někdy později
jej znovu načíst ke zpracování a případně do něj přidávat další stránky, ať již
skenováním nebo ze souboru.
Výsledky našeho testu celkem potvrdily předpoklady o vysoké schopnosti programu
Recognita nejen rychle, ale hlavně kvalitně rozpoznávat text. I když totiž
nebylo použito tréninkového režimu a jazyková analýza byla nastavena na
maximální hodnoty, výsledky jsou opravdu zajímavé, ostatně v souladu s
předpokladem. Velmi dobrých výsledků bylo z hlediska kvality dosaženo u
předlohy z jehličkové tiskárny, i když automatická analýza rozdělila oblast
zbytečně na 2 části. Naproti tomu bezchybná práce analyzéru byla v případě
laserového výstupu, ovšem při převodu již 2 chyby nastaly, což ovšem stále
ještě znamená úspěšnost více než 99 %. Stejně tak tomu bylo i u následujících 3
typů dokumentů, obchodního dopisu, knihy a novinového tisku. V případě
obchodního dopisu však bylo lépe zasáhnout do rozvržení oblastí a upravit
tabulku, která byla původně označena jako sloupcový text. V případě zpracování
tabulky sice výsledky nebyly v oblasti vynikajících, ovšem byly se svými 98 %
absolutně bezkonkurenční. Celkem dobře si produkt vedl i při zpracování faxu
standardní kvality. Lepší výsledky pak samozřejmě náležely faxu jemné kvality,
i když tentokrát zaostal za dvěma dříve uváděnými produkty. Celkově však
Recognita pracuje nejen v základním nastavení s vysokou přesností, kterou lze
dále zvyšovat, ale i s obdivuhodnou rychlostí.
8 1744 / ram

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.