Skenuješ, skenujeme, díl čtvrtý, o podstatě barev

1. 12. 1998

Sdílet

Barvy -- jaký by bez nich byl svět! Barevné květiny, monitory, ptáci, tiskárny, ryby, fotografie. Avšak hned na zač


Barvy -- jaký by bez nich byl svět! Barevné květiny, monitory, ptáci, tiskárny, ryby, fotografie. Avšak hned na začátku technického rozboru je třeba zbavit se iluzí.

Pravda je taková, že barva je čistě lidsky subjektivní pojem, navíc její určení silně závisí na individualitě, která ji posuzuje. Aby se daly barvy vůbec nezávisle charakterizovat (definovat), je nutno nejprve přijmout určitý model, zjednodušení a standardizaci.
Každý dnes ví, že světlo je stejné povahy jako záření pro přenos signálu pro televizi, rádio, telefony GSM, pořizování rentgenových snímků atd. Jde o elektromagnetické záření (vlnění) a viditelné světlo tvoří jeho část charakterizovanou tzv. vlnovou délkou o d 380 do 770 nm (nm je jedna miliontina milimetru). S vlnovou délkou úzce souvisí barva světla (viz tabulka), jejich řazení připomíná barvy a barevné přechody duhy -- jsou v¦ní obsaženy čisté spektrální barvy.

Historie pochopení

Obvyklé světlo je mix záření různých vlnových délek; jsou-li zastoupeny všechny dostatečně rovnoměrně, vnímáme světlo jako bílé. Prochází-li takové složené světlo optickým hranolem, rozkládá se na barevné složky, tzv. spektrum (proto například broušené sklo vrhá barevné odlesky). Tyto základní vědomosti a původ barev ve světle jsou již velmi staré -- rozklad světla popsal Isac Newton ve svém spise z roku 1686 (jeden český pramen udává spis Jana Marka, profesora Karlovy univerzity z roku 1668). Popis světla jako elektromagnetického vlnění vytvořil J. C. Maxwell roku 1860, a teprve na začátku tohoto století (1905) definoval A. Einstein model světla jako tok částic. Tolik historie.
Fyzikálně lze každé světlo dopadající do oka, a tedy každý vjem jednotlivé barvy popsat spektrální křivkou (mírou zastoupení jednotlivých barev spektra, záření jednotlivých vlnových délek). Základní otázka otevírající možnost charakterizace barev je, zda lze dvěma různými světly (tedy s rozdílnou spektrální křivkou) vytvořit vjem stejné barvy. Je tomu tak. Dál e se ukazuje, že mícháním tří rozdílných světel je možno vytvořit prakticky všechny barevné vjemy. K pokusu lze užít tři barevné reflektory, které svítí do jednoho kruhu, kde se jejich světla prolínají. Mění-li se intenzita barevných světel, získáváme vjemy prakticky všech barev až na některé. Pár jich působí při míchání problémy, například hnědá (je to hlavně červená se žlutou, ale na světlejším pozadí) - pak je potřeba doplnit další " složku", směs zesvětlit.
Každá barva se tedy dá zapsat součtem pokusných světel jako: barva=a * SvětloA + b * SvětloB + c * SvětloC , musíme ale připustit i záporné koeficienty a, b, c, jak jsme si ukázali u míchání problémových barev. Tady už je vidět, že jsme na dobré cestě k popisu barev. Víme, jak je zapsat, že základní složky stačí tři a že se barvy sčítáním skládají. Popis barev viděných člověkem se samozřejmě neobešel bez studia a pokusů s vnímavostí oka. Oko má čtyři typy světelných receptorů, z nichž jeden se uplatňuje za velmi nízkého osvětlení a nedává informace o barvě. Ostatní tři typy jsou různě citlivé na světlo různých vlnových délek. Pokusy s vnímáním barev barvoslepými lidmi ukazují, že skutečně existují tři typy barevných receptorů a dají se i zkonstruovat jejich křivky citlivosti na světlo různých vlnových délek.
Zatím však není jasné, jaká tři světla k míchání zvolit (aby nebylo potřeba používat záporné koeficienty) -- obvykle se za základní barvy berou RGB (červená, zelená a modrá), při jejich použití je oblast barev získaná jen mícháním největší. Protože jakýkoliv vjem lze namíchat složením barevných světel a ta zase určením jejich spektrálních křivek, stačí znát způsob, jak namíchat čisté spektrální barvy. Vše ostatní dostaneme pouhým " sčítáním". Na tomto místě můžeme zavést pojem barevného prostoru -- je dán zvolenými základními barvami a všemi z nich míchanými (tedy jen kladnými souřadnicemi složek). Tím určuje popis STEJNÝCH barev (vjemů) RŮZNÝMI poměry (čísly, souřadnicemi) URČITÝCH základních barev.

A co monitor

Příkladem může být barevný prostor monitoru. Je charakterizován třemi typy luminoforu, které mají určité barvy (základní barvy v přirozeném barevném prostoru monitoru). Bude-li 0 označovat, že luminofor nesvítí a 255 že je rozsvícen na maximum, pak všechno, co monitor umí zobrazit, je vyjádřeno trojicemi čísel (a, b, c) v intervalu od 0 do 255. Má-li monitor luminofory barev RGB, máme známý barevný prostor RGB monitoru.
A tady je jedno velmi podstatné nedorozumění: vždyť vezmeme-li jiný monitor, například starší, vyrobený podle jiné normy, monitor jiného typu (třeba LCD), či dokonce pootočíme-li regulátorem jasu, budou jeho základní barvy asi jiné! To ovšem znamená, že stejný obraz bude jen pouhou výměnou monitoru vypadat jinak! Toto je přesně ta nepříjemnost, na kterou nikdo nechce narazit. Souvisí s tím, že pojem barevný prostor RGB není obvykle doplněn definicí základních barev. Jak jsme zjistili, je RGB prostor běžně volně definovaný závislý na konkrétním zařízení. Stejně je tomu u skenerů. Skener pracuje s CCD prvky nebo fotonásobiči a případně filtry, jež jsou určitým způsobem citlivé na spektrální křivku analyzovaného světla. Jde o vlastnost charakteristickou pro daný typ skeneru, někdy i pro konkrétní kus. Znamená to, že dá-li určitá barva při snímání jedním typem skeneru určité souřadnice, při snímání jiným typem budou tyto souřadnice asi jiné. Barva se nezměnila, tak proč? Protože se trochu změnily základní barvy. K dosažení stejného výsledku je třeba je namíchat trochu jinak, a to je určeno barevnými souřadnicemi, které se musely změnit. Ve volné řeči uvažovaný barevný prostor RGB skeneru je tedy také závislý na zařízení.

Další varianta

Nelze si pomoci ani prací v barevném prostoru tiskových strojů CMYK ( cyan-azurová, magenta-purpurová, yellow-žlutá a black -černá). Jejich základní barvy nejsou čtyři, ale v podstatě také tři -- CMY -- a volí se proto, že jsou k popisu barev v ofsetovém tisku vhodnější. Černá (K) není základní, ale její přidání zvětší barevný prostor tisku -- je přidávána z důvodu zlepšení kresby, zlevnění tisku a technologických omezení (papír nepojme jakékoliv množství barvy a tmavé barvy by byly nekontrastní a škaredé). Každý CMYK prostor je taktéž zcela závislý na konkrétní technologii tisku, tedy použitém papíru, seřízení tiskového stroje, použitých barvách, pořadí tisku barev a podobně.
Problémy s barevnými prostory závislými na konkrétních zařízeních řeší systémy správy barev většinou tím, že se pracují s tzv. barevným profilem zařízení. Ten jej zcela charakterizuje a sdělí-li se systému správy barev profil pro monitor, tiskárnu i skener, je pak schopen zobrazovat na monitoru to, co bude vytištěno.
8 0000/DĚD


Barva
světla>fialová>modrá>modrozelená>zelená>žlutá>oranžová>červená
Vlnová délka
(nm)>380-440>440-480>480-490>490-570>570-590>590-610>610-770

Soutěž o skener UMAX Astra 600P

Tak tentokrát máme článek v¦podstatě se dvěma náměty a otázky
jsou proto pestřejší. Jaké otázky? No přeci v¦soutěži
s¦ConQuestem, ve které můžete získat svůj skener za 3,60 Kč
(pošlete kupón z¦redakčního bloku). Zatím jsme se v¦naší sérii
článků věnovali především základním pojmům, parametrům a
částečně základnímu softwaru. Dále přineseme rady a postupy, jak
se základním vybavením udělat co nejvíce.

Naučili jste se to důležité?

1. Světlo je:
a)druh žárovky
b)magnetické vlnění
c)elektromagnetické záření

2. Viditelné vlnová délka je:
a)380 - 770 mm
b)38 - 77 nm
c)380 - 770 nm

3. Všechny spektrální barvy obsahuje:
a)bílé světlo
b)polarizované světlo
c)modré světlo

4. Definice světla používá:
a)barevné složky
b)počet filtrů
c)kalendář

5. Co není barevný prostor?
a)RGB
b)BMP
c)CMYK

6. Monitor pracuje v prostoru:
a)BNC
b)RBG
c)YUV

7. Tiskové stroje používají barvy:
a)CMYK
b)CB
c)ABCD

8. Vysoký jas při snímání zaviní:
a)slití písmen
b)rozpad písmen
c)zašednutí podkladu

9. Pro OCR je vhodné rozlišení:
a)150 dpi
b)300 dpi
c)600 dpi

10. Češtinu umí:
a)všechna OCR
b)některá OCR
c)žádná OCR

Tipy pro práci s OCR

Jak jsme minule slíbili, tak se stalo -- máte zde tipy pro práci
s¦OCR programy:
Skener

Nemůžete od vašeho OCR programu očekávat, že přečte něco, co
ani skener správně nevidí. Jakýkoliv prach nebo šmouhy na
snímacím skle skeneru se objeví též ve vysnímaném obraze, a tím
sníží kvalitu rozpoznávání textu. U skenerů s podavači dokumentů
indikují prach na skle nežádoucí vertikální linky ve vysnímaném
obraze, u plochých skenerů se prach projeví jako tečky nebo
skvrnky. Udržujte sklo vašeho skeneru čisté.

Více listů, podavač

Kvalita dokumentů, které najednou vložíte do podavače dokumentů
(ADF, Automatic Document Feeder) na vašem skeneru, by neměla být
příliš rozdílná, neboť během snímání dávky dokumentů nelze
provádět změny nastavení rozhraní TWAIN (tedy například režimu
snímání, rozlišení, kontrastu, jasu).

Zvětšení

Umí-li program zobrazovat různá zvětšení dokumentu, lze při
velkém zvětšení (na úroveň pixelů) odhalit teoreticky vše, a tak
posoudit, zda odlišné nastavení jasu a kontrastu může odstranit
dotýkající se, přetrhané, rozmazané, tenké, příliš tlusté, slité
nebo vyplněné znaky.
Nepoužívejte bezdůvodně vysoká rozlišení pro snímání dokumentů.
V praxi dává snímání při rozlišení 200 až 300 dpi dostatečný
obraz dokumentu při rozumných velikostech obrazových souborů.
Vyšší rozlišení použijte jen při snímání velmi malého písma, a i
tak nepřekračujte 400 dpi.
Pokud budete číst extrémně malé znaky (8 až 6 bodů nebo menší),
můžete při snímání zvolit vyšší rozlišení (400 dpi nebo i
vyšší); zvětší se tím velikost písmen v obraze dokumentu. Můžete
též zhotovit zvětšenou fotokopii dokumentu, a tu teprve snímat.

Obraz získávaný skenerem

Pokud váš skener z nějakého důvodu nespolupracuje s OCR
programem, pak lze nasnímat dokumenty do obrazových souborů a
následně soubory načíst do OCR programu a nechat rozpoznat.
Jemným vyladěním snímání vašeho skeneru zdůrazníte nebo
potlačíte některé rysy znaků textu. Porovnejte výsledky při
experimentování s hledáním optimální kombinace nastavení skeneru
- režimu snímání, rozlišení, jasu a kontrastu a bezchybnosti
převodu
Proces rozpoznávání textu má velké nároky na paměť, protože
pracuje s bitmapovými obrazy dokumentů. Dovoluje-li to váš
skener, zmenšete co nejvíce snímanou plochu, nezahrnujte do ní
prázdná místa a okraje. Menší plocha dokumentu vyžaduje méně
paměti (uvědomte si, že binární nekomprimovaný černobílý obraz
prázdné stránky vyžaduje právě tolik paměti, jako obraz stránky
plné).

Členění dokumentu

Pokud vás zajímá jen část stránky, není nutno nechat
rozpoznávat celý dokument. Na sesnímaném obrazu stránky lze
obvykle myší zatrhnout oblast, která se má přečíst. Pokud
program sám určuje rozložení oblastí s textem, pak lze také
zpravidla toto automatické určování vypnout a oblasti s textem
vybrat ručně.
˙Vaše dokumenty mohou obsahovat místa, která mohou být
rozpoznána pouze s enormní chybovostí. Nové opsání takových
pasáží textu pak může být rychlejší, než opravování chyb v
rozpoznaném textu. V takovém případě doporučujeme definovat zóny
pro rozpoznávání ručně, postupně je převést na text a vynechat
ona problematická místa.

Písmo

Rozpoznávací schopnost OCR je omezena na znaky, symboly a
znaménka v určitém jazyce, obsažené v tabulce znaků, proto se
informujte před zakoupením softwaru, zda umí rozpoznávat vámi
požadovaný jazyk (to platí i pro češtinu).
Text, který je součástí grafů a obrázků, je zpravidla vhodnější
přepsat, než nechat rozpoznávat. Takovéto texty také komplikují
automatické určování zón s textem. Rovněž velmi velké nápisy a
ozdobná písma nelze než doporučit přepsat (např. novinové
titulky).
Aby se zlepšilo čtení dotýkajících se, vyplněných, příliš
tlustých nebo rozmazaných znaků, zkuste nastavit vyšší jas u
skeneru. Chybovost čtení přetrhaných znaků naopak zlepšíte
nastavením jasu menšího.
Podtržení textu mění patičky písmen; podtržené znaky se
rozeznávají špatně a je těžké či dokonce nemožné je rozpoznávat.
Takové pasáže doporučujeme raději přepsat.
Rukou psané poznámky a značky ztěžují nejen obraz, ale i určení
zón s textem. Pokud se v originále vyskytují, zkuste je
odstranit z dokumentu před OCR (nebo alespoň z obrazu dokumentu).

Výstupní text/formát

Občas je jednoduché řešení tím nejlepším. Chcete-li zcela
přepracovat rozpoznaný text, aby vyhovoval dokumentu, do nějž
jej chcete vložit, zvolte jako výstupní formát obyčejný text.
Nebudete pak muset předělávat celé formátování původního textu.
Mějte na paměti, že i obyčejný text může být v různém kódování
- ve Windows používejte ANSI (v českých Windows jde o kódovou
stránku 1250), ne ASCII text (ten je v českém systému v Latin2,
kódová stránka 852).
Používejte RTF jako formát výsledného textu, chcete-li zachovat
v rozpoznaném textu co nejvíce z formátování původního dokumentu.

Ostatní tipy

Ploché skenery mají oproti těm, které dokumenty posunují,
výhodu v tom, že jimi lze zpracovávat též vázané dokumenty,
takže není nutno nejprve pořizovat jejich fotokopie, a ty pak
teprve snímat. Kopie z kopírovacích strojů jsou vždy příčinou
zvýšení chybovosti při rozpoznávání.