Obraz, pohyb a zvuk v digitálním světě

Viděli jste neskutečné, zajímavé obrazy promítané na projekční plochu, fotografie, na kterých byly vzájemně neslu


Viděli jste neskutečné, zajímavé obrazy promítané na projekční plochu,
fotografie, na kterých byly vzájemně neslučitelné objekty? To všechno dnes
vzniká díky digitalizaci, stejně tak jako vzniká digitální video a hudba. Jako
většina nových technologií byly i tyto oblasti zprvu určeny pouze úzkému okruhu
velkých společností, dnes jsme však v situaci, kdy je může využívat i domácí
uživatel.
Digitální fotografie
Zcela zjednodušeně můžeme říci, že digitální fotografie vzniká snímáním obrazu
dopadajícího přes optickou soustavu na snímač CCD (Charge Coupled Device) a
jeho uložením na médium.
Optiku nalezneme u digitálních fotoaparátů velmi podobnou té, kterou používají
klasické kompaktní přístroje. Rozdíl je pouze v menší ohniskové vzdálenosti
(vzdálenost mezi čočkou objektivu a médiem, na které je ukládán obraz) z důvodu
menších rozměrů CCD snímače oproti políčku kinofilmu.
Jako ukládací médium můžeme u aparátů nalézt interní paměť RAM, interní pevný
disk, výměnné Smart media karty nebo jiná výměnná řešení jednotlivých výrobců,
diskety a konečně médium typu PC Card, které umožňuje do slotu ve fotoaparátu
zasunout jak paměťovou kartu, tak pevný disk. Fotoaparáty s pevnou pamětí jsou
dnes na ústupu pro nerozšiřitelnou kapacitu a tedy i nutnost ji neustále
uvolňovat. Na média je možno v závislosti na zvoleném rozlišení fotografie a
použitém typu uložit od několika středně kvalitních fotografií po několik
stovek obrázků ve vynikající kvalitě.
U většiny dnešních přístrojů nalezneme na zadní straně TFT displej, který je
využíván jako hledáček, nebo k prohlížení nasnímaných fotografií. Při jeho
častém používání však dochází k rychlé ztrátě energie baterií, což je velkou
slabinou digitálních přístrojů.
Jaké jsou hlavní rozdíly mezi "klasikou" a digitálem? Ten nejpodstatnější
spočívá ve způsobu zachycení obrazu místo filmu se světločivnou vrstvou
používají digitály CCD senzor v kombinaci s pamětí. Mezi hlavní výhody
digitálních fotoaparátů patří především rychlost zpracování. Od okamžiku
pořízení snímku nám stačí několik málo minut k tomu, abychom si z tiskárny
odebrali hotovou fotografii. Je to markantní zvláště díky tiskárnám
připojitelným přímo na fotoaparát, kdy z procesu vypadává počítač jako
mezičlánek. Nevýho-dy? Především zrnitost a většinou i barevné podání výsledné
fotografie, což je však též závislé na tiskárně a použitém tiskovém médiu.
Pokud pomineme přístroje, jejichž cena se pohybuje ve stovkách tisíc korun, je
na fotografii i při rozlišení 1 280 x x 1 024 patrné vzorkování.
Digitální video
Cenová hladina zařízení nutných ke zpracování digitálního videa se stále drží
dosti vysoko, ale nadšenci a menší firmy o nich již nemusí pouze snít. Sestavu
pro pořízení kvalitního digitálního videozáznamu je dnes možné pořídit za cenu
ojetého auta.
V zásadě existují dva způsoby digitálního zpracování videa. Máme analogovou
videokameru, z té posíláme analogový signál do počítače přes videokartu, která
obraz zdigitalizuje. Poté s ním v příslušném softwaru můžeme pracovat. Výsledek
lze převést zpátky na analogový, nebo ho ponechat v digitálním formátu. Při
druhém způsobu pracujeme s videokamerou, která obraz ukládá v digitální podobě.
Data přeneseme do počítače videokartou a další postup je pak stejný. Zpracování
pomocí počítače je též nazýváno nelineární. Oproti lineárnímu, kdy musíme pásek
postupně přetáčet a hledat místo, s nímž chceme pracovat, u nelineárního
zpracování "najedeme" přímo do onoho místa.
Formát Digital Video
Jak funguje formát DV, z něhož jsou všechny ostatní digitální formáty odvozené,
a jakým způsobem se obraz ukládá, si rozebereme v několika následujících
odstavcích.
Formát DV (Digital Video) se začal v masivnější míře prosazovat v polovině 90.
let spolu s přijetím standardu pro přenos digitálního videa a audia IEEE-1394,
FireWire. Okamžitě po přijetí standardu přišly firmy Sony a Panasonic se svými
vylepšenými verzemi. Dnes se můžeme setkat s několika digitálními formáty Sony
DVCAM, Sony Betacam SX, JVC Digital-S, Panasonic DVC-PRO a Panasonic DVCPRO 50.
Vedle nich existují i původní formáty analogové, kterými jsou např. VHS, S-VHS,
Video8, Hi8, Betacam SP.
Formáty, odvozené od DV, nabízejí poněkud horší kvalitu než profesionální
Digital Betacam, ovšem o hodně přijatelnější cenu. Pokud vás odradila slova
"poněkud horší", nelekejte se. Formáty DVCAM a DVCPRO 50 plně vyhoví i potřebám
filmových profesionálů, používají se např. pro přenos zpravodajských relací v
televizním vysílání. Výrobou DV kamkordérů se zabývá mnoho tradičních výrobců
analogových videokamer, díky unifikovanému ukládacímu formátu jsou mezi sebou
jejich produkty vzájemně kompatibilní. Cenově se levnější digitální kamery
pohybují někde okolo 30 tis. Kč podle výbavy, funkcí a v neposlední řadě
značky, a jsou tedy přístupné i zapáleným amatérům. Kvalitou záznamu můžeme DV
formát zařadit někam mezi analogové Hi8 a Betacam SP.
Zpracování obrazu
Co se děje s obrazem, když už jsme kameru aktivovali a díváme se hledáčkem na
scénu? Světlo dopadá na prvek CCD (podobně, jako je tomu u digitálních
fotoaparátů), který ho převede na elektrické signály popisující signál RGB
(red-green-blue složky, pomocí nichž se popisuje barevný bod). Jednotlivé
složky RGB jsou zkonvertovány do YUV složek, které popisují jas a barvu. Složka
jasová (Y) je vzorkována čtyřikrát, složky barvonosné (U,V) jsou vzorkovány
dvakrát. Právě odtud vzniklo označení videosignálu 4:2:2.
Jak nedokonalé je lidské oko!
Zde nacházíme první podstatný rozdíl oproti analogovému ukládání obrazu Hi8 a
SVHS pracují pouze se složkami Y,C, Video8 a VHS pracují pouze s kompozitním
signálem. Při vývoji složkování snímaného obrazu se vycházelo z nejmodernějších
znalostí funkce lidského oka a zpracování přijímaných podnětů mozkem. Složka Y
je pro ukládání nejdůležitější, vzhledem k vlastnostem lidského oka, které
daleko citlivěji reaguje na změnu jasu než na změnu barevné-ho odstínu. I proto
je možné snížit datový tok signálu na 20,5 Mb/s (při zpracování YUV) oproti
signálu RGB s rychlostí 31 Mb/s, aniž by divák na obraze zaregistroval něco
nepřirozeného. Na dalším zpracování se podílejí zákaznické DV čipy, které ještě
více zredukují signál. U signálu PAL, používaného v našich podmínkách, je tak
barevná složka tvořena sdílením informací okolních čtyř bodů, zatímco jasovou,
nejdůležitější složku si nese každý bod samostatně. Hlavním důvodem pro převod
do formátu 4:1:1 je další snížení potřebného datového toku, který se tím
dostává až na hodnotu 15,5 Mb/s. Takový datový tok je vyhovující pro klasické
snímání našeho okolí, avšak pro další, trikové zpracování obrazu, je nevhodný
právě pro absenci barvonosných informací, která má za následek neostré hrany
objektů. Protože datový tok 15,5 Mb/s je stále ještě příliš velký, je obraz
dále zkomprimován DV kompresním algoritmem, zakomponovaným v čipu, který
datovou náročnost sníží na pětinu.
Komprimace DV kontra MPEG
Způsob komprimace je poněkud odlišný od komprimace způsobem intraframe (každý
snímek zvlášť bez ohledu na předešlý a následující), používané u formátu MPEG,
oproti němu však nabízí možnost přesného střihu bez vedlejších účinků. To je
důležité pro další zpracování videa, kvůli němuž byl formát DV vlastně vyvinut.
Formát, používající interframe kompresi, je schopen při komprimaci porovnávat
za sebou jdoucí snímky a v případě, že jsou si velmi podobné detail krajiny,
prodloužený záběr zkomprimuje tyto snímky současně. To samozřejmě nepřipadá v
úvahu u záběrů pohybových, kdy se snímané objekty neustále nacházejí v jiné
pozici. Hlavním rozdílem oproti M-JPEG kompresi, která je komprimována podle
jednoho algoritmu (kvantizační tabulky), je použití více tabulek. Obraz je
rozdělen do bloků o rozměrech 8 x 8 bodů, které jsou seřazeny do skupin o
čtyřech blocích. Každá skupina je vyhodnocena a komprimována podle nejvhodnější
tabulky. Tak jsou některé části komprimovány více než ostatní. Prostor, získaný
vyšší kompresí, je pak využit pro snížení komprese u bloků obsahujících více
tzv. motion changes. Po skončení komprese dosáhneme datového toku 3,1 Mb/s,
který je přijatelným kompromisem mezi kvalitou obrazu a cenou zařízení.
Němá éra je už za námi
Spolu s obrazem se samozřejmě nahrává i zvuk. Pro ukládání audio stopy jsou k
dispozici 3 možnosti: jeden stereokanál se vzorkováním 16 bity a frekvencí 44,1
Khz (kvalita CD), jeden stereokanál s vzorkováním 16 bitů a frekvencí 48 Khz
(kvalita zvuku na DAT páskách) a konečně dva stereokanály s vzorkování 12 bitů
a frekvencí 32 Khz. Tím samozřejmě mohou uživatelům vzniknout jisté problémy se
vzájemnou kompatibilitou zařízení, používaných pro záznam a následné zpracování
obrazu. Kamery cenově přijatelné pro domácího uživatele většinou užívají
12bitové vzorkování, které nemusí být kompatibilní se softwarem určeným pro
další zpracování. Pak je nutno transformovat zvukovou stopu do formátu
podporovaného softwarem, čímž samozřejmě dochází ke snížení jeho kvality a
většinou se "rozhodí" i synchronizace mezi zvukem a obrazem. Při tvorbě firemní
prezentace nebo domácího videa nás však tato skutečnost nemusí vůbec vzrušovat
asynchronizace je minimální. Formát DV obecně nespecifikuje způsob provázání
zvuku a videa. Tento problém uspokojivě řeší až formáty DV-CAM a DVCPRO firem
Sony a Panasonic.
Na pásek se samozřejmě kromě obrazových a zvukových informací nahrávají i další
skupiny dat. Jsou to např. data nutná k následnému přesnému vyhledání určitého
místa záznamu, ochraně před kopírováním a mnohá jiná. Nejdůležitějším údajem je
Timecode, podle něhož poznají záznamové a čtecí hlavy videa na jakém místě
pásky se právě pohybují. V údajích Subcode jsou ukryty různé další informace,
jejichž obsah se liší podle toho, co považují jednotliví výrobci za důležité.
Patří mezi ně např. informace o titulcích, obsahu pásky nebo různé jazykové
mutace záznamu.
Máme doma starou kameru
Jak začít s digitálním zpracováním videa v případě, že máme doma klasickou
analogovou videokameru VHS, a nechceme se jí zbavovat? Stačí dokoupit do
výkonnějšího počítače videokartu s analogovým vstupem a výstupem, u které je
většinou přiložen i základní software určený pro zpracování videa. Po pořízení
záznamu přeneseme data do počítače pomocí karty, která je zdigitalizuje pomocí
DAC čipu (digital-analog converter), a zde je dále zpracujeme pomocí softwaru.
Zřejmě nejrozšířenějšími aplikacemi pro zpracování videa na PC jsou ty od firmy
Adobe. Zpracovaná data pak lze uložit v digitální podobě jako datový soubor na
CD médium, nebo jako videodata zkonvertovaná do formátu MPEG-1 (VideoCD) nebo
MPEG--2 (DVD Video). Dalším způsobem je jejich zpětná konverze do analogového
signálu pomocí videokarty a zpětné uložení na pásek VHS. Formát MPEG-1 je
kvalitativně porovnatelný se záznamem uloženým ve formátu VHS, vyžaduje datový
tok 1,5 Mb/s, který dnes zvládne i průměrná videokarta. Formát MPEG-2 je na
průchodnost dat náročnější cca 12 Mb/s, při kódování je tedy třeba využít
hardwaru, na rozdíl od MPEG-1, který se dá zvládnout i softwarově.
MPEG-1, Video CD
Zmínili jsme se o formátech MPEG-1, MPEG-2 spolu s CD Video a DVD. Jakou spolu
mají vzájemnou souvislost, jaké jsou jejich vlastnosti?
MPEG je kompresní algoritmus vytvořený speciálně pro kompresi filmů, která může
dosáhnout až poměru 100 : 1. Díky tomu lze na CD uložit film dlouhý 72 minut.
Tento algoritmus je však silně ztrátový, výsledkem čehož je kvalita podobná té,
jakou známe ze systému VHS. Zároveň s obrazem je komprimována i zvuková stopa,
výsledný datový tok se pohybuje okolo 1,5 Mb/s. Tento datový tok je shodný jak
pro americký systém NTSC, u kterého je promítáno 30 obr/s (respektive 60
půlobrázků), tak pro evropský PAL, jemuž stačí 25 obr/s. K uspokojivému
přehrání takto komprimovaného videa je nutné mít v počítači videokartu,
podporující hardwarovou dekomprimaci videa. Ti z uživatelů, kterým se do
speciální karty nechce investovat, se musí spokojit se softwarovým přehrávačem,
např. Xing MPEG Player, jehož kvalita se však s hardwarovou dekomprimací nedá
porovnávat; navíc musí počítač disponovat velmi rychlým procesorem. Filmy,
uložené pomocí MPEG a distribované na Video CD, se však příliš nerozšířily.
Hlavními důvody jsou nízká kvalita obrazu i zvuku a malá kapacita média (72
minut), z čehož plyne nutnost v průběhu filmu měnit disk za další, což není moc
příjemné. Pokud se měla distribuce digitál-ních filmů dále rozšiřovat, musel
vzniknout nový formát komprimace a hlavně nové médium s daleko větší kapacitou.
Tím se stalo DVD (Digital Versatile Disk).
MPEG-2, DVD
Kompresní algoritmus MPEG--2, používaný pro záznam na DVD disky, je oproti
původnímu MPEG mnohem dokonalejší. Rozlišení obrazu je oproti systému VHS
dvojnásobné, formát obrazu je přiřazen jednomu ze dvou již výše zmiňovaných
systémů NTSC nebo PAL. Kvalitativní parametry uloženého zvuku jsou také na
vyšším stupni oproti MPEG-1, který používal 4kanálový Dolby Surround systém
(přední pravý, přední levý, středový a zadní), nabízí již kanálů 5,1 (přední
pravý, přední levý, střední, zadní pravý, zadní levý, subwoofer). V USA
používaný systém zvuku se nazývá AC-3, Evropa zůstala u jednoho označení
MPEG-2. Celkový datový průtok se oproti filmům, uloženým pomocí MPEG-1, zvětšil
na 12 Mb/s oproti původním 1,5 Mb/s. Již z tohoto faktu si můžete udělat
představu o rozdílu v kvalitě stejného filmu uloženého ve dvou různých
formátech.
DVD se skládá ze dvou desek o tloušťce 0,6 mm. V případě, že na DVD je proveden
jednostranný zápis do jedné vrstvy, získáme kapacitu 4,7 GB, což je poněkud
jiná hodnota než 700 MB u CD. Protože se disk skládá ze dvou desek, je možné v
případě zápisu na obou dosáhnout kapacity 9,4 GB. Tím však kapacitní možnosti
DVD disku zdaleka nekončí. Na každou desku (stranu) je totiž možné psát ve dvou
vrstvách. Pokud chce mechanika přečíst data z vnější vrstvy, zaostří laserový
paprsek na ni a čte. V případě nutnosti čtení z vrstvy vnitřní (vzdálenější) je
laser přeostřen na tuto vrstvu. Přitom paprsek "projede" vnější vrstvou.
Přestože je vnější vrstva pro paprsek propustná, klesá při průniku jeho
odrazivost až na 30 %. Pro srovnání: při snímání vnější vrstvy se tato hodnota
pohybuje někde okolo 70 %. Samozřejmě to vyžaduje existenci velmi jemné, přesné
a tedy i drahé optiky u mechanik DVD. Pokud jste dobře počítali, vyšlo vám 17
GB jako nejvyšší možná kapacita DVD disku při využití zápisu ve dvou vrstvách
na obě strany média. Tato kapacita však v současné době není na trhu dostupná,
prozatím je stále ještě záležitostí vývojových laboratoří.
Jakým způsobem čte mechanika data uložená na DVD? Velice podobným, jako
mechaniky určené pro čtení CD. Na médiu jsou vypáleny miniaturní díry o rozměru
několika málo mikrometrů, jejichž vzájemná poloha reprezentuje jedničky a nuly.
Laserový paprsek červené barvy a s velmi malou vlnovou délkou, vyslaný optikou,
se při dopadu na místo, kde není díra, odrazí zpět a odraz je elektronicky
vyhodnocen. Při průchodu dírou samozřejmě k odrazu nedojde stav. Tento stav
elektronika mechaniky též vyhodnocuje. Sled za sebou jdoucích děr a mezer mezi
nimi se dá matematicky popsat jako lineární souvislost. V případě, že v
souvislosti dojde ke změně, je tato vyhodnocena jako jednička. Pokud souvislost
pokračuje, je tomuto stavu přiřazena hodnota nula.
Skladby ve formátu MP3
Od digitalizace videa přejděme nyní k aktuálnímu a oblíbenému formátu MP3. Ten
s výše rozebíranou problematikou velice úzce souvisí. Nebudeme se ovšem zabývat
ani softwarovými ani hardwarovými přehrávači, pozornost soustředíme na formát
jako takový.
MP3 není ničím novým, vznikl z původního formátu MPEG díky potřebě zmenšit
datové soubory nesoucí zvukové informace. Kdo se někdy setkal s hudební
skladbou, uloženou např. ve formátu WAV, ví, o čem je řeč. Proto se znovu
vraťme k původnímu MPEG. Jak je uvedeno výše, datový tok MPEG je 1,5 Mb/s. Z
této šířky je vyčleněno 1,2 Mb/s pro video a zbývajících 0,3 Mb/s pro zvukovou
stopu. Klasické CD má pro srovnání datový tok o šířce 1,4 Mb/s. Přestože
nejmenší používaná komprese MPEG je 1 : 3, mohou se audio data komprimovat až
do poměru 1 : 12 (128 Kb/s). Proč? Protože vědci vytvořili model vnímání
průměrného lidského ucha. To je schopno vnímat signály o frekvenci 20-20 000
KHz a dynamickém rozsahu 96 dB. Zároveň se lidské ucho dá poměrně snadno
ošálit. Je prokázáno, že v případě, kdy vysíláme dva signály zároveň, ucho
vnímá pouze signál silnější. Současně je lidské ucho při vnímání signálu dost
pohodlné. Jakmile si zvuk vyhodnotí, už vnímá pouze jeho změnu. Vysíláme-li
tedy dva různé signály najednou, slyší jen ten silnější. Ovšem uchu při jeho
vypnutí, nějakou dobu (udávanou řádově v mikrosekundách) trvá, než zaregistruje
signál slabší. Obou těchto vlastností, spolu s mnoha dalšími, je využíváno při
kompresi zvuku. Ta funguje na následujícím principu: co lidské ucho nezachytí,
není třeba ukládat.
Dnes tolikrát vyslovovaný název MP3 má úzkou souvislost s definovanými typy
ukládání dat ve vrstvách (layers) pomocí formátu MPEG. Samotná data se dělí na
datové rámce (frames), skládající se z 384 vzorků. Layer 1, dnes skoro
nepoužívaný formát, používá na každý frame stejnou frekvenci, dělící filtr
pracuje v závislosti na hlasitosti a citlivosti vzorků. Layer 2 pracuje zároveň
s 3 framy najednou. Layer 3 (ve kterém je ukládán MP3) používá v dělícím filtru
proměnnou frekvenci a zároveň plně využívá všech nedokonalostí lidského ucha.
Jak vzniká soubor MP3? Kompresí stereo souboru typu WAV (stereo, 16 bit, 44,1
Khz) při dodržení dvou podmínek. Datový tok 128 Kb/s, vzorkovací frekvence 44,1
KHz. Jak je uvedeno výše, MP3 vznikl samostatně především z důvodu přijatelné
velikosti audio souborů. Skladba trvající 3 minuty zabírá ve formátu WAV na
disku přibližně 30 MB. Pokud je zkomprimována do formátu MP3, zmenší se
velikost souboru na pouhé 3 MB. Na jedno CD se nám tak vejde cca 650 minut
zvukového záznamu, což, jak uznáte, není vůbec špatné. U formátu MP3 ještě
jedna důležitá poznámka. Z koupeného originálního CD máte legální možnost
vytvořit jednu kopii (není určeno, v jakém formátu) pro svou vlastní potřebu.
Tím je, myslím, řečeno vše.
Jak vidíte, digitální technologie proniká do různých oblastí. V tomto krátkém
zamyšlení se zmiňuji pouze o těch, u nichž předpokládám, že budou většině
čtenářů blízké. Digitální technologie jako náhrady původních, analogových, ale
i jako úplné novinky, můžeme najít všude kolem sebe, stačí se jen pořádně
porozhlédnout zdravotnictví, navigační systémy GPS, ploché displeje, ať už
určené pro práci s počítačem nebo jako náhrada televizních přijímačů, digitální
záznamníky a mnoho dalších.
9 1154 / ijan
Analogové
VHSZákladní, nejrozšířenější formát
VHS-CStejný jako VHS, kazety jsou však menší, záznam se většinou kopíruje
na kazety VHS; zvukový záznam je ukládán zvlášť, lze ho upravit
Video-8Pásek díky jiným rozměrům nelze na rozdíl od VHS-C přehrát v rekordéru
ani s pomocí speciální šachty, kvalitní zvuk
S-VHSKvalitnější obraz než VHS
S-VHS-CPodobně jako S-VHS je vylepšením formátu VHS-C
Hi-8Vylepšení formátu Video 8, kvalitnější zvuk, Hi-Fi zvuk
Digitální
DVDigitální formát záznamu videa
DVCAMFormát vyvinutý firmou Sony, kazety disponují 16 MB pamětí k uchování
informací o pásce (začátek, konec, náhled 1. snímku,...)
DVCPROFormát vyvinutý firmou Panasonic, páska obsahuje podélné stopy pro
ukládání dalších informací
DVCPRO 50Zrychlený posuv pásku oproti DVCPRO, nižší komprese,
vyšší kvalita záznamu
Digital-S2x širší pásek oproti DVCPRO 50, řešení firmy JVC
Betacam SXPřechod mezi vysoce profesionálním Betacam SP a ostatními digitálními
formáty díky interframe kompresi
Kapacitní možnosti disku DVD
Počet straPočet vrstevKapacita
114,7 GB
128,5 GB
219,4 GB
2217 GB









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.