Jak na audio a video...

1. 5. 2004

Sdílet

Potemnělou místnost ozařuje tmavě šedá obrazovka monitoru. Náhle se zreproduktorů podél stěn ozývá ryčná hudba, a na obrazovce se pohybuje typické logo Twentieth Century Fox. Po tomto...
Potemnělou místnost ozařuje tmavě šedá obrazovka monitoru. Náhle se z
reproduktorů podél stěn ozývá ryčná hudba, a na obrazovce se pohybuje typické
logo Twentieth Century Fox. Po tomto úvodu už začíná to, na co jsme se těšili
nejvíce. Film. Aby však počítač vůbec hrál, potřebujeme kromě CD, na němž je
film uložen, a přehrávače, mnoho menších pomocníků, které sice nevidíme, ale
bez nichž by to nešlo. K nejdůležitějším patří kodeky, starající se o obraz a
zvuk.

Videokodeky - situace stále nepřehledná

Existuje poměrně slušné množství kodeků videa. Některé jsou lepší, jiné horší.
Ne všechny se hodí na vše, a některé umí také pěkně potrápit. Nyní se na
některé z nich podíváme. Jaký kodek si vybrat? Jaké jsou možnosti a výkon
různých kodeků? Pokud vás zajímají odpovědi na tyto otázky, čtěte dál.

Jak a proč kódovat video
Multimediální data, tedy především obraz a zvuk, mají mezi ostatními typy
počítačových dat několik zajímavých zvláštností. Tou první z nich je, že
potřebují poměrně velké množství prostoru pro uložení. Dále je třeba při jejich
pořizování i reprodukci zajistit určitý minimální tok informace k tomu, aby
výsledný dojem, tedy obraz a zvuk, byl přirozený. To jsou požadavky vskutku
nemalé.
Vedle toho se ale multimediální data odlišují například od textových dokumentů
a aplikací ještě v něčem jiném. Jestliže je třeba je komprimovat, nemusí být
jejich dekomprese naprosto přesná. Zatímco změna libovolné hodnoty uvnitř
aplikace by způsobila její nefunkčnost, nebo přinejmenším nestabilitu a velkou
poruchovost, v případě videa změna způsobená komprimací a následnou
dekomprimací nevadí. Nepracuje se totiž s naprosto precizními daty
znamenajícími instrukce, ale s obrazem, který je ve výsledku analogový a jeho
příjemcem není počítač, ale snadno oklamatelné lidské smysly, v případě videa
zrak.
Kombinací obou předchozích tezí vzniklo ztrátové kódování videa. Využití
oklamání smyslů umožňuje zmenšit obrovskou masu obrazových videodat na
smysluplné minimum, které se vejde na současné datové nosiče, tedy především na
CD disky a na DVD, a je ho možné distribuovat s využitím internetu.
Cenou za drastické snížení objemu dat je kromě dopadu na kvalitu
reprodukovaného také náročnost této dekomprese. Především se jedná o náročnost
na početní výkon zařízení, které dekompresi provádí, a pak také na rychlost
jeho paměti a schopnosti číst a vyměňovat si informace v rámci jednotlivých
částí. Posledním podstatným kritériem zde je míra snížení kvality, tedy nakolik
se dekódovaný obraz odlišuje od původního a zda je možné toto snížení
zaregistrovat. Zde je však třeba vzít v úvahu relativní faktor, kterým je
subjektivní rozdílnost. Díky tomu, že video se přehrává na různých zařízeních a
různých výstupních systémech (CRT obrazovka, LCD displej, plátno a
dataprojektor) a díky tomu, že různí jedinci vnímají obraz různým způsobem,
představuje i jeho změna pro ně různé hodnoty. To je faktor, který se velice
obtížně kvantifikuje, a právě proto jej označujeme za subjektivní. Faktem však
je, že tento subjektivní faktor představuje podstatnou část zhodnocení obrazu,
přesněji řečeno multimediálních dat jako takových.

Kodek?
Pod pojmem kodek videa označujeme algoritmus, který se stará o kompresi a
dekompresi obrazu. V podstatě tedy o jeho převedení z nekomprimovaného formátu
do minimalistické velikosti a následnou rekonstrukci a zobrazení. Tento
algoritmus může být integrován do různých hardwarových zařízení, nebo se může
nacházet jako standardní či doplňková část operačního systému, případně jako
samostatný produkt. Jestliže v minulosti byly obrazové kodeky integrovány do
přehrávačů multimédií, v současné době tomu tak není. Například populární
Windows Media Player je prakticky vzato pouze jakýmsi frontendem, tedy
rozhraním, jež zobrazuje multimédia a komunikuje s uživatelem. Skutečnou práci,
tedy dekompresi, obstarávají kodeky, které jsou integrovány do operačního
systému a s přehrávačem nemusejí nijak souviset. To eliminuje výběr
multimediálních přehrávačů využívajících tuto koncepci prakticky pouze podle
toho, který se lépe ovládá a lépe vypadá, který má více doplňkových funkcí.
Jejich jádro, tedy sada kodeků, je ve všech případech totožné.

Kodek si nevybereš
Typický uživatel počítače přichází do kontaktu s hotovými videosoubory. Má je
na kompaktních discích, stahuje tyto soubory z internetu. Když pomineme
problematické stránky jejich využívání, například to, že v naprosté většině se
jedná soubory s právními vadami (nelegální kopie), budeme potřebovat k přehrání
souborů, s nimiž se můžeme potkat, pestrou škálu různých kodeků. Aby je tedy
bylo možné přehrávat, je nezbytné mít tyto kodeky připraveny v počítači a v
aktivním stavu, tedy v takovém, ve kterém je přehrávač médií, ať už WMP nebo
jiný, schopen je zavolat a využít.
K přehrávaní například stažených filmů potřebujeme typicky kodeky dva. Jeden z
nich je určen pro video, druhý pro zvukovou stopu. Ačkoliv jsou obě části filmu
uloženy v jediném souboru, prakticky představují dva různé druhy dat, které
jsou synchronizovány. Obrazový kodek se stará pouze o dekódování videa, zvukový
pak s nim spolupracuje a zajišťuje doprovod. Poslední komponentou přehrávání
filmů pak bývá technologie určená k tomu, aby s výsledným audiovizuálním dojmem
propojila třetí textovou informaci. Jinými slovy systém zobrazující titulky.
Souhra těchto komponent vede k výslednému dojmu tedy k přehrávání filmu.
Jakmile již soubor s filmem máme, obrazové a zvukové informace v něm obsažené
jsou zakódované a synchronizované. Bylo čistě na libovůli autora tohoto
souboru, tedy člověka který jej kódoval, který konkrétní algoritmus, přesněji
řečeno kterou kombinaci algoritmů pro svou práci využil, a jediné, co může
typický uživatel dělat, je se tomuto stavu přizpůsobit. Převod hotového souboru
z jednoho formátu do jiného za použití konverzního systému založeného na dvou
kodecích vstupním a výstupním, je sice možné, ale problematické řešení, i když
v některých případech použitelné, například když je potřeba přehrávat na
slabším hardwaru film zpracovaný náročným kodekem. Tak se dá říct, že pokud již
film máme, jeho kodek si příliš nevybereme. Pokud chceme sami audiovizuální
soubor vytvořit, je situace samozřejmě odlišná.

Nejčastěji používané kodeky
V současnosti používané kodeky jsou obvykle založeny na obecném algoritmu
MPEG-4. Tento algoritmus je velmi výkonný a vyskytuje se v různých variantách.
Jeho prvotním využitím byly dlouho připravované a testované kodeky WMV (Windows
Media Video) společnosti Microsoft. Poté, co ale došlo k roztržce mezi touto
společností a částí komunity, která se na kodeku podílela, vznikl jeho hack,
dnes známý jako DivX ;-). Postupem času a po mnoha změnách vznikla společnost,
která tento kodek prodává. V důsledku komercionalizace bývalého hacku bylo
vytvořeno několik dalších kodeků, z nichž nejznámější a nejpoužívanější je XviD.
Dalším populárním kodekem je Apple Quicktime. Tento kodek vznikl původně pouze
pro počítače Macintosh, nicméně je běžně instalován i na PC s operačním
systémem rodiny Windows. Jedná se o komerční produkt, který je velice populární
zejména v USA. Quicktime je nejpoužívanějším kodekem pro kompresi například
filmových trailerů, ale i obecně neproudového videa, které stahujeme z webových
serverů.
Posledním ze zajímavých kodeků je Real Video společnosti Real Networks. Ačkoliv
je tento kodek univerzální, nejčastěji se s nim setkáme u streamovaného videa z
webových serverů, kde soupeří především s konkurencí od Microsoftu.

Parametry kodeku
Pokud se na kodek podíváme z typické, tedy uživatelské strany, funguje v
podstatě takto. V první fázi je obsah souboru se záznamem rozebrán a rozdělen
na obrazovou a zvukovou část. Tyto části jsou pak předávány jednotlivým
kodekům. Obrazový kodek obvykle funguje na principu jednotlivých obrázků. Ty
jsou komprimovány triviálním algoritmem a rychle se střídají, což vytváří iluzi
pohyblivého obrazu. Aby se snížilo množství dat, které je při tom potřeba
přenést, nejsou v souboru s videem uloženy všechny obrázky. V některých
případech totiž stačí, aby byl ve scéně "kompletní" pouze obrázek jeden.
Ostatní pak již jen obsahují rozdíl mezi tímto původním obrázkem a sebou. Tedy
to, co se pohnulo, nebo změnilo barvu. Tak je možné dosáhnout vysokého stupně
komprese.
Z předchozího vyplývají dva podstatné parametry komprimovaného videa. Prvním z
nich je velikost komprimovaného souboru, druhým pak datový tok, který je nutný
pro korektní čtení a prezentaci souboru. Ideálem je, aby obě tyto hodnoty byly
pokud možno co nejmenší, a to při co nejmenší ztrátě kvality způsobené kompresí.
Všechny tyto parametry jsou jak absolutní, tak relativní. V případě současných,
velmi výkonných osobních počítačů jsou hodnoty požadované videokodeky relativně
malé, avšak jinak tomu je u speciálních zařízení, jako jsou kapesní přehrávače,
hardwarové dekodéry a další podobná zařízení.
Uživatelsky podstatným parametrem videa je rozlišení, ve kterém se nachází. Pro
delší záznamy, tedy obvykle pro celovečerní filmy a podobné útvary, se obvykle
využívá rozlišení DVD Pal. To činí 720 x 576 obrazových bodů. Pro potřeby
některých zařízení, především velkých počítačových monitorů, je toto rozlišení
přehrávači softwarově interpolováno na větší míru při zachování poměru stran.
To ovšem vytváří dodatečné hardwarové nároky, zvětšuje se totiž finální, tedy
již dekódovaný obraz a při plné frekvenci, nikoliv skládané částečné obrázky.
Problémem, který je typický pro "ne původní" kodeky a který způsobuje jejich
obtížnou implementaci především pro "ne-PC" zařízení, je změť verzí. Obrazové a
také zvukové kodeky (MP3, OGG, AC3 a další) existují v různých verzích, jež
jsou ne vždy vzájemně kompatibilní. V důsledku toho musí zařízení pro
přehrávání obsahovat podporu co možná největšího množství jednotlivých verzí,
aby bylo možno zajistit jejich fungování. V případě klasického počítače se pak
setkáváme se stejným problémem, je totiž nutné mít různé verze různých kodeků.
Proto existují balíčky, které obsahují v jediném instalátoru množství různých
verzí různých kodeků, a dávají tak možnost dobrého fungování prakticky
jakéhokoliv videa. Je však třeba poznamenat, že tyto balíčky mívají v některých
případech problémy s autorskými právy nebo s fungováním na některých systémech,
ale to zde není hlavním předmětem.

Vyrábíme video
K vytvoření videosouboru potřebujeme jednu ze dvou věcí. Buďto zdrojový soubor,
který převedeme na požadovaný kodek a počítač, nebo přístroj, který to umí
udělat za nás. Mezi tyto přístroje patří digitální videokamery a několik
dalších. V případě zdrojových souborů se obvykle jedná o formát hrubých dat
(RAW), jednoduchou bezeztrátovou kompresi (Indeo), nebo o zálohování jiného
druhu média (DVD,VHS), DVD je v současné době nejčastější. Video se kóduje
prostřednictvím samotného kodeku a patřičné aplikace. Ty existují ke každému
kodeku, v případě DivXu jsou součástí standardního balení, například u
Quicktime si je musíme zakoupit (a tedy zaplatit). V současné době je kódování
poměrně rychlé, v době pomalejších počítačů trvalo velice dlouho, anebo stejně
jako přehrávání ztrátového videa vyžadovalo nejmodernější výbavu, nebo dokonce
specializovaný hardware. Popis jednotlivých aspektů této činnosti by vyžadoval
mnohem větší rozsah a je předmětem specializovaných časopisů a publikací, to,
co nás zajímá, je především přehrávání videa.

Jak si vybrat?
V podstatě všechny kodeky, o kterých zde dnes hovoříme, splňují základní
požadavky na práci s krátkým i s dlouhým videem. U mnohých existují varianty
pro rychlé a pomalé video, pro různá rozlišení a bitraty. Pokud chceme pouze
přijímat (sledovat) soubor, který existuje v několika verzích, je dobré si
vybírat především podle hardwarových a softwarových možností, jež máme k
dispozici. V tom případě se na prvním místě nachází DivX, následován XviD a
WMV. Další kodeky se pak řadí za ně, ačkoliv žádný již dnes neobsahuje hrubé
chyby, které byly typické pro rané verze např. Intel Indea, původních kodeků
Microsoftu nebo Cinepaku. Při vytváření videa naopak vycházíme z požadavků
předpokládaných příjemců, tedy diváků. Pro kvalitní práci se hodí Quicktime pro
streamování Realvideo či ASF, profesionální je Windows Media Video. Většinou
je, zejména při distribuci finálního souboru prostřednictvím internetu, vhodné
použít standardní DivX nebo XviD. V každém případě, jak již bylo uvedeno výše,
je vhodné počítat také s uživateli, jež jsou méně hardwarově vybaveni, a
použití, například XviDu při vysokém rozlišení a s nadstandardním frameratem,
by jim mohlo dělat potíže.

Slovníček videa

Komprimovaná velikost - Množství dat, které potřebujeme pro uložení
komprimovaného videa. Moderní kodeky jsou stavěny tak, aby bylo možné na jedno
klasické CD uložit hodinu až devadesát minut standardního videa.
Framerate - Počet snímků za sekundu. Pro plynulé video je třeba dosáhnout
alespoň 25, vyšší hodnota znamená plynulejší video, ale potenciální problémy s
přehráváním.
Kodek - Aplikovaný kódovací/dekódovací algoritmus
MPEG - Moving Picture Experts Group, označení standardu, ale také jeho
původních vývojářů. Vznikl z M-JPEGu, "pohyblivé" verze nejrozšířenějšího
formátu ztrátové komprese stacionárního obrazu (fotografií).

Zajímavé odkazy

•http://www.extremetech.com/print_article/0,1583,a=121163,00.asp - srovnání
různých kodeků
•http://www.vqeg.org - skupina zabývající se kvalitou videa
•http://www.tvfreak.cz/index.php?sekce=video&clanek=m4test&strana=1 - jiné
srovnání kodeků
•http://www.kodeky.cz - rozcestník na různé verze kodeků
•http://www.divx.com - kodek DivX
•http://www.xvid.org - kodek XviD
•http://www.windowsmadia.com - kodeky systému Windows Media
•http://www.quicktime.com - kodek Apple Quicktime
•http://www.codecpack.com - odtud si můžete stáhnout kodeky v balíčku "All in 1"

Nejrozšířenější videokodeky

• WMV Windows Media Video (FMV, ASF -) kodeky společnosti Microsoft. Kvalitní a
rychlé, obsahují digitální ochranu autorských práv (DRM). V aktuální verzi 9 se
hodí především pro profesionální využití, například na internetu se s nimi
setkáme jen poměrně málo.
• DivX - Kodek, který původně vzniknul jako hack WMV a využíval jeho ovladače v
kombinaci s MP3 pro kódování zvuku. V současné době je ale DivX komerční
produkt a představuje jakýsi základ alternativních kodeků. Jeho rozšířenost je
značná, avšak rozšířenost konkurence také stoupá a původnímu DivX tak
konkurenti výrazně dýchají na záda.
• XviD - Tento kodek vychází z původních snah DivX ;-) o otevření videa ve
standardu MPEG-4. Je vyvíjen (důsledně pouze obrazová část) jako projekt s
otevřeným zdrojovým kódem. Lze sehnat kompilace pro různé systémy. Nabízí
srovnatelnou kvalitu, je však náročnější na hardware. Jeho otevřenost a
současná i budoucí absence jakéhokoliv DRM jej řadí do popředí zájmu.
• Apple Quicktime - Jeden z prvních kodeků videa, jež začaly být komerčně
využívány, dnes existuje v aktuální verzi 6.5. V našem prostředí není příliš
využíván a nesetkáme se s ním příliš často ani ve výměnných systémech. Původně
pochází z počítačů Macintosh, existuje i pro Windows. Nejčastější využití je
pro video umístěné na webových serverech, především amerických. Kodek i
přehrávač Quicktime jsou náročné na hardwarové prostředky, kvalita je poměrně
dobrá. Používá buďto MPEG-4, nebo kodek společnosti Sorenson.
• Real Video - Tento kodek je produktem společnosti RealNetworks. Používá se
nejčastěji pro přenos proudového videa (streamování) a tvoří tak starší
konkurenci formátu ASF (Aktive Streaming File) od Microsoftu. Může být
samozřejmě použit pro off-line video, tedy pro záznamy v souborech, není však v
tomto ohledu zejména v případě rozsáhlejších záznamů v našem prostředí v
domácnostech příliš využíván.

Kodeky, které se vymkly z rukou

Současní "tahouni" v oblasti kodeků DivX a XviD vznikly (původně DivX ;-) ) v
důsledku snahy Microsoftu dosáhnout velmi silné konkurenční pozice v oblasti
kódování videa, která se prolnula se snahou vzniklý formát maximálně
zabezpečit. Následovalo prolomení jeho ochrany, došlo k veřejnému uvolnění a
následnému vytváření konkurenčních kodeků, které v důsledku velice kvalitní
formát využitelný pro komerční distribuci videa degradovalo jako proprietární,
uzavřený a nepřehledný. Kodeky, zejména po vzniku XviDu, jenž je nejen
otevřený, ale také velmi dobře respektuje standard MPEG-4, se zcela vymkly
kontrole a umožnily stav, jehož jsme dnes svědky. Tedy že internetem se nešíří
jen záplava digitální hudby, ale také nejnovějších filmů převážně hollywoodské
provenience, především ale výměnnými systémy. Tento paradoxní stav, jenž vedl k
velkému rozhořčení filmového průmyslu, nejen že přetrvává, ale vůbec nijak se i
přes snahu s ním něco dělat nemění. S trochou nadsázky by se dalo říct, že
hamižnost vedla k otevření toho, co mělo být uzavřeno. Dnešní kodeky jsou od
vykradeného původního algoritmu již velmi vzdáleny a vyvíjejí se vlastním
životem. Ke spokojenosti tvůrců souborů i uživatelů diváků.

Srovnání nejznámějších videokodeků

WMV (Windows Media Video)
http://www.windowsmedia.com
Windows Media poskytuje kvalitní video při relativně malém datovém toku, ale
kódovat s ním celovečerní film není nejlepším nápadem. Je ideálním formátem pro
kratší záznamy nebo pro takové, které se budou streamovat (ASF). Obvykle nemá
žádné problémy s přehráváním na systémech Windows, jinde je situace o něco
problematičtější. Obsažené DRM umožňuje řídit možnost používání souboru a
nejjednodušší cestou k jeho vytvoření je Windows Movie Maker, jinak standardní
součást Windows XP.

DivX
http.//www.divx.com
Aktuální verze kodeku DivX přináší solidní kvalitu videa 5.1.1 a představuje
určitý standard kvality. DivX zachovává velmi dobrý obraz jak u pomalého videa,
tak i u scén, kde dochází k velkému pohybu mnoha objektů (což je asi
nejproblematičtější situace). Předchozím verzím bylo občas vyčítáno, že ne vždy
jsou schopny udržet požadovaný bitrate, přičemž mohlo docházet k zadrhávání
obrazu. Tento problém je však již minimalizován. Nedostatkem DivXu je
skutečnost, že základní bezplatná verze "pro" modelu kodeku obsahuje reklamu,
vyšší verze jsou drahé a verze bez reklam toho moc neumí. Pro přehrávání videa
je však DivX ideální mimo jiné proto, že není příliš náročný a je kvalitativně
srovnatelný s WMV. Filmy v něm jsou masivně rozšířeny na internetu, čemuž
nevadí ani skutečnost, že v některých případech na některých typech hardwaru
dochází k potížím při synchronizaci obrazu a zvuku.

XviD
http://www.xvid.org
Otevřený kodek, často používaný v kombinaci s MP3 a AC3 zvukovým kódováním.
Svou kvalitou je na pomezí mezi WMV a DivX. Existuje několik rozšířených
kompilací, což může být problematické. Hlavním technickým problémem je
hardwarová náročnost. Obraz je sice kvalitní, leč při použití některých z
těchto kompilací dochází zejména na OS Windows k občasnému rozpadávání obrazu i
u v každém případě nepoškozených souborů. Dalším problémem mohou být
stacionární scény. Celkově se počet filmů v tomto kodeku, na které můžeme
narazit na internetu, pozvolna zvětšuje a s XviD je třeba do budoucna, zejména
pro jeho otevřenost počítat. Při kódování videa vychází XviD jako mírný vítěz v
případě, že si nechcete zaplatit za DivX ani použít Windows Media. Hodí se pro
kódování celovečerních filmů i kratších záznamů, ačkoliv pro to první je
vhodnější.

Quicktime
http://www.quicktime.com
Aktuální Quicktime, využívající MPEG-4 za třicet dolarů, míří zřejmě ze všeho
nejvíce na monitory zámořských profesionálních uživatelů. Nabízí vynikající
kvalitu při vysokých hardwarových nárocích a vyšší ceně. Na celovečerní film v
tomto formátu narazíte jen zřídka. Verze pro Windows má problémy se stabilitou
a na XP v některých případech přestává reagovat. Stejně problematické je QT na
starších verzích tohoto operačního systému, zejména pokud běží na pomalejším
hardwaru. Výhodou QT je kouzlo nechtěného. Tento formát je podporován některými
digitálními fotoaparáty a kamerami, které jsou k nim dováženy. Díky tomu může
dojít k jeho vyššímu rozšíření, avšak úrovně DivX nebo třeba i WMV u nás asi
jen tak nedosáhne. Je to systém který zejména z tvůrčího hlediska našince
příliš nenadchne.

Real Video
http://www.real.com
Real Video je ideální pro streamovaní, nebo pro lokální obrazové soubory spíše
o nižší stopáži. Je také kvalitní a relativně nenáročné na hardware, široce
podporované. Stejně jako QT můžeme i tento formát najít v některých
hardwarových zařízeních, ta jsou však v našich podmínkách o něco vzácnější.
Problémem u delších záznamů je, i s aktuální verzí, víceméně náhodné
zasekávání, které je tím častější, čím vyšší rozlišení používáme. Kompresní
poměr je dobrý, avšak pro uložení celovečerního filmu v DVD rozlišení se
nehodí. Velkou výhodou je integrace zvukového kodeku a bezchybná synchronizace
obrazu a zvuku, stejně tak jako podpora napříč různými platformami (i
mobilními) a operačními systémy. Na tomto místě je třeba podotknout, že právě
na mobilních platformách je Real Video černým koněm.
Vojtěch Bednář

Audiokodeky - hudební revoluce nekončí

V jakých formátech je možné ukládat hudební soubory, a jaké mají audiokodeky
výhody a nevýhody?
Obrovský boom hudby na internetu, který odstartoval před nějakými deseti lety
příchod formátu MP3, ještě zdaleka není u konce. A ti, co se domnívali, že
formát MP3 je nedostižný a nemůže být překonán, se pěkně přepočítali. Postupem
času se na světě objevila řada nových formátů pro ukládání audiozáznamu a část
jich zase během krátké doby zmizela. Tak situace vykrystalizovala do dnešní
podoby, kdy je k dispozici několik velmi kvalitních a rozšířených formátů, a to
jak pro ztrátovou, tak pro bezeztrátovou kompresi. Pojďme se tedy nyní v
krátkosti podívat na to, v jakých formátech je možné ukládat hudební soubory, a
jaké mají rozličné kodeky výhody a nevýhody.
Komprimované audioformáty lze v zásadě rozdělit na dvě velké skupiny
bezeztrátové a ztrátové.
U prvně jmenovaných jsou zachovány v komprimovaném souboru veškeré informace
obsažené v originální nahrávce a po zpětném procesu jsou oba soubory naprosto
identické, sem patří například soubory s koncovkou APE (formát Monkey\s Audio).
Výhodou je právě 100% shoda s originálem (po zvukové stránce) a rychlost
komprimace a dekomprimace, nevýhodou relativně velká velikost v porovnání s
původním souborem ve formátu WAV (přibližně polovina).
U ztrátových se používají speciální algoritmy, které z původního souboru
odstraní všechny zvuky, o kterých si myslí, že je posluchač nemůže slyšet.
Nevýhodou je, že takto upravené soubory nemají zvuk 100% shodný s originálem a
relativně pomalý proces převádění do komprimovaného formátu, jasnou výhodou pak
je malá velikost takových souborů v poměru k originálnímu WAVu.
Jedno z nebezpečí ukrytých ve ztrátových formátech spočívá ve ztrátě určité
části originálních hudebních dat. Je to podobné typickému problému audiokazet.
Pokud si uložíte CD například do formátu MP3 a pak si ty samé soubory vypálíte
jako audio CD, jež si do MP3 uloží váš kamarád, a podobný proces proběhne ještě
několikrát, budete mít na konci skladby s podstatně horší kvalitou než původní
zdroj. Při každé kompresi do ztrátového formátu totiž kodek odstraní další část
hudebních dat. Podobně je tomu právě u audiokazet, kdy několikátá kopie se již
originálu podobá pouze vzdáleně.
Další nepříjemnost nastane, pokud si originální skladbu uložíte v příliš nízkém
bitratu (datovém toku). Máte sice malý soubor, která je relativně
poslouchatelný v přenosném MP3 přehrávači či běžných počítačových
reproduktorech, ale s kvalitní aparaturou či sluchátky vás kvalita poslechu
doslova otráví.
Toho všeho i dalších nástrah vás zbaví právě bezeztrátová komprese. Její
nevýhodou je ovšem zcela jednoznačně velikost komprimovaných souborů běžně se
pohybuje mezi 50-60 % velikosti původního WAVu. To je v porovnání například s
formátem MP3 několikanásobně více (přesný poměr závisí od použitého datového
toku).
Na straně bezeztrátových formátů je tedy naprostá zvuková shoda s originálem,
ztrátové formáty pro změnu bodují kompresním poměrem a tím velikostí souborů.
Záleží tedy na každém, čemu dá přednost zda preferuje nekompromisní kvalitu i
za cenu sotva poloviční úspory prostoru (v porovnání s WAVy), či naopak možnost
uložit do stejného prostoru několikanásobně více skladeb i za cenu o málo nižší
poslechové kvality.

Srovnání nejznámějších audiokodeků

Bezeztrátová komprese

APE (Monkey\s Audio)
http://www.monkeysaudio.com
Monkey's audio je pravděpodobně nejpopulárnější formát využívající
bezeztrátovou kompresi. Kompresní poměr se v závislosti na typu hudby a
nastavené kvalitě kódování pohybuje mezi 50 % a 60 % velikosti originálního WAV
souboru. Tedy ve stejném rozmezí jako ostatní rozšířené bezeztrátové algoritmy,
ale ve většině případů vychází soubory s koncovkou APE nejlépe jak z hlediska
rychlosti převodu, tak velikosti výsledného souboru. Výhodou Monkey\s Audio je,
že disponuje vlastním front-endem, tedy grafickým rozhraním, kde je možné
pracovat se soubory či volit možnosti komprese. Největší slabinou je pak to, že
prozatím jediným podporovaným operačním systémem jsou Windows. Pro někoho může
být také nevýhodou, že APE soubory není možné streamovat přes internet.

FLAC (Free Lossless Audio Codec)
http://flac.sourceforge.net
FLAC je podle odborného serveru Hydrogenaudio.com spolu se soubory APE
nejpopulárnějším bezeztrátovým formátem. Protože je od počátku vyvíjen jako
otevřený, je k dispozici nejen pro Windows, ale např. i pro Mac OS X, Linux a
další. FLAC na rozdíl od jiných bezeztrátových formátů podporuje streamování po
internetu. Maximální dosahovaná komprese se blíží 4 : 1, běžně se ovšem
pohybuje kolem 2 : 1 tříminutová skladba tak bude zabírat kolem 30 MB. FLAC je
velmi podobný formátu Monkey\s Audio, z hlediska kompresního poměru a rychlosti
za ním lehce zaostává.

Wavpack
http://www.wavpack.com
Zajímavostí formátu Wavpack je unikátní hybridní mód, který stojí na půl cesty
mezi bezeztrátovou a ztrátovou kompresí. Mód ukládá originální skladbu do dvou
souborů relativně malého ztrátově komprimovaného a korekčního, který v
kombinaci s prvním souborem dodává plnohodnotnou bezeztrátově komprimovanou
skladbu.

Ztrátová komprese

AAC (MP4)
http://www.apple.com/mpeg4/aac
Advanced Audio Compression (AAC) vytvořila před lety společnost Dolby s cílem
jít v kvalitě a kompresi za možnosti formátu MP3. AAC je jedním (pravděpodobně
nejznámějším) ze subformátů vzniklých z MP4 a za svůj jej (s koncovkou m4a)
přijala například firma Apple, která jej používá ve svém hudebním on-line
obchodě iTunes a MP3 přehrávačích iPod. Novinkou je pak vylepšení verze HE-AAC,
která používá podobné triky jako technologie MP3pro ke zvýšení kvality při
nízkých datových tocích pod 100 Kb/s, k tomu je ovšem třeba speciální HE
dekodér. Další použití nalezl formát AAC pro záznam zvukové stopy u MPEG-2
videosouborů, tam Dolby směřovala i vylepšené verze s označením AC2 a AC3.

MP3 (Lame)
http://lame.sourceforge.net
Soubory s koncovkou MP3 (MPEG 1 Layer III) jsou bezesporu nejpopulárnějším
formátem pro ztrátovou kompresi hudebních skladeb. Kompresní poměr dosahuje při
klasickém datovém toku (128 Kb/s) přibližně 10 : 1. Pro tento formát se
doporučuje bitrate 128-192 Kb/s, při jiných datových tocích vykazují lepší
výsledky jiné formáty. Kvalita výsledného souboru je kromě zvoleného datového
toku ovlivněna volbou enkodéru, tedy programu, který za pomoci kompresních
algoritmů provádí vlastní převod. Za nejlepší je obecně považován Lame, který
je k dispozici zdarma, a na jehož vývoji pracuje řada dobrovolníků.

MP3pro
http://www.mp3prozone.com
Jedná se o rozšíření existujícího formátu MP3. Zvenku není na první pohled
patrný žádný rozdíl, oba mají koncovku MP3 a oba lze přehrávat v existujících
přehrávačích. MP3pro má mezi "normálními" MP3 daty navíc údaje o vysokých
frekvencích, které MP3pro přehrávače využijí pro vylepšení výsledného zvuku a
MP3 přehrávače je ingorují. Tvůrce toho formátu Fraunhofer Institute uvádí, že
MP3pro je 2x kvalitnější než MP3 při stejném datovém toku, a že tedy 128Kb/s
MP3 soubor je stejně kvalitní jako 64Kb/s MP3pro.

MP4
http://www.audiocoding.com
Nástupce MP3 s označením MP4 je v podstatě kontejner obsahující řadu
subformátů, z nichž nejznámějším je AAC. Soubory s koncovkou m4a obsahují pouze
audioobsah, MP4 soubory obsahují obojí jak audio, tak videoobsah.

MPC
http://www.musepack-source.de
Formát Musepack (MPC, MPEGplus) vychází z MP2 a je nekorunovaným králem
ztrátové komprese. Musepack vyplňuje mezeru mezi ztrátovými formáty s nízkým
datovým tokem (MP3 či OGG) a bezeztrátovými formáty. Při datovém toku nad 192
Kb/s se MPC nikdo nevyrovná. Web je momentálně pozastaven.

OGG
http://www.xiph.org
Ogg Vorbis je všestranný ztrátový formát, a při datových tocích mezi 96-128
Kb/s by jen těžko hledal konkurenci z hlediska kvality i velikosti souborů. Je
to otevřený formát bez jakýchkoliv poplatků či patentů, na jehož vývoji pracuje
řada dobrovolníků. Podpora hardwarových přehrávačů je zatím minimální,
softwarové přehrávače s formátem pracují buď nativně (podpora přímo v
programu), nebo prostřednictvím externího plug-inu.

WMA
http://www.microsoft.com/windowsmedia
S formátem WMA přišel Microsoft jako s variantou k MP3 se shodnou kvalitou při
nižším datovém toku. Kvalitou i kompresním poměrem se WMA pohybuje na úrovni
MP3pro. Výhodou je, že s WMA umí pracovat většina hardwarových MP3 přehrávačů,
nevýhodou je pak velký důraz na ochranu autorských práv, což v řadě případů
vede k problémům při běžném (legálním) používání chráněných skladeb. Poslední
verzí, kterou Microsoft představil, je MWA v9, jež při komprimování skladby
přidala dvouprůchodové VBR a tři nové subformáty WMA Lossless, WMA Pro a WMA
Voice. WMA Lossless je bezeztrátová komprese, kdy komprimovaný soubor
představuje polovinu až třetinu velikosti původního WAVu. WMA Pro podporuje 5.1
a 7.1 kanálový zvuk a umožňuje ukládat audio v profesionálním rozlišení 24
bit/96 KHz. A konečně WMA Voice je speciálně určen pro hlas i hudbu s datovým
tokem pod 20 Kb/s tedy pro desítky minut dlouhé záznamy s malou velikostí
výsledného souboru.

Slovníček audia

Bit Rate - datový tok, určující kolik bitů bylo použito pro záznam, udává se v
Kb za vteřinu, čím vyšší je počet bitů, tím větší a tím kvalitnější je výsledný
soubor. Audiokvalitu nikdy nelze získat zpětně konverze souboru s 128 Kb/s na
soubor s datovým tokem 320 Kb/s povede k získaní souboru s kvalitou 128 Kb/s a
velikostí 320 Kb/s. Navíc při každém takovém převodu dojde k malé ztrátě
kvality způsobené kompresními algoritmy. Pokud tedy není k dispozici originální
zdroj (audio CD), je lepší ponechat soubory tak, jak jsou.
Constant Bit Rate (CBR)- stejný bitrate (datový tok) je použit pro celý soubor.
Variable Bit Rate (VBR)- MP3 soubory se skládají ze stovek malých částí framů,
při použití VBR rozhoduje enkodér pro každý frame, jaký datový tok použije pro
zachování maximální kvality. Bit Rate tak u jednoduchých pasáží klesá a u
složitých částí skladby naopak roste. Nevýhodou je, že díky proměnlivému
datovému toku není řada přehrávačů schopna určit skutečnou délku skladby a
ukazuje číslo až o několik minut či desítek minut rozdílné (na přehrávání to
ovšem nemá vliv). Stadardem pro enkodéry je ukládat do prvního framu skutečnou
délku skladby, ale ne každý to dělá. Zmatek řeší až ID3v2 tagy.
Average Bit Rate (ABR) - velmi podobné VBR, ovšem na rozdíl od VBR je při
velikost výsledného souboru odvozena od průměrného datového toku. Dochází tedy
pouze k variaci datového toku při zachování stejné velikosti souboru jako při
použití CBR.
Stereo - není třeba nic dodávat, dvoukanálový zvuk je široce používán a
odpovídá standardu pro audio CD
Mono - nahrávka se zvukem pouze v jednom kanálu.
Joint Stereo - Pokud vezmete zvuk z levého kanálu a porovnáte jej se zvukem z
pravého kanálu, zjistíte, že je zde řada podobností. Joint Stereo tak pro oba
kanály shodné části ukládá pouze jednou, a redukuje tak množství dat nutných
pro záznam.
Frekvence - určuje, jak často je snímám zvukový záznam. Audio CD formát pracuje
s hodnotou 44 100 Hz čili 44,1 KHz a s touto frekvencí jsou pak ukládány i
komprimované soubory. Není žádný důvod pro ripování CD na frekvenci vyšší než
zmíněných 44,1 KHz.
Psychoakustický model - Tento princip používaný u ztrátových formátů se snaží
pomocí řady technik a postupů oklamat lidské ucho tak, aby se domnívalo, že
slyší originální skladbu, i když je pravdou, že z ní je mnoho detailů a
frekvencí, pro lidský sluch nepostřehnutelných, vypuštěno.
FreeDB, CDDB - Jak FreeDB.org, tak i CDDB.com reprezentují obrovský on-line
katalog prakticky všech vydaných audio CD. Díky tomu stačí, pokud do mechaniky
počítače vložíte hudební CD a přehrávač dokáže prostřednictvím identifikátoru
unikátního pro každé vydané CD automaticky zjistit umělce, název CD a názvy
jednotlivých skladeb. A to platí i pro zkopírovaná audio CD, pokud je spolu s
hudebními stopami zkopírován i zmíněný identifikátor. Jestliže vaše CD není
identifikováno a máte po ruce originální booklet, můžete disk do databáze zadat
sami. Zpočátku existovala pouze databáze CDDB jako bezplatný projekt, kam
informace o discích ukládali dobrovolníci, ovšem poté, co ji koupila soukromá
společnost, byly bezplatné služby převedeny na komerční, a proto vznikla
alternativa v podobě FreeDB. Postupně tedy naprostá většina programů přechází z
používání CDDB na FreeDB.

Zajímavé odkazy

•http://www.hydrogenaudio.org zřejmě nejpopulárnější diskusní server,
zabývající se digitálními hudebními formáty
•http://mp3.cz oblíbený server, věnující se digitálním formátům v češtině
•http://mp3.box.sk anglicky psaný slovenský server, kde najdete vše o digitální
hudbě

Který audioformát je nejlepší?

•Monkeys Audio - pokud chcete mít vaše skladby v té nejlepší kvalitě
•MP3 - pro maximální kompatibilitu s nejrůznějšími hardwarovými i softwarovými
přehrávači a pro přenos mezi různými operačními systémy (128-192 Kb/s)
•WMA - pokud má váš přenosný MP3 přehrávač omezenou velikost paměti a přitom
nepodporuje jiné formáty (64-96 Kb/s)
•AAC - vlastníte-li flashový či harddiskový MP3 přehrávač s větší kapacitou a
podporou tohoto formátu (např. iPod) (96-160 Kb/s)
•MPC - jestliže chcete maximální kvalitu zvuku, avšak zároveň požadujete
ztrátovou kompresi (160-320 Kb/s)
•OGG - univerzální použití a vynikající poměr velikosti a kvality (80-160 Kb/s)
Kamil Pittner