Zvuk beze ztrát

4. 2. 2009

Sdílet

 Autor:
S příchodem digitálních formátů se většina z nás smířila s tím, že za větší pohodlí při ukládání, kopírování a přehrávání hudby se platí její nižší kvalitou. Jenže zatímco před deseti lety byl standard MP3 vzhledem k velikostem pevných disků a cenám flash pamětí nenahraditelný, dnes se jedná o často nepříliš kvalitní přežitek.

Na trhu existuje totiž hned několik otevřených bezztrátových zvukových formátů, využívajících klasickou LPCM technologii, i mnohem sofistikovanější komerční formáty s rozšířeným dynamickým rozsahem, jako je DTS či SACD se zcela odlišným nelineárním způsobem modulace signálu delta-sigma, nabízejícím nesrovnatelně vyšší rozlišovací schopnost.

Z(a)tracené MP3
MP3 formát, který jsme si netradičně prosadili my, spotřebitelé, nebyl původně navržen pro uchovávání a distribuci hudby samotné, ale jako zvuková stopa digitálního obrazového formátu MPEG-1, využívající pro kompresi nedokonalosti lidského sluchu. Jeho historie vlastně sahá až do roku 1894, kdy byl poprvé popsán fenomén jedné vlastnosti lidského sluchu - tóny o vyšší frekvencí jsou pro nás prakticky neslyšitelné, jsou-li následovány tónem o frekvenci nižší. Jev byl podrobně prozkoumán na sklonku padesátých let minulého století a v roce 1979 byl poprvé navržen model zvukového kodeku, založeného na psychoakustickém maskování. Práce na samotném kodeku MP3 započaly zhruba o deset let později v rámci projektu digitálního vysílání (DAB), z nějž vyšel nejprve formát MP2 zahrnutý do standardu MPEG-1 a posléze též vylepšený MP3, jehož finální podoba byla schválena v roce 1991 a finalizována o rok později. Zajímavé přitom je, že jeden z otců formátu MP3, Karlheinz Brandenburg, použil při ladění kodeku skladbu Tom's Diner od Suzanne Vega, pro její monomorfní povahu a široké zvukové spektrum.

MP3 se stalo populární díky Fraunhoferově institutu, jehož zaměstnanci vyvinuli první samostatný kódovací program l3enc i první přehrávač WinPlay3. Na dalším šíření a růstu popularity formátu v letech 1995-98 měla ale asi největší zásluhu rodící se internetová pirátská „scéna", především skupina Compress Da Audio, která vydávala CD ve formátu MP3, u nichž byl vždy přiložen i přehrávač WinPlay3. Boom MP3 začal v roce 1998 s příchodem programu Winamp a prvních kapesních přehrávačů Rio PMP300 a MPMan F10, naplno pak propukl po roce 2003, kdy již byla na trhu řada harddiskových i flashových přehrávačů a formát MP3 se pomalu, ale jistě zabydloval v autorádiích, domácích kinech a dalších typech spotřební elektroniky.

Snaha o úsporu místa vedla zejména v prvních letech používání MP3 k tomu, že většina skladeb byla kódována ve formátu 44 KHz/128 kbps, který nabízel „přijatelnou" kvalitu pro poslech v kapesních zařízeních či na méně kvalitních PC reproduktorech. Přestože dnešní programy a přístroje pro kompresi MP3 nabízejí ve stejném formátu vyšší kvalitu než ty používané před deseti lety, většina z nás je schopna vnímat výrazné zhoršení kvality při 128 či 160 kbps. Teprve od 192 kbps výše jsou rozdíly mezi MP3 a původním záznamem LPCM pro většinu posluchačů nepostřehnutelné - při použití kvalitnějších reproduktorů je ale zřetelná menší dynamika či množství detailů. MP3 má rozhodně, spolu s dalšími formáty ztrátové komprese jako je AAC, OGG, Real či WMA, své místo v přenosných přístrojích, streamovaném zvuku či v automobilu, pro budování digitálního hudebního archivu či poslech na kvalitní domácí sestavě je ale rozumné volit některý z bezztrátových formátů, který nabízí kvalitu identickou se zdrojovým materiálem - tedy CD nosiči (DVD audio či SACD představují v tomto případě samostatnou kapitolu).

FLAC a ti druzí
Bezztrátové kompresní formáty nevyužívají pro zmenšení datového objemu nedokonalostí lidského sluchu, ale datových kompresních algoritmů, byť odlišných od těch používaných například ve formátech ZIP či RAR. Typický datový objem se tak pohybuje kolem hodnoty 50 až 60 procent původní velikosti - běžné CD tak v těchto formátech zabere 200-350 MB. Nejběžnějšími formáty jsou v současné době FLAC (Free Lossless Audio Codec), Apple Lossless, MPEG-4 ALS a APE (Monkey's Audio) - většina uživatelů se při tvorbě vlastních hudebních archivů obvykle přikloní k otevřenému formátu FLAC, který již podporují i někteří výrobci spotřební elektroniky - zejména ti s kořeny ve světě IT (Sandisk, Logitech, iriver, Sonos či Denon).

FLAC (.flac nebo .flc) byl navržen tak, aby jej bylo možné využít pro celočíselné vzorky v libovolném PCM rozlišení od 4 do 32 bitů a vzorkovací frekvenci od 1 Hz do přibližně 1 MHz. Formát podporuje 1 až 8 kanálů - v praxi tedy mono až 7.1. Soubory s příponou .flac obsahují, podobně jako MP3, hlavičku s údaji o skladbě a dalšími informacemi - například možností uložit do souboru obrázek alba. Vedle přístrojů výše zmíněných výrobců lze podporu FLAC přidat i do některých dalších zařízení díky neoficiálním firmwarům - mezi takové patří například Xbox, některé modely iPodu či Sony PSP, pomocí vhodného softwaru lze FLAC „vysílat" přes domácí síť z PC do libovolného UPnP/DLNA klienta, jako je například Xbox 360.

Formát Apple Lossless se sice navenek tváří jako MP4 s příponou .m4a, ve skutečnosti se ale jedná o kompresi s lineární predikcí, tedy stejnou, jakou používá například FLAC. Sám o sobě je formát prakticky nezajímavý, ale díky tomu, že jej Apple nabízí v obchodě iTunes a podporují jej některé přehrávače iPod, je pro některé uživatele přitažlivý. Díky MP4 kontejneru mohou být soubory chráněny proti kopírování systémem DRM.

Třetím formátem, se kterým se na internetu můžete běžně setkat, je Monkey's Audio, jímž jsou kódovány soubory s příponou .ape. Jeho jedinou výhodou proti FLAC je vyšší míra komprese (menší soubory) - rozdíly jsou ale při dnešních kapacitách pevných disků či flash pamětí zanedbatelné. Programy a kodeky pro jeho přehrávání či tvorbu jsou dostupné zdarma jako freeware - to je zároveň důvod, proč je podporován výrazně méně než FLAC, který patří do rodiny open source. Poměrně vzácně se vyskytující formáty jsou starší Shorten (.shn) či velmi nový TTA (.tta) a MPEG-4 Audio Losless Coding. Ve světě DVD Audio a HD video formátů se pak používá proprietární formát MLP podporující maximálně až 6 (DVD Audio) či 8 zvukových kanálů (Blu-ray).

pcm_vs_dsd

ICTS24

Lepší než bezztrátové
Všechny doposud zmíněné formáty jsou založeny na společném základě: klasické lineární pulzně-kódové modulaci, používané pro digitalizaci zvuku u klasických CD, DVD i HD video nosičů. Její filozofie je jednoduchá: zvuková křivka je převedena na časový sled hodnot jejích amplitud - takzvaných vzorků. Pro věrné uložení těchto hodnot stačí použít o něco vyšší než dvojnásobnou „vzorkovací frekvenci". Pro 20 kHz, což je často udáváno jako horní práh lidského sluchu, tak stačí vzorkovací frekvence lehce nad 40 kHz (typicky 44 či 48 kHz). Problém LPCM modulace je jednak v tom, že pro celkový zvukový obraz lidské ucho podle všeho využívá i harmonických frekvencí nad hranicí slyšitelnosti, a pak také v povaze vzorkování samotného, kdy je plynulá analogová křivka zvukové vlny převedena na „zubatý" sled binárních vzorků.

Je trochu překvapivé, že na trhu konkuruje řadě PCM standardů jediná technologie: SACD (Super Audio CD) vyvinuté společně Sony a Phillipsem. SACD využívá technologii Direct Stream Digital (DSD) založenou na modulaci hustoty impulzů (PDM) se vzorkovací frekvencí 2,8 MHz (tedy 64× vyšší než u klasického CD-Audio či FLAC formátu). Potíž je v tom, že DSD formát je velmi obtížné do PC dostat a následně přehrát. SACD disky totiž oficiálně čtou pouze SACD přehrávače a asi jediný způsob, jak zvuk v DSD formátu přehrát, je plug-in pro Windows Media Player 10 a 11, který Sony nabízí na svých noteboocích Vaio (i ten ale DSD pouze převádí na PCM a kvalitu výstupu tak do značné míry snižuje). Pokud si chcete DSD přece jen vyzkoušet, je jednou z možností skandinávský web Nordic Sound, který nabízí ukázky skladeb v DSD a jejich verze ve FLAC s vysokou vzorkovací frekvencí (http://www.2l.no/hires/index.html). Zajímavou možností, jak získat SACD přehrávač, mimochodem představovala v minulosti PlayStation 3. Sony ale u nových verzí konzole podporu SACD, podobně jako čtečky paměťových karet či podporu her, z PS odstranilo - z kdysi všemocné PS3 se tak bohužel stává kastrát, zvládající pouze omezenou nabídku her a Blu-ray filmy.

Černá skříňka
Jistou naději pro náročné majitele rozsáhlých audio sbírek ve formátech FLAC, kteří nejsou spokojeni s kvalitou klasického LPCM kódování, představuje software Burwen Bobcat, jehož velkým zastáncem je kupříkladu Mark Levinson. Program slibuje schopnost „rekonstruovat" MP3, WMA či WAV soubory do podoby, která je příjemnější a současně je věrnější analogovému originálu - a to jak dynamicky při přehrávání ve Windows Media přehrávači, tak při uložení upravených souborů. Jako problém ale vidíme to, že Bobcat je softwarová černá skříňka za 200 dolarů, která navíc nepodporuje dnes nejpoužívanější formát FLAC.