Digitální formáty zvuku čeká souboj o příští standard

Ztrátové kompresní formáty zvuku již dávno opustily zákoutí laboratoří a vydaly se do světa. Jejich používání j...


Ztrátové kompresní formáty zvuku již dávno opustily zákoutí laboratoří a vydaly
se do světa. Jejich používání je dnes otázkou mnoha rozporů, protichůdných
obchodních strategií, technologických řešení a především věcí denního
používání. Jaké jsou vyhlídky elektronické hudby a zvuku vůbec?
V počítačovém dávnověku představoval zvuk jeden z největších technických
problémů. Nebylo sice obtížné jej digitalizovat, ukládat v jednoduchých
kompresních formátech a ani přehrávat, problémem však byla velikost. Řešení ve
formě rozdělení zvukové informace na krátké vzorky "nástroje" a jejich
přehrávání či opakování v určitém schématu sice mohlo projít pro syntézu
určitých skladeb, ale v případě zpěvu nebo reprodukce skutečných uměleckých
těles bylo nepoužitelné. Délka jediné běžné skladby v komprimovaném formátu WAV
pak přesahovala možnosti tehdejších počítačů.
Zásadní průlom v této oblasti představoval příchod ztrátových komprimačních
algoritmů. Ty jsou založeny na redukci všeho, co lidské ucho v digitálním zvuku
nezachytí, a na využití úsporného kódování informace. Bez ohledu na to, zda
těmto formátům dnes říkáme MP3, WMA nebo Ogg Vorbis, fungují všechny na stejném
teoretickém základu.
Vynález ztrátových formátů vedl k obrovskému usnadnění distribuce zvukových
záznamů. Ty nejsou již závislé na fyzickém nosiči, ale ve formě souborů fungují
všude stejně. Lze je kopírovat, přenášet a přehrávat beze ztráty kvality, beze
ztráty vlastností nutných pro jejich další zpracování a pro poslech.
Tento systém byl po velmi dlouhou dobu považován za méněcenný, a některými
lidmi i odborníky stále je. Přesto se asi během posledních tří let stal
dominující metodou nakládání se zvukovými záznamy především s hudbou. Osudy
prvotního a nejslavnějšího výměnného systému Napster i jeho potomků jsou
notoricky známé a jednou možná vejdou do dějin jako "válka zvuků". Proto nemá
cenu se jimi více zabývat.

Dnešní digitální svět
Současné digitalizované hudbě jednoznačně dominuje formát MP3. Přestože je
mnohými již pohřbíván, existuje dostatek důvodů, proč se domnívat, že nás jen
tak neopustí. Hlavní z nich jsou tyto:
MP3 je široce podporováno na úrovni softwaru i hardwaru. Lze je přehrát na
prakticky každém počítači s využitím jednoduchých a snadno dostupných aplikací.
MP3 se stalo univerzálním formátem jdoucím napříč platformami.
Soubory lze jednoduše vytvořit extrakcí zvukového CD nebo prakticky libovolného
jiného média.
MP3 je podporováno desítkami výrobců přenosných zařízení. Kapesní přehrávače s
pevnými disky, jejich obdoby s flash paměťmi a pak především velmi levné
discmany poskytují dobré řešení pro jakoukoliv kapsu.
V tomto formátu se na internetu, a především ve výměnných sítích, vyskytují
miliony skladeb.
Je prakticky nemožné chránit u něj technicky autorská práva.
Právě poslední bod tohoto stručného výčtu výhod je hlavním, ačkoliv zamlčovaným
argumentem odpůrců používání formátu MP3. Vesměs se sice maskuje za další
omezení, jako je například absence vícekanálového zvuku nebo kvalitativní
limity, zůstává však primárním. Argumenty volající po vysoké kvalitě a
rozšířených možnostech přehrávání a manipulace jsou ovšem liché ještě z jednoho
důvodu.
Drtivá většina hudby, která je v současné době distribuována na komerční

bázi, využívá formát klasického CDDA (Audio CD). To při záznamu dvoukanálového
zvuku (stereo) využívá šestnáctibitového kódování (44 kHz) a datového toku 150
Kb/s. Tato specifika mají své limity, avšak při reálném poslechu jsme na ně
zvyklí. I přes protesty audiofilů většině posluchačů na laciných i kvalitních
domácích nebo mobilních zařízeních naprosto vyhovuje tzv. CD kvalita.
Ačkoliv tvůrci formátu MP3 proklamovali něco jiného, a tím své dítko již od
začátku ocejchovali puncem nekvality, dosahuje komprimovaný soubor kvality
původního CDDA asi při 240-320 Kb/s datového toku. Tyto hodnoty mohou být podle
žánru a kvality původní nahrávky jak nižší, tak vyšší. Jsou-li vyšší, projevuje
se ztráta komprimační schopnosti fyzická velikost souboru se zvyšuje. Tento
handicap (další argument proti MP3) je na jiné frontě kompenzován neustále
stoupající kapacitou záznamových zařízení a rychlostí přenosu dat po sítích i
na internetu. Vylepšená verze MP3 MP3 Pro však prozatím zdaleka nedosáhla
popularity svého staršího bratra.

Hrozba z Redmondu
MP3 má dva významnější konkurenty. Prvním z nich je formát WMA (Windows Media
Audio) vyvíjený společností Microsoft. Podle přehledu technických parametrů a
reklamních proklamací by mělo WMA MP3 kategoricky porážet. K dosažení stejné
kvality je potřeba menšího datového toku. Tím se snižuje velikost souboru se
skladbou. Rovněž výroba souboru extrakcí CDDA je jednodušší a není k ní třeba
(v prostředí Windows) žádný "nadstandardní" software. Stejně jednoduchý je
přenos hudby do některých druhů přenosných zařízení. Avšak i tak se WMA
rozšíření MP3 nepřibližuje.
Jedním z hlavních důvodů je pravděpodobně přítomnost zabudovaného DRM (Digital
Rights Management systém správy autorských práv digitálních dat). To fixuje
vytvořené skladby na daný počítač nebo požaduje speciální digitální licenci pro
jejich přehrávání. Připravovaná verze obsahuje vylepšený model tohoto systému
Windows Media Digital Rights Management for Devices version 9. Systém by měl
přenést schopnosti správy licencí i do přenosných zařízení. "Bohužel" takový
postup vyžaduje podporu ze strany výrobců těchto zařízení. Ti sice WMA v
podstatě podporují, ale často se jedná jen o doplněk k primárnímu účelu k
přehrávání MP3.

Otevřená varianta
Jiným směrem jde alternativní formát Ogg Vorbis. Tento formát je vyvíjen jako
GPL. Původně se jednalo o odpověď na sice relativně levné, ale přesto
licencované MP3, posléze měl představovat (a představuje) také kvalitativní
skok.
Je otázkou nakolik lze vkládat konkurenční boj mezi Ogg a WMA. I když je zde
explicitně přítomen, z jiného úhlu pohledu se spíše jedná o vztah mezi zcela
uzavřeným a zcela otevřeným formátem. Ogg nabízí vyšší kvalitu než MP3 a je
flexibilnější. Ovšem zatím není zdaleka tak rozšířen. Byť podpora pro osobní
počítače není problémem, prozatím chybí dostatečné rozšíření mezi hardwarovými
přehrávači a především uživateli.

Komerce používá AAC
Dalším z kompresních formátů, o kterém je vhodné se zmínit, je AAC (Advanced
Audio Coding). Přestože je AAC kvalitnější než MP3, v prostředí digitální
distribuce hudby se s ním setkáváme relativně méně. Využívají jej služby
komerční distribuce zvukových nahrávek, je podporován některými hardwarovými
přehrávači, ale celkově nedosáhl rozšíření, které by si zcela jistě zasloužil.
K tomuto rozšíření má napomoci například se značným úspěchem nedávno otevřený
projekt laciné distribuce legálních nahrávek společnosti Apple.
A samozřejmě zde ještě zůstává Real Audio. Tento formát je velmi často využíván
pro streamování zvuku na internetu a dalších počítačových sítích je pro takové
účely optimalizován. Přehrávač Real Player (od stejné firmy) je dostupný pro
mnoho handheldů. Nicméně "off-line" využití Real Audio není příliš rozšířené.

Otázka budoucnosti
Digitální zvuk není ani zdaleka jen zábavou, jak by se dalo z předchozího výčtu
usoudit. Přesto objem digitálních zvukových dat obsahujících hudební nahrávky
utěšeně stoupá právě díky koncovým uživatelům a jejich touze po vzájemné
výměně. V případě hudby se jedná v naprosté většině případů o fyzické osoby,
které pak u digitálních zvukových formátů požadují dvě základní věci.
První z nich je kvalita, tou druhou možnost s nahrávkami prakticky neomezeně
manipulovat. Kvalitu může nabídnout mnoho formátů, ale co se týče neomezených
možností, je to už o něco horší. Každý prodejce hudby se snaží své nahrávky
chránit, a to znamená omezit uživateli práci s nimi. Formáty, které toto
umožňují, se ale zatím těší mnohem menší popularitě.
Řešit problém autorských práv je však zřejmě nevyhnutelné. Jednou z odpovědí by
měl být již zmíněný nejnovější počin Microsoftu. Dalo by se říci, že největší
softwarová společnost má při prosazování svých formátů obrovskou konkurenční
výhodu. Když se ale podíváme na množství prodaných MP3 přehrávačů, dostupnost
tohoto formátu a nastupující Ogg Vorbis, není toto tvrzení ani zdaleka tak
jisté. Microsoft chce, aby bylo v rámci daných licencí co nejjednodušší s
obsahem nakládat, omezení však vždy bude v latentní formě přítomno.
Současná oblast digitálních hudebních formátů se nachází ve fázi boje o to, co
nahradí všudypřítomný MP3. Tento boj není veden ani tak na technologické
úrovni, jako spíše ve sféře komerce. Vytlačit zažitou, spolehlivou a funkční
technologii něčím jiným se zdá být až příliš obtížné. Přesto MP3, ač v současné
době nejrozšířenější a nejpodporovanější, není řešením pro budoucnost právě z
důvodu své naprosté nekontrolovatelnosti.

Zvuk s ochranou
Když na okamžik odhlédneme od otázek kvality s tím, že CDDA úroveň je
dostačující, zůstává nám problém ochrany autorských práv v současných
kompresních formátech jako ten rozhodně největší. DRM systémy mají (jak jsme
již v CW psali) opodstatnění na dvou "frontách".
První z nich je soukromá, uzavřená sféra. Ochrana informací posílaných v
nemasovém měřítku z bodu A do bodu B není zase až tak problematická. Ochrana
dat masově distribuovaných statisícům a milionům klientů s jednoznačným
nastavením kdo, na čem a po jak dlouhou dobu je může využívat, je prakticky
nemožná.
Nejnovější aktivita společnosti Microsoft v oblasti DRM u médií je směrována
právě sem. Implementace DRM do přehrávačů se v současné době pravděpodobně
nesetká s nijak pozitivní reakcí jejich výrobců. Kromě toho hrozí riziko
snadného hacknutí, či prostě opuštění. Aby totiž mohlo být WMA vybavené DRM
technologií skutečně využíváno, musí jít o jediný podporovaný formát. Uživatel
nemající alternativu se jej rozhodne začít využívat a respektovat jeho
pravidla. Uživatel nemající alternativu však prakticky neexistuje.
I kdyby se společnosti žijící z výroby a prodeje zařízení a softwaru k práci s
digitální hudbou právě nyní rozhodly, že jediné, co budou napříště podporovat,
je zabezpečený formát Microsoftu, nebude to jemu samotnému nic platné. V oběhu
zůstane obrovské množství stávajících zařízení, stávajícího softwaru a navíc se
pro takový krok nerozhodnou všichni.
Služby on-line hudební distribuce, které v masovém měřítku využívaly leckdy
velmi agresivního DRM, nepřilákaly dostatečné množství abonentů. Kromě pocitu
"omezenosti" na tom měl jistě svůj podíl viny i fakt, že samotná obsluha
přehrávání zakoupené, respektive pronajaté hudby byla komplikovaná a
těžkopádná. Je pochopitelně otázkou, nakolik je toto problém tvůrce kompresního
a ochranného formátu a jak velký podíl odpovědnosti má za takovýto problém
autor technické implementace do konkrétního softwaru.

Kvalita CD ještě stačí
Moderní formáty s vícekanálovým zvukem a vzorkovací frekvencí vyšší než 44 kHz
pronikají na veřejnost pomalu. Veřejnost je zvyklá na CDDA kvalitu, nahrávací
studia a společnosti jsou pro ni vybavené a jedná se o nejobvyklejší úroveň
distribuce. Navíc za přispění DSP (Digital Signal Processing digitální
zpracování analogových dat) prakticky dokonale pokrývá potřebu typického
jedince na úroveň komfortního zvukového signálu (nepočítaje v to audiofily
vybavené extrémním sluchem a požadavky na reálný prostorový zvuk).
Účinnost samotné komprese také již není až tak zcela určujícím faktorem. S
narůstající kapacitou přenosových linek a celkově se zrychlující komunikací po
internetu nehrají rozdíly v desítkách kilobajtů či dokonce stovkách mezi
jednotlivými formáty až tak velkou úlohu. Trochu jinak se má tento problém
samozřejmě u hardwarových přenosných přehrávačů.
Zde se však vývoj v poslední době orientoval především dvěma směry. Takříkajíc
běžné publikum je uzurpováno discmany, které mají sice poměrně nepraktické
tvary, avšak snadno vyměnitelná a především laciná média o značné kapacitě. Na
opačném pólu stojí zařízení vybavená pevnými disky s kapacitou desítek CD.
Přestože se výrobci přehrávačů s pevnými disky (elegantní ukázkou této
technologie je například nová generace zařízení Apple iPod) trumfují v
navyšování kapacity ukládacích médií, jen málokterý uživatel je jejich obsah
schopen efektivně využít celý.
Zařízení vybavená klasickými paměťovými kartami, kterých by se otázka kapacity
dotýkala teoreticky nejvíce, jsou dnes spíše okrajovou a stylovou záležitostí.
Kromě toho jsou využívána především krátkodobě a v malé vzdálenosti od
základen, ze kterých je možné jejich obsah modifikovat.
Rovněž argument náročnosti na přehrání toho kterého druhu komprimovaného audia,
který by svědčil proti moderním formátům, je již v zásadě irelevantní. Domácí
počítače jsou po hardwarové stránce dostatečně vybaveny a přenosná zařízení
jsou konstruována jako jednoúčelová. Kromě toho mají obvykle dostatečnou
rezervu pro podporu nových řešení.

Ještě další nové formáty
Až doposud jsme hovořili pouze o virtuálních formátech využívajících k ukládání
informací o zvuku klasický soubor. Kromě nich existují aktivity směřující k
protlačení koncepce provázání informace s jejím nosičem. Tím může být například
DVD-Audio.
Na takový disk se vejde mnohem více informací než na standardní CD, a to
znamená dvě věci. Jednak může být zvukový záznam pochopitelně delší, a jednak
také kvalitnější. Kvalita je ovšem spekulativní. Vyžaduje speciální hardware
uzpůsobený pro přehrání takového disku. Nemůžeme ani očekávat, že by se začaly
prodávat disky s větším objemem hudby. Interpreti, snad s výjimkou symfonických
orchestrů, jsou rovněž navyklí na standardních 75 minut a pokud mají potřebu
tento limit překročit, využijí se dvě nebo i více CDDA.
To, co je podstatné, je tedy opět přítomnost DRM. Ochrana obsahu byla u DVD
prolomena již dostatečně medializovaným DeCSS lze ale vytvořit novou. Za cenu
obrovských investic ani ne tak do formátu, jako do jeho prosazení. Kromě toho
jde o investice poměrně nejisté. Moře stávajících přehrávačů CDDA nelze
vytěsnit novým formátem tak jednoduše, jak by se mohlo zdát stejně jako zvyky
jejich uživatelů. Ti jsou kromě specifik formátu jako takového navíc poslední
dobou navyklí ještě na jeden fenomén.
Současné přehrávače CDDA/ /MP3 dokáží číst zapisovatelná i přepisovatelná
média. Pokud by došlo na využití zcela nového formátu vybaveného ochranou,
výrobci by pravděpodobně neměli zájem o využití zapisovatelných médií z důvodu
udržení této ochrany. V tom případě je ale pravděpodobné, že by se jim nový
formát nepodařilo prosadit. V opačném by byl přehrávač využíván také pro zálohu
a přehrávání několika CDDA nebo velkého množství souborů typu MP3. Tím by se
sice nový formát prosazoval lépe, ale také by se narušil jeho původní účel, což
je podobné bludnému kruhu.

Hudba a obchod
Pokud se mají hudebníci uživit, musí se nějakým způsobem prodávat jejich hudba.
Jestliže se má prodávat, musejí ji zákazníci chtít. Pro distributory to znamená
najít kompromis mezi kvalitou, ochranou a cenou. Podle současných výsledků se
zdá, že společnosti Apple se to téměř podařilo.
Budoucnost zvukových kodeků, právě pro účely off-line přehrávání, ještě nějakou
dobu bude patřit formátu MP3. Vedle něj bude Microsoft jistě souběžně
podporovat svým DRM vybavený formát WMA a v komerční sféře určitě najde nemálo
příznivců.
Rovněž GPL Ogg je zajímavou technologií, ačkoliv se pro profesionální
distribuci nehodí. I kdyby bylo možné si jej upravit, stále zůstane otevřeným
formátem s povinností distribuovat zdrojový kód. Tato skutečnost také nahrává
argumentu o možné nejednotnosti tohoto formátu a hrozbě vytvoření mnoha
vzájemně nekompatibilních variant. Protiargumentem je, že existuje mnoho jiných
otevřených standardů, které existují roky, aniž by byly nějak výrazněji
narušeny. Přesto se Oggu v komerčních aplikacích zřejmě v masové míře nedočkáme.
Systémy distribuce hudby, které svou brutální ochranou silně omezovaly možnosti
nakládání s nahrávkami, se jak se zdá neujaly. Momentálně se boj přesunul spíše
hledání vhodného obchodního modelu než na akcentování bezpečnostních opatření,
omezování uživatele a zotročování možností, jak s draze pořízeným obsahem
nakládat.
V tomto prostředí mají prakticky všechny současné formáty rovnocennou šanci
opět s mírnou převahou nejrozšířenějšího a nejlépe podporovaného MP3. Jestliže
se ale bude místo na ochranu sázet na kvalitu, jistě přijde doba vícekanálového
zvuku s možností standardního přehrávání na nevybavené technologii, vyhánění
vzorkovací frekvence na vysokou úroveň i u formátů, které ji nepotřebují, a
přetahování se o zákazníka na základě parametrů, které pro něj nejsou ty
nejpodstatnější. To je ale prozatím doslova hudba budoucnosti.

Problém poslechu
Ke srozumitelnému zaznamenání hlasu stačí velmi málo asi 8bitový mono záznam
při 22 kHz a bezeztrátové kompresi. Pokud ale chceme kvalitně poslouchat
hudební nahrávku, je vhodné využít CDDA specifikace. Klasické stereo, tj.
ukládání dvou stop, jedné pro každou stranu (L/P), je využíváno ve velké míře
již od šedesátých let.
Ztrátové kodeky využívají buďto tohoto "klasického" sterea, nebo tzv. "joint
stereo", kdy je informace o obou kanálech ukládána jen pro jeden a rozdílově
vyvozována pro druhý.
Experimenty s prostorovým zvukem ve formátu "kvadro" sahají do počátku
dvacátého století. Pak byly obnoveny se zdokonalením analogového záznamu a nyní
mají zažívat reminiscenci v digitální době. Prostorového zvuku lze dosáhnout i
u obyčejné stereo nahrávky s využitím DSP zařízení. Pravý vícekanálový zvuk
vyžaduje formát, který ho je schopen podporovat (WMA, Ogg), a přehrávací
zařízení. Existují však názory, podle nichž není takového zvuku potřeba.
Především kvůli nedokonalosti lidského vnímání, situacím, ve kterých k vnímání
hudby dochází, a zažitému stereotypu.

Slovníček
Streamování přenos multimediálních dat po síti a jejich přehrávání na cílovém
zařízení v reálném čase. Není nutné stáhnout celý soubor s daty, ale jen jeho
malou část, aby mohla být interpretace spuštěna. Lze tak realizovat mj. přímé
přenosy.
DRM Digital Rights Management: Systémy, které se starají o přidělování a
udržování práv k digitálnímu obsahu. DRM rozhoduje o tom, kdo, kde, kdy a za
jakých podmínek je oprávněn využívat jimi vybavená data. DRM je složitý systém,
který pro svou správnou funkci obvykle vyžaduje souhru mnoha různých komponent.
Kodek Software obsahující algoritmy pro převod dat z jednoho formátu do jiného
kódování a dekódování. Smyslem kodeku obvykle je snížit celkovou velikost dat
nutných pro přenos a interpretaci jejich obsahu. Kodek je tak implementací
komprimačního algoritmu pro danou platformu. Audikodeky rozlišujeme do dvou
skupin na:
ztrátové
bezeztrátové
Druhá ze skupin je starší. Data jsou komprimována tak, že je lze rekonstruovat
bezezbytku do původní podoby. Nedostatkem je, že takto lze docílit pouze
určitého stupně komprese. Zejména v případě médií, která jsou vnímána snadno
oklamatelnými lidskými smysly, jsou častěji využívány ztrátové kodeky. Ty data
upravují tak, že při rekonstrukci není obnoveno to, čeho by si příjemce
informace stejně "nevšiml". Asi nejznámějšími ztrátovými algoritmy kódování
multimédií jsou MP3, WMA, MPG, JPG; bezeztrátovými pak PNG, původní Indeo
(AVI), rodina používaná pro kompresi zvuku WAV.
DSP Digital Signal Processing: Digitální zpracování analogových dat, které
třeba v případě zvuku umožňuje jeho korekci, úpravu, změnu tónů, výšek,
formování zvukové obálky, odstranění šumu. V dnešní době se jednoduchá DSP
zařízení montují i do těch nejlevnějších přehrávačů, vyspělejší pak můžeme
najít v mnoha jiných, se zvukem pracujících zařízeních.

Nejpoužívanější formáty pro digitální záznam zvuku
MP3 Kodek původně derivovaný z formátu videa MPEG. Nabízí dvoukanálový záznam
zvuku v kvalitě odpovídající nebo převyšující CD s pevnou, nebo pohyblivou
vzorkovací frekvencí. V současné době je považován za nejrozšířenější kodek
tohoto typu.
WMA Alternativa k MP3 od společnosti Microsoft. Má podobné vlastnosti, ale
integrované DRM. Je proklamováno, že WMA je kvalitnější než MP3 a že nabízí
stejnou kvalitu při nižší vzorkovací frekvenci. WMA je stejně jako MP3
podporováno řadou hardwarových přehrávačů a softwarová podpora je integrována
do moderních verzí Windows. Poslední je verze 9, kterou je možné si bezplatně
stáhnout z webu výrobce.
AAC Advanced Audio Coding. Opět komerční konkurence k MP3. Tento formát také
nabízí vyšší kvalitu, avšak zejména v našich krajích není tolik rozšířen. Ogg
Vorbis GPL verze audiokodeku. Na rozdíl od předchozích je volně šiřitelný,
otevřený a nezatížený žádnými licenčními poplatky. V současné době se jedná o
jakéhosi "černého koně" na poli kódování zvuku. Jeho budoucnost je ovšem jen
stěží odhadnutelná.
RA Real Audio. Další z komerčních formátů jednu dobu prakticky ovládal oblast
streamovaného audia na internetu. Dnes je využíván méně kvůli existenci
konkurenčních řešení (např. ASF/WMA).

Zajímavé odkazy
http://www.ogg.org server projektu Ogg Vorbis
http://www.microsoft.com/windows/windowsmedia domácí stránka formátu WMA
http://www.apple.com/music/store obchod s digitální hudbou společnosti Apple,
který využívá formát AAC

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.