Prostě Ouvertura: O empétrojkách a lidech

1. 11. 1999

Sdílet

Formát mp3 se narodil v roce 1991 jako třetí přírůstek do rodiny standardů prokompresi zvukového záznamu. Pupeční šňůru přestřihli zkušení porodníci z Fraunhofer Institut Integrie...
Formát mp3 se narodil v roce 1991 jako třetí přírůstek do rodiny standardů pro
kompresi zvukového záznamu. Pupeční šňůru přestřihli zkušení porodníci z
Fraunhofer Institut Integrierte Schaltungen a do rodného listu vepsali nevábně
znějící jméno MPEG layer 3, zkráceně mp3. Příjmení MPEG (Moving Pictures
Experts Group) zdědila po otci standardu pro kódování videozáznamu, jehož
zvukovou složku představuje; zatímco její křestní jméno říká, že se králi
digitálního videa narodila jako třetí a nejmladší dcera, a je tedy, jak se píše
v každé správné pohádce, ze všech potomků nejschopnější. Důvodem, proč
empétrojka přišla do multimediálního království počítačů, byla snaha zajistit
uživatelům kvalitní zvuk při co nejmenším objemu dat.
Principem, jak se z kilogramu zvukového záznamu podaří získat méně než sto
gramů záznamu v prakticky stejné kvalitě, je ztrátová komprese založená na
pečlivě shromážděných znalostech o vnímání zvuku lidských uchem. Jednoduše
řečeno, originální záznam je podroben kompresnímu algoritmu, v jehož průběhu
přijde o všechny složky, které lidské ucho za daných podmínek není schopno
postřehnout. Nejdůležitější částí algoritmu je metoda temporal masking
využívající vedle omezeného frekvenčního rozsahu ucha i další meze a
setrvačnost jeho vnímání, kdy ucho vedle hlasitého tónu jedné frekvence není
schopno odlišit slabší tón jiné blízké frekvence, a to dokonce ještě i určitou
dobu po odeznění silnějšího signálu. Jakého kompresního poměru dosáhnete,
záleží na tom, jak kvalitního výstupu se chcete dobrat. Ten bývá obvykle
charakterizován tzv. bitrate (datovým tokem), čili kolik bitů je obětováno na
jednu sekundu záznamu, šířkou pásma neboli rozpětí frekvencí, které se z
původního záznamu berou v úvahu, a počtem zvukových kanálů. Zatímco datový tok
ze zvukového CD bývá 1 400 Kb/s, po převedení do mp3 se téměř stejného výsledku
dosáhne už při 128 Kb/s, takže kompresní poměr je zhruba 1:12. S klesající
kvalitou výstupu kompresní poměr roste, takže pokud si doma archivujete své
telefonní hovory, dosáhnete při archivaci v mp3 stejné kvality při kompresním
poměru 1:192. Úspora místa je tedy dosti značná a není divu, že zvukový formát
mp3 brzy začal dobývat Internet.
Na čerstvě opanovaném území se však brzy objevily temné siluety obránců
autorských práv, které se pustily do pronásledování nového zvukového fenoménu s
neúprosností právě podvedené manželky. Nejčastěji přijímaný výklad otázky
autorských práv se přesto dá shrnout do pouhých dvou vět. Od legálně pořízených
(zakoupených) nahrávek máte právo si pro vlastní potřebu pořídit kopie v
libovolném podobě, ať je přepíšete do notového záznamu v provázkovém písmu Inků
anebo do digitální podo-by mp3. Jakmile ovšem takto pořízené kopie umístíte na
server a dáte vplen internetovému lidu, začínáte si zadělávat na slušivou
momentku v policejní databázi (tedy alespoň teoreticky). Důkazem, že řada
tvůrců stránek nočními můrami z houkajících aut, placatých čepic a dobře
nabroušených obušků rozhodně netrpí, je fakt, že dnes už prakticky každé warez
doupě obsahuje sekci s názvem mp3z. Samozřejmě že to neznamená, že každá mp3,
na kterou na Internetu narazíte, je corpus delicti nějakého zločinu, ba naopak,
řada hudebníků a vydavatelů je na své stránky umisťuje záměrně jako určitý druh
reklamy či nabídky zboží.
Dnes už je po datovém poli Internetu roztroušeno na miliony émpetrojkových
kvítků a najít mezi nimi ten, který voní právě vám, není leckdy jednoduchá
záležitost. Existují sice vyhledávací služby, specializované výhradně na
pátrání po mp3 souborech, ale nejspolehlivější způsob, jak získat empétrojky
právě těch vašich favoritů, je, po vzoru Mata a Pata, si "urobit sám". Věřte,
že stačí jen málo a je to.

Věta první: Grabbery

Tvorba vlastní empétrojky se skládá přesně z tolika kroků, kolik stupňů má
pětistupňové chilli Neda Flanderse. Pro ty, kterým názvy Springfield a
Simpsonovi nic neříkají, doplním, že správná odpověď je ze dvou.
V tom prvním musíte nahrávku převést z nosiče na pevný disk, přičemž výsledkem
obvykle bývá soubor ve zvukovém formátu wav lidově řečeném wavka, která
představuje naprosto věrný digitální záznam v poměru 1:1. Máte-li nahrávku
kdekoliv jinde než na cédéčku, jediný způsob, jak ji převést, je pořídit záznam
přes zvukovou kartu. K tomu vám postačí ten nejobyčejnější zvukový editor,
kablík do zástrčky Line In a pak pochopitelně nějaký ten kazeťák, magnetofon,
fonograf nebo jiné zařízení, z něhož lze vyloudit zvuk. Pokud ovšem převádíte
nahrávku z CD, máte ještě jinou a mnohem lepší možnost. Programy s obecným
názvem grabbery (s úžasným českým ekvivalentem rýpače) jdou na věc jinak. Pokud
pořizujete záznam přes zvukovou kartu, pak se digitální signál z CD-ROMky
převádí na analogový a na zvukové kartě znovu zpětně digitalizuje. Tento postup
ale vždy znamená, že výstup se obohatí o nějaký ten šum. Grabbery zvukovou
kartu ke svému životu vůbec nepotřebují a přepisují audiostopy z cédéčka na
pevný disk bez sebemenší ztráty kvality postupem zvaným grabování. Bohužel ne
všechny CD mechaniky jsou takovémuto převodu nakloněny a některé se přímo
vzpírají. Pokud na adrese www.mp3.com/cdrom.html najdete ve sloupečku "Can Rip"
u vaší CD-ROMky poznámku "No", máte prostě smůlu. Pokud vaše mechanika ale
ještě nestačila oslavit osmnáct měsíců života, tento problém se vás s největší
pravděpodobností nikdy týkat nebude a na hard disku se vám budou objevovat jen
samé povedené "wavky". Jediné, co se od vás očekává, je nastavit ve vašem
grabberu atributy výsledného wav souboru, což v případě CD kvality obvykle
znamená zvolit 16bitový záznam (každý vzorek, okamžitý záznam zvuku,
reprezentuje šestnáctibitové číslo), vzorkovací frekvenci 44 100 Hz (počet
zaznamenaných vzorků za sekundu) a stereo (tedy dva zvukové kanály). A
pochopitelně nikdo za vás nerozhodne, který program ke grabování použít.
Ta nejohmatanější láhev v baru "U nejlepšího grabberu" nesla dlouhou dobu
vinětu s nápisem WinDAC. WinDAC má na straně jedné velmi jednoduché ovládání,
na straně druhé umožňuje pohrát si s řadou parametrů vlastního grabování a
pořídit věrný záznam i z nevhodné mechaniky, nicméně v poslední době začíná v
porovnání s ostatními trochu ztrácet dech. Z těch, které se pokouší zaujmout
jeho místo, je zapotřebí zmínit výborný Audiograbber, jenž má dobré ovládání,
umí normalizovat zpracovávaný záznam, tzn. vyrovnává rozdílné hlasitosti
jednotlivých nahrávek, odstranit pauzy před i za hudební stopou, a pokud máte
vhodný encoder (program na kódování do mp3), nezastaví se u pouhé wavky, ale
rovnou vám vytvoří mp3. Poslední verze má také podporu CDDB, umí se tedy přes
Internet spojit s databázemi vydaných CD, identifikovat grabované album podle
jednoznačného kódu, který každé hudební CD nese, a přiřadit stopám správné
jméno skladby či písničky. Z dalších zajímavých funkcí bych zmínil schopnost
otestovat bezchybnost čtení dat z CD-ROMky, analogové čtení dat pro
negrabovatelné mechaniky, vytváření ID3 tagů a vytváření seznamů skladeb.
Spojením tohoto grabberu s encoderem, vytvořeným firmou Xing technologies,
vznikl vynikající program AudioCatalyst. Ze zbývajících grabberů je snad
zajímavý ještě Easy CD-DA Extractor, který podporuje řadu vnějších encoderů,
dokonce i encoderů jiných formátů než mp3, a vytváří mp3 přímo, aniž by se
zdržoval vytvářením dočasného wav souboru jako ostatní grabbery.

Věta druhá: Encodery

Pokud si váš grabber úspěšně zchladil žáhu na předhozeném cédéčku a obohatil
pevný disk o několik čerstvě narozených wavek, nastal nejvhodnější čas pro
vypuštění encoderu.
Encoder je program, který převádí zvukový záznam z nezkomprimované podoby
formátu wav do komprimované podoby mp3. Opozitem encoderu je decoder, smyslem
jehož existence je naopak převádět záznam z mp3 zpět do wavky.
Encoderů existuje celá řada. Vzájemně je lze porovnávat z několika hledisek,
ale těmi základními (pochopitelně odhlédneme-li od všudypřítomného hlediska
zvaného cena) jsou doba trvání komprese a kvalita výstupu v porovnání s
originálním záznamem. Za jak dlouho daný encoder přetvoří wavku do mp3 a v jaké
kvalitě, závisí zčásti na algoritmu komprese a zčásti na podmínkách, které si
sami stanovíte. Samozřejmě také platí, čím výkonnější počítač, tím lépe.
Srdcem každého encoderu je takzvaný kodek, na němž leží největší tíha
odpovědnosti, jakže to všechno vlastně dopadne. Kodek je v podstatě vlastní
kompresní algoritmus, který encoderu říká, jak má s originálním záznamem
naložit, co zahodit a co ponechat. Za nejlepší kodek se obecně uznává ten
vyvinutý Fraunhoferovým institutem a využívá jej většina z těch lepších
encoderů.
Parametry, do kterých můžete mluvit a dokonce mít při tom dojem, že něco
opravdu ovlivňujete, jsou velikost bitrate (datového toku) a způsob naložení s
kanály (pochopitelně těmi zvukovými). Obyčejně přijímaným standardem, kdy už
neinformovaný jedinec přestává rozeznávat, zda se mu přehrává záznam z
klasického CD anebo z mp3, je bitrate 128 Kb/s. Obecně platí, že čím menší
bitrate při tvorbě mp3 zvolíte, tím bude sice výsledná mp3 menší, ale o to méně
kvalitní. U mp3 s bitrate pod 128 Kb/s už většinou poznáte, že záznam není to
pravé ořechové, a bitrate kolem 64 Kb/s a nižší se hodí pouze pro potřeby
polohluchých babiček. Naopak, hudební labužník s křišťálově vytříbeným sluchem,
trpící při pomyšlení jakéhokoliv pokřivení nebesky dokonalých tónů originálního
CD, může směle nasadit bitrate kolem 192-256 Kb/s (to podle míry oné
vytříbenosti). Kvalitu výstupu můžete do jisté míry ovlivnit i tím, jak vašemu
encoderu přikážete naložit s kanály, přičemž nejlepší výsledky dává obyčejně
volba joint stereo. Zvolit při kompresi volbu stereo je dobrým tahem v případě,
že kódujete wavku, která není produktem grabování, ale kterou jste pořídili
záznamem přes zvukovou kartu.
Z jakých encoderů je tedy možné si vybrat? Nejstarším, a zřejmě i tím
poskytujícím nejkvalitnější výstup, je L3Encoder od Fraunhofer Institutu. L3Enc
je dosovský program a jako takový jej ovládáte z příkazové řádky (existují
ovšem i utilitky, které mu dodají o něco příjemnější rozhraní). Cenou za
oslnivou kvalitu výstupu nejen při vysokých bitrate (umí až 256 Kb/s), jež se
téměř blíží dokonalosti zvlášť pokud použijete volbu HQ (high quality), je
ovšem čas, který L3Enc na kompresi spotřebuje. Konkurentem přistupující k věci
z opačného hlediska je Xing mp3 Encoder. Xing vyvinul originální kodek, jenž je
naopak založen na maximální rychlosti komprese a je postaven na technologii VBR
(variable bitrate), kdy bitrate empétrojky není konstantní, ale operativně se
mění. Zatímco výšky, alias vyšší kmitočty, musí být kódovány s vyšším bitrate,
protože jinak dojde ke zhoršení záznamu, nižším kmitočtům nikterak neuškodí
kódování s nižším bitrate, a tak výsledkem je menší velikost výsledné mp3 při
zachování původní kvality oproti mp3 s konstantní rychlostí. Z rodinky
encoderů, založených na patentovaném Fraunhoferově kodeku, je dobré zmínit se o
Audioactive Production Studio nebo o MPEG Layer-3 Producer professional, které
jejich tvůrci vyšperkovali několika zajímavými funkcemi. Zatímco předchozí
programy hrdě kráčí v palbě warezu pod vlajkou shareware, následující dva nesou
na své virtuální navštívence omamně znějící heslo freeware a jsou tedy zadarmo.
Jmenují se MpegEncoder a Blade\s MP3 Encoder. Autoři vyvinuli své vlastní
kodeky a oba mají velmi podobné rysy. Doba kódování je poměrně dlouhá a zatímco
při vysokých bitrate jsou výsledné mp3 velmi dobré, se snižující se bitrate
jejich kvalita ve srovnání s produkty ostatních encoderů, získaných za stejných
podmínek, výrazně upadá.
Aby nebyly tak úplně opomenuty decodery, jejichž uplatnění je výrazně nižší,
jmenujme alespoň L3Decoder, který je rodným dvojčetem L3Encoderu od
Fraunhoferů, nebo funkci v přehrávači mp3 Winampu.

Věta třetí: Přehrávače

Pokud se vám úspěšně podařilo získat nějaký soubor typu mp3, musíte si ještě
obstarat software, který vám umožní empétrojku přehrát. Takovým programům se
obvykle říká přehrávače (playery). Základní podmínkou, aby vám tyto programy
mohly vůbec něco přehrát, je mít rychlejší počítač. Přesněji řečeno, obvykle
udávaná minimální konfigurace je Pentium na 100 MHz s 8 MB paměti. Procesory
řady 486 a slabší už dekódování mp3 v reálném čase nestíhají, což se v praxi
projeví pauzami a trhaným výstupem. Jste-li ale hrdým majitelem Pentia, stačí
si vybrat některý z dostupných přehrávačů, nainstalovat si jej a pak jste právě
zapíchli svou vlaječku do šošolky empétrojkového světa. Většina lepších
přehrávačů navíc umožňuje přehrávat řadu dalších zvukových formátů včetně
zvukového CD a vkládat do souboru mp3 dodatečné informace ve formě takzvaných
ID3 tagů, které slouží k zaznamenání jména skladby, interpreta, alba a krátkého
komentáře, a lyrics tagů, do nichž je možné vložit text písně, který pak
přehrávač zobrazuje při přehrávání mp3 ve zvláštním okně a podle časových
značek zvýrazňuje aktuální úryvek.
Za nejlepší (nejen) mp3 přehrávač je většinou uživatelů pokládán Winamp od
firmy NullSoft. Winamp podporuje velké množství zvukových formátů, umí přehrát
VBR mp3 a má mimo desetipásmového ekvalizéru pestrou škálu funkcí (regulaci
balance, vlastní ovládání hlasitosti, autorepeat, přehrávání skladeb v náhodném
pořadí, osciloskop, vytvoření wav souboru ze vstupní mp3 v reálném čase a
další). Další jeho předností je výborně udělaný editor seznamů skladeb. Winamp
podporuje a dovoluje editovat ID3 tagy, které umožňují do mp3 souboru vložit
dodatečné informace. Dalšími vynikajícími funkcemi, díky nimž je Winamp
oblíben, je podpora pluginů, dodatečných knihoven, které rozšiřují jeho
schopnosti, a takzvaných "skins", jednoduše vyměnitelných podob přehrávače. V
podstatě se dá říct, že Winamp si můžete sami nakreslit, ale pokud se vám do
toho nechce a standardní vzhled se vám příliš nezamlouvá, na jeho domovské
stránce si můžete vybrat z téměř 2 500 možností.
Pokud některé přehrávač mohou konkurovat Winampu, pak jsou to Unreal player
Max, K-jÖfol a Sonique. Unreal player Max je sharewarový produkt firmy 303tek a
verzi od verze se svými schopnostmi Winampu přibližuje. Umí přehrát ještě
pestřejší řádku zvukových formátů než Winamp, má pěkný editor seznamů skladeb,
řadu efektů, podporu lyrics tagů a mnoho dalšího. Velkou předností je
optimalizace i pro MMX a neintelovské procesory. Druhým ze skupinky lovců
Winampu je K-jÖfol spáchaný firmou Aegis. Mezi klady tohoto stále lepšího
freewarového programu patří 32pásmový ekvalizér, pěkný design, který umožňuje
rozmístit si jednotlivé ovládací prvky tak, jak se vám líbí, ovládat rychlost
přehrávání, schopnost přehrávat mp3 ve VBR formátu, oproti Winampu (ten
vyžaduje plugin) dokonce i záznamy ve VQF a AAC formátu, kterým zřejmě patří
budoucnost, a v neposlední řadě i poměrně malá zátěž procesoru během
přehrávání. Posledním z těch, jež se pevně drží Winampu za virtuální kotník, je
freeware Sonique. Je to graficky velmi pěkně zpracovaný přehrávač podporující
spoustu zvukových formátů, má vlastní dvacetipásmový ekvalizér, pestrou škálu
přehrávacích funkcí a zabudovaný dekodér. Ze čtyř doposud zmíněných přehrávačů
však vykazuje nejvyšší zatížení procesoru.
Na závěr si dovolím poznámku o tom, že přehrávače mp3 už nemají jen podobu
softwaru na vašem mp3. Řada firem uvažuje o tom, že bude vyrábět kapesní mp3
přehrávače, a některé se k tomuto dokonce již odhodlaly. Nejznámějším je
přehrávač firmy Diamond jménem Rio a podle recenzí mp3 přehrávat opravdu umí.
Rio si dovede nahrát do paměti mp3 z PC přes paralelní port a zvládne to i
opačně, bohužel kapacita paměti není prozatím příliš velká (32 MB), takže se do
ní bez externí karty vejde asi osm písniček. Krom okrouhlé sumičky 150 dolarů,
které si za něj Diamond žádá, je to zřejmě zatím jediná výraznější vada,
zabraňující významnějšímu rozšíření přehrávače mezi prostý lid.

Finále: Boj o žezlo

Jakkoliv je formát mp3 v současné době nejrozšířenější a nejpoužívanější, dá se
s jistotou říci, že doba jeho panování v říši komprimovaného zvuku nebude
neomezená. Už v dnešní době vyvinuly některé firmy formáty, které MPEG layer 3
v řadě ohledů předčí. Hlavní úsilí je napřeno na vývoj formátů s
propracovanějšími technologiemi ztrátové komprese, které by zajistily dobrou
reprodukci i při nízkých hodnotách bitrate a umožňovaly tedy kvalitní přenos
zvuku po Internetu. Dosavadní jedničkou v oblasti zvuku při velmi nízkých
datových tocích, která ještě dlouho zůstane nepřekonána, je RealAudio, ale
zpoza obzoru záznamů v CD kvalitě už k němu pomalounku začíná doléhat funění
několika nových formátů. Těmi nejčastěji zmiňovanými, a využitými při vývoji
zbrusu nového standardu pro kódování audiovisuálních objektů MPEG-4, jsou
formáty s poetickými názvy VQF a AAC.
Ten starší zakřičel poprvé na svět ve sklepeních laboratoří firmy Yamaha. VQF
(Vector quantization file) ušetří oproti mp3 při stejné kvalitě třetinu místa,
na rozdíl od ní ovšem neobsahuje zvukové stopy, vyžaduje výkonnější hardware a
má slabou softwarovou podporu.
Formát AAC (Advanced audio coding) původně vyvinula firma Astrid/Quartex. AAC
využívá nových přístupů k "ošizení" lidského ucha a v porovnání s mp3 dosáhne
stejné kvality záznamu při necelých třech čtvrtinách délky. Jeho výhody se ale
promítají hlavně do záznamů typu surround, tedy s větším počtem kanálů.
Další formáty, které se zapojují do souboje na tomto poli, jsou třebas PAC, A2b
music, nebo Liquid Audio. O tom, jestli některý z nich spláchne mp3 do
propadliště dějin, zřejmě rozhodne definitivní podoba druhé verze standardu
MPEG-4, respektive podoba jeho zvukové vrstvy, a pak samozřejmě ochota
jednotlivých firem vytvořit pro takový formát softwarové zázemí.9 0530/JL o

Relevantní odkazy

Stránky o mp3:
www.mpeg.org
www.mp3.com
mpx.system.cz
Vyhledávač mp3: mpx.system.cz/search.htm
Fraunhofer Institut: www.iis.fhg.de
Databáze CD: www.cddb.com
Texty písní: www.lyrics.ch
MPEG-4: drogo.cselt.it/mpeg/