Frekvenční slovník

Když se řekne frekvenční, tak si většina z nás představí nějaké elektrické či elektronické zařízení, oplývaj...


Když se řekne frekvenční, tak si většina z nás představí nějaké elektrické či
elektronické zařízení, oplývající ovládacími prvky, různými přepínači a
točítky. I dítě školou povinné už jistě ví, že rádiové vysílání, stejně jako
vysílání televizní nebo třeba satelitní, je vždy provozováno na určité
frekvenci, neboli kmitočtu. Ale může mít frekvenci např. anglický nebo český
jazyk? Tuto zamotanou záhadu se snaží rozmotat následující příspěvek.
Jak už bylo zmíněno v úvodu, frekvence se překládá do naší mateřštiny v
některých případech jako kmitočet neboli četnost kmitů. Tento český překlad
není samozřejmě všeobecně platný, protože slovo frekvence má svůj původ v
jazyce latinském. Ve tvaru přídavného jména frequens znamená plný, naplněný,
hojně navštěvovaný, četný. Podobně i ve tvaru podstatného jména, frequentia
znamená hojný počet, četný dav, zástup, hojnost, množství nebo velkou účast.
Běžně známé je přece třeba rčení: "Ta křižovatka je velmi frekventovaná."
Jak vidíme, všude, kde se vyskytuje slovíčko odvozené od frekvence, jde
většinou o to, že "něco je četné", že "něco je často". No a pokud jde o
veličinu frekvence, ta udává, jak často se něco vyskytuje, děje, tedy i ono
známé elektrické a rádiové kmitání. Co z toho plyne? Plyne z toho jednoduché
ponaučení, jednodušší než z kterékoli Ezopovy bajky, totiž že frekvenční
slovník je takový slovník, který je sestaven na základě četnosti (častého
výskytu) slov.
Zamýšleli jste se někdy nad tím, kolikrát průměrně za den vyslovíme třeba slovo
je? Asi ne, já vím, ale je to vhodný příklad. Bez použití slovíčka je by se
neobešlo ani tříleté dítě, ani stařeček, ani vysokoškolský profesor, stejně
jako třeba ten, kdo čistí městskou kanalizaci. Je (přesněji sloveso být) je
totiž slovem velice četným, frekventovaným, vyskytuje se v jazyce velmi často,
prakticky každý ho několikrát denně vyslovíme nebo ho vyslovit někým slyšíme.
Naproti tomu jsou v jazyce slova, která tak často nečteme a neslyšíme,
příkladem může být slovo nejneobhospodařovávatelnější nebo sopka. Se sopkou se
nemusíme setkat v mluveném nebo psaném projevu třeba i několik měsíců, aniž by
nám nějak výrazněji chyběla, že?
Výsledkem naší prosté úvahy je jednoduchý závěr, že každé slovo má svou určitou
četnost, jinak řečeno vykazuje častější či méně častý výskyt v mluveném nebo
psaném projevu, tedy určitou frekvenci.
Četností slov, o které jsme nyní hovořili, se zabývá jazykovědný obor, nazývaný
matematická lingvistika (matematická jazykověda). Zkoumá řadu parametrů u
různých druhů psaného a mluveného projevu. Mimo jiné se např. stará o to, jak
se liší slovní zásoba malých dětí a dospělých, jak se projevuje v používaném
slovníku u lidí jejich vzdělání, profese atd. Matematická lingvistika počítá
také frekventovanost slovních druhů, ale také třeba jednotlivých hlásek.
Matematická lingvistika může být ve svých výzkumech tak pestrá, jako je pestrý
samotný jazyk.
Převratem v matematické lingvistice se stal nástup osobních počítačů a
především vzestup jejich výkonů, přechod většiny komunikací na digitální
záznam, od dopisů a hlášení až po celé knihy a knihovny. Počítače dovolují
mnohem pestřejší a hlavně pružnější, opakovatelný výzkum jazyka.
Frekvenční slovník vzniká postupným sčítáním výskytů jednotlivých slov a jejich
tvarů. K tomu se využívá speciálních programů, které jsou schopny oddělit a
rozlišit slova, mají určitou schopnost "učit se", dokonalejší pracují i s
dvojicemi slov a slovními spojeními. Je samozřejmě nutné při výběru program
jaksi "vést" tím, že ručně určíme, která slova dávají smysl a která jsou pouze
zvláštními sekvencemi. Po průchodu určitou množinou slov (textů) vzniká
slovník, reprezentující optimální směs běžné mluvy a odborné terminologie.
Položíte si možná, nebo jste si již položili otázku: "K čemu je to dobré?"
Odpovědí a odůvodnění je několik. Jednou z nejpraktičtějších aplikací
matematické lingvistiky je zpracovávání frekvenčního slovníku pro cizí jazyk,
ve kterém se chceme naučit komunikovat nebo třeba v něm jen číst.
Použití frekvenčního slovníku při výuce má tu výhodu, že při postupu od
četnějších (frekventovanějších) slov k vzácnějším se s každým dalším slovíčkem
naše znalosti jaksi rychleji "rozprostírají" do šířky, než když se budeme
biflovat okrajové termíny. Na frekvenčním slovníku si můžeme také jednoduše
ověřit hloubku svých znalostí v jazyce. Postupem ve frekvenčním seznamu se dá
nalézt přibližná hranice, kde už nám znalosti neslouží tak dobře, až se nakonec
ocitáme v oblasti, kde máme stále více výpadků.
Pokud se například naučí student nováček v anglickém jazyce nejčetnější
anglické slovo, tedy určitý člen the, okamžitě zná v anglickém textu vlastně
8,6 % slov. Když k určitému členu přidáme ještě předložky of, in, for, to,
spojku and, neurčitý člen a a an, sloveso to be, dostáváme se rázem na hodnotu
21 % všech vyskytujících se slov.
Také na našem trhu se již několik let prodávají frekvenční slovníky, jak
běžného hovorového, tak i odborného jazyka v knižní podobě, jeden dokonce i
jako program na CD-ROM.
8 0964 / pah

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.