Jak posuzovat počítačové slovníky a překladače

Následující text vychází především z poznatků zjištěných během mé diplomové práce na katedře informačního a...


Následující text vychází především z poznatků zjištěných během mé diplomové
práce na katedře informačního a znalostního inženýrství Vysoké školy ekonomické
v Praze.
V praktické části diplomové práce bylo mým úkolem posoudit jak
(polo)automatické překladače textů, tak i podpůrný slovníkový software. V rámci
první kategorie jsem testoval následující produkty: SKIK 3.0, PC Translator 9.0
a PC Translator 98, Transen 1.3 CZ, Eurotran 98 a Aces 3.0. Ve slovníkovém
softwaru se dostalo na Prodict 98, GED 6.1, YAP 4.0, LEDA a slovníky firmy
Commercial Service.
Soustředil jsem se především na pomoc, kterou tyto nástroje dokáží poskytnout
při překladu anglicky psaného textu, zabývajícího se ekonomickou problematikou.
Celá oblast nástrojů strojového překladu se velmi rychle vyvíjí. Výsledky této
diplomové práce budou jistě za rok či dva poněkud zastaralé, avšak principy a
hlediska, podle nichž se jednotlivé produkty hodnotí, zůstávají stejné.
V rámci víceméně uživatelského testu jsem posuzoval následující vlastnosti:
kvalita překladu
slovník
délka dat
snadnost instalace
uživatelská přívětivost
cena
Slovník a kvalita překladu
Základním kritériem pro velikost slovníku je počet slov, respektive rozsah
slovní zásoby. Jednotliví výrobci bohužel chápou tento pojem značně odlišně.
Kritérium slovní zásoby je velmi zkresleno rozdílným chápáním pojmu "slovníkové
heslo" někteří výrobci uvádějí jako jedno heslo např. slovo "go" a vše, co je
za ním, někteří však slovníkovými hesly rozumí i "podhesla" jako např. "go
behind", "go for", "go into", atd...
Někteří výrobci dokonce jako hesla zvláště počítají i jednotlivé slovníkové
dvojice "ekvivalentů", např. jak go jít, tak go jet, atd. Potom například
nemusí existovat žádný rozdíl mezi rozsahem slovní zásoby 100 000 slov u
výrobce, který počítal pouze základní hesla a např. 450 000 slov u výrobce,
který zahrnul pod pojem "slovníkové heslo" i všechna podhesla. Bohužel dnes
nemáme žádnou normu, která by s pojmem "slovníkové heslo" zacházela, a tak se
tedy mnoho výrobců snaží navodit mylný dojem a stále ohromuje potencionální
zákazníky "obří" slovní zásobou ve svých produktech.
Uživatelské slovníky
Aplikace obvykle umožňuje uživateli vytvářet si vlastní slovník. Zajímavou
otázkou je, zda by měla umožnit i zásahy do slovníku základního. Odpověď ano
znamená potenciální riziko řady překlepů a obtížně odstranitelných
inkonzistencí. Eurotran vše např. řeší tak, že zásah do základního slovníku
neumožňuje. Důsledkem je pak skutečnost, že nemůžeme měnit již jednou
předdefinovaná slova (můžeme je sice zadat do našeho uživatelského slovníku,
ale program stejně přednostně hledá ve slovníku základním).
Rozhraní
Standardně mají podobné programy uživatelské rozhraní v podobě dvou oken, v
jednom z nich je text zdrojový a v jednom výsledek programu. Pokročilejší
programy umožňují začátek výstupního textu editovat ještě za běhu programu tedy
ještě než se dokončí celý překlad.
Patrně jednou z nejlepších vlastností editoru Eurotranu je volitelný způsob
rolování textů uživatel si může nastavit synchronní rolování obou obrazovek,
což velmi usnadňuje orientaci.
Zajímavostí je také podoba PC Translatoru s třemi okny. Střední okno pak slouží
jako jakási pracovní plocha, kam program zapisuje postupně překládaná slova,
uživatel si vybírá správný význam, mění slovosled atd.
Některé slovníky umožňují i vyhledávání pomocí hvězdičkové konvence a logických
operátorů.
K nevýhodám patří skutečnost, že některé překladače umožňují zadávání textu
pouze ve formátu ASCII. Ne vždy je také dostatečně podporována prá-ce se
schránkou (zejména u verzí překladačů pocházejících ještě z DOSové éry).
Raritou v záporném smyslu je pak Transen 1.3 CZ, v němž již nemůžeme opravovat
text poté, co nám při postupném rolování utekl z obrazovky.
Další kritéria
Sem samozřejmě patří cena produktu, snadnost instalace, datová náročnost
slovníku...
Celkové hodnocení
Hodnocení slovníků a překladačů jsem prováděl především z hlediska uživatele
zaměřeného na texty ekonomického charakteru. Navíc jsem se soustředil především
na překlady do češtiny (Eurotran však neumí překládat texty z češtiny do
angličtiny, přičemž tato jednosměrnost je jeho zřejmě nejvážnější vadou).
Nejdůležitějším hlediskem při hodnocení počítačových překladačů je samozřejmě
výstup programu, tzn. kvalita překladu společně s cenou. Kritéria hodnocení
slovníků jsou obdobná jako u překladačů. Velmi důležitým faktorem je zde také
způsob vlastní práce se slovníkem a možnosti vytváření uživatelských slovníků.
Je samozřejmé, že pro relevanci hodnocení mají zásadní význam relativní váhy
jednotlivých kritérií stanovených v tabulce (kvalitě překladu u překladačů
odpovídá např. váha 30 %, stejně jako ceně). Pokud by tyto relativní váhy byly
stanoveny jinak, bylo by samozřejmě zcela odlišné i výsledné pořadí.
Přesto myslím, že některé z mých závěrů mají i obecnější platnost. Sem patří
zejména zjištění, že zatímco na poli nástrojů pro počítačovou podporu překladu
jsem shledal významné rozdíly, pořadí na poli slovníků nebylo zdaleka
jednoznačné (viz závěrečné tabulky). Velmi příjemným překvapením pro mě bylo,
že všech pět zkoumaných slovníků mělo velmi dobrý standard, rozdíly mezi nimi
byly velmi malé a kvalita překladů byla téměř bezchybná. O vzájemném pořadí tak
vedle kvality překladu a způsobu práce se slovníkem rozhodovala především cena
produktů, rozsah slovní zásoby, ale také takové nuance jako grafické zpracování
programu, způsob instalace a délka dat na disku.
Jelikož kvalita překladu a příjemnost práce se všemi slovníky byla velmi
podobná a nepříliš odlišná a jelikož všechny slovníky obsahovaly alespoň
přikoupitelné kvalitní ekonomické nadstavby, zcela překvapivě mohu doporučit k
užívání všechny posuzované produkty.
9 0604 / pah

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.