Přeložím to za vás...

Touha a potřeba, aby cizí text, jemuž z toho či onoho důvodu nerozumíme, přeložil stroj, jsou staré jako fantastická...


Touha a potřeba, aby cizí text, jemuž z toho či onoho důvodu nerozumíme,
přeložil stroj, jsou staré jako fantastická literatura a od nástupu samočinných
počítačů se začínají pozvolna naplňovat. S příchodem PC tato aplikace natolik
zlidověla, že dnes si ji může dovolit skoro každý. Překladač Eurotran je s námi
na trhu již několik let a v současné chvíli ho reprezentuje verze 2002.
Nejdříve se pojďme podívat na instalaci produktu. Pod Windows 2000 proběhla
zcela bez problémů. Když jsem však chtěl ještě něco dopsat na starém notebooku
s Windows 95 (se starým MS IE), překladač se sice nainstaloval, ale ihned po
spuštění vydal hlášení "Nelze vytvořit ovládací prvky". Volně vložený list v
manuálu tvrdí, že instalační CD obsahuje MS IE verze 5.0, který má řešit
některé problémy. Přitom v manuálu není nikde ani slovo, že minimální
konfigurace musí obsahovat MS IE 5 nebo vyšší.

Práce překladače
Práce s produktem je zcela intuitivní. Buď otevřeme soubor s výchozím textem
(txt nebo rtf) či založíme nový soubor, do kterého kopírujeme přes schránku z
libovolných dokumentů, které tento postup umožňují. Je-li dokument pouze v
tištěné podobě, musí nastoupit skener a OCR. Naštěstí většina jich je dodávána
s OCR produkty schopnými výstupu do formátu rtf. Ruční přepisování by zabralo
příliš mnoho času a výhody plynoucí z rychlého orientačního překladu by přišly
vniveč.
Po načtení spouštíme překlad buď celého dokumentu, jednotlivých odstavců či
vět. Překladač neprovádí pouhou substituci položek ze slovníku, umí položky ze
svého slovníku i ohýbat, tj. zadáme-li "with a large green apple", přeloží
správně "s velkým zeleným jablkem". Tato vnitřní analýza zvládá i delší výrazy
tvořené spojkami "a/nebo". Dále je schopen u sloves z vnitřního slovníku dávat
správný pád předmětu následujícího za slovesem. Po skončení automatického
překladu máme možnost úpravy cílového textu. K tomu je velmi příhodná funkce
paralelního rolování. Jak se pohybujeme při úpravách v cílovém textu, výchozí
text se pohybuje spřaženě, takže máme vždy před očima oba texty ve správném
místě.
Překladač má vestavěnu určitou vnitřní inteligenci. Slovník obsahuje ke
"speaker" 2 překlady: reproduktor a reproduktorový. Zadáme-li "speaker
current", přeloží správně "reproduktorový proud".
Produkt je také možné využít jako pomůcku při čtení elektronických souborů,
pokud čtenář má mezery ve znalostech terminologie. Poklepeme-li myší na neznámé
slovíčko, ve sloupci slovníku (viz obr. dole) se objeví překlad včetně všech
kolokací daného termínu, které slovník obsahuje.

Slovník
Manuál uvádí rozsah dodávaného slovníku 420 000 slov a slovních spojení.
Neuvádí, zda se jedná o celkový počet slov v obou jazycích nebo významových
dvojic. Podle práce s produktem lze usuzovat, že jde spíše o první možnost.
Slovník lze používat i v opačném směru překladu, tj. Č-A, ale pouze k hledání,
nikoli pro souvislý překlad což je z titulu produktu samozřejmé. Příjemnou
vlastností je zabudovaný stemmer (modul odvozující základní tvar slova), takže
při dotazu na překlad "přicházíte" nalezne správně infinitiv a následně jeho
překlad.
Pokud se podíváme na slovní kolokace, převaha je technického/ekonomického
charakteru, což odpovídá nejpravděpodobnějšímu nasazování produktu. Příjemným
překvapením je znalost i některých právnických termínů.
Pokud určitý termín v základním slovníku není, můžeme jej doplnit do
uživatelského slovníku (ve formátu txt). Těchto slovníků je možné mít několik,
avšak pro překlad se používá výhradně slovník aktuálně otevřený. Výhodou tohoto
jednoduchého formátu je možnost použít souborů vytvořených jinde, obsahujících
slovní zásobu ve formátu uspořádaných dvojic (nejčastěji XLS). XLS uložíme ve
formátu CSV a následně editorem nahradíme všechny středníky dvojtečkou. Takto
upravený soubor lze již otevřít jako uživatelský slovník. (viz obr. vlevo a
vpravo nahoře)
Při těchto činnostech musíme mít na zřeteli dvě omezení: jednak angličtina může
obsahovat maximálně 4slovná spojení, jednak do uživatelského slovníku bychom
neměli ukládat položky, které jsou již ve slovníku základním. Položky
uživatelského slovníku se totiž použijí výhradně v základním tvaru, odpadne
tedy výhoda správných předložkových tvarů zmiňovaná výše.

Poznámky a připomínky
Algoritmy zpracovávající složená slova se chovají občas nelogicky. Slovník zná
správně překlad k sitting room = obývací pokoj. Při tom ale sousloví "sitting
room furniture" přeloží jako "sedící pokojový nábytek". Slovník nejspíše
nezohledňoval frekvenci výskytu určitých překladů, např. "paid-up" bude v
převážné většině výskytů blíže významu "splacený" (ve slovníku není) než
uváděné "právoplatný".
Slovník obsahuje i některé velmi sporné položky, např. upholster furniture =
čalounovat nábytek. Bůh suď jak se do slovníku dostala, protože smysl slovesa
je přeložen správně. Při tom takovéto chyby lze chytit kterýmkoliv programem na
kontrolu pravopisu.
Vkládání sloves do uživatelského slovníku je ošidné. V kladném tvaru se budou v
překladu objevovat správně (rozezná se 3. osoba j.č., minulý čas), ale co je
horší, když se před nimi vyskytne zápor (do not, did not), překladač to
nezaregistruje a překládá větu jako kladnou.

Závěr
Lze jen souhlasit s větou, která vítá každého uživatele hned v úvodu manuálu:
"... program může být pro každého angličtiny neznalého uživatele dobrým
pomocníkem. Pochvalme autora, že se nenechal svést k superlativům, kterými
běžně marketingové texty jen přetékají. Díky schopnosti vnitřních algoritmů
vypořádat se s předložkovými vazbami není výstupem tak kostrbatý text, jak jsme
jej vídali v minulosti. Čtenář s určitou dávkou fantazie se nejen dozví hlavní
téma, ale může i přibližně sledovat celý text. (Odzkoušeno na několika
souborech okopírovaných z internetu s různou tématikou.) Program plní tedy svůj
slib a nepředstírá, že je něco víc. Na produkt, který by byl schopen nahradit i
velmi průměrného živého překladatele, si ještě dosti dlouho počkáme." Dovolím
si dodat, že i v prostředí, kde se pohybují pracovníci se středoškolskou
znalostí angličtiny, může tento produkt nalézt uplatnění: pokud technici doplní
uživatelský slovník o specializovanou terminologii, potom automatický překlad
bude sekretářce/asistentce účinně pomáhat ve správném směrování příchozích
e-mailů/elektronické dokumentace jednotlivým odborníkům.

Eurotran 2002D
Překladač dokumentů
+ modul odvozující základní tvar slova, množství kolokací i rozhraní
- instalace vyžaduje IE 5.0 a vyšší
Cena (bez DPH): 2 648 Kč
Poskytl: Microton, www.microton.cz









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.