Rešerše místo překladu

Lingvistika a umělá inteligence se protínají hned několika způsoby. V Computerworldu 11/2003 jsme se např. zabývali Tu...


Lingvistika a umělá inteligence se protínají hned několika způsoby. V
Computerworldu 11/2003 jsme se např. zabývali Turingovým testem, kde je umělá
inteligence ztotožněna právě s porozuměním lidskému jazyku. Jaké jsou další
zajímavé jazykové aplikace?
Pokrok automatických překladačů postupuje znatelně pomaleji, než se zdálo ještě
v době první vlny komercializace aplikací UI v 80. letech. Automatické systémy
se dosud uplatnily především při zpracování specializovaných textů typu (mimo
jiné) celní dokumentace, které jsou psány poměrně chudou řečí.
Nejjednodušší překladače obvykle provádějí dosazování určitých hodnot
(parametrů) z textu do předem vytvořených "standardních" struktur;
předdefinovaná struktura se obvykle kryje se skutečným významem původního
textu, občas však vede k nedorozumění: Třeba informaci o katastrofálním snížení
grantů na výzkum záplav program mylně přeloží jako zprávu o přírodní katastrofě
(protože v ní jednoduchý překladač najde mnoho výrazů, které se mu ošidnou
shodou okolností přesně vejdou do hotové "šablony" na zprávy o pohromách).
Současný stav automatických překladačů ukazují např. stránky
http://www.cpen.com/Products či známá Babylonská rybka na
http://babelfish.altavista.com/. Nedostatky současných překladačů by neměly
zakrýt fakt, že poznatky získané při vývoji těchto aplikací našly uplatnění v
mnoha jiných oblastech příkladem jsou webové vyhledávače, systémy, s nimiž je
možné komunikovat v přirozeném jazyce nebo parsery XML. Problémy s počítačovým
zpracováním přirozeného jazyka však ukazují i na obecnější problém jistou
deziluzi z "velkých teorií".
Mladší lingvisté dnes proto často vystupují např. proti škole amerického
jazykovědce Noama Chomského (kritiku shrnuje stránka
http://language.home.sprynet .com/chomdex/rea44.htm). Chomského škola je svými
odpůrci chápána spíše jako kult než věda. Chomsky byl na poli počítačové
lingvistiky velmi vlivný, dokud šlo o teorie, v praxi se však jeho koncepce
ukázaly jako zjednodušené až nepoužitelné.
Také velké výzkumné projekty jako Systran (dnes služba Babelfish/Translate na
serveru AltaVista.com) a Eurotra byly do jisté míry negativně ovlivněny
zmíněnou nadvýrobou velkých teorií. Výsledkem byla předčasná ambice generovat z
textu nějaký "univerzální model" pojmů a vztahů a ten pak převést do
libovolného dalšího jazyka.
Veterán softwarového inženýrství Michael A. Jackson zobecňuje problémy
"univerzálních" metod a teorií na tvorbu softwaru vůbec. Ve své poslední knize
Problémové rámce (Problem Frames) zdůrazňuje, že metody, které slibují
zodpovědět jakýkoliv problém, se zpravidla moc neosvědčí na konkrétním
specifickém problému. Metody řešení softwarových problémů by se neměly snažit
pokrýt všechny možné aplikace a situace, přizpůsobení konkrétní kategorii
problémů je účelné.
I při počítačovém zpracování lidského jazyka se dnes lépe uplatňují koncepce
skromnější a jednoúčelové. Významným vedlejším produktem počítačové lingvistiky
je např. tzv. sémantický web (http://www.semantic web.org,
http://www.ontoknowledge.org). Dnešní automatické systémy se v tomto případě
snaží ne o překlad, ale o inteligentní shrnutí a zhodnocení obsahu textů.
Software Corporum norské společnosti Cognit (http://www.cognit.no) již koncem
90. let dokázal rešerší z mnoha webových pramenů dát dohromady pojednání o
Beethovenovi, které bylo nejméně tak dobré jako práce kontrolní skupiny z
posledního ročníku gymnázia.

Překlad tam a zpět
V dobách prvních automatických překladačů koloval následující vtip. Pokud stroj
přeloží "the Spirit is willing but the flesh is weak" (duch by chtěl, ale tělo
nemůže) tam a zpět, tak se z ruštiny asi vrátí "Theres a plenty of Vodka here,
but all the meat is rotten" (vodky je tu plno, ale všechno maso je shnilé).
Ještě dnes, o pár desetiletí později, vyrobí i Babylonská rybka (http://
babelfish.alta
vista.com/) tu a tam perličku ne zcela nepodobnou. Např. právě zmíněná věta
přeložená z angličtiny do francouzštiny a zpět vrací text "the Spirit is
willing, goal the flesh is weak".

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.