Problém angličtiny aneb když jazykem nevládnete

6. 5. 2019

Sdílet

 Autor: © Olivier le Moal - Adobe Stock
Často se na AIW zaměřujeme na novinky v oblasti rozpoznávání přirozeného jazyka, kontextuálního vyhledávání a podobě – zkrátka oblasti, kde AI a ML hraje prim. Jenže mají svou nevýhodu: obvykle jsou totiž stavěny na anglický jazyk.

V květnovém čísle Computerworldu naleznete jako přílohu také náš AI World, a v něm rozhovor s velmi šikovnými studenty z ČVUT, kteří založili startup Alquist: ten se umístil jako druhý na soutěži Alexa Prize od Amazonu (dvakrát po sobě) a obdržel tak velmi prestižní ocenění mezi konverzační umělou inteligencí.

I tito pánové z České republiky však, samozřejmě, chatbota programovali specificky na použití v anglickém jazyce.

Proč?

Lokální čeština, globální angličtina

Na důvody není těžké přijít: jde o hlavní jazyk mnoha stovek milionů lidí (když počítáme Indii, tak miliard) a jako druhý jazyk pro další stovky milionů až miliardy lidí.

I proto je angličtina hlavní jazyk současného vědeckého poznání. Slavně to v 16. století řekl Karel V. Habsburský, císař Svaté říše římské: K Bohu mluvím španělsky, k ženám italsky, k mužům francouzsky a ke svému koni německy. Dnes je situace velmi odlišná, pro naprostou většinu světa je základem komunikace, která se neodehrává v jejich rodné zemi, angličtina. Naprosto běžné je to i v globálních firmách, třeba v telekomunikacích – manažeři běžně bývají cizinci, a se svými podřízenými musí mluvit anglicky.

V zásadě nejde o nic špatného, takovýto globální jazyk komunikaci značně usnadňuje.

Problém však je u těch, kteří angličtinu neovládají. Další velmi rozšířené jazykové skupiny – němčina, francouzština, ruština, čínština a podobně – jsou na tom ještě relativně dobře; mají dostatečné množství mluvčích, a především potenciálních zákazníků na to, aby se o ně firmy zajímaly. Ostatně, to je dobře vidět třeba u filmů nebo videoher: v angličtině jsou téměř všechny, do francouzštiny, němčiny a podobně je přeložena naprostá většina těch významnějších.

U češtiny je to poněkud méně. Něco přes 10 milionů není moc vysoké číslo, a tudíž obzvláště co se týče třeba kontextového vyhledávání nebo rozpoznávání řeči musíme spoléhat právě na angličtinu.

bitcoin školení listopad 24

Je zcela možné, že se dočkáme češtiny třeba pro Alexu nebo Siri. Nebo, možné – ono je to, na rovinu, téměř jisté. Jen to nebude hned, nebude to tak funkční jako v angličtině a především přídavků, uživatelských aplikací, bude to češtiny přeložených mnohem méně, a hlavně na tom staví současné IoT.

Nezbytné nutné je proto smířit se s dvěma věcmi: v globalizovaném světě dneška si s jedním jazykem člověk vystačí jen těžko. Druhý – ať už jde o jakýkoliv rozšířenější – výrazně zjednodušuje komunikaci. A za druhé, neméně důležitě, bychom si jako Češi měli být vědomi, že je u nás řada úspěšných startupů v IT oblastech – jen budou z většiny komunikovat v angličtině, protože český trh je zkrátka příliš malý.