Asistent Sherpa – Mluv a bude ti rozuměno

Mobilní systém pro hlasovou interakci s názvem Sherpa by mohl změnit hlasové ovládání technologií. Největší průlom přinese do vyhledávání.

Asistent Sherpa – Mluv a bude ti rozuměno


Sherpa je hlasem ovládané uživatelské rozhraní, určené primárně pro mobilní zařízení. Jde o interaktivní aplikaci v principu obdobnou známým aplikacím Vlingo nebo Siri, která však přináší zásadní inovace.

Ty zásadně rozšíří využití hlasového ovládání. Zatímco Vlingo a Siri jsou primárně určeny k ovládání mobilního zařízení a jejich využitelnost mimo něj je mizivá, Sherpa je od začátku vyvíjen jako nástroj pro podporu transakcí. To je z pohledu byznysu klíčový rozdíl – pomineme-li úplně nejzákladnější překážku byznysového využití aplikací Siri a Vlingo, a sice jejich uzavřenost. Tyto aplikace nemají aplikační rozhraní, a nelze je proto integrovat do širších řešení.

Interakce člověka s počítačem je přes veškerý pokrok, jehož informační technologie dosáhly, dosud velmi nepřirozená. Klávesnice a myš představují limitující faktor pro zvýšení efektivity celého systému „počítač – uživatel“, ale Gartner přepokládá, že v roce 2020 bude na internetu polovina veškerých interakcí uživatelů s jejich výpočetními zařízeními prostřednictvím hlasu. Bude se to týkat především zadávání pokynů pro vyhledávání; je to logické, protože jde o relativně standardizovanou činnost, jejíž význam je zásadní a navíc stále roste. Právě tady se dá očekávat, že Sherpa přinese revoluční změny – zejména ve využití vyhledávání pro byznys.

Pojmy místo slov
Sherpa je systém, který využívá namísto slov pojmy, kdy každý z možných významů daného slova je reprezentován samostatným pojmem. Systém již při startu obsahuje přes čtvrt milionu pojmů a přes pět tisíc syntaktických a sémantických pravidel. Takové množství pojmů znamená, že s jejich využitím může být reprezentována drtivá většina vět přicházejících v úvahu pro interpretaci. Z toho vyplývá, že Sherpa je využitelný bezprostředně, bez jakéhokoli dodatečného vývoje.

Zatím je využitelný v angličtině a ve španělštině. Co se využití v různých jazycích týče, za pozornost stojí, že Sherpa je postaven na jazykově neutrální platformě vycházející z mezinárodního pomocného jazyka Interlingua. V dohledné době bude využitelný také jako simultánní překladač.

Největší výhodou nového systému Sherpa je možnost jeho integrace s transakčními systémy. Tyto systémy dodají kontext, který Sherpa vezme v potaz při formulování dotazu a při prezentaci nalezených výsledků vyhledávání. Sherpa tak bude asistovat při rezervacích jízdenek, letenek a ubytování či při nákupech v e-shopech anebo bude sloužit jako průvodce v samoobslužných systémech zákaznické péče.

Místo příkazů dotazy
Existující systémy pro rozpoznávání řeči, jako jsou Siri nebo Vlingo jsou skvělé nástroje, ale pouze v rámci svých omezení. Jsou zamýšleny jako nástroj k ovládání konkrétních zařízení, avšak mají sloužit jako doplňkový nástroj, a to pro ovládání jednodušších, jednoznačných funkcí. Dominantním směrem komunikace jsou u nich příkazy uživatele, což je samo o sobě limitujícím faktorem.

Sherpa naproti tomu nabízí neporovnatelně širší možnosti. Například umožňuje klást upřesňující dotazy, kdy následné hledání probíhá nad výsledky hledání předešlého. Navíc systém sám dokáže identifikovat otázku, která by mohla vést k upřesnění výsledků, a umí ji formulovat. Další výhodou je, že Sherpa ukládá preference uživatele v cloudu, což umožňuje nezávislost na používaném zařízení. Toto všechno jsou příklady důvodů, proč je Sherpa průkopnickým řešením, které stojí na počátku konce vyhledávání, jak jsme jej dosud znali.

Gartner očekává, že již v průběhu následujících tří až pěti let přestanou systémy pro rozpoznávání řeči vyžadovat změny v uživatelském chování (například typické dosavadní systémy pro převod mluvené řeči do textu vyžadují speciální mluvu – odsekávání slov a tempo pouze kolem 40 slov za minutu).

Také spolehlivost se zvýší ze současných cca 80 na zhruba 95 procent, což je na úrovni psaní na klávesnici v případě neškoleného uživatele. To umožní, aby hlas mohl začít fungovat jako primární rozhraní pro ovládání aplikací, a to nejen čistě počítačových.

Autor je analytik společnosti Gartner

Úvodní foto: © Ken Hurst - Fotolia.com



Vyšlo v Computerworldu 15/2012
Celé toto vydání lze zkoupit elektronicky








Komentáře