Vyhledávací stroje prorážejí bariéru zvuku

Vyhledávání v datech zaznamenaných formou textu je jedním z nejběžnějších způsobů využití počítače. Na obzoru...


Vyhledávání v datech zaznamenaných formou textu je jedním z nejběžnějších
způsobů využití počítače. Na obzoru se však objevují i technologie umožňující
prohledávat zvukové záznamy.
Sdělují vaši telefonní prodejci potenciálním zákazníkům všechny náležitosti,
které při tomto způsobu prodeje vyžaduje zákon? Jestliže vaše firma nahrává
svoje telemarketingové telefonáty, její IT oddělení může nainstalovat program
pro dolování dat z audiozáznamů, který umožní managementu prohledávat archivy
telefonátů, a tak na výše položenou otázku nalézt rychle odpověď.
Vyvíjené nástroje pro dolování dat z audiozáznamů, také nazývané systémy pro
indexování audia nebo programy na audio-vyhledávání, nabízejí zpracování řeči i
vyhledávací technologii v jednom. Program, který zpracovává řeč, tvoří index, v
němž označí časem a datem každé pronesené slovo či foném ve zvukovém souboru
ne-bo videonahrávce. Vyhledávací část programu potom použije tento index k
rychlé identifikaci a přehrání specifických pasáží. Program může také použít
tzv. metatagů (označení vyšší úrovně), které identifikují mluvícího nebo námět,
kterým se daný úryvek zabývá.
Přesnost zpracování řeči u těchto programů, které převádějí řeč na text,
pokročila do stadia, kdy firmy uvádějí na trh nové produkty pro indexování méně
formálních konverzací. Lze tak vyhledávat i v záznamech z podnikových porad, ve
videozáznamech ze školení a dokonce i v telefonních záznamech služeb helpdesků.
"Tato technologie, řekl bych, už pokročila do použitelného stadia," tvrdí
William Meisel, prezident společnosti TMA Associates, kalifornské výzkumné a
poradenské firmy pro rozpoznávání hlasu.

Rozumět všem
Na rozdíl od těch programů, které sice převádějí řeč na text, ale které mohou
být přizpůsobeny jednotlivým uživatelům, produkty na dolování dat z
audiozáznamů musejí být nezávislé na řečníkovi a to nejen pokud jde o zabarvení
jeho hlasu nebo rychlost mluvy, ale také např. o jím používanou slovní zásobu.
Nejenže spoléhají na velké odborné slovníky se specializovaným názvoslovím, ale
také se přizpůsobují různým typům konverzace (např. telefonní) nebo odvětví
(např. zdravotnictví). "I když nejnovější produkty mohou zpracovávat řeč ve
stejné nebo i ve větší rychlosti, než jak probíhá ve skutečném čase, výsledek
není ještě čitelný přepis," varuje Jackie Fennová, analytička společnosti
Gartner. Kromě toho, protože neustále vznikají nejen nové společnosti, ale i
produkty a slova, uživatelé musejí pravidelně aktualizovat svoje systémy, nebo
čelit "problému zastaralého slovníku", jak tento jev nazývá Francis Kubala,
vedoucí výzkumník firmy BBN Technologies z Cambridge.
Nástroje na dolování dat z audiozáznamů jsou nejužitečnější tam, kde index,
který je poté možno prohledávat, může nahradit doslovný přepis. Vyhledávání
informací pro marketingové účely v rozhovorech je tak zatím podle Meisela dosti
nereálné. "Zpracovávání rozhovorů na helpdesku je trochu složitější, protože s
nástroji na dolování dat z audiozáznamů můžete, ale nemusíte objevit něco
užitečného," vysvětluje Fenn.

Součást celku
Uvedená technologie může být nejvíc užitečná tím, že bude včleněna do jiných
aplikací. Například společnost Virage z Kalifornie nabízí ve svém systému pro
indexaci videa nazvaném VideoLogger program Fast Talk, který vyvinula firma
Fast-Talk Communication, a jako plug-in modul i Audio Indexer od BBN.
Pokročilejší systémy by podle analytiků jednou mohly propojit záznamy help
desků s prodejními aktivitami a dalšími informacemi o vztazích k zákazníkům.
Dolování dat z audiozáznamů ovšem nefunguje uspokojivě ve všech případech. Ted
Ryan, vedoucí vývoje společnosti Coca-Cola, říká, že chtěl tento systém použít
minulý rok pro vytvoření seznamu televizních reklam, ale mluvený komentář mu
kolidoval s hudbou. Protože dosáhl stupně přesnosti na úrovni pouhých 15 %,
raději se vrátil k ručnímu přepisování.
Společnost Coca-Cola také zkusila vytvořit seznam z audiozáznamů svých
zasedání. "Náš generální ředitel byl tehdy Kubánec. Když jsme tento systém
použili na ředitelovy projevy, vycházely z toho naprosté nesmysly," říká Ryan.
I když tento pokus nevyšel, Ryan říká, že by chtěl otestovat nejnovější
nástroje na indexování reklam v rádiu. "Je fakt, že se přesnost systémů
neustále zlepšuje," říká Kubala. Podle vlastních slov očekává, že se v příštích
třech letech bude počet chybně zaznamenaných slov dramaticky snižovat.

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.