Vhodná vyhledávací strategie je základem úspěchu

Textové vyhledávací technologie konečně začínají dospívat. Sofistikované algoritmy umožňují poměrně efektivně ...


Textové vyhledávací technologie konečně začínají dospívat. Sofistikované
algoritmy umožňují poměrně efektivně prohledávat jak převážně nestrukturovaná
data na webu, tak i organizovaná data ve firemních databázích a v intranetech
či extranetech. Ani této oblasti se však nevyhýbají problémy.
Samostatná vyhledávací řešení nasazovaná v praxi mohou fungovat až komicky
špatně. Například na webu firmy Monsanto nabízejícím zemědělské produkty vedlo
v době našeho testování při hledání výrazu "hnojiva" prvních 10 odkazů na
standardizované právní texty o odmítnutí odpovědnosti; nejvýše uvedených deset
záznamů týkajících se termínu "proudová stíhačka" na stránkách Boeingu vedlo k
již nevyráběnému letadlu a top 10 odkazů na výraz "Camry" na webu Toyoty bylo v
čínštině.
Pokud je ale textové vyhledávání integrováno do širšího rámce firemních
aplikací, pak bývá daleko úspěšnější. Může totiž vycházet i z dalších informací
například z profilů autorů, z příslušnosti do určitého oddělení firmy a podobně.

Možná nasazení
Kvalitní vyhledávání je podmínkou úspěchu v řadě oblastí webového podnikání.
Zřetelné je to u on-line obchodů, ale v podstatě to platí i pro jakékoli weby
se seznamy produktů nebo s nabídkou rozsáhlejších dokumentů.
Současné technologie nabízejí mnohé. K lákavým možnostem aplikace vyhledávání
patří:
Obohacení firemních webových stránek: Na mnohých z nich nějaké vyhledávání je,
ale většinou by mohlo fungovat podstatně lépe. Cílem je přivést potenciálního
zákazníka co nejrychleji k cíli pokud tedy například zadá jméno nějakého
produktu firmy, první položka ve výsledku by měla vést na jeho domovskou
stránku. Tak tomu ale často není.
Vylepšení on-line dokumentace: Pokud na webu poskytujete mnoho technických
informací, pak je navigace na stránkách nejspíše obtížná. Jestliže zákazníkům
pomůžete snadněji vyhledat to, co potřebují, pak jim i sobě ušetříte spoustu
času i peněz. Efektivní textové vyhledávání je k tomu nezbytné.
Lepší orientace v aplikacích: Předpokládejme, že zaměstnanec firmy hledá
informaci týkající se určité oblasti a objeví relevantní, ale povrchní údaje
vytvořené nějakým kolegou. Lze předpokládat, že pokud ho telefonicky
kontaktuje, bude schopen potřebné údaje zjistit. Takovéto vyhledávání znalostí
je nejen neocenitelné u globálních inženýrských a konzultantských firem, ale
napomáhá také objevit řešení obzvláště obtížných nebo důležitých problémů v
oblasti prodeje.
Dolování textu: Pravděpodobně máte k dispozici bohatou škálu textů a možná i
hlasových záznamů týkajících se zákaznických kontaktů ze servisních středisek,
call center, obchodního oddělení, z dopisů a e-mailů od zákazníků, případně i
nahrávky telefonních hovorů nebo záznamy z chatu. Jejich analýzou můžete
zjistit klíčové informace o segmentaci zákazníků, silných a slabých stránkách
produktů a jejich chybách. Je to sázka do loterie, protože nevíte, kolik toho
opravdu zjistíte, nicméně stejně jako u původní formy dolování dat jde o
riziko, které stojí za to podstoupit.

Technické zázemí
Veškeré výše uvedené aplikační scénáře závisejí na vztahu mezi textem a dalšími
druhy dat. Při samostatném vyhledávání textu jsou v dokumentech vyhledávána
slova či fráze, které jsou následně použity pro vyhodnocení tématu dokumentu.
Ale lingvistické techniky samy o sobě nejsou schopny poskytnout uspokojivé
výsledky. Proto všechny vyhledávače před érou Googlu nefungovaly nijak zvlášť
dobře; dokud Google nepřišel s efektivním způsobem využití dodatečných,
nelingvistických informací, nemohl prostě být problém relevance při vyhledávání
na webu vyřešen.
Řešení využívané Googlem pohled na oblíbenost odkazu není ovšem aplikovatelné
ve většině firemních prostředí. Firmy však mají přístup k velkému množství
jiných mimotextových informací. Dokumenty mohou být označeny údaji o datu
vytvoření, o autorovi, o předmětu a především o zamýšleném adresátovi a jejich
účelu. Zákaznické aplikace lze asociovat s ohromným rozsahem údajů o
zákaznících a produktech. Většinu těchto údajů lze nejlépe ukládat a sdělovat
pomocí SQL, LDAP (Lightweight Directory Access Protocol) nebo XML.
Klíčovým aspektem integrace textu s dalšími druhy údajů je systém pro správu
databází vybavený plným rozsahem funkcí. IBM i Oracle podporují syntaxi
"WHERECONTAINS", umožňující spojení textového vyhledávání a běžných relačních
dotazů do jediného SQL příkazu. A jelikož SQL systémy dnes ovládají rovněž XML
a LDAP, lze dosáhnout i potřebné integrace.
Specifické textové funkce stále často chybějí u obecných nástrojů pro vývoj
aplikací. Naštěstí to ale není až tak podstatné. Systémy pro správu relačních
databází totiž ukládají celý dokument jako velké binární objektové pole, takže
programátorům obvykle dostačují obecné technologie pro tvorbu SQL. Obtížnější
problém představuje integrovaná správa textu a tabulkových údajů. A ani
integrace bitmap do relačních databází zdaleka není triviální.
Přední výrobci systémů pro správu databází, jako například Oracle nebo IBM,
pokročili daleko v integraci textu a relačních databází. Microsoft, který
dlouho zaostával, slibuje, že se brzy dotáhne na zbytek pole. Budoucnost
vyhledávání tedy vypadá slibně.
Otázka zní: Měli byste zahrnout vyhledávání textů do svých aplikací? Pro
většinu firem zní odpověď ano. Textová data jsou všudypřítomná a důležitá pro
řadu oblastí podnikání. Náklady na integraci textů s dalšími typy údajů jsou
zvládnutelné a nabízejí řadu přínosů. Firmy, jež nemají žádnou strategii
týkající se vyhledávání textů, tak pravděpodobně nevyužívají možností IT naplno
a to zcela bezdůvodně.









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.