Rozšířené prohledávání firemní sítě

Intranetové portály sice mohou nabídnout jediný přístupový bod ke všem firemním dokumentům, avšak stále může doc...


Intranetové portály sice mohou nabídnout jediný přístupový bod ke všem firemním
dokumentům, avšak stále může docházet k tomu, že budou zaměstnanci ztrácet čas
hledáním obsahu, který potřebují, mezi tisíci (nebo snad i miliony) dokumentů.
Interpretací dotazů uživatelů, prohledáváním napříč různými datovými sklady a
prezentací výsledků s nejvyšší relevancí však mohou podnikové vyhledávací
stroje (Enterprise Search Engine, ESE) zjednodušit úlohy hledání odpovídající
informace ve správném kontextu bez ohledu na to, ze kterého zdroje pochází.
Technologie pro vyhledávání a indexaci bývají vestavěny do mnoha typů aplikací,
avšak obvykle umožňují nalézt data pouze v rámci asociované aplikace a nemohou
pátrat napříč různými sklady a archivy, jimiž podnik může disponovat. Naproti
tomu ESE systémy typicky prohledávají strukturované i nestrukturované informace
v mnoha různých formátech uložené ve všech zařízeních ve firemní síti.
Ve společnosti Anadarko Petroleum vedly obrovské objemy dokumentů Boba
Downinga, manažera obchodních systémů, k tomu, aby zde nasadil ESE řešení.
"Naši inženýři geologové a geofyzikové trávili zhruba 50 % času hledáním
informací ve více než 2 milionech dokumentů v našem intranetu," říká. Ve firmě
proto pro indexaci a prohledávání archivů obsahu nainstalovali RetrievalWare
společnosti Convera. ESE indexuje veškeré podnikové SQL databáze, intranet,
adresářové struktury windowsového souborového serveru a vše, co je uloženo v
systému pro správu obsahu od společnosti Documentum, jakož i několik on-line
zpravodajských zdrojů. Downing odhaduje, že příslušná skupina zaměstnanců nyní
díky novým vyhledávacím funkcím ušetří ročně zhruba 78 tisíc hodin práce.

Plno nových triků
Podnikové vyhledávací stroje používají pro nalezení správných výsledků mix
nejrůznějších technologií a produkty se stále vyvíjejí. "Mnohé z používaných
technologií už existují dlouhou dobu, nyní se však začínají objevovat první
praktické aplikace v komerční, resp. byznysové oblasti," říká Laura Ramosová,
analytička společnosti Giga Information Group.
Jádra ESE řešení obsahují stejné základní elementy, jako například běžné
internetové vyhledávací stroje: Křižují napříč podnikovým obsahem (lokalizují
dokumenty podle následujících hypertextových odkazů), indexují jej a následně
jej prezentují jako odezvu na dotazy uživatelů. Nicméně indexy mohou být
poměrně rozsáhlé.
Právní firma Dickstein Shapiro Morin & Oshinsky LLP má bezmála tisícovku
zaměstnanců a disponuje několika miliony dokumentů: Zhruba 2 miliony jsou
spravovány systémem Fulcrum KnowledgeServer firmy Humming bird a k dalším
několika milionům přistupují uživatelé prostřednictvím specializovaného
softwaru pro soudní subjekty. Databáze společnosti zahrnuje soubory uložené
jako dokumenty aplikací Word a WordPerfect, jakož i soubory ve formátu PDF.
Společnost navíc využívá obsah ze své proprietární CRM databáze a z dokumentů
obdržených od klientů a soudních oponentů. "Vzhledem k tomu, že advokáti
potřebují provádět také vyhledávání příbuzných slov, index vyžadovaný
vyhledávacím strojem činí 60 % velikosti uloženého dokumentu," říká Keith
Berkland, manažer pro vývoj aplikací.
Po počátečním procházení a indexaci používají vyhledávací stroje různé techniky
pro určování relevance. "První generace vyhledávacích strojů je založena na
mechanismu, při němž je do indexu zahrnováno velké množství věcí," říká
Ramosová. "Ve druhé jde už více o to, jak porozumět záměrům a požadavkům
uživatelů a jak lépe doručovat obsah."
"Hlavním problémem, se kterým jsme se potýkali, byla relevance výsledků
hledání," říká Brad Hochhalter, ředitel Permanente Knowledge Connection,
stránek klinické knihovny firmy Kaiser Permanente Health Plan. "V lékařské
oblasti existuje mnoho homonym ve významech termínů a množství synonym, je tedy
obtížné rychle najít relevantní odpovědi." Stránky poskytují 11 tisícům lékařů
a 50 tisícům podpůrných zaměstnanců organizace přístup k téměř 40 tisícům
interních dokumentů 170 lékařských časopisů, učebnic atd.
Hochhalter říká, že vyhledávací software společnosti Verity vracel pro jejich
účely neuspokojivé výsledky a uživatelé vyhledávání často vzdali. "Mohly jsme
změnit algoritmy v enginu nástroje Verity, ale rozhodování, které faktory a jak
vyhodnocovat, by mohlo mít nepředvídatelné důsledky." Dodává, že ladění
vyhledávacího stroje by bylo časově i pracovně náročné.
Pro zajištění lepších výsledků utratil Kaiser 28 tisíc dolarů za vyhledávací
řešení společnosti Google. Instalace obnášela umístění přístroje do racku v
datovém centru a zapojení 2 kabelů. Poté nastavili základní funkce a během
několika týdnů doladili výsledky hledání. Systém zanedlouho poskytoval výrazně
lepší výsledky, ovšem s jednou nevýhodou: Řešení Verity Kaiserovi umožňovalo
ukládat externí metadata pro popis dokumentu, zatímco Google pracuje s
metadaty, která jsou přímo integrována v dokumentu. V případě Verity tedy může
Hochhalter přidávat metadata bez otevírání každého dokumentu. Verity tak nadále
zůstává standardem v rámci firmy, i když Google je podle Hochhaltera lepší
volbou pro prohledávání knihovny lékařských dokumentů.
Další možností, jak nalézt správné informace, je použití vyhledávacího enginu
pracujícího s přirozeným jazykem ten uživatelům umožňuje klást běžné otázky
namísto hledání podle klíčových slov. Společnost LPL Financial Services používá
takové řešení od firmy iPhrase Technologies pro dodávání obsahu z jejich
portálu více než 4 tisícům agentů ve 2 100 pobočkách po celém světě. Produkt
podával výsledky s 60% relevancí ihned po instalaci, nicméně poté, co v LPL
strávili několik měsíců vkládáním specifických termínů firmy a laděním výsledků
hledání, se relevanci povedlo zvýšit až na 80 %.
"Naším cílem při nasazení nástroje v rámci portálu bylo zejména přesměrovat
některé z telefonátů, které byly určeny pro call centrum," říká Rochelle
Putnam, viceprezident centra služeb ve firmě. "Nakonec jsme ale zjistili, že
jej využívají i interní zaměstnanci pro zvýšení konzistence při zpracovávání
dotazů a snížení doby strávené voláním odborným poradcům pro získání odpovědí
na své otázky."
Kromě rychlejšího přístupu k existujícímu obsahu používají zaměstnanci LPL
systém iPhrase také k jeho vylepšení. Putnam říká, že mohou denně sledovat
otázky, které jsou makléři často kladeny, a zjišťují, zda portál obsahuje
materiály, jež potřebují. V případě, že ne, mohou příslušný obsah zpracovat a
připojit jej ke stávajícímu. "Vložíme takové dotazy do vyhledávacího nástroje
zjistíme, co odpoví," vysvětluje Putnam.

Hledání návratnosti
Pro opodstatnění nákupu ESE je třeba odhadnout míru zlepšení produktivity,
avšak provést takovou kalkulaci může být dosti obtížné, jestliže se časové
úspory pohybují v řádu minut nebo sekund nastřádaných v průběhu dne.
"Návratnost zde má specifické podoby v závislosti na konkrétních potřebách
firem, nelze tedy použít univerzální měřítko," říká Ramosová.
Downing byl schopen obhájit náklady na systém firmy Anadarko demonstrací
velkých časových úspor ve svém oddělení. Např. při nedávném prohledávání
archivu e-mailů za posledních 10 let pro vytvoření evidence bylo ušetřeno
zhruba 700 pracovních hodin. LPL posuzuje návratnost investic kalkulací redukce
telefonátů přicházejících do centra služeb.
Obecně se dá říci, že se ESE systémy vyplatí zejména ve firmách s vysokou
úrovní vzdělanosti uživatelů, kde je třeba často prohledávat velké objemy
dokumentů. Tam, kde je množství dokumentů na běžné úrovni, je podle analytiků
možné si vystačit s vyhledávacími mechanismy a adresářovými službami, které
jsou dodávány spolu s operačními systémy nebo aplikacemi.

Techniky pro ladění vyhledávání
Odstranění mnohoznačnosti: Jediné slovo může mít množství významů, takže ESE
systém musí být schopen mezi nimi rozlišovat.
Morfologie: Vyhledávací stroj musí rozumět tomu, jakým způsobem je slovo
použito ve větě dotazu uživatele.
Synonyma: Technologie musí zajistit také nalezení těch dokumentů, které
obsahují synonyma.
Hlasování: Mnohé z vyhledávacích strojů zahrnují rovněž mechanismus zpětné
vazby, díky němuž lze výsledky hledání zlepšovat tak, že mají uživatelé možnost
seřadit výsledky podle užitečnosti.
Lidská kontrola: Vyhledávací enginy mohou být vyladěny pro specifické potřeby
uživatelů v dané firmě prostřednictvím revize výsledků a lepším nastavením
jejich relevance.
Sledování kontextu: ESE může při vyhledávání analyzovat typ uživatele a
aplikace a podle toho stanovit relevanci.
Personalizace: Podnikové vyhledávací stroje mohou zvažovat výsledky na základě
přiřazených nebo zjištěných preferencí individuálních uživatelů či pracovních
skupin. Některé systémy se mohou také učit rozpoznávat preference v průběhu
doby na základě sledování typů odpovědí, na které uživatel po vyhodnocení jeho
dotazu klikne.

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.