Tma pod svícnem aneb informace skryté za humny

Co uděláte, když potřebujete něco najít na Internetu? Prostě spustíte prohlížeč, zadáte adresu oblíbeného vyhled...


Co uděláte, když potřebujete něco najít na Internetu? Prostě spustíte
prohlížeč, zadáte adresu oblíbeného vyhledávače a můžeme prohledávat Web.
Problém ovšem nastane, chceme-li něco podobného udělat v intranetu. Jak v něm
získat alespoň základní orientaci? Mezi jakými produkty a technologiemi můžeme
vybírat?
Kde je problém?
Pod svícnem bývá největší tma. Je to zvláštní, ale prohledávání vnitřní firemní
sítě je v jistém ohledu záležitostí podstatně komplikovanější než orientace v
Internetu. Informace může být ve vedlější místnosti dostupná hůře, než kdyby se
nacházela na druhém konci zeměkoule. Kromě jiného je to dáno tím, že pod pojmem
intranet nechápeme vždy pouze dokumenty ve formátu HTML, ale spíše
vnitropodniková data obecně byť je základní rozhraní dnes již obvykle webové.
Nástrojů je celá řada
K prohledávání našeho intranetu můžeme použít buď nějaký speciální nástroj,
nebo sáhnout do balíku našeho webového serveru.
Nástroje přitom posuzujeme hlavně podle formátů, s nimiž jsou schopné pracovat,
inteligence indexování a prezentace výsledků.
Pokud (respektive když) společnost pocítí potřebu moci rychle a efektivně
vyhledávat ve svých firemních datech, má většinou následující výběr buď použít
nějaký software, který je součástí jejich serverového balíku, nebo použít
software od třetích stran. Těchto "třetích stran" dnes existuje celá řada a
rychle přibývají další. Nabízejí většinou profesionální, komplexní (a často i
celopodnikové) řešení, což se samozřejmě na druhé straně projeví i v cenách za
tento typ aplikací.
Do kategorie profesionálních nástrojů pro prohledávání intranetu se řadí např.
Search 97 (Verity), AltaVista Search Enterprise Pack, InMagic IntraNet Spider
nebo UltraSeek.
Pokud ovšem nechceme zrovna profesionální řešení, ale nějaký jednodušší
software, který si sami nainstalujeme, spravujeme, a který nám poskytne většinu
požadovaných funkcí, můžeme sáhnout do serverového balíku našeho webového
serveru. Z těch nejpoužívanějších máme na výběr mezi QuickFinderem
(intraNetWare), Compass Serverem (Netscape Server) a Index Serverem (Windows NT
Server). Každý z těchto softwarů má svá pozitiva i negativa, takže pokud je
ještě na výběr, je dobré vědět nejenom to, co po softwaru chceme, ale i jestli
to náš kandidát vůbec umí.
Samotné hledání
Soustředíme se především na aplikace, které jsou součástí balíku webového
serveru. Nejzákladnější funkce vyhledávání mají pochopitelně všechny jmenované
nástroje. Všechny tedy umí používat booleanovské operátory (AND, OR, NOT), tzn.
lze říci, jestli musí být ve vyhledaném souboru všechna slova (fráze), nebo jen
některá, případně, která slova ve výsledku nesmí být vůbec. Všechny také umějí
používat tzv. proximity operators, což jsou operátory (většinou ADJ, NEAR),
pomocí kterých může uživatel definovat, jestli nějaké slovo musí být poblíž
jiného slova apod.
Další dobře známou a poměrně často využívanou službou jsou také tzv. wildcards.
Jde převážně o totéž jako při označování souborů pomocí znaků " a ", lze
vyhledávacímu softwaru říct, které znaky ve slově mohou být libovolné nebo
jestli celý zbytek slova (bez ohledu na délku) může být libovolný.
Věcí, kterou v našich jazykových podmínkách pravděpodobně příliš neupotřebíme,
je tzv. natural language processing. Tuto funkci podporuje z našich tří
softwarů pouze Index Server; jedná se o to, aby server dokázal najít co
nejpřesněji výsledek, pokud uživatel položí otázku v přirozeném jazyce. Stejně
tak zůstaneme v češtině ochuzeni o funkci koncepčního vyhledávání, která umí
vyhledávat i různé další tvary zadaného slova.
Další důležitou funkci, momentálně podporovanou také jen v Index Serveru, je
používání číselných operátorů (rovná se, menší než, větší než). Toto může hrát
roli třeba při vyhledávání v databázích, kde bychom chtěli vidět jenom položky
s nějakou specifickou číselnou hodnotou.
Indexování
Indexování je samozřejmě důležitá část celého vyhledávacího softwaru. Jedna z
věcí, které mohou při výběru softwaru hrát roli, jsou různé typy dokumentů,
které chceme indexovat. Je tedy zbytečné si pořizovat výborný software, pokud
bohužel neumí indexovat soubory, které na síti máme.
Ze souboje na tomto poli vychází zřejmě nejlépe QuickFinder, který umí
indexovat opravdu celou řadu typů souborů (viz tabulka). Na druhé straně, např.
do Index Serveru lze dodat programy od třetích stran, které dovolují indexovat
další typy souborů.
Inkrementální a dynamické indexování je také velice důležité. Jedná se v
podstatě o to, že pokud se na místě, odkud se indexují soubory, změní nějaký
soubor, objeví se nový apod., není potřeba přeindexovávat celou databázi. Je
jasné, že pokud se toto děje často, tak je celý index roztroušený a vyhledávání
ztrácí na rychlosti, takže celé přeindexování stejně po čase musí proběhnout
(to je většinou nastaveno na nějakou pravidelnou noční hodinu).
Tyto druhy indexování mají všechny tři uvedené vyhledávače. Všechny mají také
podporu pro různé jazyky, tzn. že bychom mohli mít třeba stejné dokumenty v
češtině a v angličtině a pak dát uživateli na výběr, ve které databázi chce
vyhledávat.
Zobrazování výsledků
O nalezeném souboru můžeme nechat uživateli vypsat celou řadu informací, jako
např. hodnocení, což bývá většinou číslo od jedné do tisíce (to lze v nastavení
měnit), které udává, jak moc odpovídá vyhledaný soubor podmínkám zadání. Podle
toho hodnocení jsou také dokumenty většinou řazeny. O souboru lze také vypsat,
kdy byl naposledy změněn, lze zobrazit jeho délku, titulek, případně metadata
(např. meta tagy v HTML). Pokud není soubor umístěn na lokálním disku, ale ve
sdíleném adresáři, na jiném počítači, na Internetu apod., je taky možné
zobrazit jeho URL.
Jakousi třešničkou na dortu, ve které vítězí opět Index Server, je zobrazování
nalezených slov nebo frází jiným písmem. Index Server je možné nastavit i tak,
aby před zvýrazněná slova vkládal odkazy, takže výsledné není problém ve
vyhledaném souboru "skákat" po jednotlivých nalezených slovech.
Kam a proč?
Pokud nemáte speciální požadavky, nechcete vytvořit nějaké profesionální
řešení, ale chcete jen efektivně zpřístupnit firemní data nebo prostě dát k
dispozici určitá data (nemusí být jen firemní, ale také z různých dalších
internetových serverů), představují všechny zmíněné vyhledávací nástroje velice
dobrou alternativu, jak vaše přání uskutečnit.
Kupodivu, ani požadavky na hardware nemusí být nijak extrémně veliké např.
QuickFinder může běžet již tam, kde je Novell Web Server (tzn. od procesoru
486), Index Server můžete velice dobře nainstalovat na váš stávající Windows NT
Server a Compass Server lze bez problémů přidat k jakémukoliv webovému serveru.
9 0091 / pah

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.