Ve znamení Morphea

Jak se hledá v Centru Krátce poté, co změnu některých svých služeb oznámil Seznam, se ozvala i konkurence. Provozova...


Jak se hledá v Centru
Krátce poté, co změnu některých svých služeb oznámil Seznam, se ozvala i
konkurence. Provozovatelé Centra již předtím zprovoznili nový fulltext zvaný
Morpheus a posléze zveřejnili i další představy o tom, kam se má ubírat
internetové vyhledávání.
Představitelé společnosti NetCentrum se chtějí zaměřit na specifické vlastnosti
češtiny. Ve spolupráci s Ústavem formální a aplikované lingvistiky na MFF UK se
podařilo získat lemmatizátor a slovník synonym. Vyhledávač Centra nyní
(volitelně) podporuje ohýbání slov, opravu překlepů i hledání synonym. Zpřesnit
by se mělo i chápání frází. Tak např. dotaz "byt 2 + kk Praha 6" by měl být
vyhodnocen podle svého smyslu (sémanticky), nikoliv pouhým vložením logických
operátorů mezi slova.
Druhou zásadní změnou, která přímo souvisí s předcházejícím případem, má být
integrace vyhledávání přímo do specializovaných databází. Uživatel dnes nehledá
statické informace, ale spíše služby typu aktuálních cen určitého zboží či
služby, slevových akcí, konkrétní telefonní číslo apod. Vyhledávač by měl být
ve své odpovědi schopen linkovat přímo odpovědi z aktuálních databází třetích
stran.
V tomto případě samozřejmě zbývá řada technických překážek, daných především
různým komunikačním rozhraním stávajících databází. Centrum se však chce
vyhnout tomu, aby specializované databáze bylo nuceno budovat samo, mj. i
proto, že takový proces je velmi náročný na lidskou práci. Podle představitelů
Centra se však stejně poněkud překvapivě ukazuje, že podíl lidské práce s tím,
jak je třeba zajistit větší funkčnost služeb, vzhledem k zcela automatizovaným
procesům spíše roste.
Zatímco Seznam ve svém katalogu chce striktně oddělovat stránky nekomerčních
institucí od databáze firem, Centrum se snaží katalog jako samostatnou službu
spíše odbourat. Přitom buduje rovněž vlastní databázi firem (je jich zde údajně
uvedeno více než 67 000), linky do ní se však budou řadit mezi dotazy nalezené
"klasickým" fulltextem. Katalog firem bude navíc možné třídit také podle
regionu.
Jako poslední novinku lze uvést, že řada vyhledávacích technologií Centra má
být uvolňována jako open source zpravidla půjde o předešlou verzi služby ve
chvíli nasazení verze aktuální.









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.