Obsah webu budoucnosti by měly chápat i stroje

Náplň současného webu je pro stroje v naprosté většině nesrozumitelná. Jen těžko tak mohou skutečně efektivně hl...


Náplň současného webu je pro stroje v naprosté většině nesrozumitelná. Jen
těžko tak mohou skutečně efektivně hledat potřebné informace a nacházet mezi
nimi souvislosti. To by se ale mělo změnit.
Většina manažerů pro informační technologie důvěrně zná koncept tzv.
sémantického webu a to dokonce i tehdy, pokud tento termín nikdy předtím
neslyšeli. Sémantický web totiž nepředstavuje nic jiného, než existenci
pavučiny webových stránek v takové podobě, která umožní její strojovou
čitelnost. To následně přinese uživatelům daleko pohodlnější manipulaci s
webovými daty včetně možnosti jejich vzájemného propojení.
Sémantický web může být, zjednodušeně řečeno, zrealizován jako zveřejnění
obsahu relační databáze, přičemž ovšem budou dostupná nejen vlastní data, ale
také popis jednotlivých atributů. O sémantickém webu jako o "zwebované relační
databázi" ostatně mluvil i Tim Berners Lee, označovaný za vynálezce webu, na
letošním fóru NSF (National Science Foundation) v americkém Arlingtonu.
Sémantický web podle něj umožní firmám manipulovat s externími heterogenními
webovými daty naprosto stejným způsobem, jako pracují s daty interními. Jako
naprosto přirozené pak vidí použití technologií sémantického webu v roli
nástroje k řešení problému integrace dat.

V pozadí
Idea sémantického webu vychází z potřeby dát obsahu webu jasný smysl a učinit
zde dostupná data srozumitelná strojům. Základní realizace pak spočívá ve
vývoji standardů, které systémy potřebují pro to, aby byly schopny najít
spojitosti mezi daty z mnoha databází.
Stroje budou k tomuto účelu využívat popisy informací uvedené na webu,
nadefinované slovníky a ontologie (ontologie je v tomto kontextu myšlena jako
vymezení konceptu, tedy zařazení slova do širších souvislostí příkladem
takového vymezení může být popis významu slov ve výkladovém slovníku). K
dokumentům na webu a k dalším internetovým zdrojům by měly být připojeny
informace, které budou pro počítače představovat podklad pro vyvozování vztahů
mezi těmito informačními zdroji.
Sémantický web by umožnil manipulaci napříč mnoha heterogenními databázemi.
Tato schopnost by například mohla umožnit letenkové rezervační službě
automaticky spolupracovat s osobním kalendářovým programem zákazníka tak, aby
sama navrhla termín letu, který odpovídá uživatelově časovému plánu. A to i
tehdy, pokud by nebylo dopředu dohodnuto rozhraní mezi těmito dvěma kusy
softwaru. A pochopitelně by umožnila řešit také daleko komplikovanější úlohy.

Co se tu nabízí
Předpovědět v tomto okamžiku, jaké služby může sémantický web poskytovat, je
stejně obtížné, jako předpovídat v době zrodu webu, kam se vyvine. "Domnívám
se, že na začátku bylo velmi nejasné, jaké budou služby a dominantní obchodní
model internetu," říká Ora Lassila, výzkumník Nokia Research Center. Podobně i
služby, které vzniknou jako důsledek vzniku sémantického webu, zůstávají podle
něj velkou neznámou.
Pro velké společnosti ale může bezprostřední hodnota sémantického webu spočívat
nikoli v poskytování nových služeb, ale spíše v integraci dat napříč
heterogenním prostředím. A koncepty a standardy vhodné pro toto řešení jsou
podle názoru expertů dostatečně vyvinuté tak, aby to umožnily již dnes.
Eric Miller, který u W3C (World Wide Web Consortium) vede práce na
technologiích sémantického webu, věří, že jde o svatý grál podnikové integrace.
"Hovoříme o skutečně významné redukci času potřebného pro datovou integraci,"
říká.
Konsorcium W3C, které vede Tim Berners Lee, stojí v čele snahy vyvinout pro
sémantický web potřebné standardy. K těm patří např. RDF (Resource Description
Framework), standard používaný pro vyjádření ontologií, nebo XML, standard pro
vytváření na míru šitých tagů pro výměnu dat mezi heterogenními aplikacemi.

Zaostřeno na ontologie
Velmi obtížným aspektem budování sémantického webu je vytvoření vhodných
ontologií. Tento proces vyžaduje úsilí rozdílných komunit, jako např. lidí
pracujících v oblasti zdravotnictví, obchodu, pojišťovnictví nebo ve
finančnictví. Jen tak bude možno vytvořit obecné slovníky, které budou moci
systémy využít k rozpoznání obsahu webového dokumentu.
Naštěstí zde však vytváření ontologií nevyžaduje globální koordinaci. Jestliže
jsou nějaká slova používána různými způsoby, jako např. pojem "titul" v
pojišťovnictví a stejný pojem v oblasti prodeje knih, služby budou schopny
detekovat tyto rozdíly, a neměl by tak být problém dosáhnout interoperability.
Nicméně informace o možnosti takových rozdílů a všechny různé významy takových
pojmů musejí být strojům předloženy v definované podobě.

Do budoucnosti
"Sémantický web je do značné míry vizí, vypadající, jako by patřila do velmi
vzdálené budoucnosti," říká Ronald Schmelzer, analytik americké společnosti
ZapThink. "Snaha o to, aby spolu počítače nejenom komunikovaly, ale aby rovněž
chápaly obsah své komunikace, představuje tradičně obtížně řešitelný problém."
Vytvoření sémantického webu bude podle Jase Dhillona, prezidenta a CEO
společnosti Celcorp, trvat léta. Jeho společnost však již nyní využívá
standardu RDF a definovaných ontologií k integraci aplikací.
"Web vlastně představuje určitý druh komunikačního propojení, a jestliže se
tedy chystá podniknout další krok a nabídnout nám vyšší produktivitu a snazší
použití, musí se stát inteligentním," říká Dhillon. "Sázíme na to, že Tim
Berners Lee v této věci uspěje," dodává.
Jestliže Berners Lee uspěje s přesvědčováním výrobců softwaru, aby investovali
do aplikací pro sémantický web, firmy dostanou k dispozici nový způsob
integrace databází a aplikací. Vyhnou se tak použití tradiční metody vytváření
rozhraní u jednotlivých aplikací v případě, že do nich nebyla integrována
podpora pro společný standard již výrobcem.

Postupy dneška
Společnost Celcorp např. už dnes používá ontologie vytvořené nad RDF ve svém
produktu, který se chová jako student, jenž je schopen vytvářet nové
metaaplikace tak, že extrahuje vlastnosti z několika aplikací existujících.
Analyzuje, co uživatelé dělají v existujících programech, jak se v nich
pohybují, jaké akce jsou prováděny a jaká data používána. Potom tyto informace
ukládá do své báze znalostí.
V dalším kroku tzv. "významový stroj" vytváří novou aplikaci. Dělá to tak, že
povolí uživatelům specifikovat cíle nebo výsledky, kterých chtějí dosáhnout. Za
použití RDF pak tento stroj prohlíží bázi znalostí, aby zjistil, zda jsou zde k
dispozici všechny prvky potřebné k vytvoření potřebného procesu. Ve třetím
kroku je vygenerován kód a posléze vykonán, a to na základě informací uložených
v bázi znalostí.
Zastánci sémantického webu předpovídají, že v krátké době vznikne více
společností jako Celcorp a budou nabízet podobné služby a nové nástroje pro
aplikaci konceptů sémantického webu do existujících obchodních procesů.
Tim Berners Lee pak radí, aby se manažeři zodpovědní za firemní technologie
připravili na budoucnost spojenou se sémantickým webem tím, že se zeptají svých
dodavatelů aplikací, zda při vývoji svého softwaru používají RDF.

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.