Sémantický web

Web budoucnosti, jenž umožňuje porozumět obsahu webových stránek i počítačovým systémům. Sémantický web je zal...


Web budoucnosti, jenž umožňuje porozumět obsahu webových stránek i počítačovým
systémům.
Sémantický web je založen na několika standardech a nástrojích:Russell Kay
Obrovské množství digitalizovaných počítačových dat obsažené v celosvětové
pavučině WWW (World Wide Web), včetně takzvaného hlubokého webu, by mohl být
považován za největší informační útvar, jaký byl kdy sestaven. Web je zcela
jistě jedinečným nástrojem jak pro hledání, tak pro šíření myšlenek a znalostí.
Ale skutečností zůstává, že web stále klade pozoruhodný odpor přímému,
výkonnému a účinnému využití samotnými počítači. Webové stránky jsou navrženy
tak, aby je mohli číst lidé, nikoliv stroje, a proto smysl obsahu jednotlivých
stránek musí být odvozen lidmi ti se na webové stránky dívají (případně
nahlédnou do HTML kódu) a jsou schopni analyzovat uváděné informace například i
podle názvu hypertextových odkazů.
Tim Berners-Lee, absolvent University of Oxford, který v roce 1989 vynalezl
principy webu, už v roce 1990 vytvořil první webový prohlížeč a server. V
dnešní době tento člověk řídí sdružení World Wide Web Consortium a má mnohem
ambicióznější vizi webu budoucnosti, kterou nazývá sémantickým webem.
Sémantický web přidává do webových stránek infrastrukturu metadatových značek
(tagů), jimiž definuje informační prvky na stránce a také je propojuje, takže
počítače mohou rozpoznat smysl značně rozdělených dat tak snadno, jako dnes
internet propojuje jednotlivé dokumenty. Sémantický web umožní strojům podobně
jako lidem hledat, číst, chápat a využívat data z celého webu, a plnit tak
potřebné úkoly. Sémantický web nenahradí, nýbrž rozšíří jeho podobu, jak ji
známe dnes.
V některých případech může už dnes specializovaný software pracovat s
jednoznačně určenými daty na webu, ale to jsou jen výjimky, nikoli pravidlo.
Surfování po webu, on-line nakupování, porozumění výsledkům vyhledávání a
rozhodování, jakými dalšími odkazy se řídit to vše zatím vyžaduje lidskou mysl.
Jakmile se ale sémantický web stane realitou, umožní uživatelům spustit agenta
nebo proces, který pak bude pokračovat samostatně a možná jen čas od času u
zadavatele ověřovat, zda jeho činnost pokračuje správným směrem.
Podstata webu
Berners-Lee postavil svůj web na stránkách, což jsou dokumenty napsané v HTML.
Jako všestranný jazyk HTML kombinuje interaktivní formuláře, text či
multimediální objekty (jako jsou třeba obrázky a zvuk) a popisuje, jak mají být
tyto prvky zobrazovány a jak má stránka celkově vypadat. Naneštěstí má HTML jen
velmi omezené možnosti klasifikovat bloky textu na stránce, samozřejmě mimo
toho, jakou roli hrají v typickém uspořádání stránky a zvolené grafické podobě.
Tak, jak rostlo využívání webu jako takového, omezení jazyka HTML vedla k
vývoji jazyků XML a XHTML, které začaly nabízet mechanismy, jak webovým
stránkám přidat také popis jejich významu. Jednoduchý protokol pro přístup k
objektům (Simple Object Access Protocol, SOAP) a webové služby se staly
skutečností a usnadnily uživatelům a dokonce i automatizovaným procesům
shromažďovat z celého webu určité informace nebo na něm provádět specializované
operace. Až se sémantický web stane skutečností, bude software schopen vypátrat
informace i uvnitř webových stránek, a prolomit tak hranici dokumentu tím bude
získán přístup k reálným datům, jež bude možné přímo použít. V určitém smyslu
se sémantický web stane jakýmsi druhem globální databáze.
Udělat stroje chytřejšími
V době, kdy babičky nebo předškolní děti běžně využívají počítač a surfují po
internetu, je občas obtížné si vybavit, jak moc musí uživatelé počítač vést a
radit mu, aby vůbec něčeho dosáhl. Stroje neumějí používat částečné informace,
nechápou, co je na obrázku nebo v grafice, nejsou příliš dobré ve vytváření
analogií a v kombinování informací z různých zdrojů a nemají příliš velkou
slovní zásobu.
Web můžeme snadno využít k vyhledání článku Computerworldu nebo nějakého blogu,
vypátrat hudební skladbu, kterou jsme slyšeli v rádiu, koupit si knížku, najít
ordinaci očního doktora poblíž našeho pracoviště nebo veřejně položit otázku na
diskusním fóru nebo elektronické nástěnce. Ale zkuste po počítači žádat, aby
udělal stejnou věc sám, a on nebude ani vědět, kde začít, ledaže byste mu
poskytli podrobnou a bezchybně formulovanou posloupnost příkazů a odpovědí ve
správném pořadí.
Prostřednictvím jazyka HTML a internetového prohlížeče můžeme například
vytvořit a zveřejnit webovou stránku katalogu s nabídkou zboží. Ale HTML nemá
žádnou přirozenou schopnost, jak poznat, že řekněme položka číslo JG1896 je
špičkový aparát s maloobchodní cenou tisíc korun. Vše, co může HTML stanovit,
je, že text "JG1896" bude umístěn vedle textů "Špičkový aparát" a "Kč". HTML
nemá žádný prostředek, jak vyjádřit nebo vědět, že "Špičkový aparát" je nějaký
druh spotřebního zboží, že "Kč" představuje cenu nebo že tyto informace
popisují předmět, který se odlišuje od jiných předmětů uvedených na stejné
stránce.
Sémantický web by se s tím vypořádal tím, že by počítačům a jejich programům
umožnil najít, přečíst, porozumět a využít informace obsažené ve webových
dokumentech, a tak prostřednictvím automatizovaných agentů a na webu založených
služeb vykonat potřebné úlohy.
(pal) 6 1080
XML poskytuje základní formát strukturování dokumentů, ačkoli sám konkrétní
sémantiku nemá.
XML Schema je jazyk, který přiřazuje k datům jejich typ a dovoluje, aby
struktura dokumentu umožňovala předvídatelné výpočty.
Systém popisu zdrojů (Resource Description Framework, RDF) je jednoduchý
třípoložkový datový model (podmět, přísudek, předmět) určený k popisu objektů
nebo prostředků a jejich vztahu. Model založený na RDF bývá často popsán
prostřednictvím jazyka XML.
Jednotné identifikátory zdrojů (Uniform Resource Identifier, URI) jsou krátké
znakové řetězce, jež popisují zdroje na webu: dokumenty, obrázky, stáhnutelné
soubory, služby, elektronické poštovní schránky a podobně. URI (někdy také
označované jako Jednotné lokátory zdrojů (Uniform Resource Locators, URL)
umožňují programům přistupovat k adresám zdrojů jednoduchým způsobem.
RDF Schema (RDF-S) popisuje vlastnosti, třídy a hierarchii prostředků RDF.
Webový ontologický jazyk (Web Ontology Language, OWL) se používá k jednoznačné
reprezentaci významu termínů a vazeb mezi nimi. OWL má více možností k tomu,
aby byly významy správně vyjádřeny, než je tomu v případě XML, RDF i RDF-S, a
jde za hranice těchto jazyků ve schopnosti reprezentovat strojově
interpretovatelný obsah.

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.