Sémantické technologie: Teorie skrývající se za sémantikou

Jakým způsobem vzniká význam a jak se zachycuje a formalizuje pro snazší mechanické zpracování pomocí jazyků RDF a OWL? To se dozvíte v následujících řádcích.

Sémantické technologie: Teorie skrývající se za sémantikou


Pro hlubší porozumění problematice sémantických technologií je třeba věnovat se alespoň krátce studiu vzniku významu. Podle Wittgensteina význam slov vzniká jejich používáním v rámci tzv. jazykových her. To znamená, že není předem a pevně daný, ale vzniká používáním a mění se na základě kontextu. Dalo by se říci, že takovýto nevyslovený předpoklad je základem statistického zpracování přirozeného jazyka, tak jak jej používají například Google a Bing pro své automatické překladače.

Význam a logika
Matematická logika přistupuje k významu z opačného konce – dává nám nástroje pro definování významu jednotlivých symbolů (oproti tomu podle Wittgensteina není nutné ani možné slova přímo definovat). Definice vždy zužuje možný význam daného symbolu (slova) kladením podmínek, které daný symbol musí splňovat. Klasická matematická logika je extenzionální – tj. symboly ztotožňuje s množinami a platí, že dva symboly jsou stejné, právě když jejich množiny jsou stejné.

Například skládá-li se náš svět pouze z individuí {alice, bob, cecilie, dan, eva}, pak symbol „muž“ můžeme definovat jako množinu {bob, dan}. Pokud v naší teorii existuje i symbol „žena“, bez dalšího může být ztotožněn s jakoukoliv podmnožinou naší množiny individuí. Chceme-li ho definovat, řekneme například, že musí splňovat podmínku „nikdo není zároveň muž a žena.“

V takovém případě je možné interpretovat symbol žena jako některou z množin {alice}, {cecilie}, {eva}, {alice, cecilie}, {cecilie, eva}, {alice, eva}, {alice, cecilie, eva} nebo jako prázdnou množinu {}. Naší zamýšlené interpretace pojmu žena jako množiny {alice, cecilie, eva} bychom mohli dosáhnout dalším zpřesňováním definic symbolů „muž“ a „žena“ – zúžili bychom jejich významy na námi zamýšlené. Je nutné poznamenat, že často není možné dosáhnout definic, kterým by odpovídaly přesně a jen zamýšlené interpretace.

Extenzionální sémantika nezachycuje jeden důležitý jev přirozeného jazyka. Uvažujme známý příklad pojmů „Jitřenka“ a „Večernice“. V obou případech jde o planetu Venuši, takže z pohledu extenzionální logiky by v obou případech šlo o množinu {Venuše}, a tím pádem jsou tyto pojmy z jejího pohledu nerozlišitelné.

Intenzionální logika dokáže zohlednit fakt, že v jednom případě máme na mysli planetu, která je vidět ráno, a v druhém případě planetu, jež je vidět večer. Jde tedy o dvě rozdílné entity, které ovšem sdílejí stejnou extenzi. Intenzionální logika tak pomáhá zachytit více různých významů než logika extenzionální.

RDF a RDF/S
RDF (Resource Description Framework) je jednoduchý jazyk pro popis výroků a jejich zpřístupnění na webu. Každý RDF výrok má formu minivěty (trojice) tvaru (předmět, predikát, objekt), tj. například: (eva, rdf:type, žena) čili „eva je/má typ/je ve třídě žena“. Množina RDF trojic tvoří RDF graf, kde předměty a objekty jsou vrcholy a predikáty jsou hrany.

Existuje rozšíření RDF, tzv. RDF Named Graphs, které umožňuje snazší formulování výroků o trojicích a o RDF grafech, tj. například výrok typu „(petr, říká, (venuše, rdf:type, planeta)),“ které samotné RDF umožňuje jen pomocí nemotorné techniky nazvané reifikace.

RDF/S je jazyk založený na RDF, který standardizuje definování pojmů a jejich vztahů. Je to tedy jednoduchý ontologický jazyk, který má povahu intenzionální logiky.

Pomocí jistých technických triků umožňuje například, aby třída obsahovala sama sebe bez porušení axiomu fundovanosti, a umožňuje mluvit o pojmech jako o třídách i jako o instancích tříd. To znamená, že je například možné hovořit o člověku jako o množině instancí: (člověk, rdfs:subClassOf, savec), ale i o člověku jako o instanci: (člověk, rdf:type, rdfs:Class).

RDF a RDF/S jsou tedy na logice založené jazyky, které jsou uzpůsobené popisu světa a sdílení těchto popisů v rámci webu. Každá třída i instance má své URL, na kterém by správně měl být bližší popis daného pojmu v RDF. Tyto popisy tedy tvoří jeden obrovský graf, kterým je možné postupně procházet a nalézat upřesňující a doplňující informace.



Úvodní foto: © alphaspirit - Fotolia.com



Vyšlo v Computerworldu 15/2012
Celé toto vydání lze zkoupit elektronicky








Komentáře