Databázové horizonty

Databáze budou škálovatelné do gigantických proporcí, budou se rozpínat přes množství lokací a udržovat informace ...


Databáze budou škálovatelné do gigantických proporcí, budou se rozpínat přes
množství lokací a udržovat informace v heterogenních formátech. A navíc budou
autonomní se schopností samostatného vyladění. Přední dodavatelé databází se k
těmto cílům přibližují různými směry.
Před třiceti lety objevila vývojová pracovnice firmy IBM Pat Selingerová
optimalizaci dotazů založenou na nákladech, při níž bylo při prohledávání
relační databáze (jako např. DB2) minimalizováno využití systémových zdrojů
počítače nalezením nejefektivnějších metod a cest přístupu. Nyní Selingerová
jako viceprezidentka v oblasti architektury a technologie správy dat vede
projekt IBM označovaný jako Leo (Learning Optimizer), který by měl optimalizaci
DB2 dovést do nové dimenze. Namísto optimalizace dotazu jednou, když je
kompilován, bude Leo sledovat dotazy při jejich průběhu a dolaďovat je s tím,
jak se bude učit, tj. sbírat poznatky o vztazích mezi daty a požadavky
uživatele. "Leo empiricky odvozuje důležité údaje o datech," říká Selingerová.
Např. zjistí, že PSČ v položce adresa může být asociováno pouze s jedním
městem, i když tyto vztahy nejsou předem specifikovány." Leo se tak uplatní
zejména v rozsáhlých a komplexních databázích, v nichž mohou existovat vztahy
mezi daty, které nejsou explicitně deklarovány návrháři databáze. V komerční
verzi DB2 by se technologie mohla objevit v průběhu 2-3 let.

Jednoduchý přístup
Společnost Microsoft tvrdí, že uživatele nelze nutit, aby ukládali vše e-maily,
dokumenty, audio/video soubory, obrázky, tabulky atd. do jediné obří databáze.
Proto firma pracuje na vývoji technologie, která umožní uživateli bezešvý
přístup k mnoha heterogenním datovým skladům prostřednictvím jednoduchého
dotazu. "Projekt Unified Data zahrnuje 3 kroky," říká Stan Sorensen, manažer
pro SQL Server. "Firma nejdříve navrhne ,schéma založené na XML, které
definuje datové typy. Poté vyvine metody pro uvedení vzájemných vztahů mezi
různými datovými typy a nakonec vyvine běžný dotazovací mechanismus pro
distribuované databáze. Předpokládejme například, že hledáme dokument
odkazující na ,Microsoft a dokument ,sdělí na dotaz, že na jiném místě se
nachází ještě i multimediální soubor, který rovněž odkazuje na Microsoft."
Technologie by se měla jako součást SQL Serveru objevit zhruba za rok, v
následujících letech by pak měla být přidána i do dalších produktů Microsoftu.
Společnost Oracle předpokládá, že její zákazníci směřují k datovým skladům o
velkých objemech a komplexnosti, které jsou rozloženy přes více lokalit. Další
vývoj jejích produktů pak nesměřuje pouze k zajištění tohoto typu funkčnosti,
ale také k tomu, aby tyto úlohy vykonávaly mimořádně spolehlivě. "V několika
příštích verzích bychom chtěli nabídnout plně autonomní databáze," tvrdí Robert
Shimp, viceprezident pro marketing databázových produktů. Oracle také hodlá
ulehčit spolupráci lidem v různých firmách se široce proměnlivými typy
informací. "Co dnes v podstatě dosud neexistuje, je základní infrastruktura,
která je schopná řídit veškeré různorodé typy dat," říká Shimp. "Je potřeba
nabídnout schopnost propojit všechny clusterované databáze v různých lokalitách
po celém světě do jediného unifikovaného pohledu pro individuálního uživatele."

Datové toky
Vědci ze Stanfordské univerzity pracují na způsobech, kterými lze přistupovat
ke kontinuálním tokům informací (obchody s akciemi, telekomunikační přenosy)
pomocí dotazů a poté je archivovat. Dotaz může být např. napsán za účelem
nepřetržitého sledování podezřelých vzorků v síťovém provozu a následného
varování. "Problémem při řešení těchto úloh pomocí tradičního DBMS je
aktuálnost," říká Jennifer Widomová, profesorka počítačových věd na Stanfordské
univerzitě. "Chcete-li vložit stream do DBMS, musíte v určitém bodě zastavit,
vytvořit soubor, nahrát do něj data a pak se na ně dotazovat. Dotazy na datové
streamy probíhají kontinuálně a automaticky poskytují nové odpovědi." Widomová
spolu s kolegy pracuje na vývoji algoritmů pro streamové dotazy a dodává, že
vyvinou kompletní systém pro řízení datových toků. Dokončení však zabere ještě
několik let.

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.