Datové modelování: Základ datové architektury

S Thierry Brunetem, expertem na problematiku datového modelování ze společnosti CA, který nedávno navštívil Českou Republiku, jsme pohovořili o trendech v této oblasti a o řešení od CA pro datové modelování.


Jaké jsou principy rozvoje datového modelování a jakým způsobem se vyvíjí?
Základním principem datového modelování je centrální a standardizovaný návrh (nebo schéma) databáze. Bez takového schématu nemůže existovat žádná robustní architektura a tomuto schématu musí rozumět všichni, kdo na projektu datové architektury pracují, a to jak obchodníci, tak i technici, obchodní uživatelé, datoví architekti, analytici, návrháři databází, projektoví manažeři, vývojáři i databázoví administrátoři.

Nástroj pro robustní datové modelování by měl pomoci jak při návrhu globálně užívaného programu, tak i generovat požadovaný kód databázové struktury, tzv. DDL (Data Definition Language), který je rozdílný pro každou cílovou databázi. Pokud toto platí, mohou schéma sdílet všichni, kdo pracují s nástroji, jež závisí na informacích z databázové struktury.

Nástroj CA ERwin Data Modeler 7.3 může pomoci při návrhu obchodních a datových modelů, přičemž nativně podporuje 35 různých verzí RDBMS, včetně řešení Teradata 12.0, SQL 2005/2008, Oracle 11.x a DB2 v9, My SQL a Ingres. Po rozšíření o ERwin Data Profiler mohou databázoví architekti sledovat kvalitu stávajících dat dříve, než s nástrojem ERwin Data Modeler začnou vytvářet cílový systém.

Od uvedení nástroje ERwin Data Modeler před 20 lety je stále jasnější, že role datového návrháře nebo architekta nabývá na významu. Zatímco dříve stačilo poskytnout centrální návrh pro databázové platformy, dnešní datoví návrháři řeší otázky integrace s rozbočovači pro správu matričních dat (Master Data Management; MDM), nástroji Business Intelligence (BI), transformačními nástroji (ETL) a další. To vede k tomu, že naše nástroje nyní obsahují více než 70 metadatových propojení, s nimiž modeláři sdílí základní definice návrhů, které jsou uloženy v řešení ERwin Data Modeler, a další nástroje, jako zmiňované MDM konvertory a nástroje BI a ETL a dokonce i modelovací nástroje. Rovněž disponujeme nástroji pro vytvoření datových modelů z podnikových informačních systémů jako jsou SAP, Oracle e-Business, atd.

V dnešním světě nestačí být jen skladem informací o datovém modelování. Datový architekt musí sledovat jiné projekty a nástroje, aby zůstal v obraze. Díky našim propojením a rozhraním používá mnoho našich zákazníků CA ERwin jako základnu pro své aktivity v oblasti správy dat.

Je správa současných databázových systémů z tohoto pohledu dostatečná nebo je zde prostor pro zlepšení?
Mnoho našich zákazníků investovalo do projektů datové architektury, aby zlepšili kontrolu nad svými různorodými databázovými systémy. S rostoucím počt em technologií a množstvím obchodních informací ve firmách je zde ale neustále prostor pro zlepšení. Obchodní procesy, aplikace a systémy Business Intelligence často běží na různých databázových systémech. Návrh databáze, její vývoj a správa jsou rozdílné disciplíny, které sice konvergují do stejného směru, ale slouží jiným uživatelům, procesům i technologiím. Takže individuální přístup ke každému zdroji informací a s různými nástroji datového modelování pro různé databáze obecně není efektivní pro globálně použitelnou datovou architekturu.

Vezměme si společnost, která má schéma podnikové databáze podle korporátních pravidel a zákazníkovi nabízí možnost, aby byl identifikován v každé pobočce po celém světě. Již dosažení jednotné definice „zákazníka“ může být obtížné, protože každý region může mít jinou databázi pro ukládání informací a v mnoha případech může být „zákazník“ definován různě (např. povinnost mít aktivní účet, zahrnutí bývalých zákazníků). Malé rozdíly ve výkladu však mohou mít zásadní vliv na tvorbu výkazů. Rozdíly ve struktuře mezi různými databázovými systémy, jako jsou DB2, Oracle a SQL Server, pak mohou vést k potížím při přípravě informací pro reporting.

Aby byl projekt datové architektury úspěšný, modelovací sada ERwin může pomoci při tvorbě standardního schématu a při komunikaci těchto informací zúčastněným stranám v různých regionech. Je to výborný nástroj pro ukládání definic, a to jak z obchodního pohledu, tak i z pohledu databázových struktur. Určení těchto základních datových standardů je klíčovým krokem při centralizaci základních datových aktiv, jako je „zákazník“. I nadále zde zůstávají organizační a kulturní odlišnosti, které se musí překonat, ale zahájit projekt s centrálním nástrojem a standardní architekturou je významným krokem při tvorbě standardů.

Jaký je přesně vztah mezi datovým modelováním a databázovou administrací?
Nástroje pro databázovou administraci získávají kód databázové struktury z nástrojů pro datové modelování pro účely rozvoje databáze, její správy a ladění.

Nástroje pro datové modelování a návrhy jsou v první řadě komunikační nástroje pro datové architekty, obchodní analytiky a projektové manažery. Dále poskytují databázovým návrhářům a projektovým manažerům návrhy databází a automatizační mechanismy. V neposlední řadě generují databázovou strukturu, přičemž tento kód musí odpovídat potřebám a omezením databázových administrátorů a stejně jako nástroj pro datové modelování musí zachovávat své schéma synchronizované s generovanou databází.

Jaká jsou specifika přístupu CA v této oblasti?
Modelovací sada ERwin může databázovým administrátorům poskytnout požadovaný kód s ohledem na jejich omezení a potřeby a umožňuje jim kontrolu nesrovnalostí v návrhu. To vše realizuje prostřednictvím centralizovaného grafického rozhraní, takže databázoví administrátoři nemusejí být odborníky v mnoha databázových platformách. Mohou navrhovat struktury vizuálně a nechat nástroj CA ERwin, aby jim generoval kód DDL. Pro ty administrátory, kteří jsou odborníky v určitém jazyku a kteří mají specifické standardy nebo kódovací formáty, jež chtějí upravovat, nástroj CA ERwin Data Modeler umožňuje upravit vývojářskou šablonu pomocí výkonného makrojazyka bez ohledu na to, co je cílovou databází. ERwin Data Modeler 7.3 může synchronizovat každý databázový objekt se schématem a vše komplexně srovnat a zobrazit rozdíly mezi databázovými schématy a také vliv navrhovaných změn.

Jaké nové funkce se plánují pro ERwin Data Modeler?
Právě jsme uvedli verzi 7.3 modelovací sady ERwin a mezi její nové funkce patří

- podpora systémů správy databází (DBMS) napříč platformami: Tato verze obsahuje významné aktualizace pro podporu Teradata 2.6 a 12.0, SQL Server 2005/2008 a Oracle 11.x;

- výkazy: ERwin Data Modeler 7.3 obsahuje vlastní řadič ODBC, dotazovací nástroj a výkazy Crystal Report společnosti Business Object, a tak může vytvářet upravitelné výkazy s použitím SQL pro přístup do datového modelu ERwin;

- integrace a výměna metadat: Více než 70 propojení s jinými řešeními Business Inteligence, transformačními nástroji, datovými sklady, správou matričních dat, vývojářskými nástroji a konkurencí. Novinkou této verze jsou rozhraní pro SAP MDM, Oracle BI a Cognos ReportNet QueryStudio;

- upravitelnost: Upravitelné šablony pro generování kódu DDL používají nový makrojazyk a integrované vývojářské prostředí (IDE).

Kromě toho jsme rozšířili naši nabídku o nástroj CA ERwin Data Profiler, který analyzuje až 25 datových zdrojů současně a pomáhá tak určit nesrovnalosti v datech. Rovněž může profilovat velké množství dat z různých zdrojů a vytvářet statistiky pro sledování kvality těchto dat. Pro starší systémy bez definovaných datových struktur může podle hodnot odvodit vzájemné vazby a následně exportovat vypracovaná schémata do nástroje ERwin Data Modeler pro datové sklady, správu matričních dat a databázový návrh.

Navíc nyní nabízíme nástroje CA ERwin Data Modeler ve verzi Community Edition, což je bezplatná roční licence pro studenty a začínající modeláře. Jedná se o úpravu našeho klíčového produktu, která má sice limitovanou funkčnost, jako např. omezený počet entit, ale je ideální variantou pro uživatele, kteří začínají s modelováním dat. Představuje vynikající nástroj pro menší projekty datového modelování.

 

Thierry Brunet (na fotografii uprostřed článku) pracuje jako Principal Consultant ve společnosti CA.











Komentáře