V době, kdy celá řada podniků vidí vysokou hodnotu big dat, je dobré začít přemýšlet o tom, jak využít databázové administrátory a manažery data warehousingu právě pro potřeby big dat.
Oracle nabídl elegantní řešení – rozšíření jeho middlewaru Data Integrator, které zmíněným specialistům na databáze a data warehousing umožní zapojit se do činností spojených s big daty. Úložiště big dat se totiž pro ně mohou stát jen dalším datovým zdrojem, vedle současných strukturovaných databází a klasických datových skladů.
„Rozšíření Data Integrator for Big Data dovoluje, aby vývojář, který nepracuje s Hadoopem, se stal produktivním právě i v prostředí Hadoopu,“ tvrdí Jeff Pollock, vicepresident pro správu produktu ve firmě Oracle.
Platformy big dat, jako jsou například Hadoop nebo Spark, byly původně zaměřené spíše na programátory, kteří pracují s jazyky jako Java nebo Python, než na databázové specialisty. Tradiční analýzy podnikových dat totiž vykonávají specialisté na DBA a experti na ETL (Extract Transform and Load Tools) za pomocí nástrojů jako SQL nebo vizuální prvky typu drag-and-drop.
Data Integrator for Big Data ale rozšiřuje možnosti middlewaru o nativní možnost pracovat s big daty. Díky tomu nebude potřeba vzdělávat zmíněné administrátory pro to, aby dokázali pracovat například se systémem Hive for Hadoop, ale budou pro tuto činnost mít pro ně přátelský nástroj, tvrdí Pollock.
Administrator bude moci pracovat s běžnými koncepty jako entity a vztahy či s 4GL data flow mappingem. Software pak automaticky generuje kód v různých jazycích, což je nezbytné pro dokončení celé operace.
Novinka může pracovat s prostředím Hadoopu i Sparku a nevyžaduje na straně datového uzlu instalaci žádného softwaru (využívá se architektura distribuovaného computingu).
Podle Oraclu mohou například detailové organizace díky novému rozšíření analyzovat nákupní historii svých zákazníků, když třeba software pro snímání dat v reálném čase Oracle GoldenGate 12c dokáže přesouvat transakční data do clusteru Hadoopu, kde pak mohou být připravené pro analýzy prostřednictvím Data Integratoru.
Podobnou aktivistu, která by propojila big data s analytickými systémy tradičních dat představilo nedávno i HP, a to díky integraci systému Vertica s platformou Autonomy IDOL (Intelligent Data Operating Layer). Díky tomu mohou podniky například rychle analyzovat rozsáhlé objemy nestrukturovaných dat.