Databáze EMC Greenplum nabízí přímé propojení s Hadoopem

Inovovanou verzi svého řešení Greenplum představilo EMC. Tato platforma určená pro analýzu dat přímo v databázi byla obohacena o vyšší podporu big dat.


Uživatelé tak mohou podle výrobce spouštět rozsáhlé důležité analýzy snáze a rychleji, což zvyšuje produktivitu analýz i jejich obchodní hodnotu a zlepšuje schopnost kvalifikovaně se rozhodovat.

Greenplum 4.2 zahrnuje vysoce výkonný konektor gNet pro platformu Hadoop, vylepšení jazyka a kompatibility urychlující migraci na platformu Greenplum, jednodušší škálovatelné zálohování s využitím softwaru EMC Data Domain Boost, infrastrukturu rozšíření a nástroje pro jednoduchou analýzu přímo v databázi a také cílenou optimalizaci výkonu.

V současnosti umožňuje vysoce výkonný paralelní import a export veškerých dat (komprimovaných i nekomprimovaných) z platformy Hadoop pomocí konektoru gNet for Hadoop, který zprostředkovává paralelní komunikaci.

Novou klíčovou funkcí databáze Greenplum je i pokročilá integrace s deduplikačními úložnými systémy EMC Data Domain prostřednictvím softwaru EMC Data Domain Boost, která přináší výrazně rychlejší a efektivnější zálohování. Tato integrace distribuuje části deduplikačního procesu na databázové servery Greenplum a umožňuje jim tak do systému Data Domain odesílat pouze jedinečná data.

Tím výrazně zvyšuje agregovanou propustnost, omezuje objem dat přenášených v síti a odstraňuje potřebu vytvářet a spravovat virtuální disky (jedná se o rychlou inline deduplikaci s propustností až 26,3 TB/h, zálohování více než 173 TB dat tak trvá necelých osm hodin).

Ve verzi 4.2 jsou dostupné i jednoduché nástroje pro analýzu přímo v databázi prostřednictvím rozšíření Greenplum Extensions. Zjednodušuje se tak provoz a správu pokročilých funkcí v databázi v rámci celého clusteru. Verze 4.2 rovněž podporuje odstranění dynamických diskových oddílů a optimalizaci paměti pro dotazy. Značně tak omezuje objem dat prohlížených v rámci dotazu, což výrazně zrychluje zpracování dotazu a umožňuje spustit více souběžných procesů.Komentáře