Big data potřebují standardizovat – chystá se pro ně obdoba modelu LAMP?

29. 12. 2014

Uvidíme v tomto oroce vznik komplexní sady pro big data, ekvivalentní tomu, co ve světě IT webů znamená LAMP (Linux, Apache HTTP server, MySQL a PHP)? Mnozí experti si to umějí představit.

Richard Daley, zakladatel a ředitel společnosti Pentaho, která se orientuje na analýzy a business intelligenci, se domnívá, že sada pro big data se začne vytvářet už v letošním roce – s tím, jak vznikne konsenzus kolem některé z referenčních architektur big dat.

Dá se ale prý předpokládat, že horní vrstvy této sady bude možná tvořit více proprietárních prvků, než je tomu u sady LAMP.

„Existují tisíce referenčních architektur big dat,“ tvrdí Daley. „Bude se zřejmě opakovat historie. Totéž jsme viděli při vzniku sady LAMP. Hnacím faktorem je tlak v podobě nákladů a velikosti.“

Daley si však myslí, že organizace, jež jsou u technologií big dat tomuto tlaku vystavené, zejména takové, které je využívají pro marketing nebo pro detekci narušení sítě, rychle začínají vidět pozitivní aspekty.

Podle studie CompTIA mělo již nějakou formu big dat v roce 2013 cca 42 procent organizací. „V uplynulých 12 měsících jsme viděli, že přínos big dat dokáže využít stále více subjektů,“ tvrdí Daley a dodává: „Analýza a využití big dat přinášejí mnohem větší užitek než jen jejich ukládání pro případný pozdější rozbor.“

Explozi dynamických, interaktivních webových stránek koncem devadesátých let a v následující dekádě částečně způsobila dostupnost sady LAMP, kterou tvoří Linux, Apache HTTP server, MySQL a PHP (nebo Perl či Python).

Tyto bezplatné open source komponenty jsou samy o sobě nezávisle vytvořenými výkonnými nástroji. Pokud se však seskupí do podoby webové vývojové platformy, vytvářejí mocnou synergii.

Komponenty jsou snadno dostupné a mají otevřené licence s relativně minimálními omezeními. Možná nejdůležitější je dostupnost zdrojového kódu, který poskytuje vývojářům obrovské množství flexibility.

Zatímco akronym LAMP specifikuje jednotlivé komponenty (přestože v některých vrstvách existují i náhrady), Daley tvrdí, že u big dat existuje v každé vrstvě mnohem více možností – v závislosti na uvažovaném účelu použití.

„D“ – datová vrstva

Spodní vrstvou sady – tedy základem – je datová vrstva. Je to místo pro distribuce Hadoopu, databáze NoSQL (HBase, MongoDB, CouchDB a mnoho dalších) a dokonce i pro relační databáze a analytické databáze jako SAS, Greenplum, Teradata nebo Vertica.

„Každou z těchto technologií lze použít pro aplikace big dat,“ prohlašuje Daley. „Hadoop a NoSQL jsou otevřené, více škálovatelné a nákladově efektivnější, ale nedokážou udělat všechno. Pak zde přicházejí ke slovu řešení jako Greenplum a Vertica s velmi rychlými analytickými aplikacemi.“

V mnoha směrech ale má tato vrstva sady většinu práce teprve před sebou, myslí si Daley. Relační a analytické databáze podle něj za sebou mají dlouholetý vývoj, ale technologie Hadoop a NoSQL jsou stále ještě v relativně raném stadiu.

„K Hadoop a NoSQL musím říci, že je ještě brzy na jejich plné přijetí,“ uvádí Daley. „Jsme sice již za propastí ve smyslu jejich akceptace –- státivně rann přínos big data již jsme za stadiem raných osvojitelů. Ale pro obě tato prostředí tady existuje ještě spousta práce ve smyslu správy, služeb a provozní způsobilosti.“

Hadoop je podle Daleyho velmi složitou technologií a stále má poněkud hrubé obrysy. A pokud se podíváte na prostředí NoSQL, je to prý pořád trochu zmatek. Každý stroj NoSQL má svůj vlastní dotazovací jazyk.

„I“ – integrační vrstva

Další v pořadí je integrační vrstva. To je místo, kde dochází k přípravě dat, jejich čištění, transformaci a k datové integraci.

„Velmi zřídka se data získávají jen z jednoho zdroje,“ vysvětluje Daley a dodává: „Pokud se díváme na všestrannou zákaznickou aplikaci, stahujeme data ze tří, čtyř nebo dokonce pěti zdrojů. Když někdo potřebuje analytickou nebo dokonce prediktivní aplikaci, 70 procent času se spotřebovává v této vrstvě přetvářením dat.“

Přestože tato vrstva není atraktivní součástí big dat, je to také oblast, která je poměrně vyspělá, s množstvím nástrojů (jako Sqoop a Flume) a existující mezery dodavatelé rychle zaplňují, připomíná Daley.

„A“ – analytická vrstva

Další v pořadí je analytická vrstva, kde dochází k analýzám a vizualizaci.

Kompletní článek zahrnující spoustu dalších poznatků, trendů a zajímavostí si můžete přečíst v Computerworldu 6/2014.

Našli jste v článku chybu?

Sdílet

Autor článku

Thor Olavsrud

Témata:

Mohlo by vás zajímat

Anketa

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Vsadili jste na digitální transformaci? Čekají vás neustálé změny a úpravy

Třetí čtvrtletí letošního roku ryze českých investic

Coffee break: Když Wi-Fi potřebuje překonávat i kovové zdi

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

HPE ocenilo partnery roku 2024, nejlepším distributorem je DNS

Raspberry Pi: jaké příslušenství zvolit pro začátek?

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

IDC: Dodávky průmyslových tiskáren stagnují, výkonnost segmentů se ale liší

Big data potřebují standardizovat – chystá se pro ně obdoba modelu LAMP?

Sdílet

Autor článku

Thor Olavsrud

Témata:

Mohlo by vás zajímat

Co se dočtete v novém Computerworldu 11/2024?

Windows Recall: Kontroverzní funkce sledující obrazovku má další zpoždění!

Podcast: Kybernetická bezpečnost v Česku – dokážeme čelit novým hrozbám?

Anketa

Využíváte už ve firmě autonomní agenty postavené na bázi umělé inteligence?

Kvíz týdne

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Z našich webů

Vsadili jste na digitální transformaci? Čekají vás neustálé změny a úpravy

Třetí čtvrtletí letošního roku ryze českých investic

Coffee break: Když Wi-Fi potřebuje překonávat i kovové zdi

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

Na co mají zaměstnanci nárok, pokud se starají o nemocné blízké?

HPE ocenilo partnery roku 2024, nejlepším distributorem je DNS

Raspberry Pi: jaké příslušenství zvolit pro začátek?

Na NIS2 si vyhraďte minimálně 6 měsíců, radí Jan Sedlák z MasterDC

IDC: Dodávky průmyslových tiskáren stagnují, výkonnost segmentů se ale liší

Dále u nás najdete

Bezplatný Microsoft PC Manager vylepšen

Vyzkoušeli jsme test, který ukazuje, co jsme zdědili po předcích

Od dynamitu k Viagře. Výbušný nitroglycerin uvolňuje cévy

Domácí mazlíčci jí téměř ožívají pod rukama. Figurky vyrábí z vlny

Opatrně s kofeinovým práškem, už jedna lžička je životu nebezpečná

Firmy mají řešit byznys, ne hledat účtenky, razí Fidoo

Lumbální punkce sice vypadá děsivě, ale nebolí

Digitální transformace znamená neustálé změny a úpravy

Osvědčené způsoby, jak snížit vysoký krevní tlak

Nitroděložní tělíska jsou spolehlivá a hodí se i pro mladé ženy

Správná péče o bércové vředy může zabránit zanícení

Jihlava a Havlíčkův Brod mění daň z nemovitostí. Co další města?

SSD už také mají obrovskou kapacitu – až 122 TB

Obsah vytvořený pomocí AI vidíte každý den. Jen to nevíte

Sledují vás přes HDMI? Útok využívá elektromagnetické záření

Celý příští týden se můžete nechat anonymně otestovat na HIV

Youtubeři a influenceři se musí registrovat

„Nemáme na tom zájem“. Opozice brzdí TV poplatky

Firmy s vazbami na Čínu jsou problém. Zákaz je i o geopolitice

Edge zkouší nový trik na uživatele Chromu