Automatizovaný tiering: Jak snížit objem uchovávaných dat (1.)

3. 1. 2011

Inteligentní software dokáže automaticky umístit data do cenově nejefektivnější formy storage. To firmám dovolí ušetřit výdaje za drahé úložiště i optimalizovat přístup k datům.

Stále ne zcela jistá ekonomika a závratným tempem rostoucí objem ukládaných dat jsou jedním z důvodů, proč téměř všichni dodavatelé úložných systémů nabízejí produkty slibující zmenšení objemu uchovávaných informací. Redukce množství dat totiž nejenže snižuje náklady na hardware, software, energii a plochu datového centra, ale také ulehčuje sítím a zkracuje dobu zálohování. Jak ale poznat, kterou technologii použít? Nejprve je nutné pochopit způsob, jakým vaše firma data používá, a určit, kdy se úspory tvořené snížením objemu dat vyplatí vzhledem ke snížení výkonu.

Metoda, která se nejlépe hodí pro potřeby konkrétního uživatele, příliš nezávisí na oboru jeho podnikání, ale především na typu ukládaných dat. Například deduplikace obvykle nepřináší významnější úspory pro rentgenové snímky, inženýrská testovací data, video nebo hudbu. Může však například významně snížit náklady na zálohování virtuálních počítačů použitých jako servery. Zde je pět metod pomáhajících významně snížit objem uchovávaných dat.

1. Deduplikace
Deduplikace – proces hledání a eliminace duplicitních částí dat uložených v různých množinách dat – dokáže snížit objem ukládaných informací až o 90 %. Díky ní lze například uchovat jen jednu kopii přílohy odeslané stovkám zaměstnanců. Deduplikace se stala téměř podmínkou v oblasti zálohování, archivace a ve všech typech druhotného ukládání dat, kde je rychlost přístupu méně důležitá než snížení objemu.

Chris Watkis, ředitel IT ve firmě Grey Healthcare Group, která zajišťuje zdravotnický marketing, uvádí dosažení redukčního poměru až 72 : 1 při zálohování všech informací, a to díky deduplikačnímu procesu využívajícímu applianci Virtual Tape Library od společnosti FalconStor Software. Firma i365, která je dodavatelem služeb cloudového úložiště, dosahuje podle slov svého technologického ředitele Davida Allena ve smíšené zátěži u souborů Microsoft Exchange, SharePoint, SQL Server a u virtuálních strojů VMware redukce dat v poměru 30 : 1 až 50 : 1.

Data lze přitom deduplikovat na souborové nebo blokové úrovni, přičemž různé produkty jsou schopny zkoumat bloky s různou velikostí. Ve většině případů platí, že čím podrobnější vyhodnocení dokáže systém provádět, tím větší jsou úspory místa. Detailní deduplikace však může trvat déle, a proto zpomaluje přístup k datům.

Deduplikace může být realizována formou předběžného zpracování, dále v reálném čase při zápisu do cílového umístění nebo může být provedena následným procesingem, a to až po uložení dat v konečném storage systému. Posledně jmenovaná metoda je „nejlepším řešením při požadavku rychlých přesunů dat – například při časově omezeném zálohování,“ uvádí Greg Schulz, analytik společnosti The Server and StorageIO Group. Radí však zvažovat i metodu předběžného zpracování, pokud uživatel má čas a potřebuje snížit náklady.

Zatímco deduplikace v reálném čase dokáže zmenšit množství ukládaných dat v průměru poměrem cca 20 : 1, nedovoluje škálovatelnost řešení, může snížit výkon a také může nutit uživatele kupovat více serverů za účelem provádění deduplikace, prohlašují kritici. Na druhou stranu Schulz tvrdí, že tento proces využívající následné zpracování vyžaduje použít větší úložiště jako vyrovnávací paměť, a toto místo pak není použitelné pro jiné účely.

Zákazníkům s více platformami serverů a úložišť dokáže celopodniková deduplikace uspořit finance eliminací duplicitních kopií dat uložených v různých platformách. „To je důležité, protože většina organizací vytváří až 15 kopií shodných informací pro použití aplikacemi, jako jsou dolování dat (data mining), systémy ERP nebo CRM (řízení vztahů se zákazníky),“ prohlašuje Randy Chalfant, viceprezident strategií ve společnosti Nexsan, která je dodavatelem diskových úložišť. Uživatelé budou chtít také možná zvážit použití jednoho systému deduplikace, který umožní aplikacím a uživatelům data rehydratovat (vrátit do původní nededuplikované podoby) v případě potřeby a také zabránit nekompatibilitě mezi více systémy.

Schulz uvádí, že základní deduplikační produkty pracují v režimu předběžného zpracování do okamžiku dosažení nastaveného limitu zátěže a poté se přepnou do režimu následného zpracování. Další varianta – deduplikace založená na zásadách – umožňuje správcům úložišť volit, které soubory lze deduplikovat, a to na základě jejich velikosti, důležitosti či dalších kritérií.

Společnost SFL Data, která shromažďuje, ukládá, indexuje, prohledává a poskytuje data pro společnosti a právní firmy zapojené do právních sporů, našla rovnováhu mezi snížením výkonu a redukcí objemu dat. Využívá produkt Ocarina Networks 2400 Storage Optimizer pro „téměř on-line“ ukládání komprimovaných a deduplikovaných souborů v clusteru BlueArc Mercury 50, který lze rozšiřovat až na dva petabajty využitelné kapacity. Firma poté provádí rehydrataci souborů, které uživatelé vyžadují.

„Rehydratace souborů trochu prodlužuje přístupový čas, ale je to mnohem lepší, než říci zákazníkům, že musí počkat dva dny, než pro ně budou soubory dostupné,“ uvádí Ruth Townsend, technický ředitel SFL, a poznamenává, že díky deduplikaci a kompresi jejich společnost ušetří až 50 procent místa.

Dokončení článku vám přineseme zítra…

Našli jste v článku chybu?

Sdílet

Autor článku

Robert LScheier

Témata:

Mohlo by vás zajímat

Anketa

Využíváte už některé z inovativních metod šifrování?

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Spěcháte na návratnost investic AI? Je možné, že to bude drahé

Vyšlo nové číslo CFOworldu 4/2024

Vivolink představí svoje ProAV a systémová řešení na veletrhu ISE 2025 v Barceloně

Nedostatečné zabezpečení koncových zařízení ohrožuje firmy

Co se v roce 2025 mění pro firmy, zaměstnance a daňové poplatníky?

Arrow Electronics je AWS Rising Star Distributor Partner roku v regionu EMEA

Jak zabránit zneužívání umělé inteligence – je AI Akt řešením?

Novela zákoníku práce pohledem firem? Rychlejší výpovědi a nedořešení dohodáři

AT Computers je IDG Distributorem roku společnosti Lenovo

Automatizovaný tiering: Jak snížit objem uchovávaných dat (1.)

Sdílet

Autor článku

Robert LScheier

Témata:

Mohlo by vás zajímat

Europol zatnul tipec hackerům, chystali hromadný útok během Vánoc

Co je nejoblíbenější způsob použití umělé inteligence v práci?

Předpověď kybernetických hrozeb pro rok 2025: Připravte se na větší a odvážnější útoky

Kybernetická bezpečnost: Podcast o tajemstvích bezpečnostních operačních center s Pavlem Hrabcem

Anketa

Využíváte už některé z inovativních metod šifrování?

Kvíz týdne

TIP NA VIDEO

SPECIÁLNÍ PROJEKTY

Z našich webů

Spěcháte na návratnost investic AI? Je možné, že to bude drahé

Vyšlo nové číslo CFOworldu 4/2024

Vivolink představí svoje ProAV a systémová řešení na veletrhu ISE 2025 v Barceloně

Nedostatečné zabezpečení koncových zařízení ohrožuje firmy

Co se v roce 2025 mění pro firmy, zaměstnance a daňové poplatníky?

Arrow Electronics je AWS Rising Star Distributor Partner roku v regionu EMEA

Jak zabránit zneužívání umělé inteligence – je AI Akt řešením?

Novela zákoníku práce pohledem firem? Rychlejší výpovědi a nedořešení dohodáři

AT Computers je IDG Distributorem roku společnosti Lenovo

Dále u nás najdete

Neplaťte si IT kurzy sami, využijte dotace od EU

Autor zasněžených Vánoc přišel jako malý o oko

Outlook, jak ho známe, končí. Co ho nahradí a kdy?

Zkuste vánoční cukroví bez cukru. 5 vyladěných receptů

OpenAI zavádí do ChatGPT „Santa Mode“. Co říká na Ježíška?

Vyšetření krvácení do stolice jako prevence rakoviny nestačí

640 kB paměti by mělo stačit každému: skutečně?

Let's Encrypt příští rok nabídne certifikáty jen na šest dnů

Jaká jsou úskalí recenzí spotřebitele z pohledu podnikatele?

Operátoři testují nástroj proti podvrženým mobilním číslům

Celofán nepatří do plastu a rozbité ozdoby nesmí do skla

Nejistota pro podnikatele, zásadní změny DPH ještě nejsou schváleny

Raspberry Pi má nový počítač v klávesnici a monitor

Nové HDMI 2.2 už je za rohem

Zahraniční cestovní náhrady 2025: Téměř 40 změn

Beey dokáže rozpoznat, který poslanec mluví

Udělejte si french toast ze zbylé vánočky

Češi mají aplikaci, která propojuje lidi podle společných koníčků

Tuzemské cestovní náhrady v roce 2025

Zranitelnost v Google Chrome umožňuje vzdálené spuštění kódu