Facebook chystá odkladiště na velké objemy starých dat

18. 10. 2012

Sdílet

 Autor: © Leo - Fotolia.com
Společnost přehodnocuje využití datových úložišť v rámci svých datacenter. Ve snaze snížit náklady na skladování miliard fotografií zavádí efektivnější formy ukládání dat.

Uživatelé největší světové sociální sítě uloží do svých profilů měsíčně zhruba 7 petabajtů nových fotografií. Protože počet i objem nahraných fotografií neustále narůstá, snaží se Facebook nalézt levnější a méně energeticky náročný způsob jejich uložení. Informoval o tom Jay Parikh, viceprezident společnosti pro rozvoj infrastruktury.

Parikh při svém vystoupení na konferenci Structure Europe v Amsterodamu ve středu informoval o tom, že v průměru nahrají uživatelé Facebooku 300 milionů fotografií denně, přičemž tento počet může výrazně narůst při zvláštních událostech. „Mezi dny s největším počtem nahraných fotografií patří například Halloween. Během jediného dne k nám uživatelé uloží 1 až 2 miliardy fotografií,“ prozradil Parikh.

Zájem o momentky z Halloweenu nebo podobně aktuální snímky však rychle klesá, takže po několika dnech nebo týdnech už si je nikdo nezobrazuje. „Ale podle smlouvy, kterou s námi uživatelé uzavírají, nesmíme odstranit žádná data ani v případě, že je nikdo nepoužívá. Musíme je dále udržovat,“ vysvětlil Parikh. Proto také přišli s myšlenkou ukládání takových dat do jakýchsi „chladicích boxů“. Facebook se proto rozhodl postavit nové datové centrum s různými typy datových úložišť, hardwarem serverů a síťovým vybavením, které spotřebovává méně energie a je levnější než stávající datacentra. Ovšem bez zhoršení rychlosti odezvy, podotkl Parikh.

Parikh ovšem neprozradil, jaké technologie hodlají použít konkrétně. Obecně platí, že datacentra s nižšími pořizovacími a provozními náklady nabízejí nižší přístupové rychlosti. Pokud jsou například data uložena na magnetických páskách, klesnou náklady na pořízení i spotřeba energie, výrazně ale naroste přístupová doba k datům.

Například Amazon nabízí cloudové úložiště Glacier, které by mělo sloužit jako alternativa k páskovým jednotkám. Tato služba je určena pro ukládání dat, která nejsou používána příliš často a u kterých je možno na příslušná data počkat i několik hodin.

Nicméně to je podle Parikha pro Facebook příliš pomalé řešení. „Nemůžeme si dovolit na žádost o zobrazení fotografie, na kterou se deset let nikdo nepodíval, zobrazit oznámení, že bude k dispozici za 24 hodin. Musíme ji zobrazit v relativně krátkém čase,“ řekl Parikh.

Současná datová centra jsou budována tak, že umožňují zpracovávat velké objemy dat, ale ke své práci potřebují hodně energie. Technologie „chladicích boxů“, kterou si představuje Facebook, by měla výrazně trochu jiná. „Potřebujeme obrovská úložiště, která nemají tak vysokou spotřebu energie,“ konstattoval Parikh.

V aplikační vrstvě pracuje Facebook na softwaru, který určí, jak a kam má být uložen nějaký soubor, když se o něj nikdo nezajímá. „To znamená, že data budou postupně přemisťována v rámci naší infrastruktury s ohledem na své stáří a popularitu,“ prozradil Parikh. Některé z nově zaváděných algoritmů v aplikační vrstvě by měly Facebooku umožnit předvídat, které soubory by mohl chtít někdo použít, a přesunout je na přístupnější místo. Což v důsledku umožní rychlý přístup i k velmi starým souborům.

„Chladicí box“ by se měl podle Parikha v infrastruktuře Facebooku objevit v roce 2013 nebo 2014. Některé části softwaru použitého pro tuto novou technologii potom Facebook nabídne jako open source v rámci svého projektu Open Compute Project.