Superpočítače přicházejí z laboratoří do byznysu

Vysoce výkonné počítače neslouží jen pro tak notoricky známé úlohy, jako je např. modelování vesmíru. Dnes prov


Vysoce výkonné počítače neslouží jen pro tak notoricky známé úlohy, jako je
např. modelování vesmíru. Dnes provádějí důležité výpočty i v byznysu, např.
analýzu hypotéčních rizik.
Poslední místo, kde byste asi čekali superpočítač Cray, leží necelých 50 km
jižně od severního polárního kruhu. Superpočítače ale dnes spatříte na mnoha
jiných nečekaných místech analyzují úvěrová rizika, prosívají transakce s
platebními kartami (tady pátrají po nelegálních operacích) nebo se probírají
údaji o poruchových pevných discích.
Výzkumníci v Arctic Region Supercomputing Center (ARSC) na okraji Fairbanksu na
Aljašce tráví spoustu času modelováním globálních klimatických změn. Když ale
jednoho dne místní učitel chtěl svým žákům přiblížit migrační zvyky vlků, v
ARSC propůjčili strojový čas na sběr a vyhodnocení telemetrických dat
vysílaných z obojku nasazeného vůdci smečky. Když se nakonec data převedla do
grafické podoby, mohli si žáci učinit lepší představu o obrovských
vzdálenostech, které vlci během roku urazí.
Vysoce výkonné počítače (HPC High Performance Computers) již nejsou vyhrazeny
pouze pro vědce. Ve skutečnosti dnes mnoho lidí soudí, že vývoj v oblasti
superpočítačů je spíš než odtažitými výpočty živen hlavně tvrdými ekonomickými
stimuly firemní sféry a jejich hlavním mottem ziskem a ztrátou. Důvodem je
skutečnost, že klíčové technologie vyvinuté pro HPC, zejména dolování dat a
jejich grafické a vizuální zpracování, poskytují firmám konkurenční výhodu.
Časy se mění
Podle zástupců Smaby Group, firmy zaměřené na průzkum trhu z Minneapolis, bylo
vloni za superpočítače nasazené na vědecko-technické aplikace utraceno 3,1
miliardy dolarů, zatímco v oblasti komerčních aplikací 6,6 miliard. Do roku
2002 předpovídá generální ředitel firmy Gary Smaby, že podíl vědecko-
technických využití klesne na čtvrtinu celkového trhu.
Např. BlackRock, finanční firma z New Yorku, využívá vysoce výkonné počítače
provádějící dolování dat k analýze 55 milionů nesplacených amerických hypoték.
Afshin Goodarzi, viceprezident firmy, pracuje se 170 GB informací o hypotékách
v databázi Sybase provozované na systému Origin 2000 od SGI.
Jdi za penězi
S využitím dolování dat byly navrženy modely urychlených splátek pro každou
individuální hypotéku v zemi a usnadněna predikce termínu, kdy individuální
klient splatí svoji půjčku, tudíž ukončí placení úroků věřiteli.
"Stará metoda byla založena na analýze nekonzistentní "hromady" dat. Zaměřujeme
se na výše jednotlivých úvěrů, abychom odhalili platební charakteristiky," říká
Goodarzi. Před nástupem HPC a dolování dat "byl celkový objem dat vždy
kritickou překážkou," dodává. "Současné technologie nám umožňují soustředit se
na jednotlivce."
Jeden z největších světových výrobců pevných disků Western Digital produkuje
100 000 jednotek denně. U každé z nich firma zaznamenává 1 000 konkrétních
informací. Data se archivují po dobu 3 až 5 let podle konkrétní délky záruční
doby disku.
V minulosti, podle Kena Chatfielda, viceprezidenta firmy Sage Tree,
stoprocentní dceřiné firmy Western Digitalu, firma sledovala historické trendy
v reklamacích disků, aby mohla prognózovat procento poruch. Tato informace byla
použita pro výrobu jistého přebytku disků vycházejícího z odhadů trhu, který
sloužil k vykrytí reklamovaných disků.
Více proměnných
"Nyní můžeme svým systémům pro zpracování dat klást mnohem inteligentnější
otázky," říká Chatfield, "jako třeba do jakého zeměpisného regionu produkce
směřuje, abychom mohli určit, zda-li vyšší nebo nižší vlhkost má vliv na
poruchovost disků. Můžeme pozorovat nejmenší detaily a rychle rozpoznat, odkud
poruchové disky přišly, ze které výrobní linky pocházejí, kdo je testoval a
cokoliv dalšího, na co můžeme pomyslet."
Jak uvádí Chatfield, vedlejší efekt využití dolování dat s cílem snížit počet
reklamovaných disků je měření přesnosti reakce operátora "call-centra" ve vazbě
na každý reklamovaný produkt Western Digitalu. Firma odhalila, že tzv. "mrtvé"
disky, velmi často reklamované, ve skutečnosti řádně fungovaly. Bylo však
pozdě, protože tou dobou už vyměněný kus směřoval k zákazníkovi.
Problém vyústil k rozpoznání, že personál help-desku k problému přistoupil
nesprávně, a firmě tak způsobil zbytečné výdaje, a co je horší, včas
nepodchytil potíže na straně zákazníka.
Za pomoci dolování dat mohou u Western Digital stanovit, který pracovník
call-centra potřebuje ještě doplňující trénink. Dolování také pomohlo navrhnout
prémie pro ty pracovníky, kteří docílí vyšší poměr správných reakcí při
typickém počtu volání o technickou radu.
Robert Grossman, profesor na Illinojské univerzitě v Chicagu, je široce
uznávaný expert na dolování dat. Už mnohokrát byl svědkem nasazení komerčních
aplikací. Příkladem je třeba pátrání po zneužívání platebních karet, kdy
dolování dat může být navýsost užitečným nástrojem. Této technologie si vysoce
cení takové společnosti, jako je Visa International nebo American Express.
Stále snadněji
Bohužel v oblasti e-commerce, kde je shromažďován zdaleka největší objem dat
během každé transakce s platební kartou, se dolování dat ukázalo jako pomalé.
Než se dospěje k závěru, bývá "zločinec pryč". I s penězi.
Automatická detekce finančních zpronevěr však přinesla své výsledky, když byla
použita v Texasu. Tam v roce 1996 odhadli, že vznikla škoda za více než 7,8
miliard dolarů na podvodných účtech zdravotního pojištění (Medicaid)
vystavovaných lékaři a laboratořemi. Tato částka nyní klesla na pouhých 800
milionů. Částečně to bylo umožněno tím, že prostředků pro názornou vizualizaci,
používaných při dolování rozsáhlých kolekcí ukládaných dat, je čím dál tím více.
Na loňské konferenci SC99 v oregonském Portlandu byla vystavována plejáda
vizualizačních nástrojů od firem Advanced Visualization Systems, Logicon,
Numerical Algorithms Group, Pallas, SGI a dalších.
Grossman, který říká, že dolování dat stojí před mnoha výzvami, se domnívá, že
stále rostoucí snadnost a dostupnost těchto prostředků je právě jeden z
nejzáludnějších problémů. Jeho obavy vyplývají z oné snadnosti, paradoxně
nikoliv z obtížnosti zvládnutí.
"Statistikové to nechtějí (usnadnění), protože je to připravuje o mystérium
statistiky," říká. "Ale na druhé straně také riskujete, že kápnete na hloupé
lidi provádějící hloupé kejkle s daty, jako třeba korelaci počtu infarktů s
postavením hvězd."
Webové superservery
E-commerce silně závisí na superpočítačích, žádá-li se výkon. Makléřská firma
Charles Schwab & Co. ze San Francisca využívá 2 000 počítačů RS/6000 SP od IBM,
a to jen na provoz serverového softwaru od Netscapu, protože tyto unixové
systémy jsou ideální pro zpracování milionů relativně jednoduchých HTTP
požadavků. Nicméně veškeré skladové operace nadále probíhají na mainframech
S/390.
Kromě pár výjimek nenašly HPC využití na transakční straně e-commerce. Jedním z
důvodů je fakt, že HPC aplikace vyžadují specializované programovací nástroje a
znalosti, pokud se chce využít všech možností paralelního zpracování
superpočítačů. Firmy, jako třeba Etnus, The Portland Group, Sundance DSP a
další, takové produkty nabízejí, ale jejich určení míří spíše směrem k vědě a
technice.
Zákazníci z oblasti obchodu, kteří HPC využívají, se rekrutují, jak se zdá, z
relativně zavedených trhů, jako je petrochemický či automobilový průmysl.
Hlavní vývojáři světa IT obecně také nejsou správnými kandidáty pro HPC zatím.
Představitelé společnosti Sun Microsystems však podle vlastních slov věří, že
to změní pomocí Javy vybavené volitelnými možnostmi paralelního zpracování.
Vzhledem k všeobecně velkému rozšíření Javy zde asi jistý potenciál bude. Ovšem
vše je zatím ve stadiu zrodu.
Záplava dat
Dvě věci předurčují dolování dat a datovou vizualizaci (tyto dvě domény HPC
jsou mimořádně vhodné pro oblast IT) pro e-commerce. První je ohromné množství
dat shromážděných při každé návštěvě webových stránek. Druhou je rapidně
klesající cena ukládání dat. Podle Richarda Wintera, prezidenta marketingové
firmy Winter z Walthamu, tato cena klesá o 50 % za rok.
"Jeden terabyte může firmu stát nějakých pár set tisíc dolarů. Avšak informace,
které tento terabyte skladuje, se projeví v zisku firmy desítkami milionů
dolarů," říká.
Winter uvádí, že například dolování dat pomohlo firmám poznat, že když v
samoobsluhách umístily pohlednice poblíž regálů se rtěnkami, prodej pohledů
prudce vyletěl. "Člověk neví proč tomu tak je. Pouze víte, že to opravdu
funguje," konstatuje Winter. A to je v byznysu to nejdůležitější.
Superpočítač pro vědu
V hlavním textu tohoto článku přinášíme informace o využití superpočítačů v
byznysu, zde uvedeme příklad nasazení nového superpočítače ve vědeckých
institucích.
Konkrétně se jedná o superpočítač SGI, který si pro svou práci vybraly 2
holandské vědecké instituce, Netherlands Organization for Scientific Research
(NWO) a Netherlands Computing Facilities Foundation (NCF). Superpočítač bude
nainstalován ve středisku pro akademické výpočetní služby v Amsterodamu v druhé
polovině tohoto roku a počítá se s jeho využitím při řešení komplexních otázek
náročných na numerický výkon v oboru lékařství a pro vědeckotechnické výpočty.
Superpočítač disponuje 1 024 procesory MIPS RISC a nabízí výkon jednoho
teraflopu, tj. 1012 operací za vteřinu. Systém bude dále vybaven 10 TB (104 GB)
on-line paměti a 100 TB near-line paměti StorageTek.
Zajímavé je, že se tak Holandsko stane první zemí v Evropě, kam bude dodán
výkonný škálovatelný server 3. generace architektury ccNUMA. Její předností je
mj. to, že se jeví uživateli jako celek s jedinou pamětí a programuje se
podobně snadno jako systémy s jedním procesorem. Systém navíc vyniká i
jednoduchou správou. Vrcholný výkon systému by měl během 3 let dosáhnout
hodnoty 3 Tflops.
0 0063 / pen

Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.