Video:
Mezi nesporné výhody patří architektura podporující masivní paralelní zpracování úkolů. V klasických počítačích se jedná maximálně o několik procesorů, v případě Tesly jde dnes až o 960 procesorů s výsledným výkonem 4 TFLOPs. Výkon jedné Tesly je tedy až 250x vyšší než výkon osobního počítače, konkrétně však záleží na tom, jaké výpočetní algoritmy na superpočítači provozujete.
Obrovskou výhodou Tesly je fakt, že se jedná o supervýkonný produkt o velikosti běžného PC. Každý vědecký pracovník si tedy může postavit superpočítač na svůj pracovní stůl a jednoduše ho využívat. Nemusí se tak dělit o strojový čas s kolegy u sálového superpočítače, který může být v celém výzkumném ústavu či na univerzitě pouze jeden. Pro napájení také stačí standardní elektrická zásuvka, takže nikdo nemusí platit obrovské účty za desítky propojených počítačů do výpočetních clusterů.
Aby mohli výzkumníci používat výkon Tesla superpočítače co nejpohodlněji, připravila pro ně společnost Nvidia podporu pro programovací jazyk C. Aplikace je možné vytvářet jak v prostředí Windows, tak i Linux. Celkově se architektura paralelního zpracování s pomocí GPU označuje jako CUDA. Jazyk C využívaný pro psaní aplikací pro superpočítač je označován jako OpenCL (Open Computing Language). Výhodou Nvidia CUDA systému je fakt, že nikdo nenutí vědce, aby se učili speciální postupy nebo nové programovací jazyky. I při využití Tesly tak mohou jednoduše využívat rozšířený jazyk C. Do budoucna by se měla objevit i podpora pro programovací jazyky C++ a Fortran.
O přínosu superpočítačů založených na GPU čipech pohovořili v Londýně odborníci na slovo vzatí. Mezi prvními byl Dr. Batenburg z Antwerpské univerzity v Belgii. Jejich tým se zabývá tomografií pro lékařské účely – tedy snímkováním virtuálních řezů pacienta. Z dat se skládá 3D model, který následně využívají lékaři. Pokud se provádí snímkování pacienta ve vysokém rozlišení, vznikne obrovské množství dat a matematické vytvoření 3D modelu trvá velmi dlouho. Na jednom PC se model počítá až několik týdnů, což je pro lékaře nepoužitelné. Vědecký tým navíc vytvořil vylepšenou metodu výpočtů, která přináší lepší výsledky, ale je časově ještě náročnější. Vědci přepracovali celý algoritmus tak, aby se počítal s využitím osmi GPU, které byly v osmi grafických kartách Nvidia a dokonce byly fyzicky v jednom jediném PC. Tehdy ještě neexistovala Tesla s podporou vývojového prostředí CUDA, takže bylo nutné přepsat algoritmus přímo do jazyku, který podporuje GPU. Nicméně, práce se vyplatila. Výpočet se z týdnů zkrátil na 51 minut. Univerzita byla nadšena a zcela právem. Jen pro porovnání nechali studenti běžet stejné výpočty na procesorech CPU ve výpočetní síti složené z 512ti operonů. Výsledek byl i tak oproti pouhým osmi grafickým kartám v jediném PC pomalejší.
Dalším příklad, kde se uplatňují výpočty s pomocí GPU, uvedla společnost ffA. Tato britská firma se zaměřuje na vývoj softwaru pro analýzu seizmických průzkumů a současně i nabízí služby v této oblasti.
S pomocí superpočítače Tesla se jim podařilo zvýšit rychlost výpočtů oproti stanici osazené procesorem Intel Xeon Quad Core až 98x. Pokud se výpočet speciálně optimalizoval, aby plně využil všechna jádra (využíval multi- threading), pak byl stejně výpočet s pomocí GPU 41x rychlejší.
Další konkrétní možnosti Tesly demonstroval i mladý vědec Dr. Graham Pullan z Cambridské univerzity. Zde se zabývají například výpočty a simulacemi dynamiky tekutin, počítačovým zobrazením v lékařství, zpracováváním obrazů či analýzami a výpočty souvisejícími s průzkumem vesmíru.
Čísla hovoří za mnohé. Například výpočty pro simulaci průtoku vody turbínou zabraly počítači s procesorem 2,5 GHz celkem 12 hodin, při výpočtu s pomocí superpočítače Tesla S870 (4 GPU) pouze 9 minut. Pro výpočet jednoho listu turbíny to pak jsou přibližně 2 minuty, takže designér může dělat řadu úprav, pokusů a vylepšení, a do dvou minut vidí, jak vylepšení fungují při simulaci (tedy jak se bude chovat list turbíny v reálném provozu). Na výsledky nemusí čekat dlouhé hodiny. Obdobně se zrychluje zpracování dat v medicíně nebo i v obyčejném zpracování obrazů. Zajímavé je i urychlení při práci s modelem vesmíru, kde vědci pracují s prostorem čítajícím až deset milionů objektů. Přitom se musí počítat veškeré souvztažnosti mezi jednotlivými nebeskými tělesy.
Přínos osobního superpočítače je velký a to nemluvíme ani pořádně o univerzitním super-super počítači, který pomáhá tým doktora Pullana Nvidii vyvíjet a testovat. Jedná se o výpočetní cluster složený z 32 Tesla S1070 jednotek s neuvěřitelným výkonem 128 TFLOPs.
Jak je vidět, přínos extrémně rychlých GPU jednotek je zcela zřejmý a už nyní se mění pohled na superpočítače. Je vidět, že to nemusejí být obrovské sálové mašiny, nebo stovky propojených počítačů do výpočetních clusterů, které mají obrovskou spotřebu energie. Společnost Nvidia dnes ukázala jiný přístup, zdá se, že mnohem elegantnější a efektivnější i ekonomičtější.
Na druhé straně je nutné připomenout, že ne každou úlohu lze snadno přizpůsobit pro paralelní superpočítač. Všechny výše uvedené příklady se pro takovéto zpracování přímo nabízely. Tesla se proto uplatní především v odvětvích, které jsme v naší reportáži zmínili, při sekvenčních výpočtech, kdy se následně kalkuluje s předchozími výsledky výpočtů, je urychlení mnohem menší. Nicméně, i přesto je přínos Tesly markantní.
Vědci nyní budou moci dělat extrémně náročné výpočty, simulace a pokusy rovnou ve své laboratoři či dokonce doma. Za tento luxus mohou poděkovat nejen vývojářům z Nvidie, ale paradoxně i počítačovým hráčům, neboť bouřlivý vývoj GPU procesorů financovali z velké části právě oni při honbě za nejlepší grafikou ve svých oblíbených hrách.