Nvidia zasazuje tvrdou ránu AMD, představila extrémní GPU

Celkem 21 miliard tranzistorů, 5 120 CUDA akcelerátorů, 815 milimetrů čtverečních. Tak vypadá Tesla V100, opravdu monstrózní grafická jednotka jednoho z klíčových výrobců, firmy Nvidie. Kde najde uplatnění?

Nvidia zasazuje tvrdou ránu AMD, představila extrémní GPU


Potřebujeme najít cestu, kterou se ubírat po překonání Moorova zákona,“ vysvětluje generální ředitel firmy Jen-Hsun Huang.

Karta Tesla V100 na architektuře Volta tak poněkud bere vítr z plachet architektuře Radeon Vega konkurenční AMD, která nyní působí jako mladší a slabší bratr.

Grafickým procesorům prozatím stále vládne Pascal od Nvidie, tu by však ještě před koncem června měla sesadit Radeon Vega. Uveřejnění Volty však bere AMD vítr z plachet ještě předtím, než se vůbec dostane do oběhu; a to i přesto, že Tesla V100 míří primárně na datacentra, nikoli na hráčské publikum.

Téměř přehnaně obrovská karta vystavěná na 12nm architektuře překonává všechny své předchůdce výkonem i rozměry – současná vlajková loď Nvidie Tesla P100 má 3 830 CUDA akcelerátorů a 15 miliard tranzistorů; u herních PC velmi oblíbená GeForce GTX 1060 má pak „jen“ 1 280 CUDA akcelerátorů.

A zatímco už tak gigantická Tesla P100 je velká 600 mm čtverečních, na Teslu V100 zdaleka nedosahuje – ta se může „pochlubit“ 815 milimetry, což už je opravdu na hraně.

Volta je „u limitu možností fotolitografie,“ popisuje s úsměvem Huang, a stvořená díky rozpočtu na vývoj a výzkum čítajícím více než 3 miliardy dolarů.

Podle Nvidie je mikroprocesorová architektura Volty o 50 % výkonnější než Pascal, což, pokud se v praxi potvrdí, je velmi působivé. Tesla V100 také zahrnuje „tenzorová jádra“ stvořená specificky pro potřeby hlubokého učení (deep learning) a které poskytují 12x větší propustnost teraflopů, než má Pascal Tesla P100, popisuje Huang.

Pro pořádek: do tenzorových jader investoval také Google, který je již běžně pojmenovává jako TPU. Firmy dle dostupných zdrojů nijak nespolupracují, ani se však nezdá, že by se výrazně snažili si navzájem konkurovat.

Tesla V100 využívá 16 Gb ultrarychlé, 4096bitové paměti o vysoké šířce pásma k rychlému zpracování dat. Není jasné, zda spotřebitelské varianty karet Volta budou zahrnovat HBM2; u Radeon Vega je to jisté, technologie je však stále v plenkách a velmi drahá.

GeForce GTX karty série 10 mají GDDR5X technologie založenou na běžných designech pamětí a SK Hynix nedávno oznámil, že „plánuje masově vyrábět pro produkt klienta s high-end grafickou kartou nové vysokorychlostní GDDR6 DRAM moduly na začátku roku 2018.“ O spotřebitelskou verzi některé z karet založené na architektuře Volta jít může.

HBM2 paměť dosahuje rychlostí až 900 Gb/s, říká Nvidia, a Tesla V100 navíc zahrnuje technologii NVLink druhé generace. S rychlostí přenosu 300 Gb/s je nyní NVLink 10x rychlejší než standardní rozhraní PCIe, tvrdí Huang.

Nvidia představila i supervýkonný systém DGX-1, který by měl nahradit až 400 serverů a jenž je právě osazený osmi grafickými kartami Tesla V100. Nabídne tak 40 960 CUDA jader a výkon 960 teraflops.

Úvodní foto: Nvidia










Komentáře