Správné nástroje pro správu a monitorování sítě

Mechanici, kteří hledají závady a opravují letadla Airbus, mají k dispozici specifické nástroje. Ti od Boeingu použí...


Mechanici, kteří hledají závady a opravují letadla Airbus, mají k dispozici
specifické nástroje. Ti od Boeingu používají ale trochu odlišné "nářadí". Na
svou síť se můžete dívat obdobným způsobem. Firemní nástroje a testovací
vybavení se mohou velmi lišit společnost od společnosti, přestože
infrastruktura podnikových sítí je velmi podobná. Zvolit správný nástroj pro
určitou práci je záležitostí posouzení síťových potřeb vaší firmy (a rozpočtu,
který máte k dispozici) a nalezení řešení, jež vaše požadavky splní.
V následujícím textu jsme se rozhodli porovnat nástroje pro správu sítě.
Testovali jsme aplikace WhatsUp Gold 8.0 (IP Switch), UniCenter Application
Performance Monitor 3.5 (Computer Associates), VitalStats 2.0 (Webmetrics),
PacketLogic 3.2.3 (NetIntact), NetCrunch 2.3 (AdRem Software) a Opalis Robot
4.0 (Opalis Software). Náš test nemá vítěze ani poražené, pouze slabé a silné
stránky jednotlivých produktů. Uvedené nástroje představují prostě různé
způsoby, jak splnit určitý úkol.

Jak jsme testovali
U každého z produktů jsme hodnotili schopnost řídit, spravovat, aktualizovat,
monitorovat, informovat o problémech, odhalovat a odstraňovat je, resetovat,
rekonfigurovat a zabezpečit síťová zařízení, servery a klientské počítače.
Veškeré testy probíhaly na WAN sítích.
Schopnost automaticky vyřešit problém byla výhodou. Vyzkoušeli jsme odesílání
SNMP varování a zpracování příchozích varovných hlášení. Vytvářeli jsme zprávy
zobrazující stav zařízení a počítačů, trendy využití sítě, narušení
bezpečnosti, dostupnost a dobu provozu, základní informace o síti a grafické
mapy sítě. Otestovali jsme také specifické funkce nabízené jednotlivými
produkty.
Testovací síť sestávala ze šesti podsíťových fastethernetových domén se
směrovači Perle a Cisco. Mezi použitými OS byly Windows NT/98/2000/Me/XP,
Solaris 8.0 a Mac OS 8. Relační databáze na síti tvořily Oracle8i, IBM DB2
Universal Database, Sybase Adaptive Database Server 12.5 a Microsoft SQL Server
2000. Byly použity přenosové protokoly TCP/IP, IPX, AppleTalk a SNA.
Protokolový analyzér Agilent Advisor sledoval provoz na síti a zjišťoval
celkové zatížení a detailní obsah paketů.
Server Compaq Proliant ML750 se čtveřicí 900MHz procesorů Pentium, 2GB RAM,
135GB pevnými disky a operačním systémem Windows 2000 Advanced Server se stal
testovací platformou pro všechny produkty kromě PacketLogicu firmy NetIntact,
který je dodáván jako samostatné zařízení montovatelné do racku.

WhatsUp Gold 8.0
WhatsUp Gold je velmi užitečným nástrojem vhodným k nasazení v prostředí malých
a středních sítí. Jeho rychlý a přesný proces zjišťování komponent sítě a
informativní grafy o stavu a dostupnosti sítě jsou požehnáním pro
administrátory, kteří se dosud potýkají se zlepšením zmíněných parametrů, a to
bez jakéhokoliv automatizovaného monitorovacího nástroje.
WhatsUp Gold od roku 2000 zaznamenal několik vylepšení v oblasti monitorování a
hlášení. Nyní je schopen (pokud jej nastavíte pro jejich sledování) restartovat
služby Windows, které selhaly, umí exportovat data ve formátu XML a jeho
uživatelské rozhraní je intuitivnější a má rychlejší odezvu.
WhatsUp Gold má však také svá omezení. Nenabízí grafické záznamy Management
Information Base a nenabízí ani referenční úrovně stavu zařízení. Naopak
disponuje dvěma opravnými funkcemi opětovným spuštěním selhavších služeb
operačních systémů Windows a také spuštěním definovaného externího programu v
případě výskytu problémů. Mapa sítě bohužel postrádá symboly základních prvků,
jako jsou například přepínače; telekomunikační rozhraní má ikonu pro Windows
NT, ale nikoliv pro Windows 2000. Zvolíte-li zobrazení aktuálního stavu sítě,
objeví se křiklavé okno, které je užitečné pouze tehdy, pokud tento nástroj
uvedete do stavu "mini-status". WhatsUp Gold se následně přemění na barevně
odlišený stavový pruh (zelená barva značí, že je vše v pořádku, červená
upozorňuje na problém). Stavový pruh lze přesunout do rohu obrazovky.
WhatsUp Gold je jednoduchým nástrojem, disponujícím dobrými funkcemi pro
zjišťování (discovery), využívá přitom ICMP (Internet Control Management
Protocol) ping v nastaveném intervalu ke kontrole síťových zařízení a vytváří
užitečné zprávy. Pokud chcete, může WhatsUp Gold k monitorování zařízení využít
také protokol IPX nebo NetBIOS pakety.
Automatické zjišťování (výrobcem nazývané SmartScan) je působivé. Používá
protokol SNMP a údaje ze směrovacích tabulek; zjišťuje síťová zařízení rychle a
přesně. V našich testech přeměnil SmartScan hierarchická data na sadu
oddělených map podsítí, místo aby nakreslil jednu mapu zahrnující veškerá
zařízení.
Ve stanovených intervalech se WhatsUp Gold dotazuje sítě a sbírá informace o
stavu zařízení. Sleduje také síťový provoz přes protokoly SMTP, HTTP, DNS, FTP,
POP3, IMAP, Telnet a další běžné služby. Lze s ním provádět pingy, skenování
portů, obsahuje také utility pro měření propustnosti. Software umí rovněž
upozornit správce sítě na problémy prostřednictvím e-mailu. Nastavení varovného
e-mailu, informujícího o nedostupnosti síťových zařízení spolu s několika
posledními řádky záznamu událostí Windows NT nám trvalo jen několik minut.
Nabízení zprávy o síťových událostech a statistiky jsou pak užitečné pro
sledování výpadku zařízení a služeb.
Interaktivní webové stránky vzdálené správy bylo radost používat, přičemž
obsahovaly veškeré funkce nativního Win32 rozhraní. Dovolují například na dálku
zkontrolovat stav libovolného síťového zařízení, a to s využitím pouhého
vytáčeného připojení a webového prohlížeče.
Produkt WhatsUp Gold je spolehlivým monitorovacím nástrojem, vhodným k nasazení
do malých a středních sítí, který můžete začít používat ihned, bez nutnosti
zdlouhavého školení.

CA APM 3.5
Sledování doby odezvy aplikací je s využitím Application Performance Monitoru
(APM) firmy CA přesnější a méně náročné, než použití stopek. Jedná se o
vynikající nástroj pro účely kontroly dodržování smluvních ustanovení o
přijatelné době odezvy. Jedná se o dobrý způsob, jak donutit dodavatele
softwaru nebo vaše programátory k upřímnosti, pokud například tvrdí, že nová
aplikace nebo transakční subsystém nabízí dobu odezvy nižší než dvě sekundy.
APM (samostatně dostupná součást produktu UniCenter) sleduje dobu odezvy pomocí
zjišťování začátku a konce síťových událostí, odpovídajících dané transakci.
Modul agenta sbírá naměřené časy během dne a ukládá je do lokální databáze,
přičemž všichni agenti periodicky odesílají výsledné statistiky do centrálního
APM Manageru. S výjimkou webových aplikací je nutné pro každého klienta
nainstalovat agentský modul. Jeho instalace je naštěstí snadná a trvá jen
chvilku. Co se týče webových aplikací, APM běží na serveru a sbírá údaje o
odezvě. Výrobce dodává rozsáhlou databázi znalostí o aktivačních událostech pro
detekci transakcí určenou aplikacím, jako jsou Microsoft Exchange či SAP/R3,
avšak při nutnosti monitorování softwaru vytvořeného na zakázku se nevyhnete
řešení technických detailů. Zpočátku se nám jevilo nastavení položek znalostní
báze pro unikátní transakce jako složité, ale postupem času, jakmile jsme celý
proces pochopili, se stalo snadným.
APM obsahuje také modul Transaction Server, sloužící pro zaznamenávání a
pozdější přehrání transakčních událostí a zpráv. Transaction Server ukládá
transakce ve formě JavaScript nebo VBScript programů, jejichž přehrání lze
naplánovat na určitou dobu.
APM Web Reporting Server zase vytváří zprávy zobrazitelné ve webovém
prohlížeči, a to následujících čtyř kategorií: varování, aplikace, klienti a
servery. K dispozici máte různé typy zpráv Enterprise Reports kumulují data ze
všech agentů; Group Reports zobrazují výsledky z určitých počítačů; Host
Reports poskytují informace z určitého agenta a User Reports vám nabídnou údaje
na základě přihlašovacích jmen operačního systému Windows. Kromě
přednastavených zpráv v každé z kategorií disponuje Web Reporting Server
šablonami, s jejichž pomocí snadno vytvoříte zprávy vlastní.
APM obsahuje také šikovný diagnostický nástroj Data Viewer pro připojení k
agentovi a pro sledování dat v reálném čase.

VitalStats 2.0
Až na jednu výjimku se jedná o nástroj, nad jehož využitím byste neměli váhat.
Služba VitalStats realizovaná firmou WebMetrics monitoruje jeden či více
serverů přístupných z internetu a sleduje problémy s konektivitou, využitím
procesoru, paměti a pevných disků. Při našich testech jsme tuto službu využili
pro dohled nad serverem Microsoft Internet Information Services.
Softwarový agent VitalStats se instaluje na webový server a v minutových či
pětiminutových intervalech komunikuje s jedním ze serverů firmy WebMetrics, na
nějž odesílá statistiky. Tento server sbírá údaje a prezentuje je ve formě
grafů a logů, jež si můžete prohlédnout, pokud se na daný server přihlásíte.
Pokud centrální monitorovací software zjistí problém, jako je například
nadměrné zatížení sledovaného serveru nebo výpadek komunikace, odesílá zprávu
pomocí e-mailu. E-mailové varování může obsahovat například takovouto zprávu:
"Doba stažení stránky přesáhla 30 sekund" nebo "Nelze zobrazit stránku
vase.ip.adresa spolu se záznamem průběhu příkazu traceroute mezi WebMetrics
serverem a příslušným počítačem". Na svých webových stránkách zobrazuje
WebMetrics výkonové grafy za zadané časové období.
Firma WebMetrics nabízí specifické služby pro webové, databázové a aplikační
servery. Na aplikační servery zákazníci neinstalují agenta, místo toho
WebMetrics testuje dostupnost serveru odesíláním tzv. keep-alive zpráv a
zaznamenává odezvu serveru. Firma WebMetrics vybudovala svou síť GlobalWatch ve
více než 17 městech po celém světě, přičemž monitorovací servery jsou k
dispozici v severní Americe, Asii a Evropě.

PacketLogic 3.2
PacketLogic je přesným, dobře navrženým monitorovacím nástrojem. Lze jej snadno
nastavit, přičemž analýza datových toků je praktická a vysoce relevantní.
Produkt PacketLogic je do racku montovatelné zařízení, které připojíte ke své
síti tak, aby provoz procházel přes něj. Zařízení je tvořeno počítačem na
platformě Intel s operačním systémem Linux, který se stará o automatické
spuštění softwaru PacketLogic. Kromě tohoto softwaru vytvořila firma NetIntact,
také vlastní TCP/IP protocol stack, který zařízení pomáhá lépe zvládnout vysoká
zatížení. Testovací zařízení zpracovávalo 25-30 tisíc paketů za sekundu (v
závislosti na obsahu a velikosti paketů), aniž bychom si povšimli nějakého
zpomalení toku dat. PacketLogic se spravuje pomocí klientského modulu, který
lze stáhnout z webu výrobce.
Za pomoci detekce na sedmé vrstvě klasifikuje PacketLogic síťový provoz a
zjišťuje limitní hodnoty (např. pro účely varování) nebo za účelem vytváření
statistik. Zařízení volitelně umí upřednostňovat také určité třídy provozu a
fungovat jako firewall. Vyzkoušeli jsme čtyři funkce: varování, statistiky,
shaping a firewall.
PacketLogic zkoumá obsah každého paketu, nikoliv pouze číslo cílového portu, a
tak zjišťuje příslušný protokol. Rozeznává více než 80 protokolů včetně
Gnutelly, Kazaa, Direct Connectu, Citrixu, HTTP, FTP, POP3, IRC, SMTP a SSH.
PacketLogic sleduje využití sítě podle jednotlivých aplikací, uživatelů a
spojení a vytváří statistické zprávy. Ty například odhalují, které aplikace a
uživatel spotřebovává v daném časovém intervalu největší šířku pásma a jakým
způsobem.
Varovný mechanismus PacketLogicu má nastavitelné limity pro detekci vysokého
vytížení nebo nežádoucího provozu. Pravidla lze nastavit pro různé časové úseky
(například jednotlivé dny v týdnu, přičemž výrobce dělí pravidla do osmi
kategorií: klient, server, port serveru, port klienta, rozhraní serveru,
rozhraní klienta, služba a časový objekt). Pravidla lze aplikovat na jednotlivý
počítač, skupinu počítačů či na veškerý provoz směřující na určitý port.
PacketLogic ukládá varování do souborových záznamů, které lze v klientu
zobrazit obdobným způsobem, jaký nabízí Prohlížeč událostí (Event Viewer) ve
Windows.
Při vysokých zatíženích zařízení rozhoduje o tom, který paket odeslat nejdříve
a který umístit na konec fronty, a to s využitím QoS pravidel nastavených
správcem sítě. Při našich testech PacketLogic exceloval při směrování
kritických paketů před méně důležitými zprávami. Dokonce jsme vyzkoušeli vysoké
zatížení smíšeného TCP/IP a ne-TCP/IP provozu, abychom zjistili, jak se bude
zařízení chovat. TCP má interní regulační mechanismus, který v přítomnosti
ostatních protokolů typicky selhává. Mechanismus sleduje celkovou úroveň TCP
provozu, aby věděl, kdy je třeba aplikovat omezení, avšak detekce úrovně
provozu ignoruje ostatní protokoly během rozhodování o tom, kolik paketů lze
odeslat v rámci "okna" před vyčkáním na odezvu relace. Zařízení PacketLogic
zvládlo provoz velmi dobře, přičemž například upřednostňovalo databázové
transakce před e-mailovými zprávami.

AdRem NetCrunch
NetCrunch se vám bude hodit při zjišťování uzlů sítě, zobrazová ní mapy sítě a
tvorbě užitečných zpráv. Monitoruje zařízení podporující protokol SNMP, Windows
a NetWare servery, a lze jej nainstalovat jako službu Windows, která pracuje na
pozadí.
NetCrunch využívá k odhalení zařízení a počítačů na síti ICMP pingů a SNMP
dotazů. Jeho přesnost na nás udělala dojem. Zjišťování zařízení na síti není
funkcí, která by se implementovala právě nejsnáze, ale firma AdRem to zvládla
skvěle. Co se týče uzlů podporujících SNMP je NetCrunch schopen zjistit typ
zařízení například zda se jedná o přepínač, tiskárnu, NetWare server nebo
směrovač. Nástroj lze nastavit pro opakované skenování sítě, a tak je možné
zjistit zařízení, která při původním skenování nebyla dostupná.
Zjištěné části sítě NetCrunch zobrazuje ve formě hierarchických map podsítí s
jejich vzájemným propojením. Změna barev, pozadí a ikon je snadná, přičemž
problémová zařízení zvýrazňuje NetCrunch pomocí červené blikající ikony. Je
dále schopen zjistit, zda je zařízení zapnuto a u Windows serverů také sleduje,
zda využití zdrojů serveru (procesor, paměť či pevný disk) nepřesáhlo nastavení
limitní hodnoty.
Pokud se na mapu sítě nedíváte zrovna v okamžiku, kdy dojde k problémům,
nemusíte mít obavy. NetCrunch umí administrátory upozornit pomocí e-mailu, SNMP
varování (odesílaných na samostatný systém pro správu sítě, např. OpenView)
nebo pageru. Lze také odeslat varovná hlášení na určité klientské stanice s
operačním systémem Windows. U problémů, které je možné odstranit automaticky,
lze nastavit NetCrunch tak, aby resetoval zařízení, které selhalo, spustil
program nebo rebootoval server. Veškeré funkce pro varování a upozornění při
našich testech fungovaly bez problémů.
Administrační průvodce NetCrunch bohužel podrobně vysvětluje síťové koncepty,
avšak jen málo říká o samotném využití produktu.

OpalisRobot 4.0
Tuto aplikaci lze využít pro monitorování kritických oblastí sítě a plánování
zálohovacích operací a dalších úloh.
OpalisRobot monitoruje záznamy (logy) událostí, záznamové soubory v textovém
formátu, SNMP varování (traps), výkonnostní statistiky a běžící programy. Co se
týče posledně zmíněné kategorie, OpalisRobot detekuje, zda běží určené služby a
procesy. Také sleduje změny souborů, přítomnost zařízení (pomocí ICMP pingu),
běžící webové, FTP, DNS, NNTP a poštovní servery a dostupnost databází.
Výše zmíněné i další podmínky lze využít pro přesné specifikování konkrétních
operací. Například lze zamezit zálohování na pásku, pokud datum modifikace
souboru naznačuje, že program, který měl soubor aktualizovat, nebyl úspěšně
ukončen. OpalisRobot umí zasílat varovná hlášení pomocí e-mailu, pageru nebo
pop-up oken a upozornit na problém, který je třeba odstranit. Pokud lze problém
vyřešit automaticky, umí OpalisRobot spustit program nebo restartovat server.
Využívání uživatelského rozhraní OpalisRobotu bylo potěšením. Grafické
prostřední typu "táhni a pusť" lze použít k nastavení plánovaných úloh podle
určených závislostí. Funkce plánování obsahuje inteligentní kalendář, ve kterém
lze vyznačit pracovní dobu firmy a dobu spuštění plánovaných programů. Lze
volně využívat událostí serveru a sítě pomocí techniky "drag-and-drop" ke
stanovení podmínek pro spuštění programů nebo zaslání varování o chybách. S
využitím OpalisRobotu je odstraňováním problémů téměř zábavou.









Komentáře
K tomuto článku není připojena žádná diskuze, nebo byla zakázána.