Rychlokurz: Win HTTrack - pavouk na webovské stránky

1. 1. 2003

Sdílet

V dnešní době je možno na internetu najít téměř všechno (jen vědět, kde tohledat). Často však potřebujete si informace na stránkách nejen prohlédnout, ale stáhnout si je k sobě na...
V dnešní době je možno na internetu najít téměř všechno (jen vědět, kde to
hledat). Často však potřebujete si informace na stránkách nejen prohlédnout,
ale stáhnout si je k sobě na počítač. Můžete je tedy ukládat stránku po stránce
(každý asi cítí, že pokud stránek bude víc, je tato metoda zcela neefektivní
nákladná na čas, peníze i prostor na disku), nebo použít některý z programů pro
tak zvané off-line prohlížení stránek. Jeden z nich si dnes představíme.


INSTALACE

Instalace je jednoduchá a prostá, nemusí se jí bát ani ten největší počítačový
"greenhorn". Dvojklikem spustíme instalační exe-soubor a potom už jen klikáme
na tlačítko [>>Next>>]. Toť vše, vítejte...


PRVNÍ SPUŠTĚNÍ

Pokud jsme při instalaci nic neměnili, měl by se nám program po dokončení
instalace rovnou spustit. Pokud se tak nestane, program můžete (i pro příště)
spustit kliknutím na tlačítko [Start] \ Programy \ WinHTTrack \ WinHTTrack
Website Copier.

První otázka programu bude na jazyk, kterým s vámi má komunikovat. Z nabízeného
seznamu si vyberte "Cesky" (i když fantazii se meze nekladou, a pokud někomu
vyhovuje více maďarština...). Program vás upozorní, že pro přepnutí do jiného
jazyku vyžaduje znovuspuštění programu. Zatím však restartovat nebudeme nebojte
se, všechny další nastavovací okénka se nás už budou ptát česky.

Otázka číslo dvě se týká proxy serveru. Pokud pro surfování Internetem
používáte proxy server, zde vyplníte jeho identifikační údaje (adresa proxy
serveru, port, případně ješte pod tlačítkem [Konfigurace] vyplníme jméno a
heslo pro přístup). Že nevíte, co je proxy, natožpak jakou má adresu? Buď tedy
zvolte jednodušší cestu a zeptejte se (nejlépe svého správce sítě), nebo se
podívejte do nastavení vašeho prohlížeče Internetu (pro Internet Explorer je to
z menu Nástroje \ Možnosti Internetu \ Připojení \ Nastavení místní sítě \
sekce Server Proxy a tlačítko [Upřesnit]).

Tím jsme skončili s nastavováním a ocitli se v hlavním okně. Jak nás již
program upozornil, pro komunikaci v češtině budeme muset program zrestartovat
nyní je ta pravá chvíle, tedy nač čekat, jdeme do toho. Tlačítkem [Exit]
program ukončete a přes hlavní Windows-Start nabídku program opět spusťte. Vida
program již na nás mluví česky.


JAK NA TO

Nic nám nebrání spustit náš první stahovací projekt. Tím nás krok za krokem
provede průvodce. Program nám radí začít stisknutím tlačítka [Další >]
poslechněme ho. Nyní máme zadat jméno projektu nebo můžeme vybrat již
existující projekt pro aktualizaci. My ještě žádný projekt nemáme, takže jej
vytvoříme. Do jména zapíšeme např. "MySQL manual" a do pole "Základní cesta"
zapíšeme cestu k místu, kam chceme stažené stránky umístit, např. "c:\www"
(ještě pohodlnější je kliknout na tlačítko [..] a umístění vybrat). Klikneme na
tlačítko [Další >].

V dalším kroku zadáváme podrobnosti ke stahování. Nejprve sdělíme programu,
jakou akci vlastně požadujeme.


Akce:

- Stažení web stránek: Základní stažení stránek z Internetu na lokální disk.
Vhodné pro první stahování ze serveru.

- Stažení web stránek + otázky: Stahování stránek s otázkami. Program se bude v
průběhu stahování ptát, zda má nalezené stránky stahovat či ne.

- Stažení souborů: Stažení pouze souborů specifikovaných v okně adres.

- Stažení všech stránek (vícenásobné stažení): Stáhne všechny stránky z odkazů,
které jsou na uvedených adresách. Pokud do pole pro adresy přetáhnete metodou
drag&drop soubor s vašimi oblíbenými stránkami, stáhnou se všechny na váš pevný
disk.

- Kontrola odkazů na stránkách (test záložek): Zkontroluje platnost odkazů na
uvedených stránkách.

- Navázání přerušeného stahování: Jak název napovídá, slouží tato akce pro
pokračování stahování po přerušení.

- Aktualizace stažených stránek: Kontrola a stažení nových a změněných stránek
z projektu.


Následně musíme programu říci, kterých stránek se to vlastně týká tedy které
stránky chceme stáhnout. Stiskněte tlačítko [Přidat URL]. V okně vyplňte
internetovou adresu, a pokud je to třeba, zadejte jméno a heslo pro přístup ke
stránkám (např. "http://www.mysql.cz/documentation/mysql/bychapter/").

Pokud není stránka jednoduše dostupná pomocí zapsání adresy (např. pokud je
výsledkem odeslání dat z formuláře), pak musíte postupovat trochu složitější
cestou. Začněte stiskem tlačítka [Získat URL]. Okno, které se objeví vám
poradí, že máte postupovat následovně. Spusťte svůj internetový prohlížeč a
nastavte se na stránku s požadovaným formulářem. Potom je potřeba dočasně
nastavit proxy server vašeho prohlížeče (menu Nástroje \ Možnosti Internetu \
Připojení \ Nastavení místní sítě \ sekce Server Proxy). Do adresy proxy
serveru zapište "127.0.0.1" a do čísla portu "3128". Tlačítkem [OK] nastavení
potvrdíte. Nyní vyplňte formulář údaji a stiskněte tlačítko pro odeslání dat.
Tato data budou zachycena programem a budou použita pro stažení stránek. Váš
proxy server prohlížeče můžete následne nastavit na původní hodnoty.

Ať už jednoduchým či složitým způsobem, máme nyní nastaveny adresy stahovaných
stránek. Program tedy ví, odkud má stahovat, ale zatím netuší, co vše chcete
stáhnout. To a mnoho dalšího máte možnost nastavit kliknutím na tlačítko
[Nastavení]. Toto určení je velmi důležité chceme přeci stáhnout všechna
požadovaná data, avšak nic navíc. V následujícím okně je toho opravdu mnoho na
nastavování, my se však zmíníme pouze o tom nejdůležitějším.

Filtry - V tomto listě řekneme programu, které z nalezených souborů požadujeme
stáhnout z Internetu na disk. Uvedeme soubory, které chceme (tlačítko [Zahrnout
odkazy]), a soubory, které naopak nechceme označit ke stažení (tlačítko
[Vyloučit odkazy]).

Limitní hodnoty - Tento list je pravděpodobně nejdůležitější. Nastavujeme v něm
limitní hodnoty, při kterých program ukončí stahování. Brzy totiž zjistíte, že
nebýt tohoto nastavení, měli byste za chvíli plný disk a účet za Internet by se
vyšplhal někam, kam nechcete (a efekt užití tohoto programu by byl úplně
opačný).

Řízení běhu - Ovládá jednotlivá spojení se serverem (jejich počet), nastavuje
dobu čekání na soubory a minimální rychlosti stahování. Tímto nastavením můžete
z vaší linky dostat opravdu maximum.

Odkazy - V této sekci je užitečné zaškrtnout volbu "Stáhnout nejprve HTML
soubory". Soustředíme tím pozornost programu přednostně k HTML souborům, a
teprve následně k souborům ostatních typů.

Protokol, rejstřík, cache - I v této sekci doporučuji ponechat nastavení tak
jak jsou, jen zaškrtnout i volbu "Vytvořit seznam slov". Touto volbou řekneme
programu, aby vytvořil soubor index.txt s databází slov, která se vyskytují v
dokumentech. V tomto souboru budou údaje o tom, kolikrát a kde se jednotlivá
slova vyskytují velice šikovné.

Ostatní sekce můžete ponechat beze změny. Pokud budete přeci jen chtít
experimentovat s nastavením, pomůže vám i poměrně hezky zpracovaná nápověda
(bohužel v angličtině).

Na poslední stránce uvedeme, zda chceme začít stahovat ihned (a pomocí kterého
připojení), nebo nastavit stahování na určený čas, případně pouze nastavení
uložit na později. Pokud uvedeme název dial-upového připojení k Internetu,
program nás již ničím neobtěžuje a připojení je automatické. Zde také máme
možnost zaškrtnout (doporučuji), že chcete spojení zavěsit po dokončení
stahování.

Když přijde správný (nastavený) čas, spustí se stahování. Na obrazovce uvidíte
průběh jednotlivých spojení i celkovou statistiku. Po dokončení stažení všeho
definovaného se připojení k Internetu ukončí (opět, pokud jste to tak
nastavili). Po stažení program nabídne dvě tlačítka. Tlačítkem [Zobrazit
chybový protokol] necháme zobrazit záznam o chybách či varováních, které se
objevily během stahování. Kliknutím na tlačítko [Prohlídnout stažené stránky]
se přeneseme na stránky, které máme stažené na pevném disku. Tyto můžeme
procházet bez připojení k Internetu, a tedy bez poplatků.

Když po čase budeme mít podezření, že ony stránky přestávají být aktuální,
spustíme opět náš program, v poli "Název projektu" vybereme požadovaný projekt
a odklikáme až ke stahování. Program bleskově projde stránky a stáhne všechny
změny. Tato aktualizace bývá opravdu rychlá... a tedy levná.


ZÁVĚR

Ať již jste připojeni pevnou linkou megabytových kapacit, nebo jako já z domova
ždímáte telefonní linku na maximum, HTTrack Website Copier se ukazuje být více
než užitečný pomocník. Pokud se naučíte tento nástroj ovládat, bude vaší pravou
rukou. Nejen stahování manuálů, kontrola změn na sledovaných serverech, ale i
každodenní stažení oblíbených stránek se zprávami zvládne opravdu elegantně.

Domovská stránka: http://www.httrack.com