autor: Magdalena Stempska - nauczyciel bibliotekarz w Zespole Szkół Nr 3 w Toruniu, webmaster Toruńskiego Oddziału TNBSP.
WinHTTrack Website Copier program do ściągania stron WWW
wstęp  |   instalacja  |   ściąganie  |   aktualizacja  |   problemy  |   przeglądanie

Wstęp

Celem, który przyświecał autorce niniejszej pracy jest chęć umożliwienia szerokiej rzeszy nauczycieli różnych specjalności opanowania łatwego, darmowego i działającego w polskiej wersji językowej narzędzia do ściągania z Internetu kompletnych witryn WWW i tworzenia ich kopii (luster) na dysku twardym komputera. Umiejętnosć taka może się okazać szczególnie cenna dla tych nauczycieli bibliotekarzy, którzy w swojej pracy wykorzystują materiały internetowe. Wiadomo, że nadal w większości polskich bibliotek szkolnych nie ma dostępu do Internetu lub jeśli jest, to nie jest on stały i często czas korzystania z Internetu ograniczony jest możliwościami finansowymi szkoły. Zastosowanie programu WinHTTrack umożliwia przekopiowanie ważniejszych z punktu widzenia bibliotekarza witryn na lokalny komputer i tym samym wielokrotne oglądanie ich bez potrzeby ponownego łączenia się z Internetem. Dodatkową zaletą umieszczenia stron na dysku twardym jest znaczne przyspieszenie ich działania.

W przedstawionym dalej opisie pominięte zostały wyjaśnienia dotyczące wielu opcji konfiguracyjnych określających sposób działania programu. Także opis postępowania użytkownika skrócony został do najistotniejszych zagadnień służących osiągnięciu celu tj. ściągnięciu wybranej strony WWW. Szczegółów dotyczących działania i konfiguracji pogramu należy szukać w dołączonej do niego pomocy.


Instalacja programu

Skąd wziąć program?

Program WinHTTrack Website Copier można ściągnąć z Internetu np. z portalu republika.pl ( http://pliki.republika.pl/www/httrack-3.09c.exe). Dla ułatwienia dalszych opisów przyjmujemy, że ściągnięty plik instalacyjny zostanie zapisany na Pulpicie naszego komputera. Program ma status Freeware jest więc darmowy. Zgodnie z zapisem w licencji można go także rozpowszechniać.

Instalacja

Po ściągnięciu programu przystępujemy do jego instalacji. Przedstawię ją krok po kroku nie wdając się jednak w szczegóły i w zasadzie nie zmieniając domyślnych ustawień.
  1. Odnajdujemy na Pulpicie ściągnięty z Internetu plik o nazwie httrack-3.09c.exe (nazwa może różnic sie numerem wersji), klikamy dwukrotnie jego ikonę.



    Pojawi się małe okienko informujące o tym, że będziemy instalować program WinHTTrack Website Copier. Zamykamy je wciskając przycisk O.K.
  2. Kolejnym okienkiem jest okno powitalne programu instalacyjnego, wciskamy przycisk NEXT.



  3. W następnym okienku możemy przeczytać licencję instalowanego oprogramowania. Wciskamy klawisz YES.
  4. W następnych dwóch okienkach wciskamy przycisk NEXT, ewentualną zmianę ustawień pozostawiając bardziej doświadczonym użytkownikom.
  5. W szóstym okienku wciskając klawisz INSTALL rozpoczynamy właściwą instalację. Na ekranie widzimy wskaźnik jej postępu.



  6. Chwilę potem pojawia się okienko informujące o zakończeniu instalacji. Przed wciśnięciem klawisza FINISH można odznaczyć opcję "View history.txt file", aby niepotrzebnie nie otwierać dodatkowego okna z opisem ostatnich zmian w programie.



  7. Jeśli w poprzednim kroku nie odznaczyliśmy opcji "Launch WinHTTrack Website Copier", to po chwili na Pulpicie widzimy uruchomiony program WinHTTrack z otwartym okienkiem "About ...". W okienku tym możemy zmienić język w którym będzie pracował program. Z rozwijalnej listy wybieramy pozycję "Polski", a następnie wciskamy klawisz O.K., aby zamknąć okienko z informacją o tym, że zmiana języka zostanie uwzględniona po zamknięciu i ponownym uruchomieniu programu.



  8. Kolejne, ostatnie już okienko umożliwia konfigurację serwera proxy. Nic nie zmieniamy i wciskamy klawisz O.K.



  9. Zamykamy program wciskając klawisz EXIT a następnie O.K. Od następnego uruchomienia program będzie działał w polskiej wersji językowej.


Ściąganie stron WWW

Uruchomienie programu

Jedną z możliwości uruchomienia programu jest skorzystanie z przycisku START a następnie wybieranie kolejno: PROGRAMY - WINHTTRACK- WINHTTRACK WEBSITE COPIER. Drugim sposobem jest dwukrotne kliknięcie umieszczonej na Pulpicie ikony programu.



Kopiowanie stron

Zaprezentuję najprostszy schemat umożliwiający ściągniecie pojedynczej strony WWW nie próbując zmieniać konfiguracji programu i opcji określających sposób pobierania plików.
  1. Po uruchomieniu programu pojawia się okno w którym wpisujemy dowolną nazwę projektu tj. nazwę dla strony którą będziemy ściągać, będzie to jednocześnie nazwa folderu w którym ściągnięta strona zostanie umieszczona. Wszystkie ściągane przez nas projekty będą umieszczane w folderze wskazanym w polu nazwanym "ścieżka bazowa" - domyślnie na dysku C w folderze "Moje Strony Web". Więc ścieżka dostępu do przykładowej ściągniętej strony może wyglądać następująco: C:\Moje Strony Web\strona festiwalu. Po wpisaniu nazwy wciskamy klawisz DALEJ.



  2. W drugim kroku z rozwijalnej listy wybieramy sposób działania programu. My wybierzmy "Pobierz Stronę(y) Web". Następnie klikamy w okienku "Adres strony w sieci (URL)" i wpisujemy adres strony którą chcemy ściągnąć np.: "http://www.festiwalruchu.pl". Po wykonaniu tych czynności wciskamy przycisk DALEJ.



  3. W kroku trzecim nie zmieniamy żadnych opcji i wciskamy przycisk ZAKOŃCZ.



  4. W kolejnym oknie widzimy jak przebiega proces ściągania plików strony na nasz komputer.



  5. Po zakończeniu tworzenia lustra. Pojawia się okienko, które daje możliwość otworzenia kopii strony i sprawdzenia czy wszystkie jej elementy zostały poprawnie ściągnięte. Wciskając przycisk ZAKOŃCZ możemy zakończyć ściąganie danego projektu i w ramach nowego projektu rozpocząć ściąganie kolejnej strony. Wciskając przyciski WYJŚCIE a następnie O.K. kończymy pracę z programem.




Aktualizacja ściągniętych stron

Strony internetowe często zmieniają swoja zawartość, są aktualizowane, zdarza się też, że ściągnięta przez nas strona nie jest kompletna. Opiszę jak w takich sytuacjach uaktualniać projekt raz już zapisany.
  1. Po uruchomieniu programu rozwijamy listę zawierającą nazwy dotychczasowych projektów. Wybieramy nazwę projektu, który chcemy zaktualizować i wciskamy przycisk DALEJ.
  2. W drugim kroku musimy zadbać o to, aby w polu "Działanie" wybrana była opcja "*Uaktualnij lustro". Wciskamy DALEJ.



  3. Dalsze kroki wyglądają identycznie jak podczas pierwszego tworzenia lustra.


Niektóre problemy ze ściąganiem stron

Ściągając kopie stron z Internetu prędzej czy później spotkamy się z takimi stronami, których ściągnięcie okaże się dla nas trudne lub wręcz niemożliwe. Będą to m.in.:
  • strony, tworzone w oparciu o skrypty realizowane po stronie serwera np. php,
  • strony, których domeny wskazują na ramkę przekierowującą przeglądarkę na inny adres np. wszystkie strony zawierające w nazwie domenę prv.pl,
  • strony, które w kodzie źródłowym posiadają wpisy utrudniające ich ściąganie.


Oglądanie ściągniętych stron

Jak już wiemy ściągnięte przez nas strony zapisane są w podfolderach o nazwach odpowiadających nazwom ich projektów. Możemy je przeglądać wykorzystując zainstalowaną na komputerze przeglądarkę internetową. Aby to zrobić musimy otworzyć folder "Moje Strony Web" i dwukrotnie kliknąć znajdujący się tam plik index.html. Plik ten zawierający spis wszystkich projektów otworzy się przy wykorzystaniu domyślnej przeglądarki internetowej jako strona WWW. Strona ta będzie wyglądać podobnie do przedstawionej na rysunku poniżej.



Po kliknięciu nazwy interesującego nas projektu na krótką chwilę otworzy nam się kolejna strona WWW podobna do pierwszej, lecz zawierająca zazwyczaj tylko jedną nazwę będącą nazwą domenową strony umieszczonej w danym projekcie, a następnie samoistnie otworzy się właściwa kopia strony. W niektórych przypadkach mogą wystąpić problemy z samoistnym otwarciem tej strony, w takiej sytuacji otwieramy ją klikając widniejącą w okienku przeglądarki jej nazwę domenową.



Przeglądanie stron zapisanych na dysku twardym komputera nie ma żadnego związku z programem WinHTTrack i przebiega od niego zupełnie niezależnie. Jedynym niezbędnym oprogramowaniem potrzebnym do ich oglądania jest program spełniający zadania przeglądarki internetowej np. Internet Explorer. Innymi słowy raz ściągnięte strony możemy kopiować na inne komputery i przeglądać bez potrzeby instalowania na nich programu WinHTTrack.