Witryna pod lupą, czyli jak korzystać z Webalizera
Czy Twoja strona internetowa jest popularna? Wiesz to, zgadujesz czy może nie masz zielonego pojęcia, kto ją odwiedza? Jeżeli tym jednym zdaniem obudziliśmy Twoją ciekawość, to ten tekst jest właśnie dla Ciebie.
Jeszcze kilka lat temu sporym powodzeniem cieszyły się liczniki odwiedzin. Specjalny skrypt (program) zliczał liczbę wyświetleń odpowiednio spreparowanego pliku graficznego (licznika) i udostępniał tę informacje autorowi oraz innym użytkownikom odwiedzającym stronę. Takie mechanizmy kontroli liczby odwiedzin strony powoli odchodzą do lamusa, choćby ze względu na niewielką wartość zbieranych przez nie danych.
Alternatywą dla liczników – równie prostą w zastosowaniu, choć znacznie bardziej funkcjonalną – jest analiza logów serwera. Każde odwołanie do serwera WWW rejestrowane jest w specjalnym dzienniku zdarzeń. Najczęściej jest to zwykły plik tekstowy, w którym informacje te są zapisywane w ustalonej konwencji, o czym za chwilę. Poddając pojedyncze wpisy zdarzeń dalszej analizie, np. zliczając ich liczbę wystąpień, odpowiednie narzędzia analityczne potrafią w ciągu kilkunastu sekund wygenerować syntetyczny raport.
Należy jednak pamiętać o tym, że ani liczniki, ani analiza dziennika zdarzeń serwera nie dają w pełni rzeczywistego obrazu sytuacji związanej z odwiedzinami. Istnieje bowiem wiele czynników, które przekłamują uzyskiwane wyniki. Należą do nich m.in. sytuacje, w których użytkownicy korzystają z sieci firmowych (widoczni są oni pod jednym adresem IP), serwerów proxy lub samodzielnie zmieniają sposób, w jaki przeglądarka „przedstawia się” serwerowi. Szerzej o tym zagadnieniu pisze B. Barrett w krótkim przewodniku po analizie logów serwera WWW – Simpletons Guide to Web Server Analysis.
Common Logfile Format
Podstawowym formatem zapisu logów w większość serwerów WWW jest Common Logfile Format (CLF). Informacja o każdym zdarzeniu (odwołaniu) zapisywana jest do zwykłego pliku tekstowego po jednym wpisie na linię. Pojedyncza linia zawiera aż (lub tylko) siedem informacji o zdarzeniu, każda oddzielona od siebie spacją, a jej format ma postać:
remotehost rfc931 authuser [date] "request" status bytes
Pole remotehost zawiera nazwę lub adres IP komputera, który połączył się z serwerem. Z kolei rfc931 niesie informacje o nazwie użytkownika na danym komputerze, authuser natomiast nazwę, którą osoba odwiedzająca wprowadziła w formularzu autoryzacyjnym, o ile strona ta była chroniona hasłem. Pole [date] (w nawiasach kwadratowych) wskazuje czas, w którym nastąpiło odwołanie. Request to zaś żądanie przesłane do serwera, np. żądanie pliku o określonej nazwie. To, jaką odpowiedź zwrócił serwer klientowi, przechowywane jest w sekcji status. Parametr ten przyjmuje wartość liczbową zgodnie z kodami statusów HTTP zwracanymi przez serwer. Ostatnie z pól – bytes – określa rozmiar pliku przesłanego do klienta.
Obok CLF wiele serwerów, w tym Apache, potrafi zbierać logi w formacie Combined Log Format. Format ten dostarcza dwóch dodatkowych informacji w stosunku do CLF. Są one zamieszczane jako dwie ostatnie pozycje w wierszu i zawierają dane o stronie, z której zostało skierowane wywołanie (ang. referer), oraz przeglądarce, jakiej użył odwiedzający (ang. user-agent).
Przykładowy log Apache’a zarejestrowany w formacie CLF (common) ma postać:
192.168.16.1 - - [22/Jun/2007:13:49:38 +0200] "GET /index.html HTTP/1.1" 200 36341
Ten sam log, ale w formacie Combined Log Format, zostałby wzbogacony o dodatkowe informacje:
192.168.16.1 - - [22/Jun/2007:13:49:38 +0200] "GET /index.html HTTP/1.1" 200 36341 "http:// 192.168.16.2/linki.html" "Mozilla/5.0 (Windows; U; Windows NT 5.1; pl; rv:1.8.1.5) Gecko/20070713 Firefox/2.0.0.5"
W przypadku Apache’a administrator może samodzielnie zadeklarować format logów. Służy do tego parametr LogFormat zamieszczony w głównym pliku konfiguracyjnym serwera. W większości wypadków definicje common oraz combined są poprawne i nie ma potrzeby ich modyfikowania.
Dyrektywę LogFormat można stosować w odniesieniu do całościowej konfiguracji serwera lub pojedynczego serwera wirtualnego w dyrektywie <VirtualHost>. Przykładowy wpis w pliku ustawień Apache’a wygląda następująco:
CustomLog /var/log/apache2/access.log combined
«poprzednia 1 2 3 4 następna »
Komentarze
Aby dodać komentarz, musisz podać swój nick, treść komentarza oraz poprawnie przepisać oba słowa z obrazka
(słowa muszą być rozdzielone spacją).
W treści komentarza można używać języka formatowania BBcode.
Popularne
Nazwa padła ofiarą szantażystów, inni polscy hosterzy też zagrożeni?
22
Darmowy Internet od Aero2. Jak go zdobyć i jakie są prawdziwe koszta? Instrukcja krok po kroku
11
Programowanie w środowisku Android – wprowadzenie do projektowania aplikacji dla urządzeń mobilnych
17
Premiera Diablo 3 wzbudziła dyskusję na temat gier, które zawsze chcą być online
19
Nowy problem z Windows 8: bootuje się za szybko
10
Amerykańscy rodzice straszeni „e-narkotykami” dostępnymi w Sieci
21
Anonymous upubliczniają 1,7 GB danych wykradzionych Departamentowi Sprawiedliwości USA
12
Blueseed: libertariańska sztuczna wyspa przyciągnęła już ponad sto startupów z całego świata
8
Rewolucja w Firefoksie, nowa łatka czterokrotnie ograniczyła zużycie pamięci
20
Darmowy Internet od Aero2. Jak go zdobyć i jakie są prawdziwe koszta? Instrukcja krok po kroku
11
CVDazzle: makijaż jest w stanie pokonać automatyczne systemy ulicznego monitoringu
3
Programowanie w środowisku Android – wprowadzenie do projektowania aplikacji dla urządzeń mobilnych
17
Ubuntu 12.04 LTS już dostępny: stabilna dystrybucja na następne pięć lat?
28
Zostań webmasterem polskiego rządu, zarobisz na komfortowe życie dla siebie i swojej rodziny
33
Społeczność
muniu aaaaaaaaaaaaaaaaa
miszczu Wspaniała technologia! Dzięki niej zawsze będziesz patrzył w kierunku w...
miszczu Tytuł nie oddaje rzeczywistości jak zwykle. Mimo wszystko Microsoft...
mistrz autor jest samobójcą, używa internet explorera
boemund_2 Bardzo dobrze. Na dzień dzisiejszy posiadacz VS2010 za prawie 3 tysiaki...
Fox @Wszerad
W obydwu przypadkach piszesz jednak o filmach przyrodniczych ;)
WebDev Uważam, że lepiej pisać aplikacje okienkowe stosując przenośne biblioteki...
- Najdmen.pl: Konta www z wyłączonym licznikiem transferu od IONIC.pl (1)
- 2BE.PL: [Oferta] Promocja jak złoto w 2BE.PL (1)
- gardius: Dobra hurtownia sportowa (1)
- gardius: Tanie książki gdzie warto kupować? (1)
- Najdmen.pl: PROMOCJA, 500 DOMEN .EU ZA 1 PLN NETTO ! (1)
- VMLine: [Oferta] Serwery VPS Xen-HVM/OpenVZ z darmową administracją (2)
- Marek: Generowanie PDFa (2)
Polecane książki
Praca
Czytaj Webhosting
Chcesz być na bieżąco z naszymi informacjami? Zapisz się na Newsletter.
Zarejestruj domenę
Sprawdź dostępność swojej domeny:
| .pl: | 0 zł | .com: | 19.90 zł | |
|---|---|---|---|---|
| .com.pl: | 0 zł | .eu: | 19.90 zł |








