publikuj: Opublikuj w wykop.pl Opublikuj we flaker.pl Opublikuj na OSnews.pl Opublikuj w delicious wydrukuj
skomentuj »

TAGI: clf , combined log format , liczba odwiedzin , licznik odwiedzin , serwer , statystyka serwera , webalizer

2007-08-29 23:08  |  Artur Pęczak

Witryna pod lupą, czyli jak korzystać z Webalizera

Witryna pod lupą, czyli jak korzystać z Webalizera

Czy Twoja strona internetowa jest popularna? Wiesz to, zgadujesz czy może nie masz zielonego pojęcia, kto ją odwiedza? Jeżeli tym jednym zdaniem obudziliśmy Twoją ciekawość, to ten tekst jest właśnie dla Ciebie.

Jeszcze kilka lat temu sporym powodzeniem cieszyły się liczniki odwiedzin. Specjalny skrypt (program) zliczał liczbę wyświetleń odpowiednio spreparowanego pliku graficznego (licznika) i udostępniał tę informacje autorowi oraz innym użytkownikom odwiedzającym stronę. Takie mechanizmy kontroli liczby odwiedzin strony powoli odchodzą do lamusa, choćby ze względu na niewielką wartość zbieranych przez nie danych.

Alternatywą dla liczników – równie prostą w zastosowaniu, choć znacznie bardziej funkcjonalną – jest analiza logów serwera. Każde odwołanie do serwera WWW rejestrowane jest w specjalnym dzienniku zdarzeń. Najczęściej jest to zwykły plik tekstowy, w którym informacje te są zapisywane w ustalonej konwencji, o czym za chwilę. Poddając pojedyncze wpisy zdarzeń dalszej analizie, np. zliczając ich liczbę wystąpień, odpowiednie narzędzia analityczne potrafią w ciągu kilkunastu sekund wygenerować syntetyczny raport.

Należy jednak pamiętać o tym, że ani liczniki, ani analiza dziennika zdarzeń serwera nie dają w pełni rzeczywistego obrazu sytuacji związanej z odwiedzinami. Istnieje bowiem wiele czynników, które przekłamują uzyskiwane wyniki. Należą do nich m.in. sytuacje, w których użytkownicy korzystają z sieci firmowych (widoczni są oni pod jednym adresem IP), serwerów proxy lub samodzielnie zmieniają sposób, w jaki przeglądarka „przedstawia się” serwerowi. Szerzej o tym zagadnieniu pisze B. Barrett w krótkim przewodniku po analizie logów serwera WWW – Simpletons Guide to Web Server Analysis.

Common Logfile Format

Podstawowym formatem zapisu logów w większość serwerów WWW jest Common Logfile Format (CLF). Informacja o każdym zdarzeniu (odwołaniu) zapisywana jest do zwykłego pliku tekstowego po jednym wpisie na linię. Pojedyncza linia zawiera aż (lub tylko) siedem informacji o zdarzeniu, każda oddzielona od siebie spacją, a jej format ma postać:

remotehost rfc931 authuser [date] "request" status bytes

Pole remotehost zawiera nazwę lub adres IP komputera, który połączył się z serwerem. Z kolei rfc931 niesie informacje o nazwie użytkownika na danym komputerze, authuser natomiast nazwę, którą osoba odwiedzająca wprowadziła w formularzu autoryzacyjnym, o ile strona ta była chroniona hasłem. Pole [date] (w nawiasach kwadratowych) wskazuje czas, w którym nastąpiło odwołanie. Request to zaś żądanie przesłane do serwera, np. żądanie pliku o określonej nazwie. To, jaką odpowiedź zwrócił serwer klientowi, przechowywane jest w sekcji status. Parametr ten przyjmuje wartość liczbową zgodnie z kodami statusów HTTP zwracanymi przez serwer. Ostatnie z pól – bytes – określa rozmiar pliku przesłanego do klienta.

Obok CLF wiele serwerów, w tym Apache, potrafi zbierać logi w formacie Combined Log Format. Format ten dostarcza dwóch dodatkowych informacji w stosunku do CLF. Są one zamieszczane jako dwie ostatnie pozycje w wierszu i zawierają dane o stronie, z której zostało skierowane wywołanie (ang. referer), oraz przeglądarce, jakiej użył odwiedzający (ang. user-agent).

Przykładowy log Apache’a zarejestrowany w formacie CLF (common) ma postać:

192.168.16.1 - - [22/Jun/2007:13:49:38 +0200]
"GET /index.html HTTP/1.1" 200 36341

Ten sam log, ale w formacie Combined Log Format, zostałby wzbogacony o dodatkowe informacje:

192.168.16.1 - - [22/Jun/2007:13:49:38 +0200]    
"GET /index.html HTTP/1.1" 200 36341    
"http:// 192.168.16.2/linki.html" "Mozilla/5.0    
(Windows; U; Windows NT 5.1; pl; rv:1.8.1.5)
Gecko/20070713 Firefox/2.0.0.5"

W przypadku Apache’a administrator może samodzielnie zadeklarować format logów. Służy do tego parametr LogFormat zamieszczony w głównym pliku konfiguracyjnym serwera. W większości wypadków definicje common oraz combined są poprawne i nie ma potrzeby ich modyfikowania.

Dyrektywę LogFormat można stosować w odniesieniu do całościowej konfiguracji serwera lub pojedynczego serwera wirtualnego w dyrektywie <VirtualHost>. Przykładowy wpis w pliku ustawień Apache’a wygląda następująco:

CustomLog /var/log/apache2/access.log combined

«poprzednia 1 2 3 4 następna »

publikuj: Opublikuj w wykop.pl Opublikuj we flaker.pl Opublikuj na OSnews.pl Opublikuj w delicious wydrukuj
skomentuj »

Polecamy

Reklama

Komentarze

Uwaga! Możesz zarejestrować się w serwisie i w ten sposób zarezerwować swój nick oraz ominąć konieczność ciągłego odczytywania wyrazów.

Aby dodać komentarz, musisz podać swój nick, treść komentarza oraz poprawnie przepisać oba słowa z obrazka (słowa muszą być rozdzielone spacją).
W treści komentarza można używać języka formatowania BBcode.

Polecane książki

Czytaj Webhosting

Chcesz być na bieżąco z naszymi informacjami? Zapisz się na Newsletter.

Zarejestruj domenę

Sprawdź dostępność swojej domeny:

.pl: 0 zł   .com: 19.90 zł
.com.pl: 0 zł   .eu: 19.90 zł