Witryna pod lupą, czyli jak korzystać z Webalizera
Czy Twoja strona internetowa jest popularna? Wiesz to, zgadujesz czy może nie masz zielonego pojęcia, kto ją odwiedza? Jeżeli tym jednym zdaniem obudziliśmy Twoją ciekawość, to ten tekst jest właśnie dla Ciebie.
Jeszcze kilka lat temu sporym powodzeniem cieszyły się liczniki odwiedzin. Specjalny skrypt (program) zliczał liczbę wyświetleń odpowiednio spreparowanego pliku graficznego (licznika) i udostępniał tę informacje autorowi oraz innym użytkownikom odwiedzającym stronę. Takie mechanizmy kontroli liczby odwiedzin strony powoli odchodzą do lamusa, choćby ze względu na niewielką wartość zbieranych przez nie danych.
Alternatywą dla liczników – równie prostą w zastosowaniu, choć znacznie bardziej funkcjonalną – jest analiza logów serwera. Każde odwołanie do serwera WWW rejestrowane jest w specjalnym dzienniku zdarzeń. Najczęściej jest to zwykły plik tekstowy, w którym informacje te są zapisywane w ustalonej konwencji, o czym za chwilę. Poddając pojedyncze wpisy zdarzeń dalszej analizie, np. zliczając ich liczbę wystąpień, odpowiednie narzędzia analityczne potrafią w ciągu kilkunastu sekund wygenerować syntetyczny raport.
Należy jednak pamiętać o tym, że ani liczniki, ani analiza dziennika zdarzeń serwera nie dają w pełni rzeczywistego obrazu sytuacji związanej z odwiedzinami. Istnieje bowiem wiele czynników, które przekłamują uzyskiwane wyniki. Należą do nich m.in. sytuacje, w których użytkownicy korzystają z sieci firmowych (widoczni są oni pod jednym adresem IP), serwerów proxy lub samodzielnie zmieniają sposób, w jaki przeglądarka „przedstawia się” serwerowi. Szerzej o tym zagadnieniu pisze B. Barrett w krótkim przewodniku po analizie logów serwera WWW – Simpletons Guide to Web Server Analysis.
Common Logfile Format
Podstawowym formatem zapisu logów w większość serwerów WWW jest Common Logfile Format (CLF). Informacja o każdym zdarzeniu (odwołaniu) zapisywana jest do zwykłego pliku tekstowego po jednym wpisie na linię. Pojedyncza linia zawiera aż (lub tylko) siedem informacji o zdarzeniu, każda oddzielona od siebie spacją, a jej format ma postać:
remotehost rfc931 authuser [date] "request" status bytes
Pole remotehost zawiera nazwę lub adres IP komputera, który połączył się z serwerem. Z kolei rfc931 niesie informacje o nazwie użytkownika na danym komputerze, authuser natomiast nazwę, którą osoba odwiedzająca wprowadziła w formularzu autoryzacyjnym, o ile strona ta była chroniona hasłem. Pole [date] (w nawiasach kwadratowych) wskazuje czas, w którym nastąpiło odwołanie. Request to zaś żądanie przesłane do serwera, np. żądanie pliku o określonej nazwie. To, jaką odpowiedź zwrócił serwer klientowi, przechowywane jest w sekcji status. Parametr ten przyjmuje wartość liczbową zgodnie z kodami statusów HTTP zwracanymi przez serwer. Ostatnie z pól – bytes – określa rozmiar pliku przesłanego do klienta.
Obok CLF wiele serwerów, w tym Apache, potrafi zbierać logi w formacie Combined Log Format. Format ten dostarcza dwóch dodatkowych informacji w stosunku do CLF. Są one zamieszczane jako dwie ostatnie pozycje w wierszu i zawierają dane o stronie, z której zostało skierowane wywołanie (ang. referer), oraz przeglądarce, jakiej użył odwiedzający (ang. user-agent).
Przykładowy log Apache’a zarejestrowany w formacie CLF (common) ma postać:
192.168.16.1 - - [22/Jun/2007:13:49:38 +0200] "GET /index.html HTTP/1.1" 200 36341
Ten sam log, ale w formacie Combined Log Format, zostałby wzbogacony o dodatkowe informacje:
192.168.16.1 - - [22/Jun/2007:13:49:38 +0200] "GET /index.html HTTP/1.1" 200 36341 "http:// 192.168.16.2/linki.html" "Mozilla/5.0 (Windows; U; Windows NT 5.1; pl; rv:1.8.1.5) Gecko/20070713 Firefox/2.0.0.5"
W przypadku Apache’a administrator może samodzielnie zadeklarować format logów. Służy do tego parametr LogFormat zamieszczony w głównym pliku konfiguracyjnym serwera. W większości wypadków definicje common oraz combined są poprawne i nie ma potrzeby ich modyfikowania.
Dyrektywę LogFormat można stosować w odniesieniu do całościowej konfiguracji serwera lub pojedynczego serwera wirtualnego w dyrektywie <VirtualHost>. Przykładowy wpis w pliku ustawień Apache’a wygląda następująco:
CustomLog /var/log/apache2/access.log combined
«poprzednia 1 2 3 4 następna »
Polecamy
Reklama
Komentarze
Aby dodać komentarz, musisz podać swój nick, treść komentarza oraz poprawnie przepisać oba słowa z obrazka
(słowa muszą być rozdzielone spacją).
W treści komentarza można używać języka formatowania BBcode.
Popularne
MSWiA zamówiło narzędzia do „złamania” Tora i podsłuchiwania internautów. Czy złamało przy tym prawo?
89
Korea Północna: korzystasz z telefonu komórkowego? Jesteś więc zbrodniarzem wojennym
5
Nowa polityka prywatności Google'a już za miesiąc wejdzie w życie. Mamy się czego bać?
16
Firefox 10 już jest. Wiele atrakcji dla programistów, użytkownicy raczej nic nie zauważą
9
Pobieraczek.pl pozwie internautów, którzy nie chcą płacić abonamentu
1451
Linux wypiera z korporacyjnych serwerów już nie tylko Uniksy, ale i Windows
11
Źle się dzieje z Chrome, ze stabilnością coraz gorzej. Gdzie się podziała słynna izolacja procesów?
23
MSWiA zamówiło narzędzia do „złamania” Tora i podsłuchiwania internautów. Czy złamało przy tym prawo?
89
[Aktualizacja] Facebook zablokował Demotywatory.pl. W czym zawiniły?
36
FBI zamknęło Megaupload. Anonimowi dali się sprowokować. Teraz ich akcja uzasadni potrzebę SOPA?
17
Pobieraczek.pl pozwie internautów, którzy nie chcą płacić abonamentu
1451
Rząd Tuska zablokował dostęp do tańszych leków z internetowych aptek
61
Programowanie w środowisku Android – wprowadzenie do projektowania aplikacji dla urządzeń mobilnych
15
„Donald matole, twój rząd dopadną kibole” – hakerska elita przyłącza się do walki z ACTA
23
Społeczność
hipertracker @slawek22, ORM wcale nie musi tworzyć nieoptymalnych kwerend. Poza tym...
matrixik A ja już długi czas temu przesiadłem się z Konnecta na Mirandę i jestem...
Rumcajs Kolejna PRowska ściema Donka. Już mnie krew zalewa.
Artykuł 41...
zalesz o Pan Sławek :)
Patrzę nic się nie zmieniło, w sumie to nic się nie...
slawek22 Jeszcze taka dygresja na poparcie tezy, akurat sobie czytałem o node...
slawek22 Tylko po co mi 5, 10 albo nawet 15 razy szybszy JRuby skoro całą "moc...
pobieraczek.pl zapłacicie wszyscy ;D
- gardius: Dobra hurtownia sportowa (1)
- gardius: Tanie książki gdzie warto kupować? (1)
- Najdmen.pl: PROMOCJA, 500 DOMEN .EU ZA 1 PLN NETTO ! (1)
- VMLine: [Oferta] Serwery VPS Xen-HVM/OpenVZ z darmową administracją (2)
- Marek: Generowanie PDFa (2)
- Marek: problem z menu (2)
- Marek: Własne checkboxy w HTML,CSS (1)
Polecane książki
Praca
Obsługa księgowa z językiem niemieckim
Tech Support Engineer with fluent English and German, French, Italian or Spanish
Młodszy Specjalista w Dziale Należności ze znajomością języka francuskiego
Analityk Baz Danych i Systemów Monitorowania
Menedżer ds. Klienta Biznesowego
Starszy Programista Aplikacji Internetowych/Team Leader
Czytaj Webhosting
Chcesz być na bieżąco z naszymi informacjami? Zapisz się na Newsletter.
Zarejestruj domenę
Sprawdź dostępność swojej domeny:
| .pl: | 0 zł | .com: | 19.90 zł | |
|---|---|---|---|---|
| .com.pl: | 0 zł | .eu: | 19.90 zł |








