copyright I Ljungströmilj@flowsim.se piltillbaka till flowsims startsida 



 

VAD SOM SYNS I WEBBSERVERSTATISTIK & VAD SOM INTE SYNS & VAD DET NU KAN BETYDA...

Träffar, hits och accesser - vad är det?

Ett exempel

 
August sitter vid sin dator och öppnar en hemsida på webbplatsen www.strindberg.nn.
Sidan han tittar på består av en HTML-fil och på sidan finns 15 bilder (en bakgrundsbild, en logo, några olika pilar, några menybilder etc). Om August låter sidan ladda klart har han alltså hämtat 16 filer och därmed åstadkommit 16 träffar (accesser, eng. hits) på webbplatsen www.strindberg.nn.
 
August går vidare och tittar på en ny sida på samma webbplats - en HTML-fil och 11 nya bilder - och är uppe i 28 träffar. Nästa sida han tittar på består av en HTML-fil och sex nya bilder.
 
August har nu tittat på tre stycken delsidor på en webbplats och stått för 35 träffar på den här webbplatsen.
  • En träff (en hit, en access) är inte samma sak som en besökare.
  • En träff betyder att en fil - en textfil, en HTML-fil, en bild-fil, ett CGI-script etc - hämtats av någon.

 
pil
 

Och vem har egentligen varit på www.strindberg.se?

Webbansvarig på webbplatsen www.strindberg.nu tar sig en titt på sina loggfiler och ser följande:
 
totalt - 35 träffar
 
Han/hon inser snabbt att det totala antalet träffar är totalt ointressant och tar istället reda på hur många träffar HTML-filerna fått.
 
HTML-fil 1 - 1 träff
HTML-fil 2 - 1 träff
HTML-fil 3 - 1 träff
 
Varje HTML-fil har hämtats en gång men... Är det en och samma person eller är det två eller tre olika personer som tittat på de tre delsidorna (HTML-fil 1, 2 och 3)?
 
I serverns loggfiler kan man se vilken IP-adress eller vilket IP-nummer (t ex sdu242-238.ppp.algonet.se eller 123.123.123.123) som hämtat en bestämd fil.
 
Även om de tre HTML-filerna hämtats hem av ett och samma IP-nummer så kan det mycket väl vara olika personer som hämtat filerna. Och omvänt behöver inte tre olika IP-adresser betyda att det är tre personer som tittat på sidan.
  • det är oftast omöjligt att avgöra om det är en eller flera personer som laddat hem filer oavsett om IP-nummer och IP-adresser är desamma eller olika.

 
pil
 

Vad har cachen med det hela att göra?

exemplet fortsätter
August stannar kvar på samma webbplats. Han klickar på Föregående och återvänder till den föregående sidan. Blir det fler träffar av det?
 
Normalt blir det inte det för nu ligger sidan förmodligen i Augusts cache.
 
Cachen i besökarens webbläsare lagrar temporärt alla hemtagna sidor på besökarens dator. Det är därför det går snabbt att bläddra tillbaka till en sida när man väl låtit den ladda klart en gång.
 
Om August valt att inte låta webbläsaren spara några sidor i cachen och inga andra cacher heller används skulle 7 nya träffar registreras när han klickar på Föregående. Går han sedan tillbaka till första sidan blir det ytterligare 16 nya träffar och 58 träffar totalt. I så fall skulle statistiken just nu se ut så här
www.strindberg.nu
totalt - 58 träffar
HTML-fil 1 - 2 träff
HTML-fil 2 - 2 träff
HTML-fil 3 - 1 träff
 
Den som gör en hemsida kan också se till så att sidan aldrig hamnar i någon cache och i så fall blir det alltså också ytterligare 7 träffar när August väljer Föregående.
 
Alla sidorna på webbplatsen www.strindberg.nu är dock cachebara och Augusts webbläsare cachar de sidor han tittar på så det blir inga fler träffar hur mycket August än bläddrar fram och tillbaka i sidorna och statistiken ser alltså för tillfället ut så här:
 
www.strindberg.nu
totalt - 35 träffar
HTML-fil 1 - 1 träff
HTML-fil 2 - 1 träff
HTML-fil 3 - 1 träff
 
August tycker att webbplatsen är kul och ger adressen till Siri som sitter vid en dator strax intill. Siri skriver in adressen och trycker på RETURN. Företaget, skolan eller var det nu är August och Siri befinner sig, använder en gemensam cacheserver och där finns nu de sidor som August just tittat på; Siris order till webbläsaren att hämta sidan når alltså inte längre än till den cachen. Att Siri tittar på sidan syns inte alls på den server där webbplatsen www.strindberg.nn ligger och inga träffar registreras alltså.
 
Siri tycker också att webbplatsen är kul och till slut sitter alla 40 personerna på avdelningen och tittar på samma sidor. Sidorna finns hela tiden i cachen och inga träffar registreras på den server där webbplatsen www.strindberg.nn ligger.
 
Statistiken ser ut så här:
 
www.strindberg.nu
totalt - 35 träffar
HTML-fil 1 - 1 träff
HTML-fil 2 - 1 träff
HTML-fil 3 - 1 träff
 
Och det ser fortfarande ut som om var och en av de tre HTML-sidorna har haft besök av en person.
I själva verket har nu 40 personer tittat på en eller flera av de tre HTML-sidorna.
 
Sedan väljer Siri att klicka på en länk som leder till ytterligare en delsida på samma webbplats; den sidan har varken August eller någon annan besökt. Sidan finns inte på den lokala webbcacheservern men denna kan i sin tur vara konfigurerad till att leta i någon annan webbcacheserver och finns sidan inte på den heller så kan begäran gå vidare till ytterligare en annan osv.
 
Just den här länken som Siri klickar på leder till en delsida (HTML-fil 4) som ingen någonsin brukar titta på så den finns inte cachad någonstans utan begäran går vidare ända till servern där webbplatsen www.strindberg.nn finns och där registreras nu en träff på filen HTML-fil 4. Det finns inte en enda bild på den sidan så Siri producerar bara en träff totalt.
 
Statistiken ser för tillfället ut så här:
 
www.strindberg.nu
totalt - 36 träffar
HTML-fil 1 - 1 träff
HTML-fil 2 - 1 träff
HTML-fil 3 - 1 träff
HTML-fil 4 - 1 träff
 
Nu ser det ut som om de fyra HTML-sidorna var och en fått besök av en person. Alla fyra sidorna ser ut att vara lika populära.
I själva verket har 40 personer tittat på en eller flera av de tre första HTML-sidorna och bara en enda har tittat på sida nr 4.
 
För att dra det här in extremum: webbplatsen gör succé även på andra avdelningar och det slutar med att hundratals människor sitter och tittar på sidorna 1, 2 och 3. Det här flitiga besökandet gör att sidorna hela tiden finns i den gemensamma cachen. Ingenting av all den här aktiviteten syns på servern där www.strindberg.nn finns.
Den ointressanta sidan 4 däremot besöks sällan och hinner åka ur cachen mellan varven med resultatet att den sidan kommer att få många träffar på hemmaservern och därmed se ut att vara mest välbesökt...
  • en HTML-sida som i hemmaserverns statistik har fått t ex tio träffar kan ha setts och lästs av många fler personer...
  • en HTML-sida som i hemmaserverns statistik har fått t ex tio träffar kan ha setts och lästs av bara en enda person...

 
pil
 

Så hur ser en träff egentligen ut?

Varje gång någon vill hämta en fil på en server (och den filen inte finns cachad någon annanstans!) registreras det i en loggfil som normalt heter någonting i stil med access.log. Så här kan en bit av en loggfil se ut:
 
bild av loggfil Längst till vänster kan man se "vem" som hämtat hem en fil, här är det bl a någon som använder algonet som internetoperatör som hämtat några filer på den här servern.
Därefter kan man se datum och tid och vilken metod (GET eller POST) som användes och därefter vilken fil som hämtades.
 
Med hjälp av den här filen kan man så skapa någon sorts statistik. Hur många som sett eller läst filen
iljsida1.html kan man inte få svar på däremot kan man få reda på hur många gånger filen iljsida1.html har hämtats från hemmaservern. (Antalet hämtningar kan alltså vara mycket större eller mycket mindre än antal personer som sett sidan...)
 
Eftersom den här loggfilen finns på en dator som använder UNIX eller Linux som operativsystem kan man snabbt få reda på det; man skriver helt enkelt in följande kommando i prompten
 
grep -c iljsida1.html access.log
 
och trycker på ENTER. Kommandot räknar alla förekomster av ordet iljsida1.html i filen access.log
 
Några varianter:
 
Hur många filer har
mindator.mindoman.se laddat hem? Skriv
 
grep -c mindator.mindoman.se access.log
 
Hur många gånger har filen
bild.gif laddats hem? Skriv
 
grep -c bild.gif access.log

 
Syntaxen är alltså:
 
grep -c ord_att_leta_efter fil_att_leta_i
 
där
ord_att_leta_efter kan bytas ut mot t ex ett ord eller ett filnamn. -c betyder helt enkelt att resultatet av letandet inte ska printas som vanligt rad för rad utan räknas. Ett tal blir alltså resultatet av det här kommandot.
 
Om man i stället vill ha just en listning av alla som hämtat filen
iljsida1.html plockar man bort -c och skriver så här:
 
grep iljsida1.html access.log
 
Är det många som laddat hem
iljsida1.html så kommer man bara att kunna se de sista raderna i terminalfönstret. Då kan man skriva så här
 
grep iljsida1.html access.log | more
 
Därefter kan man bläddra i resultatlistan med hjälp av mellanslagstangenten (hel sida) eller ENTER (radvis).

 
pil
 

Cachen i Netscape

Cache-inställningarna i Netscape hittar man om man i webbläsarens menyrad klickar på Redigera/Inställningar och därefter på plustecknet framför Avancerat och slutligen på Cache.
Man kan t ex ändra storlek på såväl minnescache som diskcache och bestämma var de cachade filerna ska hamna.
Klickar man knapparna Töm minnescache och Töm diskcache så försvinner alla sidor man besökt och man måste hämta dem på nätet igen.

 

 

 

 

Sidan gjordes av
 
ilj@flowsim.se
 
Den här sidan hör hemma i ett ramsystem
hos:
http://www.flowsim.se

 

 
piltillbaka till flowsims startsida