![]() |
![]() |
VAD SOM SYNS I WEBBSERVERSTATISTIK & VAD SOM INTE SYNS & VAD DET NU KAN BETYDA...Träffar, hits och accesser - vad är det?Ett exempelAugust sitter vid sin dator och öppnar en hemsida på webbplatsen www.strindberg.nn. Sidan han tittar på består av en HTML-fil och på sidan finns 15 bilder (en bakgrundsbild, en logo, några olika pilar, några menybilder etc). Om August låter sidan ladda klart har han alltså hämtat 16 filer och därmed åstadkommit 16 träffar (accesser, eng. hits) på webbplatsen www.strindberg.nn. August går vidare och tittar på en ny sida på samma webbplats - en HTML-fil och 11 nya bilder - och är uppe i 28 träffar. Nästa sida han tittar på består av en HTML-fil och sex nya bilder. August har nu tittat på tre stycken delsidor på en webbplats och stått för 35 träffar på den här webbplatsen.
![]() Och vem har egentligen varit på www.strindberg.se?Webbansvarig på webbplatsen www.strindberg.nu tar sig en titt på sina loggfiler och ser följande:totalt - 35 träffar Han/hon inser snabbt att det totala antalet träffar är totalt ointressant och tar istället reda på hur många träffar HTML-filerna fått. HTML-fil 1 - 1 träff HTML-fil 2 - 1 träff HTML-fil 3 - 1 träff Varje HTML-fil har hämtats en gång men... Är det en och samma person eller är det två eller tre olika personer som tittat på de tre delsidorna (HTML-fil 1, 2 och 3)? I serverns loggfiler kan man se vilken IP-adress eller vilket IP-nummer (t ex sdu242-238.ppp.algonet.se eller 123.123.123.123) som hämtat en bestämd fil. Även om de tre HTML-filerna hämtats hem av ett och samma IP-nummer så kan det mycket väl vara olika personer som hämtat filerna. Och omvänt behöver inte tre olika IP-adresser betyda att det är tre personer som tittat på sidan.
![]() Vad har cachen med det hela att göra?exemplet fortsätterAugust stannar kvar på samma webbplats. Han klickar på Föregående och återvänder till den föregående sidan. Blir det fler träffar av det?Normalt blir det inte det för nu ligger sidan förmodligen i Augusts cache. Cachen i besökarens webbläsare lagrar temporärt alla hemtagna sidor på besökarens dator. Det är därför det går snabbt att bläddra tillbaka till en sida när man väl låtit den ladda klart en gång. Om August valt att inte låta webbläsaren spara några sidor i cachen och inga andra cacher heller används skulle 7 nya träffar registreras när han klickar på Föregående. Går han sedan tillbaka till första sidan blir det ytterligare 16 nya träffar och 58 träffar totalt. I så fall skulle statistiken just nu se ut så här www.strindberg.nu totalt - 58 träffar HTML-fil 1 - 2 träff HTML-fil 2 - 2 träff HTML-fil 3 - 1 träff Den som gör en hemsida kan också se till så att sidan aldrig hamnar i någon cache och i så fall blir det alltså också ytterligare 7 träffar när August väljer Föregående. Alla sidorna på webbplatsen www.strindberg.nu är dock cachebara och Augusts webbläsare cachar de sidor han tittar på så det blir inga fler träffar hur mycket August än bläddrar fram och tillbaka i sidorna och statistiken ser alltså för tillfället ut så här: www.strindberg.nu totalt - 35 träffar HTML-fil 1 - 1 träff HTML-fil 2 - 1 träff HTML-fil 3 - 1 träff August tycker att webbplatsen är kul och ger adressen till Siri som sitter vid en dator strax intill. Siri skriver in adressen och trycker på RETURN. Företaget, skolan eller var det nu är August och Siri befinner sig, använder en gemensam cacheserver och där finns nu de sidor som August just tittat på; Siris order till webbläsaren att hämta sidan når alltså inte längre än till den cachen. Att Siri tittar på sidan syns inte alls på den server där webbplatsen www.strindberg.nn ligger och inga träffar registreras alltså. Siri tycker också att webbplatsen är kul och till slut sitter alla 40 personerna på avdelningen och tittar på samma sidor. Sidorna finns hela tiden i cachen och inga träffar registreras på den server där webbplatsen www.strindberg.nn ligger. Statistiken ser ut så här: www.strindberg.nu totalt - 35 träffar HTML-fil 1 - 1 träff HTML-fil 2 - 1 träff HTML-fil 3 - 1 träff Och det ser fortfarande ut som om var och en av de tre HTML-sidorna har haft besök av en person. I själva verket har nu 40 personer tittat på en eller flera av de tre HTML-sidorna. Sedan väljer Siri att klicka på en länk som leder till ytterligare en delsida på samma webbplats; den sidan har varken August eller någon annan besökt. Sidan finns inte på den lokala webbcacheservern men denna kan i sin tur vara konfigurerad till att leta i någon annan webbcacheserver och finns sidan inte på den heller så kan begäran gå vidare till ytterligare en annan osv. Just den här länken som Siri klickar på leder till en delsida (HTML-fil 4) som ingen någonsin brukar titta på så den finns inte cachad någonstans utan begäran går vidare ända till servern där webbplatsen www.strindberg.nn finns och där registreras nu en träff på filen HTML-fil 4. Det finns inte en enda bild på den sidan så Siri producerar bara en träff totalt. Statistiken ser för tillfället ut så här: www.strindberg.nu totalt - 36 träffar HTML-fil 1 - 1 träff HTML-fil 2 - 1 träff HTML-fil 3 - 1 träff HTML-fil 4 - 1 träff Nu ser det ut som om de fyra HTML-sidorna var och en fått besök av en person. Alla fyra sidorna ser ut att vara lika populära. I själva verket har 40 personer tittat på en eller flera av de tre första HTML-sidorna och bara en enda har tittat på sida nr 4. För att dra det här in extremum: webbplatsen gör succé även på andra avdelningar och det slutar med att hundratals människor sitter och tittar på sidorna 1, 2 och 3. Det här flitiga besökandet gör att sidorna hela tiden finns i den gemensamma cachen. Ingenting av all den här aktiviteten syns på servern där www.strindberg.nn finns. Den ointressanta sidan 4 däremot besöks sällan och hinner åka ur cachen mellan varven med resultatet att den sidan kommer att få många träffar på hemmaservern och därmed se ut att vara mest välbesökt...
![]() Så hur ser en träff egentligen ut?Varje gång någon vill hämta en fil på en server (och den filen inte finns cachad någon annanstans!) registreras det i en loggfil som normalt heter någonting i stil med access.log. Så här kan en bit av en loggfil se ut:![]() Därefter kan man se datum och tid och vilken metod (GET eller POST) som användes och därefter vilken fil som hämtades. Med hjälp av den här filen kan man så skapa någon sorts statistik. Hur många som sett eller läst filen iljsida1.html kan man inte få svar på däremot kan man få reda på hur många gånger filen iljsida1.html har hämtats från hemmaservern. (Antalet hämtningar kan alltså vara mycket större eller mycket mindre än antal personer som sett sidan...) Eftersom den här loggfilen finns på en dator som använder UNIX eller Linux som operativsystem kan man snabbt få reda på det; man skriver helt enkelt in följande kommando i prompten grep -c iljsida1.html access.log och trycker på ENTER. Kommandot räknar alla förekomster av ordet iljsida1.html i filen access.log Några varianter: Hur många filer har mindator.mindoman.se laddat hem? Skriv grep -c mindator.mindoman.se access.log Hur många gånger har filen bild.gif laddats hem? Skriv grep -c bild.gif access.log Syntaxen är alltså: grep -c ord_att_leta_efter fil_att_leta_i där ord_att_leta_efter kan bytas ut mot t ex ett ord eller ett filnamn. -c betyder helt enkelt att resultatet av letandet inte ska printas som vanligt rad för rad utan räknas. Ett tal blir alltså resultatet av det här kommandot. Om man i stället vill ha just en listning av alla som hämtat filen iljsida1.html plockar man bort -c och skriver så här: grep iljsida1.html access.log Är det många som laddat hem iljsida1.html så kommer man bara att kunna se de sista raderna i terminalfönstret. Då kan man skriva så här grep iljsida1.html access.log | more Därefter kan man bläddra i resultatlistan med hjälp av mellanslagstangenten (hel sida) eller ENTER (radvis). ![]() Cachen i NetscapeCache-inställningarna i Netscape hittar man om man i webbläsarens menyrad klickar på Redigera/Inställningar och därefter på plustecknet framför Avancerat och slutligen på Cache.Man kan t ex ändra storlek på såväl minnescache som diskcache och bestämma var de cachade filerna ska hamna. Klickar man knapparna Töm minnescache och Töm diskcache så försvinner alla sidor man besökt och man måste hämta dem på nätet igen. |