Politiker-Stopp

Ihr Browser versucht gerade eine Seite aus dem sogenannten Internet auszudrucken. Das Internet ist ein weltweites Netzwerk von Computern, das den Menschen ganz neue Möglichkeiten der Kommunikation bietet.

Da Politiker im Regelfall von neuen Dingen nichts verstehen, halten wir es für notwendig, sie davor zu schützen. Dies ist im beidseitigen Interesse, da unnötige Angstzustände bei Ihnen verhindert werden, ebenso wie es uns vor profilierungs- und machtsüchtigen Politikern schützt.

Sollten Sie der Meinung sein, dass Sie diese Internetseite dennoch sehen sollten, so können Sie jederzeit durch normalen Gebrauch eines Internetbrowsers darauf zugreifen. Dazu sind aber minimale Computerkenntnisse erforderlich. Sollten Sie diese nicht haben, vergessen Sie einfach dieses Internet und lassen uns in Ruhe.

Die Umgehung dieser Ausdrucksperre ist nach §95a UrhG verboten.

Mehr Informationen unter www.politiker-stopp.de.


Zugriffsstatistiken der letzten Monate

Mittwoch, den 6. April 2011

Nachdem Florian Simeth über seine Besucherzahlen geschrieben hat, will ich Euch meine nicht vorenthalten. Ich verwende auf meiner Website unterschiedliche Tracking-Systeme, die auch unterschiedliche Zahlen liefern.

Fangen wir erstmal mit der Auswertung von etracker an. Um etracker verwenden zu können, habe ich ein kleines JavaScript in meine Website integriert, welches beim Aufruf des Besuchers bestimmte Informationen zur Auswertung an etracker übermittelt. Der Server steht in Hamburg und es gelten daher die deutschen Datenschutzbestimmungen.

Als weiteres Tracking-Tool verwende ich die Open Source Lösung Piwik, welche auf meinem Server läuft. Dabei werden ähnlich wie bei etracker die Besucher durch ein kleines JavaScript erfaßt, welches ein Ein-Pixel-großes Bild vom Server abruft. Piwik nutze ich jedoch erst seit Juli 2010 auf meiner Website.

Schließlich gibt es ja noch die Serverlogfiles. In den Serverlogfiles steht, was auf meinem Server (bzw. auf dem Virtual Host von spitzohr.de) passiert. Dabei handelt es sich nicht umbedingung um Besucher meiner Seite. Wenn beispielsweise jemand ein Bild von meinem Blog auf seiner Seite eingebunden hat, so werden diese in den Logfiles erfaßt und durch den Webalizer als Besuch auf dem Server gezählt. Aber auch die verschiedensten Robots und Spiders werden hier erfaßt.

Und hier noch die Anzahl meiner Blog-Artikel.

Viel Spass beim Interpretieren ;-)

Statistik September 2010

Sonntag, den 3. Oktober 2010

Ich bin ein Egoblogger. Ganz nach dem Motto: Blogitto Ergo Sum. Und um zu sehen, wieviel Interesse mein Ego in der Welt draußen verursacht hier mal die Serverstatistik dieser Website:

Zugriffe pro Tag auf Spitzohr.de:

Zugriffe pro Stunde auf Spitzohr.de:

Top 20 von 811 Suchausdrücke Gesamt

# Anfragen Suche
1 588 18.03% mandeln
2 158 4.84% katzenbilder
3 108 3.31% wappen bundesländer
4 92 2.82% wappen der bundesländer
5 84 2.58% -
6 63 1.93% drachen falten
7 62 1.90% bundesländer wappen
8 54 1.66% lego ritter
9 49 1.50% k-
10 41 1.26% f-
11 35 1.07% lego star wars
12 34 1.04% lichtschwerter
13 31 0.95% windows 7 taskleiste
14 29 0.89% star wars pla-
15 28 0.86% deutschland wappen
16 27 0.83% deutsche wappen
17 27 0.83% [entfernt].de spam
18 27 0.83% wappen deutschland
19 25 0.77% sternzerstörer
20 24 0.74% süße kaninchen

Die Suchbegriffe beziehen sich meist auf die Google Bildersuche, welche Platz 2 (de), 3 (at) und 4 (ch) und 7 (com) unter den Top 20 Referers einnehmen. Zusätzlich zu den oben genannten Suchbegriffen gibt es noch einige andere, bei denen ich recht zufriedenstellende Platzierungen einnehmen:

Alle Ergebnisse für die deutsche Google Bildersuche, Stadt 3.10.2010 22:18:

Wer weitere schöne Fotos von meiner Website in der Google Bildersuche findet, darf sie natürlich gerne hier kommentieren ;-)

Wie gut sind meine Seiten?

Sonntag, den 25. April 2010

Ich betreute mehrere Websites und will natürlich wissen, welche von denen gut sind und wo ich noch was verbessern muß. Dazu benötige ich natürlich entsprechende Kennzahlen, mit denen ich die Sites vergleichen kann.

Eine Kennzahl sind die Besucherzahlen, welche auf die gleiche Weise erfaßt werden sollten. Bei der klassischen Logfileauswertung werden alle Zugriffe auf den Server erfaßt. Dazu gehören unter Umständen auch angebotene Webservices, Angriffe und auch auf anderen Seiten eingebundene Dateien. Dadurch haben die Zahlen eine gewisse Unschärfe, die selbst durch einen Heisenbergkompensator nicht korrigiert werden können. Da hilft eigentlich nur, dass man die Logfiles vor der Auswertung bearbeitet und unerwünschte Einträge ausfiltert.

Anbei ein paar Zugriffszahlen (Januar 2010, ohne Filter, Standard-Reports von domainfactory):

Website Rechner kb Besuche Seiten Dateien Anfragen
spitzohr.de 32.924 12.608.675 27.142 195.116 698.554 741.758
episodenguide.de 22.843 14.011.783 18.217 49.520 1.046.165 1.191.672
  • Rechner: Anzahl der unterschiedlichen IP-Adressen oder IP-Adressen/Browser-Kombinationen
  • kb: Ausgelieferten Daten/Traffic in Kilobyte
  • Besuche: Als ein Besuch werden alle zusammenhängenden Zugriffe auf Seiten durch einen Rechner gewertet. Wenn zwischen zwei Zugriffen jedoch mehr als 30 Minuten liegen, sind diese nicht mehr zusammenhängend und zählen somit als ein weiterer Besuch
  • Seiten: Alle ausgelieferten Dateien, die das Auswertetool als Seite erkannt hat. Dabei werden Seiten meist über ihre Dateiendung (z.B. .html, .htm, .php etc.) oder als Aufruf von Verzeichnissen definiert.
  • Dateien: Alle ausgelieferten Dateien
  • Anfragen: Alle an den Server gestellten Anfragen. Meistens werde dabei Dateien ausgeliefert. Bei einigen Anfragen werden jedoch keine Dateien ausgeliefert, sondern nur Statusinformationen zurückgemeldet, wie beispielsweise “Die Datei hat sich seit dem letzten Aufruf nicht geändert” oder “Die angefragte Seite ist umgezogen. Die neue Adresse ist …”

Bei diesen Zahlen fällt auch schon das nächste Problem auf. Die Anzahl der “Seiten” von episodenguide.de ist im Vergleich zu spitzohr.de deutlich geringer. Diese Zahlen stimmen so leider nicht. Beim Episodenguide haben viele Seiten die Erweiterung “.cfm”. Diese Seiten werden in der Auswertung nicht als Seiten erkannt und daher nur in der Spalte “Dateien” mitgezählt.

Bei Tagging-basierten Auswertungen werden die Zahlen deutlich genauer. Dabei wird in jeder Seite ein Bild von einem Tracking-Server eingebunden. Dieser Tracking-Server zählt dann die Aufrufe des Bildes. Das hat zur Folge, dass somit nur die echten Seitenaufrufe gezählt werden. Die ganzen Angriffe, Webservices oder gestohlenen Bilder werden nicht erfaßt. Meist wird dieser Bild-Aufruf dabei auch noch über JavaScript erzeugt und mit weiterführenden Informationen ergänzt. So kann man als Websites-Betreiber auch die verwendete Bildschirmauflösung erfassen.

Anbei ein paar Zugriffszahlen von etracker (Januar 2010)

Website Besucher Bounce Rate Quereinsteiger Seitenaufrufe Zeit pro Besucher Zeit pro Seite
spitzohr.de 6.648 77,54% 6.312 9.119 00:00:30 00:00:22
episodenguide.de 29.255 26,90% 19.290 261.693 00:04:10 00:00:28
  • Besucher sind ähnlich wie oben “Rechner”. Durch die Tagging-Methode werden hier aber vorallem nur Besucher der Website erfaßt. Bei der Logfile-Auswertung sind dort auch noch Bots und andere Rechner dabei, welcher aber nicht umbedingt Besucher der Website sind.
  • Die Bounce Rate gibt an, wieviel Besucher bereits nach dem erste Seitenaufruf die Seite wieder verlassen.
  • Quereinsteiger sind Besucher welche die Website nicht über die Startseite betreten haben. Diese Besucher gelangen dabei direkt über Unterseiten auf die Website. Meistens kommen diese Besuchern dann von Suchmaschinen und gelangen (im Idealfall) zur gesuchten Seiten.
  • Seitenaufrufe sind die Anzahl der ausgelieferten Seiten
  • Zeit pro Besucher ist die durchschnittliche Zeit der Besucher, die dieser auf der Website verbracht hat. Diese Metrik wird aus dem Zugriffszeitpunkt des ersten und des letzten Aufrufs ermittelt.
  • Zeit pro Seite ist die durchschnittliche Zeit pro Seitenaufruf. Dabei wird die Zeitspanne gemeint, die zwischen zwei Seitenaufrufen liegt

Diese Zahlen sind teilweise etwas schwierig zu lesen und meist nur richtig interpretierbar, wenn man sich schon länger mit dieser Thematik beschäftigt hat. Zudem gibt es noch viele weitere Faktoren, die man in eine Bewertung einer Website einfließen lassen kann. Ein sehr interessanter kostenloser Dienst zur Bewertung verschiedenster Faktoren ist die Website Seitwert.

Seitwert berücksichtigt dabei neben Suchmaschinen (Google, Yahoo) auch die Qualität des HTML-Codes (über den W3 Validator) und einige andere Themen (Social Bookmarks, Alter der Domain etc.). Wenn man seine Seite bewerten läßt, kommt am Ende eine Zahl raus. Für jeden Teilbereich gibt es ebenfalls einen Wert. Dadurch hat man als Website-Betreiber nicht nur eine gute Bewertung, sondern auch gleich die nötigen Hinweise, an welcher Stelle noch Verbesserungsbedarf vorhanden ist.

Website Seitwert Google Yahoo Extern Technisch Social Bookmarks Sonstiges
Maximalwerte 100 29 17 10 13 22 9
spitzohr.de 29,94 10,85 3,83 0,26 9,5 0,5 5
episodenguide.de 31,05 7,12 5,26 0,64 13 0,03 5

Vorallem im Bereich Externe Wertung (bezieht sich auf Alexa) und den Social Bookmarks (del.icio.us, Mister Wong, Linkarena, Kledy) sind beide Seiten nicht gerade gut. Bei Alexa muß aber auch bedacht werden, dass dieser Dienst die Zugriffszahlen dieser Seiten nur von Besuchern erfaßen kann, die eine Alexa-Toolbar bei sich im Browser installiert haben. Dieser Dienst ist in Deutschland aber relativ unbekannt – und wird wohl auch nur von sehr wenigen meiner Besucher verwendet.

Technisch bin ich mit episodenguide.de inzwischen bei 13 von 13 Punkten. Bei Spitzohr.de stört im Moment ein eingebundenes Youtube-Video meinen ansonst validen HTML-Code.

Unter “Sonstiges” haben beide Seiten das Problem, dass sie nicht in Wikipedia referenziert werden. Allerdings sehe ich auch keinen Grund, warum meine Seiten dort erwähnt oder verlinkt werden sollten.

Ansonst bleibt nur noch die Wertung von Google und Yahoo. Um dort meine Bewertung zu verbessern, muß ich hier deutlich aktiver SEO betreiben.

Was den PageRank von episodenguide.de betrifft ist noch zu erwähnen, dass oftmals direkt auf episodenguide.de/startrek/ verlinkt wurde. Dieses Unterverzeichnis hat einen PageRank von 3 – die Startseite hingegen enthielt lange Zeit keinerlei Inhalte und war nur eine Weiterleitung auf das Star Trek-Portal und hat daher keinen PageRank. Ich habe bereits die Startseite von episodenguide.de in ein Blog umgebaut – jedoch bisher nur wenig relevante Inhalte. Die meisten Besucher wollen einfach nur schnell und direkt auf Episodenbeschreibungen kommen.

Ich werde die Seitwerte meiner Seiten nun über einen längeren Zeitraum beobachten und Detailverbesserungen vornehmen. Mal schauen, ob ich mit beiden Seiten bis Ende des Jahres auf 40 Punkte komme ;-)

Sicherheit im Internet: Der HTTP-Referrer

Mittwoch, den 10. Februar 2010

Heute mal wieder ein Beitrag zum Thema Sicherheit. Ein schönes Thema dazu habe ich im DomainFactory-Blog gefunden: Vorsicht, Referer. Erstmal will ich Euch erklären, was ein Referer (bzw. Referrer) ist. Ein Referer gibt an, von welcher Seite ein Besucher kommt.

Also wenn ich jetzt auf http://www.spitzohr.de/ bin und auf einen Link http://www.episodenguide.de/startrek/ klicke, dann kann der Episodenguide sehen, dass ich von Spitzohr.de gekommen bin. Wie das funktioniert? Der Browser ist so lieb und teilt das mit. Kann man – wenn man will – mit verschiedenen Tools und Erweiterungen natürlich verhindern. Aber erstmal will ich etwas zu diesen Referer erklären.

Der Referer kann gefährlich sein. Beispielsweise wenn man seine “geheime” Bookmark-Liste auf einem Webserver hat. Sobald man einen Link dort anklickt, bekommt die Zielseite auch die Adresse für die Bookmark-Liste. Diese Adresse kann unter umständen in die falschen Hände fallen eventuell sogar in Suchmaschinen erscheinen. Warum das so gefährlich sein kann? Auf diesen Bookmark-Listen sind Links auf Seiten, die man gerne besucht. Eventuell auch auch Online-Banking-Anbieter oder auch Direkt-Links, mit denen man sich in verschiedene Dienste einloggen kann. Wenn man seine “geheime” Bookmark-Liste im Internet hat, sollte diese zumindest durch ein Passwort geschützt sein. Somit können dann nur Personen darauf zugreifen, die auch das Passwort kennen.

Aber auch einige Online-Portale hatten in der Vergangenheit und teilweise noch heute Sicherheitsprobleme wegen dem Referer. Wenn man sich in eine Website einloggt, muß der Server dem Benutzer bei jedem Seitenaufruf wieder erkennen. Dazu wird eine Session-ID im Server hinterlegt und dem Besucher gegeben. Die Session-ID steht beim Besucher in einem Cookie oder aber auch in der URL (z.B. ?PHPSESSID=xyz). Sobald ich von dieser Seite eine andere Website aufrufe, hat natürlich diese andere Website im Referer auch die Session-ID stehen. Wenn jemand an diesen Referer herankommt, kommt er auch in das Online-Portal rein. Vor langer Zeit hatte ein Webmail-Anbieter ein solches Problem und hatte deswegen eine Funktion gebaut, bei dem externe Links erst über eine zusätzliche Seite verlinkt war. Dadurch stand im Referer nicht mehr die Seite mit der Session-ID, sondern eine unverfängliche Adresse einer Zwischenseite. Inzwischen gibt es natürlich auch Dienste wie anonym.to, die nach dem gleichen Prinzip die Herkunft verschleiern.

Das klingt bisher so, als wäre ein Referer nur was böses und man sollte es lieber abschaffen. Aber es gibt auch jede Menge sinnvolle Einsatzmöglichkeiten.

Sobald man über eine Suchmaschine auf eine Website kommt, kann der Website-Betreiber aus den Logfiles auslesen, über welchen Suchbegriff seine Seite gefunden wurde und die Website entsprechend optimieren. So hatte ich vor langer Zeit mal beim Episodenguide festgestellt, dass viele Besucher auf der Suche nach Bildern von Schauspielern auf meiner Website gelanden sind. Sie hatten z.B. nach “Pictures Patrick Stewart” gesucht. Wer den Episodenguide kennt, wird sicherlich schon festgestellt haben, dass dort nur wenige Bilder sind. Eigentlich nur jeweils ein kleines Bild pro Episode. Aber ich hatte neben dem Namen des Schauspielers auch immer ein “Copyright bei Paramount Pictures” auf der Seite stehen. Diese Besucher waren sicherlich nicht erfreut, auf meine Seite zu kommen, wo es eigentlich kaum bis gar keine Bilder zu den Schauspielern gab. Ich habe den Copyright-Vermerk daher in eine Grafik umgewandelt und schon ist das Wort “Pictures” aus meiner Seite verschwunden. Die Besucherzahlen gingen leicht nach unten, die aufgerufenen Seiten pro Besuch aber deutlich (ca. 10 Seiten pro Besuch) nach oben.

Aber auch intelligente Scripte in den Seiten erkennen schon beim Besuch, mit welchem Suchbegriff die Seite aufgerufen wurde und können diese Daten nutzen, um dem Besucher besser zu unterstützen. Quasi sowas: “Sie haben mit dem Suchbegriffe ‘Schuhe’ meine Seite gefunden, Schuhe finden Sie im dritten Stock…”. Oder der Suchbegriff wird in der Seite automatisch hervorgehoben. Oftmals – wenn auch nicht immer – ein Mehrwert für den Besucher.

Zudem kann der Referer auch als zusätzliche Sicherheitsfunktion genutzt werden. So werden bei manchen Seiten überprüft, ob der Besucher von einer zugelassen Seite kommt – oder über einen unerlaubten Weg die Seite aufrufen will. Das gleiche trifft auch auf Bilder oder andere Dateien zu. Webserver lassen sich heute so konfigurieren, dass Bilder nur angezeigt werden, wenn sie auch von der richtigen Seite aufgerufen werden. Ein “Entführung” von Bildern auf andere Seiten wird damit erschwert. Bei meinem Server ist diese Funktion nicht aktiviert. Aber durch den Referer im Logfile kann ich sehen, wo meine Bilder überall Verwendung finden. Meinen Fußabdruck im Schnee wird z.B. von “lisa-maus” auf ihrer Website eingebunden.

Es werden aber nicht nur Bildern, sondern auch ganze Designs geklaut. Dummerweise hatte der Design-Dieb… Mitnutzer auch Grafiken meiner Website direkt verwendet. Über den Referer haben seine Besucher diese Website verraten. Das Design wurde dort inzwischen geändert ;-)

Fazit: Es gibt bei Referes einige Vor- aber auch Nachteile. Wem die Nachteile überwiegen, kann mit Firefox-Erweiterung (im DomainFactory-Blog wurde RefControl vorgeschlagen, gibt es über den Add-On-Manager) den Referer unterdrücken. Auch einige Sicherheitssuites bitte diese Funktion unter den Punkt “Privatsphäre” an. Und ich glaube auch, dass der Porno-Privatsphäre-Modus in einigen Browersn ebenfalls den Referer unterdrücken. Für mich als Website-Betreiber ist der Referer aber sehr wichtig. Ich kann sehen, über welche Seiten oder Links Besucher meine Websites aufsuchen. Kann meine Websites anhand dieser Daten für meine Besucher weiterverbessern. Ebenfalls läßt sich so auch die Zweckentfremdung von Inhalten feststellen – was je nach zusätzlich verursachten Traffic sogar richtig teuer werden kann. Die Sicherheitslöcher in den größeren Web-Portalen wurden schon lange behoben. Bei Bookmark-Listen sollte auf jeden Fall ein Passwortschutz verwendet werden, da oftmals die Firmen-Browser keinen solchen Referer-Schutz anbieten und sich auch keiner aktivieren läßt.

Eigentlich bleibt also nur das Thema Datenschutz übrig, welches ich noch nicht angesprochen haben. Will man den Betreiber einer Website die Information geben, von wo man auf diese Website gekommen ist? Den Betreiber ist die einzelne Person eigentlich egal, wichtig sind hier die (anonymisierten) Statistiken. Trotzdem wird im Logfile neben der IP-Adresse (welche übrigens der normale Website-Betreiber keiner Person zuordnen kann), Datum und Uhrzeit, aufgerufene Seite auch der Referer gespeichert.

Episodenguide Zugriffsstatistik

Freitag, den 29. Mai 2009

Vor zwei Wochen erhielt ich eine Mail von etracker, dass eine meiner Seiten (der Star Trek Episodenguide) über den Seitenaufrufe/Monat-Limit wäre. Das Limit in meinem Tarif liegt bei 200.000. Inzwischen habe ich diesen Monat schon 341.448 Seitenaufrufe gehabt.

Der Besucheranstieg in diesem Monat ist enorm. Die Besucherzahlen habe sich im Vergleich zum Vormonat verdoppelt.

Besucher pro Monat

Besucher pro Monat

Monat Besucher Quereinsteiger Seitenaufrufe Seitenaufrufe pro Besucher Ansichtszeit pro Besucher Ansichtszeit pro Seite
Mai 2009 31.540 19.450 341.448 10,83 03:41 00:20
April 2009 15.197 9.000 171.522 11,29 04:54 00:26
Februar 2005 31.832 19.816 293.661 9,23 06:43 00:43
April 2008 7.161 3.512 95.862 13,39 04:28 00:20
Februar 2003 9.116 6.913 72.463 7,95 09:38 01:12

In der Tabelle habe ich mal den aktuellen Monat Mai, sowie den Vormonat eingetragen. Dazu dann die je nach Wert besten Monate.

Interessant ist, dass seit September 2006 die Ansichtszeiten pro Besucher immer zwischen vier und fünf Minuten waren. Der aktuelle Monat ist jedoch unter vier Minuten. Von Juli 2002 bis Februar Februar 2005 waren die Besucher zwischen sechs und sieben Minuten auf der Website unterwegs. Februar 2003 sticht da sogar mit über Neun Minuten und 38 Sekunden hervor. Im März 2005 ist die Zeit schlagartig von sechs Minuten und 43 Sekunden auf vier Minuten und 22 Sekunden gefallen. Die Zahlen habe sich von Juli 2005 bis Februar 2006 erholt gehabt. Juni 2006 ging es dann sogar auf drei Minuten und Zwölf Sekunden herunter.

Diese Zahlen sind faszinierend. Leider kann ich keinen Zusammenhang mehr mit Änderungen auf der Website herstellen. Zumindest keinen genaueren.

Bei der oberen Grafik mit Page Impressions (Seitenaufrufen) kann man eigentlich sehr gut sehen, wann Sat.1 die neue Serie Enterprise ausgestahlt hatte. Die Erstausstrahlung der dritten Staffel (November 2004 bis Februar 2005) hat die Zugriffszahlen deutlich nach oben getrieben. Mit dem Finale der dritten Staffel hatte der Episodenguide die bisher höchsten Zugriffszahlen – wurde jetzt aber durch den neuen Film überholt ;-). Während der Ausstrahlung der vierte Staffel (Februar 2006 bis Juli 2006) haben die Besucherzahlen aber wieder nachgelassen. Seitdem dümpelte den Zugriffszahlen knapp unter 100.000 Seitenaufrufen pro Monat herum.

Meine Prognose: Durch den neuen Film ist das Interesse an Star Trek (und auch an den Serien) wieder deutlich angestiegen. Ich denke aber, dass dieses Interesse in einigen Monaten wieder etwas abgeflacht sein wird und auch die Zugriffe sich wieder auf etwa 120.000 Seitenaufrufen pro Monat einpendeln werden. Mal schauen, was in den nächsten Monaten passiert.

Besucherzahlen Episodenguide

Montag, den 1. September 2008

Ich habe mal wieder auf die Statistik meines Episodenguides geschauft. Laut etracker (ermittelt seit 07.07.2002 die Zahlen) waren bisher 976.813 Besucher auf meinem Star Trek Episodenguide. Wow. Seit dem Start am 12.03.2000 könnten es wohl schon mehr als eine Millionen Besucher gewesen sein – allerdings hatte der Episodenguide in den ersten Jahren noch nicht so erfolgreich.

Im August 2008 waren es 9.652 Besucher – die höchste Zahl seit Januar 2007 (9.682 Besucher). Scheinbar steigen die Besucherzahlen wieder, was vielleicht auch mit der Behebung eines Fehlers zusammenhängen könnte. Von dem Rekord-Monat Februar 2005 mit 31.832 Besuchern bin ich aber noch weit entfernt. Vielleicht komme ich ja im September wieder auf über 10.000 Besucher.

Jetzt abe ich aber erstmal noch etwa 2,5 Monate Zeit, um zu überlegen, ob ich was zum “Millionsten Besucher” auf meiner Website mache…

Statistik-Vergleich: Serverseitig, etracker, Google Analytics

Dienstag, den 1. Juli 2008

Ich habe drei Systeme, um die Besucherzahlen auf meiner Website zu messen. Zwei davon basieren auf “Tagging” bzw. “Pixel-Methode”. Manche sagen dazu auch “Webbug”. Die dritte Methode ist einfach die Logfile-Auswertung – wobei das nicht wirklich das Besucherverhalten auf der Website, sondern nur die Aktivitäten auf dem Server wiedergeben.

Fangen wir also mal mit den Besuchern (engl. “Visitors” bzw. auch “Unique Visitors”) für den Monat Juni 2008 an.

  • etracker: 3.701 ( keine eindeutigen Besucher, sondern nur “Besuche” )
  • Google Analytics: 2.619
  • Webalizer: 12.069 (“Rechner”)

Während etracker und Google Analytics ähnliche Zahlen haben, zeigen die Logfiles doch wesentlich mehr Besucher. Allerdings werden dabei die Besucher anhand ihrer IP-Adresse in Kombination mit ihrem Browser als “Rechner” gezählt. Die meisten Besucher haben jedoch jeden Tag eine anderen IP-Adressen (Stichwort: “Zwangstrennung”). Somit können die Besucherzahlen mit Logfiles nicht sauber identifiziert werden. Zudem kommen da noch die ganzen Crawler der Suchmaschinen, Feedreader etc. dazu. Auch entführte Bilder werden über die Tagging-basierte Messmethode nicht erfaßt – wobei dies ja auch keine Besucher meiner Website sind, sondern einer Seite, die nur meine Bilder verwendet…

Als nächstes schaue ich mir mal die Besuche an. Ein Besucher kann die Website mehrmals besuchen. Das sind dann “Besuche” (engl.: “Visits”):

  • etracker: 3.701
  • Google Analytics: 3.479
  • Webalizer: 15.408

Etracker hat zwar im Report “Besucher nach Monat” in der Spaltenüberschrift den Begriff “Besucher” verwendet, aber es scheint sich um die “Besuche” zu handeln.

Besuche sind berechnete Werte. So werden normalerweise alle Seitenaufrufe einer IP/Browser-Kombination zu einem Besuch zusammengefaßt, solange diese nicht mehr als eine bestimmte Zeit (meist 30 Minuten) unterbrochen werden. Also wenn ein Besucher auf meiner Seite erst nach 30 Minuten auf einen weiteren Link klickt, dann wird dies als ein neuer Besuch gezählt.

Kommen wir daher jetzt zu den klassischen Seitenaufrufen (engl. “Page Views”, “Page Impressions”, “Views” und bei Tagging-Systemen auch oftmals “Hits”). Dabei werden einfach nur die Zugriffe auf Seiten gemessen. Bei Tagging gilt dies natürlich nur für die Seiten, die auch “verpixelt” sind. Die Logfile-Methode hat erstmal alle Zugriffe erfaßt und muß anhand der Dateiendung die Seiten erkennen und Bilder ausfiltern.

  • etracker: 5.684
  • Google Analytics: 5.517
  • Webalizer: 65.683

Auch hier hat die Logfile-Analyse deutlich mehr Zugriffszahlen ermittelt als bei den anderen beiden Messmethoden. Aber der Unterschied ist doch schon extrem. Zwar dürfte es ein paar nicht verpixelte Seiten auf meinem Server geben – und auch die Suchmaschinen werden nicht gezählt. Aber fast Faktor 12 Unterschied? Insgesamt wurden laut Webalizer 247.268 Dateien (also inkl. Bilder, CSS-Dateien, JavaScript-Files etc.) vom Server heruntergeladen. Das ist dann doch etwas verwirrend.

Okay, werfen wir mal einen Blick auf die Top-Seiten:

Erstmal die Startseite:

  • etracker: 1. Platz, 1.150 Seitenaufrufe
  • Google Analytics: 1. Platz, 1.230 Seitenaufrufe
  • Webalizer: 23. Platz, 3186 Seitenaufrufe

Hier zeigt die Logfile-Analyse nur noch doppelt so viel Zugriffszahlen im Vergleich zur Pixelmethode an. Die Seite ist aber erst auf Platz 23 (Top 30 URLs). Es ist aber die erste richtige Seite in dieser Statistik. Vorher kommen 14 unterschiedliche JavaScript-Dateien, 5 CSS-Dateien, ein PHP-Script für AJAX, die Favicon-Datei und auch das Feed.

Meine Seite zum A110:

  • etracker: 2. Platz, 601 Seitenaufrufe
  • Google Analytics: 2. Platz, 562 Seitenaufrufe
  • Webalizer: 30. Platz mit 800 Seitenaufrufen

Hier sind die Zahlen schon wesentlich näher beieinander. Die nachfolgenden Seiten sind leider im Webalizer nicht mehr zu finden. Die anderen beiden Zahlen dürften aber in den meisten Fällen relativ ähnlich zueinander sein.

Mein nächster Blick gilt daher den Verweisen. Da fallen mir bei der Logfile-Analyse vorallem viele Foren und Profil-Seiten auf. So ist z.B. in einem Thread “Image Wars 2” ein Bild meiner Seite eingebunden. Das ich den verantwortlichen [LSQ]ScarFace aufgrund seines unqualifizierten Kommentars nicht mag, ist sicherlich verständlich. Vielleicht sollte ich hier Sandra’s Beispiel folgen. Oder einfach nur diesen Typen ignorieren. Auch kommt es immer mal wieder vor, das einige Blogger Bilder meiner Seite “verwenden”. So habe ich ein Foto, dass ich in Zürich gemacht hatte, auf einem anderen Blog wiedergefunden. Das ist aber auch ein schönes Foto, stimmts ;-) Aber auch in einigen Gästebüchern werden Bilder von meiner Seite eingebunden. So ist beispielsweise in einem Beitrag von Sandra1978 vom 30. Mai 2008 ein Foto meines Fußabdrucks im Schnee zu finden. Weitere lustige Foren-Beiträge sind z.B. “Postet das erste Bild, das Google findet, wenn ihr nach eurem Realname sucht“. Armer Florian *g*. Oder hier noch eine “Über Mich“-Seite.

Desweiteren finde ich in der Auswertung viele Suchseiten (vorallem Google in den unterschiedlichen Ausprägungen, Bildersuche, Videosuche, unterschiedliche Länder…).

Folglich vermute ich, dass viele meiner Fotos in Foren, Profilseiten und Blogs verwendet werden und daher eine sehr hohe Anzahl an Besuchern und Hits verursachen. Und kaum einer dieser Besucher besucht wirklich meine Website. Folglich sagt dies nicht viel über meine eigene Website aus – und daher sind dies in diesem Zusammenhang wertlose Daten für mich. Ansonst sagt dies auch aus, dass einige meiner Bilder als “ansprechend” empfunden werden. Auch, wenn diese dann verwendet werden, um sich über mich lustig zu machen. Schließlich sind dies aber zusätzliche Verweise auf meine Seite, die mich im Suchmaschinen-Ranking weiter nach oben bringen. Sie stärken meine Website. Traffic ist für mich (noch) nicht problematisch, und die gelegentlichen bösartigen Kommentare tun mir nicht weh. Wie lang der Long Tail ist, werde ich wohl nur rausfinden, wenn ich die Logfiles mit einer weiteren Software komplett analysieren würde.

Vergleichen wir das ganze jetzt mal mit meinen Star Trek Episodenguide. Wie ihr aus dem vorhergehenden Beitrag ja schon sehen konntet, habe ich bei spitzohr.de inzwischen mehr Traffic.

Hier mal die Besuche:

  • Google Analytics: 7.010 Besuche
  • Webalizer: 8.083 Besuche

Die Zahlen sind – trotz unterschiedlicher Messmethode doch sehr ähnlich. Zumindest im Vergleich zu spitzohr.de. Der Episodenguide hat aber auch keinen Feed und es werden wohl auch nur selten Fotos entführt..

Schauen wir uns mal die Seitenzugriffe an:

  • Google Analytics: 92.059 Seitenzugriffe
  • Webalizer: 16.979 Seitenzugriffe (.cfm wird wohl nicht als Seite erkannt)
  • Webalizer “Dateien”: 413.054 Dateien wurden abgerufen

Oh, großer Unterschied. Das muß wohl an der für Webalizer unbekannten Extension “.cfm” liegen. Möglicherweise ist das einfach nicht eingetragen, da auf diesem Server gar kein Cold Fusion läuft… Aber das ist ein anderes Thema. Man kann aber relativ gut erkennen, dass ich deutlich mehr Besucher auf den Episodenguide locken kann. Und laut Google Analytics werden 13,3 Seiten pro Besuch angeschaut, was doch sehr für den Inhalte der Seite spricht. Bei Spitzohr.de sind es nur 1,59 Seiten pro Besuch – ob mein Inhalt deswegen schlechter ist? Es ist ein Weblog und die neusten Inhalte werden direkt auf der Startseite vollständig angezeigt. Kann man in diesem Zusammenhang also nicht als Qualitätsmerkmal betrachten. Aber 13,3 Seiten pro Besuch ist schon bemerkenswert.

Was den Traffic angeht: Ich habe hier wesentlich mehr Fotos – und diese auch in einer höheren Auflösung. Und dann sind da noch meine “Sendungen”. Den Episodenguide habe ich ja im März 2000 gestartet. Das war vor über sieben Jahren – noch bevor die meisten DSL hatten. Damals hatte ich mir noch Gedanken über Dateigrößen gemacht – und die Inhalte und Bilder auch nie wieder geändert. Und hier nehme ich darauf kaum noch rücksichtig…

Update: Webalizer ist kostenlos bei den meisten Providern dabei – so auch bei meinem bevorzugtem Provider Domainfactory. Auch Google Analytics ist kostenlos. etracker gibt es ebenfalls als kostenlose (etracker free) Variante, ich verwende hier jedoch etracker pro (6,45 Euro im Monat) und finde, dass die Statistik auch ihr Geld wert ist. etracker hat für mich die aussagekräftigsten Reports. Vorallem die Anzeige der Quereinsteiger und auch die Ansicht nach “letzten Besucher” ist für mich sehr interessant. Da kann ich fast live sehen, mit welchen Suchbegriffen meine Seite gefunden wurde oder wo ich aktuell verlinkt bin. Außerdem halte ich etracker für seriöser als Google Analytics. Warum? etracker verdient Geld, indem es für seine Kunden die Besucherzahlen der Websites ermittelt und auswertet. Ich zahle Geld und erhalte Reports. Google hingegen lebt davon, Informationen zu sammeln und diese zur Optimierung ihrer Werbeanzeigen zu verwenden. Google Analytics ist daher nicht einfach nur kostenlos. Ich erhalte zwar Statistiken über meine Website, Google erhält im Gegenzug auch ebenfalls diese Daten und noch viel mehr Informationen. Und diese können die auch nutzen. Damit macht Google Geld und kann uns Analytics kostenlos zur Verfügung stellen. In meinem Fall (spitzohr.de und episodenguide.de) sehe ich da kaum Probleme. Es sind keine komerziellen Seiten und ich schalte auch keine Adwords. Jeder muß für sich aber selber entscheiden, ob er seine Daten an Google geben soll oder lieber ein wenig zahlt, aber dann auch kontrollieren kann, wer die Daten nutzt.

Juchuu, ich habe Traffic

Dienstag, den 1. Juli 2008

Mal wieder Zeit, die Statistiken ein wenig anzuschauen.

Meine Traffic-Intensivste Seite ist – wie könnte es anders sein – dieses Weblog hier. Serverseitig wurden serverseitig über 6 GB (6.311,012 MB) letzten Monat heruntergeladen. Mein Star Trek Episodenguide kommt mit 5.839,622 MB auf Platz 2.

Serverseitig gesehen, sind die Top-Suchebegriffe auf spitzohr.de:

  1. one a110
  2. one mini notebook a110
  3. florian
  4. mandeln
  5. lego
  6. one a110 test
  7. spitzohr
  8. one mini notebook a150
  9. one mini notebook a110 test
  10. vampir

Insgesamt kamen 2587 Anfragen über Googles Bildersuche. Das macht 0.87% aller Anfragen aus. Wenn ich mir die Top-Verweise so anschaue, dann wurden auch viele meiner Bilder für “Profilseiten” und Foren entführt :-(. Deswegen spreche ich hier auch immer von “serverseitiger” Statistik. Diese Auswertung basiert auf den Ereignissen, die auf dem Server passieren. Das ist aber für die Website meist uninteressant. Normalerweise will man ja wissen, was auf der Website passiert. Dafür habe ich etracker und Google Analytics. Dazu demnächst mehr.

400 Besucher gestern

Freitag, den 21. Dezember 2007

Noch vor wenigen Tagen meinte ich, dass ich bald die 300 Besucher / Tag Marke knacken würde. Erst vor kurzem hatte ich 289 Besucher (18. Dezember) bzw. einen Tag später schon 291 Besucher. Die 300 rückt näher. Und jetzt? Im Dashboard wurde als Prognose für heute 320 angezeigt. Aber als ich meinen Blick dann auf “Besucher Gestern” habe wandern lassen. 400 stand da. Davon sind 380 Besucher direkt auf einer Unterseite eingestiegen (Quereinsteiger). Insgesamt waren es gestern 534 Seitenaufrufe. Umgerechnet hat sich gestern im Schnitt jeder Besucher 1,335 Seiten angeschaut.

Was kann man jetzt aus diesen Zahlen rauslesen? 95% Quereinsteiger? Da sollte ich mal schauen, wo die Besucher eigentlich herkommen.

  • Google Bildsuche Deutschland: 102 Besucher (25,5%)
  • Google Deutschland: 98 Besucher (24,5%)
  • Google Bildsuche: 56 Besucher (14%)
  • Googl: 10 Besucher (2,5%)

Leider sind die URLs der Bildsuche zu lang – und etracker kann daher den Suchbegriff nicht aus dem Referrer extrahieren. Daher kann ich dort nicht sehen, was die Besucher für Bilder gesucht haben.

Vielleicht gibt es unter “Page Impressions pro Seite” (Seitenaufrufe pro Seite) hilfreiche Informationen.

Aber warte mal? Bei den Suchphrasen sind mir “Zugunglück Schwindegg”, “Schwindegg Unfall” und “Unfall Schwindegg” aufgefallen. Allerdings waren es nur 6, 4 bzw. 3 Besucher. Insgesamt kam der Begriff “Schwindegg” gestern bei 28 Suchanfragen vor. Also habe ich auch mal danach gesucht – und bin fündig geworden. Gestern gab es einen Zugunfall in Schwindegg – und mein Artikel über die Wartungsmängel von April 2005 wird bei Google mit dem Suchbegriff “Schwindegg Zug” auf Platz 1 angezeigt :-(


Stoppt die Vorratsdatenspeicherung! Jetzt klicken & handeln!Willst du auch bei der Aktion teilnehmen? Hier findest du alle relevanten Infos und Materialien: