Statistik-Vergleich: Serverseitig, etracker, Google Analytics

Ich habe drei Systeme, um die Besucherzahlen auf meiner Website zu messen. Zwei davon basieren auf „Tagging“ bzw. „Pixel-Methode“. Manche sagen dazu auch „Webbug“. Die dritte Methode ist einfach die Logfile-Auswertung – wobei das nicht wirklich das Besucherverhalten auf der Website, sondern nur die Aktivitäten auf dem Server wiedergeben.

Fangen wir also mal mit den Besuchern (engl. „Visitors“ bzw. auch „Unique Visitors“) für den Monat Juni 2008 an.

  • etracker: 3.701 ( keine eindeutigen Besucher, sondern nur „Besuche“ )
  • Google Analytics: 2.619
  • Webalizer: 12.069 („Rechner“)

Während etracker und Google Analytics ähnliche Zahlen haben, zeigen die Logfiles doch wesentlich mehr Besucher. Allerdings werden dabei die Besucher anhand ihrer IP-Adresse in Kombination mit ihrem Browser als „Rechner“ gezählt. Die meisten Besucher haben jedoch jeden Tag eine anderen IP-Adressen (Stichwort: „Zwangstrennung“). Somit können die Besucherzahlen mit Logfiles nicht sauber identifiziert werden. Zudem kommen da noch die ganzen Crawler der Suchmaschinen, Feedreader etc. dazu. Auch entführte Bilder werden über die Tagging-basierte Messmethode nicht erfaßt – wobei dies ja auch keine Besucher meiner Website sind, sondern einer Seite, die nur meine Bilder verwendet…

Als nächstes schaue ich mir mal die Besuche an. Ein Besucher kann die Website mehrmals besuchen. Das sind dann „Besuche“ (engl.: „Visits“):

  • etracker: 3.701
  • Google Analytics: 3.479
  • Webalizer: 15.408

Etracker hat zwar im Report „Besucher nach Monat“ in der Spaltenüberschrift den Begriff „Besucher“ verwendet, aber es scheint sich um die „Besuche“ zu handeln.

Besuche sind berechnete Werte. So werden normalerweise alle Seitenaufrufe einer IP/Browser-Kombination zu einem Besuch zusammengefaßt, solange diese nicht mehr als eine bestimmte Zeit (meist 30 Minuten) unterbrochen werden. Also wenn ein Besucher auf meiner Seite erst nach 30 Minuten auf einen weiteren Link klickt, dann wird dies als ein neuer Besuch gezählt.

Kommen wir daher jetzt zu den klassischen Seitenaufrufen (engl. „Page Views“, „Page Impressions“, „Views“ und bei Tagging-Systemen auch oftmals „Hits“). Dabei werden einfach nur die Zugriffe auf Seiten gemessen. Bei Tagging gilt dies natürlich nur für die Seiten, die auch „verpixelt“ sind. Die Logfile-Methode hat erstmal alle Zugriffe erfaßt und muß anhand der Dateiendung die Seiten erkennen und Bilder ausfiltern.

  • etracker: 5.684
  • Google Analytics: 5.517
  • Webalizer: 65.683

Auch hier hat die Logfile-Analyse deutlich mehr Zugriffszahlen ermittelt als bei den anderen beiden Messmethoden. Aber der Unterschied ist doch schon extrem. Zwar dürfte es ein paar nicht verpixelte Seiten auf meinem Server geben – und auch die Suchmaschinen werden nicht gezählt. Aber fast Faktor 12 Unterschied? Insgesamt wurden laut Webalizer 247.268 Dateien (also inkl. Bilder, CSS-Dateien, JavaScript-Files etc.) vom Server heruntergeladen. Das ist dann doch etwas verwirrend.

Okay, werfen wir mal einen Blick auf die Top-Seiten:

Erstmal die Startseite:

  • etracker: 1. Platz, 1.150 Seitenaufrufe
  • Google Analytics: 1. Platz, 1.230 Seitenaufrufe
  • Webalizer: 23. Platz, 3186 Seitenaufrufe

Hier zeigt die Logfile-Analyse nur noch doppelt so viel Zugriffszahlen im Vergleich zur Pixelmethode an. Die Seite ist aber erst auf Platz 23 (Top 30 URLs). Es ist aber die erste richtige Seite in dieser Statistik. Vorher kommen 14 unterschiedliche JavaScript-Dateien, 5 CSS-Dateien, ein PHP-Script für AJAX, die Favicon-Datei und auch das Feed.

Meine Seite zum A110:

  • etracker: 2. Platz, 601 Seitenaufrufe
  • Google Analytics: 2. Platz, 562 Seitenaufrufe
  • Webalizer: 30. Platz mit 800 Seitenaufrufen

Hier sind die Zahlen schon wesentlich näher beieinander. Die nachfolgenden Seiten sind leider im Webalizer nicht mehr zu finden. Die anderen beiden Zahlen dürften aber in den meisten Fällen relativ ähnlich zueinander sein.

Mein nächster Blick gilt daher den Verweisen. Da fallen mir bei der Logfile-Analyse vorallem viele Foren und Profil-Seiten auf. So ist z.B. in einem Thread „Image Wars 2“ ein Bild meiner Seite eingebunden. Das ich den verantwortlichen [LSQ]ScarFace aufgrund seines unqualifizierten Kommentars nicht mag, ist sicherlich verständlich. Vielleicht sollte ich hier Sandra’s Beispiel folgen. Oder einfach nur diesen Typen ignorieren. Auch kommt es immer mal wieder vor, das einige Blogger Bilder meiner Seite „verwenden“. So habe ich ein Foto, dass ich in Zürich gemacht hatte, auf einem anderen Blog wiedergefunden. Das ist aber auch ein schönes Foto, stimmts ;-) Aber auch in einigen Gästebüchern werden Bilder von meiner Seite eingebunden. So ist beispielsweise in einem Beitrag von Sandra1978 vom 30. Mai 2008 ein Foto meines Fußabdrucks im Schnee zu finden. Weitere lustige Foren-Beiträge sind z.B. „Postet das erste Bild, das Google findet, wenn ihr nach eurem Realname sucht„. Armer Florian *g*. Oder hier noch eine „Über Mich„-Seite.

Desweiteren finde ich in der Auswertung viele Suchseiten (vorallem Google in den unterschiedlichen Ausprägungen, Bildersuche, Videosuche, unterschiedliche Länder…).

Folglich vermute ich, dass viele meiner Fotos in Foren, Profilseiten und Blogs verwendet werden und daher eine sehr hohe Anzahl an Besuchern und Hits verursachen. Und kaum einer dieser Besucher besucht wirklich meine Website. Folglich sagt dies nicht viel über meine eigene Website aus – und daher sind dies in diesem Zusammenhang wertlose Daten für mich. Ansonst sagt dies auch aus, dass einige meiner Bilder als „ansprechend“ empfunden werden. Auch, wenn diese dann verwendet werden, um sich über mich lustig zu machen. Schließlich sind dies aber zusätzliche Verweise auf meine Seite, die mich im Suchmaschinen-Ranking weiter nach oben bringen. Sie stärken meine Website. Traffic ist für mich (noch) nicht problematisch, und die gelegentlichen bösartigen Kommentare tun mir nicht weh. Wie lang der Long Tail ist, werde ich wohl nur rausfinden, wenn ich die Logfiles mit einer weiteren Software komplett analysieren würde.

Vergleichen wir das ganze jetzt mal mit meinen Star Trek Episodenguide. Wie ihr aus dem vorhergehenden Beitrag ja schon sehen konntet, habe ich bei spitzohr.de inzwischen mehr Traffic.

Hier mal die Besuche:

  • Google Analytics: 7.010 Besuche
  • Webalizer: 8.083 Besuche

Die Zahlen sind – trotz unterschiedlicher Messmethode doch sehr ähnlich. Zumindest im Vergleich zu spitzohr.de. Der Episodenguide hat aber auch keinen Feed und es werden wohl auch nur selten Fotos entführt..

Schauen wir uns mal die Seitenzugriffe an:

  • Google Analytics: 92.059 Seitenzugriffe
  • Webalizer: 16.979 Seitenzugriffe (.cfm wird wohl nicht als Seite erkannt)
  • Webalizer „Dateien“: 413.054 Dateien wurden abgerufen

Oh, großer Unterschied. Das muß wohl an der für Webalizer unbekannten Extension „.cfm“ liegen. Möglicherweise ist das einfach nicht eingetragen, da auf diesem Server gar kein Cold Fusion läuft… Aber das ist ein anderes Thema. Man kann aber relativ gut erkennen, dass ich deutlich mehr Besucher auf den Episodenguide locken kann. Und laut Google Analytics werden 13,3 Seiten pro Besuch angeschaut, was doch sehr für den Inhalte der Seite spricht. Bei Spitzohr.de sind es nur 1,59 Seiten pro Besuch – ob mein Inhalt deswegen schlechter ist? Es ist ein Weblog und die neusten Inhalte werden direkt auf der Startseite vollständig angezeigt. Kann man in diesem Zusammenhang also nicht als Qualitätsmerkmal betrachten. Aber 13,3 Seiten pro Besuch ist schon bemerkenswert.

Was den Traffic angeht: Ich habe hier wesentlich mehr Fotos – und diese auch in einer höheren Auflösung. Und dann sind da noch meine „Sendungen“. Den Episodenguide habe ich ja im März 2000 gestartet. Das war vor über sieben Jahren – noch bevor die meisten DSL hatten. Damals hatte ich mir noch Gedanken über Dateigrößen gemacht – und die Inhalte und Bilder auch nie wieder geändert. Und hier nehme ich darauf kaum noch rücksichtig…

Update: Webalizer ist kostenlos bei den meisten Providern dabei – so auch bei meinem bevorzugtem Provider Domainfactory. Auch Google Analytics ist kostenlos. etracker gibt es ebenfalls als kostenlose (etracker free) Variante, ich verwende hier jedoch etracker pro (6,45 Euro im Monat) und finde, dass die Statistik auch ihr Geld wert ist. etracker hat für mich die aussagekräftigsten Reports. Vorallem die Anzeige der Quereinsteiger und auch die Ansicht nach „letzten Besucher“ ist für mich sehr interessant. Da kann ich fast live sehen, mit welchen Suchbegriffen meine Seite gefunden wurde oder wo ich aktuell verlinkt bin. Außerdem halte ich etracker für seriöser als Google Analytics. Warum? etracker verdient Geld, indem es für seine Kunden die Besucherzahlen der Websites ermittelt und auswertet. Ich zahle Geld und erhalte Reports. Google hingegen lebt davon, Informationen zu sammeln und diese zur Optimierung ihrer Werbeanzeigen zu verwenden. Google Analytics ist daher nicht einfach nur kostenlos. Ich erhalte zwar Statistiken über meine Website, Google erhält im Gegenzug auch ebenfalls diese Daten und noch viel mehr Informationen. Und diese können die auch nutzen. Damit macht Google Geld und kann uns Analytics kostenlos zur Verfügung stellen. In meinem Fall (spitzohr.de und episodenguide.de) sehe ich da kaum Probleme. Es sind keine komerziellen Seiten und ich schalte auch keine Adwords. Jeder muß für sich aber selber entscheiden, ob er seine Daten an Google geben soll oder lieber ein wenig zahlt, aber dann auch kontrollieren kann, wer die Daten nutzt.