Verweildauer
Die Verweildauer wird seit einiger Zeit als eine der angeblich aussagekräftigsten Kenngröße im Internet gehandelt. Mit derart pauschalen Aussagen sollte man jedoch vorsichtig sein!
Zwar existieren kompliziertere technische Lösungen, die Verweildauer zu messen. Dennoch unterliegen auch diese (vor allem JavaScript-Lösungen) technischen Grenzen (siehe unten). Für herkömmliche Aufzeichnungsmethoden in Logfiles gelten jedoch erhebliche Einschränkungen.
Zu einem soliden Internet-Controlling gehört auch, auf die Grenzen des Messbaren hinzuweisen. Eine solche liegt bei der herkömmlich gemessenen Verweildauer vor:
- Bereits das Wort "verweilen" ist unglücklich gewählt, da es eine aktive Handlung einer Person impliziert oder suggeriert. De facto wird kein Verweilen gemessen, sondern ausschließlich das messbare Klicken eines Links mit dem damit verknüpften Abruf von Seiten - also die Pause zwischen zwei Handlungen! Aus der Differenz des Zeitstempels der ersten auf dem eigenen Auftritt angeklickten Seite zum Zeitstempel der zweiten auf dem eigenen Auftritt angeklickten Seite wird der rein mathematische Wert ermittelt.
- Da nur die Differenz zwischen zwei auf dem eigenen Server abgerufener Dateien berechnet werden kann, treten unter anderem folgende Probleme auf:
- Falls nur eine Seite aufgerufen wird, so ist die gemessene Verweildauer nicht messbar. Die meisten Analyseprogramme ergeben hier: 0 Sekunden. Dies betrifft vor allem die Startseite.
Angenommen, 10 Nutzer rufen Ihre Startseite auf. Fünf davon klicken eine weitere Seite bei Ihnen an, so ist die Zeitdifferenz messbar. Angenommen, es ergäben sich durchschnittlich 20 Sekunden, so wäre die Gesamtsumme 100 Sekunden. Die anderen fünf Nutzer betrachten nur die Startseite, diese jedoch im Durchschnitt 40 Sekunden und verlassen dann Ihren Auftritt. Wir wissen nun, dass die durchschnittliche Verweildauer bei 30 Sekunden liegen müsste. Leider wird diese Zeit der einmaligen Aufrufe nicht erfasst. Der von den Analyseprogrammen errechnete Gesamtdurchschnitt der Verweildauer aller 10 Seitenaufrufe ist nun 100 Sekunden dividiert durch alle 10 Aufrufe und somit völlig unrealistische 10 Sekunden.
- Noch extremer wird der Wert, wenn die Nutzer eine Seite grundsätzlich nur einmal aufrufen. Dieses Phänomen kann bei Visitenkarten oder Mikro-Auftritten entstehen. Hierbei handelt es sich um Auftritte, die aus nur einer einzigen Seite bestehen. Da es keine Folgeseiten geben kann, gibt es keine Zeitdifferenz. Deshalb ist die durchschnittliche Verweildauer immer 0.
- Noch verheerender wirkt sich meines Erachtens die technisch bedingte Errechnung der Verweildauer der herkömmlichen Analysesoftware auf die letzte Seite aus. Sie kann niemals gemessen werden.
In der Regel handelt es sich jedoch hierbei um die aussagekräftigste Seite.
Annahme: Ein Nutzer sucht eine bestimmte Information: Hierzu geht er in eine große Suchmaschine (z.B. Google) und findet unter einem Stichwort Ihren Internet-Auftritt. Er klickt den Link an und gelangt auf Ihre Startseite. Dort klickt er nach ca. 10 Sekunden die vermutlich passende Rubrikenstartseite an und sucht das gewünschte Stichwort. Eventuell muss er nochmals einen weiteren Link anklicken, um zum erwarteten Ziel zu gelangen. Auf der Zielseite angekommen wird er entweder hoch erfreut sein und alle gewünschten Informationen finden oder enttäuscht. Im ersten Fall wird er minutenlang oder vielleicht sogar ein Stunde aufmerksam den Text lesen - und dann den Auftritt zufrieden verlassen. Er hat schließlich alles erreicht, was er wollte. - Im letzteren Fall wird er den Auftritt nach wenigen Sekunden unzufrieden verlassen. Er hat sein Ziel nicht erreicht. In beiden Fällen verlässt er in der Regel den Auftritt. Das errechnete Ergebnis für beide Fälle in allen Analyseprogrammen ist identisch: 0 Sekunden Verweildauer.
- Verweilen ist auch nicht identisch mit Lesen! Es bedeutet noch nicht einmal ansehen.
Ob der Nutzer nach dem Seitenaufruf den PC oder das Zimmer verlässt, einen anderen Browser oder eine andere Software aufruft und mit ihr arbeitet, ist völlig unklar.
Da heute jedoch die meisten Betriebssysteme multitasking-fähig sind, ist davon auszugehen, dass andere Applikationen offen sind, und fast jeder Nutzer mehrere Dinge quasi parallel bedient.
- Festgehalten wird ausschließlich eine IP - eine Nummer, die mit der Postleitzahl zu vergleichen ist. Damit wird ein Anschluss an das Internet gekennzeichnet. Es finden sich in der Regel keinerlei Benutzernamen im Logfile. Das Verweilen eines bestimmten Benutzers ist somit nicht möglich.
- Eine IP ist nicht identisch mit einem PC und sie ist auf keinen Fall mit einem Nutzer identisch. IPs werden aufgrund ihrer Knappheit und damit verbundenen Kosten bei den meisten Providern dynamisch vergeben. Dies bedeutet, dass jeder Nutzer des Internets bei jeder Einwahl eine neue IP erhält. Oft bleibt diese Nummer während einer Sitzung identisch.
Allerdings bleibt festzuhalten, dass viele Nutzer mit Zeittarif nachdem Sie etwas Interessantes gefunden haben, die Verbindung aus Kostengründen zum Netz unterbrechen, die Inhalte sorgfältig lesen oder ausdrucken und dann erst wieder - mit einer neuen IP - in das Internet und auf Ihren Auftritt zugreifen.
Bei manchen Providern wechselt die IP sogar zwischen den Tätigkeiten GET und POST, sodass ein einziger PC zwei IPs erhält. Mindestens ein großer Provider verteilt die IPs jedoch im Zeitscheibenverfahren ständig neu, sodass ein angeschlossener PC alle paar Sekunden eine neue IP erhält.
Als vermeintliches Ergebnis erhalten sie keine oder kürzere Verweildauern für die aufgerufenen Seiten.
Diesem Problem kann man teilweise mit Cookies oder Session IDs begegnen.
- Eine IP bedeutete nicht, dass dahinter ein Mensch steckt. Aufrufe von Seiten können auch durch einen Spider einer Suchmaschine, ein Monitoring-System, Hacker-Tools, Download-Software etc. verursacht werden. Diese benötigen für die Auswertung der Inhalte einer Seite wesentlich weniger Zeit als jeder Mensch. Als vermeintliches Ergebnis sinken die angegebenen Durchschnittswerte der Verweildauer.
- Ferner bedeutet Verweildauer auch nicht, dass sich dahinter ein einziger Benutzer verbirgt! Während eines Zeitraumes X kann z.B. beim Heimanwender zuerst der Familienvater, dann die Mutter, die Tochter oder der Sohn an den PC gegangen sein und eine andere Seite angeklickt haben.
- Angenommen, eine Firma oder eine Familie besitzt einen Router oder Proxy-Server, so können mehrere Personen gleichzeitig im Internet surfen. Dies geschieht jedoch in der Regel über dieselbe IP. Angenommen, sie besuchen denselben Internet-Auftritt, so wird dies im Logfile mit einer IP dargestellt. Alle Logfile-Analyse-Programme interpretieren jedoch eine IP als einen Besucher!
Das Problem hierbei liegt in der Vorgehensweise der Zählung über den Zeitstempel: Angenommen, es sind zwei Personen, so erfolgen letztendlich während eines Zeitraumes x doppelt so viele Seitenabrufe als bei einer Person. Da die Verweildauer jedoch als reine Division berechnet wird, ergibt sich de facto auf dem Papier die Hälfte der tatsächlichen Verweildauer jeder Person auf den jeweiligen Seiten!
- Die meisten Analyseprogramme setzen einen willkürlichen Wert für die Analyse der zusammengehörenden IPs anhand der Zeit. In der Regel werden IPs einem Nutzer zugeordnet, solange er innerhalb von 15 Minuten eine weitere Seite anklickt.
Viele Texte im Internet sind allerdings länger und erfordern mehr als 15 Minuten Verweildauer. Eventuelle Pausen oder andere Tätigkeiten des Nutzers werden nicht erkannt.
- Im Übrigen sind die Werte der Verweildauer sowieso völlig wertneutral - will heißen wertlos.
Angenommen, der Idealfall wäre eingetreten, und ein Nutzer hätte tatsächlich die Verweildauer dazu genutzt, den Inhalt einer Seite ausführlich zu studieren. Was sagt dann ein gemessener Wert von zwei Minuten aus? Hat er sich so lange auf der Seite aufgehalten, weil der Inhalt und die Gestaltung derart perfekt seine Anforderungen erfüllten? Oder hat er aufgrund einer miserablen Textgestaltung so lange gebraucht, um zu erkennen, dass sein Informationswunsch hier nicht erfüllt wird, und aufgrund eines chaotischen Layouts den Link zur nächsten Seite erst so spät gefunden?
Ohne dass man den Nutzer hierbei in Laborversuchen beobachten und befragen kann, ist eine gemessene Verweildauer in jede Richtung auslegbar.
- Neueste Untersuchungen belegen sogar, dass die Zeit, welche Nutzer zum Erfassen von Web-Inthalten benötigen, extreme individuelle Schwankungen aufweist: Die Spitzenwerte können zwischen der schnellsten Person und der langsamstem um das 15-fache auseinander liegen. Im Durchschnitt wurde der Faktor 2,4 ermittelt.
Angenommen Sie stellen Inhalte für Personen mit extrem schneller Auffassungsgabe in das Internet - also Ihre Zielgruppe besteht aus diesen Genies -, dann werden Sie immer extrem geringe Verweilzeiten erhalten. Dies wäre dann sogar ein positives Zeichen, da Sie Ihre Zielgruppe exakt erreicht hätten.
Im anderen Extremfall - falls Sie sich an den Personen mit langsamerer Auffassungsgabe orientierten, bzw. diese sich auf Ihren Seiten tummelten - würden Sie extrem lange Verweilzeiten als Ergebnis erhalten.
Letztendlich bleibt jedoch festzuhalten, dass Sie sich die Benutzer im Internet nur selten aussuchen können und - was noch viel bedeutender ist - sowohl die schnellsten als auch die langsamsten Anwender können bezahlende Kunden bei Ihnen werden!
JavaScript
Zwar kann man mit JavaScript in einer HTML-Datei die Verweildauer - auch einer einzelnen Seite - messen (Beispiel siehe unten). Im Prinzip lädt man eine weitere Datei (meist ein unsichtbares kleines Bild) am Ende des Betrachtungszeitraumes.
Aber auch hier existieren Einschränkungen:
- Der Browser des Nutzers muss JavaScript unterstützen.
- Der Nutzer muss JavaScript aktiviert haben. Das tun bei weitem nicht alle Nutzer.
- Die Firewall muss JavaScript durchlassen / ausführen lassen. Sicherheitsbewusste Nutzer, viele Universitäten und noch mehr Firmen gehen damit sehr restriktiv um.
- Das Browsen muss normal beendet werden. Ein Klick auf das X (Schließen-Symbol) des Browser, ein Herunterfahren des Betriebssystems etc. führt bei fast allen getesteten Systemen zu keinem Eintrag im Logfile.
- Probleme treten auch beim zwangsweisen Reload auf (Strg+R).
- Die Zeiten werden ungenau gemessen (sehr oft zu kurz). Dies darf auch nicht verwundern, da es sich bei JavaScript um ein client-seitiges Programm handelt. Es läuft auf dem Kunden-PC ab.
- Weitere Zeitdifferenzen zum Server sind aufgrund der Distanz und somit der Laufzeit der Signale normal.
- Die Ergonomie der Seite wird verschlechtert, da sich die Ladezeit / Ausführungszeit verlängert.
- Ferner sind nicht alle Anwender mit dieser wässrigen Auslegung der Privacy-Politik einverstanden. Immerhin wird ein zweiter Ladevorgang erfordert, für den der Nutzer nichts erhält, jedoch seine vermeintliche Aufenthaltsdauer preisgibt.
- Ohne dynamische Datenbank oder z.B. PHP ist der Aufwand zum Einbau des Codes und zur Pflege derartiger Seiten aufwändig. Damit sind für Firmen in der Regel auch nicht unerhebliche Kosten verbunden.
- Die Messmethode funktioniert nur zukünftig, d.h. nachdem der Quellcode in die betreffende HTML-Seite eingebaut wurde. Retrospektive Betrachtungen mit altem einfachen Datenbestand sind damit nicht möglich.
- Mit herkömmlichen Analyseprogrammen lässt sich das Logfile mit JavaScript-Einträgen der Verweildauer kaum auswerten. Noch komplizierter wird es, wenn daraus Grupierungen erstellt und Durchschnittswerte errechnet werden sollen.
Letztendlich stellt sich jedoch auch bei dieser technisch durchführbaren Messung von Einzelseiten die Frage nach dem Wert der Ergebnisse:
Ist eine Seite a mit durchschnittlich 20 Sekunden Verweildauer "besser" als eine Seite b mit 15 Sekunden?
Beispielcode
Da immer wieder die Frage gestellt wird, wie man die Verweilzeit bei Einzelabrufen messen kann, sei im Folgenden ein Beispiel mit JavaScript angegeben, das auch bei einfachen / statischen HTML-Seiten auf den meisten technisch einfach ausgestatteten Servern funktioniert.
Mit dem folgenden Beispielcode (test1.htm) wurden diverse Tests durchgeführt.
<html><head>
<title>Testseite</title>
<script type="text/javascript">
var Start = new Date();
var Startzeit = Start.getTime();
function Aufenthalt() {
var Ende = new Date();
var Endezeit = Ende.getTime();
var Aufenthalt = Math.floor((Endezeit - Startzeit) / 1000);
document.img1.src = "1.gif?Sek="+Aufenthalt;
}
</script>
</head>
<body onUnload="Aufenthalt()">
Testseite 1
<br><a href="test2.htm">zur Seite 2</a>
<br><img src="1.gif" alt="" width="1" height="1" name="img1">
</body>
</html>
Damit man zum Testen schnell hin- und herspringen kann, existierte eine ähnlich aussehende Datei test2.htm
Das Ergebnis sieht als Eintrag im Logfile folgendermaßen aus:
217.83.170.156 - - [06/Mar/2004:13:49:21 +0100] "GET 1.gif?Sek=14 HTTP/1.1" 200 42 www.testdomain.de "http://www.testdomain.de/test1.htm" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)" "-"
Die Zahl hinter Sek= gibt die gemessene Verweildauer in Sekunden an.
Hilfe
Ich helfe Ihnen bei der
Analyse Ihres Internet-Auftrittes
Zum Seitenanfang