Inhaltsverzeichnis
Was ist Google Analytics Fake-Traffic?
Als Fake-Traffic werden solche Zugriffe bezeichnet, die in euren Analytics Daten erscheinen, die aber aus irgendeinem Grund nicht „echt“ sind, also nicht von einer Person stammen. Das kann sowohl technische Probleme als auch bewusste Täuschung als Ursache haben. Egal was die Ursache ist: Diese Zugriffe wollt ihr normalerweise nicht in euren Auswertungen haben, denn sie verfälschen Zugriffszahlen und verwässern somit die Aussagekraft.Ghost-Traffic als Spam
Generiert jemand Zugriffe oder generell Einträge in euren Analytics Berichten, um auf Webseiten oder Services aufmerksam zu machen, ist das klassischer Spam – nur eben nicht per Email. Ghost Traffic deshalb, weil die Zugriffe häufig nicht wirklich auf euerer Seite entstehen, sondern direkt in euren GA Bericht geschleust werden.
Beispiel für Bot-Traffic in Google Analytics
Wie funktioniert Google Analytics Spam?
Das Analytics-Tracking Script auf eurer Seite ist lediglich ein Werkzeug, um alle Daten der Nutzer einzusammeln. Die eigentliche Datenübertragung passiert anschließend an einen Google-Server https://www.google-analytics.com durch eine bestimmte URL mit entsprechenden Parametern.
Jeder Parameter steht für eine bestimmte Information, z.B. bedeutet aip=1, dass die IP-Anonymisierung aktiviert wurde. Der Haken an der Sache: Der Aufruf dieser URL ist nicht geschützt. Jeder kann sie direkt aufrufen und in die Parameter-Felder schreiben, was er oder sie möchte.
Ein Script zu schreiben, das nacheinander eine Liste von Analytics Konto-Nummern durchgeht und an diese einen entsprechend vorbereiteten Aufruf sendet, ist keine unlösbare Aufgabe für einen Programmierer. Mit den „richtigen“ Parametern landen die gewünschten Einträge im Seiten-, Ereignis- oder vor allem im Verweis- und Kampagnen-Bericht.
Warum ausgerechnet im Verweis-Bericht?
Der Bericht Verweise zeigt in Analytics an, auf welcher Website Nutzer einen Link geklickt haben, um auf eure Website zu kommen. Der Browser übergibt diese Information netterweise im Referrer-Feld. Taucht in den Verweisen ein neuer Eintrag auf, von dem viele Nutzer kamen, schaut man nach, wo denn dieser tolle Link herkam und geht auf die URL.
Bot-Traffic im Verweis-Bericht
Die Domain beherbergt lediglich eine Weiterleitung, die euch weiter zu einer Website führt, auf der man in diesem Fall genau solche gefakten Nutzerzugriffe kaufen kann. Um z.B. seine eigene Nutzer-Statistik aufzuhübschen, für Vorgesetzte, Investoren oder z.B. Kunden, die auf eurer Seite Werbung schalten.
Fake Zugriffe durch Bots, Crawler und Spider
Im Netz sind jede Menge Programme unterwegs, die Websites abrufen, kopieren oder durchforsten. Neben den bekannten Suchmaschinen wie Google gibt es tausende mehr oder weniger bekannte Programme, die eure Seiten untersuchen. Nicht jeder dieser Bots taucht in euren Nutzerberichten auf, dazu müssen sie die Tracking-Codes der Seite ausführen. Tun sie das allerdings, sind sie für Google Analytics zunächst kaum vom Browser eines echten Nutzers zu unterscheiden. Manche Bots lassen sich an ihrer Browserkennung identifizieren (im Bericht Zielgruppe > Technologie > Browser und Betriebssystem). Der Google-Crawler melden als Browserkennung z.B. „Googlebot“. Einige Bots werden sich allerdings als „normaler Nutzer“ tarnen und vorgeben, als Chrome, Firefox oder Edge auf die Seite zu kommen.Was kann man gegen Fake-Traffic tun?
Mit ein paar Handgriffen könnt ihr euer Analytics-Konto eine Art Spam-Filter für Fake-Traffic einbauen. Wie bei Email-Spam gilt: Einen 100%-tigen Schutz gibt es nicht, aber 80% sind ja auch schon was.Bots herausfiltern
Einige Bots, wie etwa den eigenen Googlebot, filtert Analytics immer heraus. Einen Teil weiterer Bots kann GA ebenfalls automatisch herausfiltern. Dazu setzt ihr in der Verwaltung der Datenansicht ein Häkchen bei der Option „Bots herausfiltern“
Bots herausfiltern
Hostname filtern
Wenn ihr mit Filtern Traffic ausschließt, solltet ihr vorher immer eine Rohdaten-Ansicht angelegt haben. Dort lasst ihr Zugriffe ungefiltert einlaufen und habt so immer eine Backup-Ansicht, mit der ihr eure Filter überprüfen könnt.

Hostnamen in Google Analytics

Hostname Filter anlegen

Hostname Usercontent
Referrer und Kampagnen filtern
Eine weitere Möglichkeit um Fake-Traffic einzuschränken, ist es verdächtige Verweise und Kampagnen komplett zu blockieren. Hierbei schließt ihr von vorneherein bestimmte Sessions aus. Dazu legt ihr einen Filter für das Feld Kampagnenquelle bzw. Verweis.
Kampagnenquelle Filter
Property-ID über 1 wählen
Bei der simpelsten Form dieses Traffic-Spams läuft ein Script eine Liste von Analytics-Konten ab und schickt Aufrufe dort hin. Dabei wird in jedem Fall die erste Property „bespielt“, da diese in den meisten Analytics-Konten vorhanden ist. Weitere Properties werden dagegen oft nicht berücksichtigt, weil sie eben oft gar nicht vorhanden sind. Wenn ihr für eure primäre Domain also eine Property mit einer „höheren“ ID nutzt, seid ihr zumindest diese einfachen Scripte schon mal los.Zusätzliche Absicherung über den Google Tag Manager (fortgeschritten)
Nutzt ihr den Google Tag Manager, um auf eurer Site Tracking-Codes auszuspielen, könnt ihr darüber eine zusätzliche Absicherung einbauen. Legt dazu eine Benutzerdefinierte Dimension in eurer Analytics Property an.
Custom Dimension

Custom Dimension in GTM

Benutzerdefinierte Dimension filtern
Wenn der Spam schon in Google Analytics gelandet ist?
Mithilfe von Analytics Segmenten könnt ihr unliebsamen Traffic anhand von Verweisen, Kampagnen, Seiten/Ereignisse oder vielen anderen Kriterien ausschließen. Allerdings sind diese Filterungen immer nur temporär und somit keine wirklich dauerhafte Lösung.Was ist mit neuen Google Analytics 4 Properties?
Laut Google werden in Google Analytics 4 Properties Bot und Spider Zugriffe direkt gefiltert:In Google Analytics 4 properties, traffic from bots and spiders is automatically excluded. This ensures that your Analytics data, to the extent possible, does not include events from known bots. At this time, you cannot disable bot traffic exclusion or see how much bot traffic was excluded. Bot traffic is identified using a combination of Google research and the International Spiders and Bots List, maintained by the Interactive Advertising Bureau. Quelle: https://support.google.com/analytics/answer/9888366?hl=enDarüber hinaus gibt es in den neuen GA4 Berichten bisher keine vergleichbaren Filtermöglichkeiten wie in den klassischen Properties.


