Google Analytics Spam: Fake-Traffic und Referrer-Spam loswerden

von | Feb 10, 2021 | Analytics

Nicht jeder Traffic, der in Google Analytics ankommt, ist echter Traffic. Fake-Traffic und Referrer-Spam verfälschen eure Zugriffszahlen. Wie ihr ungebetene Gäste erkennt und mit welchen Filtern ihr den Spam in Google Analytics stoppen könnt, lest ihr im Post.

Update: Ende Januar/Anfang Februar 2021 tauchte Traffic in unseren Konten auf, der verdächtig nach Spam aussah. Gab es das bei euch auch? Schreibt uns gerne einen Kommentar dazu!

Was ist Google Analytics Fake-Traffic?

Als Fake-Traffic werden solche Zugriffe bezeichnet, die in euren Analytics Daten erscheinen, die aber aus irgendeinem Grund nicht „echt“ sind, also nicht von einer Person stammen. Das kann sowohl technische Probleme als auch bewusste Täuschung als Ursache haben. Egal was die Ursache ist: Diese Zugriffe wollt ihr normalerweise nicht in euren Auswertungen haben, denn sie verfälschen Zugriffszahlen und verwässern somit die Aussagekraft.

Ghost-Traffic als Spam

Generiert jemand Zugriffe oder generell Einträge in euren Analytics Berichten, um auf Webseiten oder Services aufmerksam zu machen, ist das klassischer Spam – nur eben nicht per Email. Ghost Traffic deshalb, weil die Zugriffe häufig nicht wirklich auf euerer Seite entstehen, sondern direkt in euren GA Bericht geschleust werden.

Beispiel für Bot-Traffic in Google Analytics

Beispiel für Bot-Traffic in Google Analytics

Wie funktioniert Google Analytics Spam?

Das Analytics-Tracking Script auf eurer Seite ist lediglich ein Werkzeug, um alle Daten der Nutzer einzusammeln. Die eigentliche Datenübertragung passiert anschließend an einen Google-Server https://www.google-analytics.com durch eine bestimmte URL mit entsprechenden Parametern.

Request URL

Jeder Parameter steht für eine bestimmte Information, z.B. bedeutet aip=1, dass die IP-Anonymisierung aktiviert wurde. Der Haken an der Sache: Der Aufruf dieser URL ist nicht geschützt. Jeder kann sie direkt aufrufen und in die Parameter-Felder schreiben, was er oder sie möchte.

Ein Script zu schreiben, das nacheinander eine Liste von Analytics Konto-Nummern durchgeht und an diese einen entsprechend vorbereiteten Aufruf sendet, ist keine unlösbare Aufgabe für einen Programmierer. Mit den „richtigen“ Parametern landen die gewünschten Einträge im Seiten-, Ereignis- oder vor allem im Verweis- und Kampagnen-Bericht.

Warum ausgerechnet im Verweis-Bericht?

Der Bericht Verweise zeigt in Analytics an, auf welcher Website Nutzer einen Link geklickt haben, um auf eure Website zu kommen. Der Browser übergibt diese Information netterweise im Referrer-Feld. Taucht in den Verweisen ein neuer Eintrag auf, von dem viele Nutzer kamen, schaut man nach, wo denn dieser tolle Link herkam und geht auf die URL.

Bot-Traffic im Verweis-Bericht

Bot-Traffic im Verweis-Bericht

Die Domain beherbergt lediglich eine Weiterleitung, die euch weiter zu einer Website führt, auf der man in diesem Fall genau solche gefakten Nutzerzugriffe kaufen kann. Um z.B. seine eigene Nutzer-Statistik aufzuhübschen, für Vorgesetzte, Investoren oder z.B. Kunden, die auf eurer Seite Werbung schalten.

Fake Zugriffe durch Bots, Crawler und Spider

Im Netz sind jede Menge Programme unterwegs, die Websites abrufen, kopieren oder durchforsten. Neben den bekannten Suchmaschinen wie Google gibt es tausende mehr oder weniger bekannte Programme, die eure Seiten untersuchen. Nicht jeder dieser Bots taucht in euren Nutzerberichten auf, dazu müssen sie die Tracking-Codes der Seite ausführen. Tun sie das allerdings, sind sie für Google Analytics zunächst kaum vom Browser eines echten Nutzers zu unterscheiden.

Manche Bots lassen sich an ihrer Browserkennung identifizieren (im Bericht Zielgruppe > Technologie > Browser und Betriebssystem). Der Google-Crawler melden als Browserkennung z.B. „Googlebot“. Einige Bots werden sich allerdings als „normaler Nutzer“ tarnen und vorgeben, als Chrome, Firefox oder Edge auf die Seite zu kommen.

Was kann man gegen Fake-Traffic tun?

Mit ein paar Handgriffen könnt ihr euer Analytics-Konto eine Art Spam-Filter für Fake-Traffic einbauen. Wie bei Email-Spam gilt: Einen 100%-tigen Schutz gibt es nicht, aber 80% sind ja auch schon was.

Bots herausfiltern

Einige Bots, wie etwa den eigenen Googlebot, filtert Analytics immer heraus. Einen Teil weiterer Bots kann GA ebenfalls automatisch herausfiltern. Dazu setzt ihr in der Verwaltung der Datenansicht ein Häkchen bei der Option „Bots herausfiltern“

Bots herausfiltern

Bots herausfiltern

Die wichtige Einschränkung ist hier „bekannte Bots und Spider“, allerdings sind GA schon eine ganze Menge Programme und Crawler bekannt.

Hostname filtern

Wenn ihr mit Filtern Traffic ausschließt, solltet ihr vorher immer eine Rohdaten-Ansicht angelegt haben. Dort lasst ihr Zugriffe ungefiltert einlaufen und habt so immer eine Backup-Ansicht, mit der ihr eure Filter überprüfen könnt.

Bei jedem Zugriff übermittelt der Tracking-Code die Ursprungsdomain, auf der der Zugriff gemessen wird. Auf unserer Website enthält das Host-Feld z.B. auf jeder Seite den Wert www.luna-park.de.

Bei Ghost-Spam, der über direkte Aufrufe in eure Property geschickt wird, ist dieses Feld nicht immer korrekt befüllt. Denn für diese Aufrufe wird häufig einfach nur eine Property-ID „geraten“ und dann dort ein Aufruf abgesetzt. Ein Prüfung, auf welcher Website sie tatsächlich verbaut ist, bleibt meistens aus. Im Screenshot seht ihr viele Aufrufe für die Domain webanalyse-news.de, auf der der Tracking-Code aber gar nicht verbaut ist.

Hostnamen in Google Analytics

Hostnamen in Google Analytics

Mit einem Host-Filter könnt ihr solche unerwünschten Zugriffe von vorneherein abblocken. Dazu fügt ihr unter den Einstellungen der Datenansicht einen Filter von Typ Host hinzu, mit dem ihr nur Zugriffe von den Domain zulasst, von denen ihr Traffic erwartet.

Hostname Filter anlegen

Hostname Filter anlegen

Im Beispiel seht ihr einen regulären Ausdruck: Es werden alle Domains zugelassen, die luna-park enthalten, also luna-park.de, luna-park.net, www.luna-park.de, usw. Außerdem werden noch Zugriffe mit usercontent im Hostnamen durchgelassen. Diese entstehen, wenn ein Nutzer eure Seite über den Google Cache aufruft. Denn auch dabei werden Tracking-Codes ausgeführt, allerdings kommen sie von einer anderen Domain, wie man im Screenshot sieht.

Hostname Usercontent

Hostname Usercontent

Referrer und Kampagnen filtern

Eine weitere Möglichkeit um Fake-Traffic einzuschränken, ist es verdächtige Verweise und Kampagnen komplett zu blockieren. Hierbei schließt ihr von vorneherein bestimmte Sessions aus. Dazu legt ihr einen Filter für das Feld Kampagnenquelle bzw. Verweis.

Kampagnenquelle Filter

Kampagnenquelle Filter

Eine aktuelle Liste bzw. Vorlage für diese Filter findet ihr auf carloseo.com

Property-ID über 1 wählen

Bei der simpelsten Form dieses Traffic-Spams läuft ein Script eine Liste von Analytics-Konten ab und schickt Aufrufe dort hin. Dabei wird in jedem Fall die erste Property „bespielt“, da diese in den meisten Analytics-Konten vorhanden ist. Weitere Properties werden dagegen oft nicht berücksichtigt, weil sie eben oft gar nicht vorhanden sind.

Wenn ihr für eure primäre Domain also eine Property mit einer „höheren“ ID nutzt, seid ihr zumindest diese einfachen Scripte schon mal los.

Zusätzliche Absicherung über den Google Tag Manager (fortgeschritten)

Nutzt ihr den Google Tag Manager, um auf eurer Site Tracking-Codes auszuspielen, könnt ihr darüber eine zusätzliche Absicherung einbauen. Legt dazu eine Benutzerdefinierte Dimension in eurer Analytics Property an.

Custom Dimension

Custom Dimension

Anschließend fügt ihr in euren Tags im Google Tag Manager die Dimension hinzu und übergebt darin eine beliebige Zeichenkette. Es ist egal, was oder wie lang diese Zeichenkette ist.

Custom Dimension in GTM

Custom Dimension in GTM

Zurück in der Analytics Verwaltung richtet ihr nun einen Filter in der Datenansicht ein, mit dem ihr nur noch Zugriffe durchlasst, die über diese Benutzerdefinierte Dimension verfügen.

Benutzerdefinierte Dimension filtern

Benutzerdefinierte Dimension filtern

Damit lasst ihr jetzt nur noch Zugriffe durch, die von eurem Google Tag Manager Container ausgehen.

Wenn der Spam schon in Google Analytics gelandet ist?

Mithilfe von Analytics Segmenten könnt ihr unliebsamen Traffic anhand von Verweisen, Kampagnen, Seiten/Ereignisse oder vielen anderen Kriterien ausschließen. Allerdings sind diese Filterungen immer nur temporär und somit keine wirklich dauerhafte Lösung.

Was ist mit neuen Google Analytics 4 Properties?

Laut Google werden in Google Analytics 4 Properties Bot und Spider Zugriffe direkt gefiltert:

In Google Analytics 4 properties, traffic from bots and spiders is automatically excluded. This ensures that your Analytics data, to the extent possible, does not include events from known bots. At this time, you cannot disable bot traffic exclusion or see how much bot traffic was excluded.

Bot traffic is identified using a combination of Google research and the International Spiders and Bots List, maintained by the Interactive Advertising Bureau.

Quelle: https://support.google.com/analytics/answer/9888366?hl=en

Darüber hinaus gibt es in den neuen GA4 Berichten bisher keine vergleichbaren Filtermöglichkeiten wie in den klassischen Properties.

Fazit

Unerwünschter Traffic in den Berichten von Google Analytics ist ärgerlich und kann die Arbeit mit euren Daten aufwendig bis unmöglich machen. Daher solltet ihr Vorkehrungen für eine gute Datenqualität treffen. Die beschriebenen Einstellungen und Filter helfen euch dabei, eine erste Schutzwand für Fake-Traffic aufzustellen.

Weitere Tipps zur richtigen Einstellung eures Analytics Kontos findet ihr im Artikel Google Analytics Konto richtig einrichten.

<a href="https://www.luna-park.de/blog/author/mvo/" target="_self">Markus Vollmert</a>

Markus Vollmert

Markus Vollmert ist seit langem im Online Marketing unterwegs und dabei in Zahlen und Daten zuhause. Als Gründer und Geschäftsführer von lunapark beschäftigt er sich mit Trackings und Daten für Websites und Kampagnen. Markus ist außerdem Autor von Google Analytics – Das umfassende Handbuch aus dem Rheinwerk Verlag.

Weiterführende Artikel

2 Kommentare

  1. W. P. Müde

    Hallo,

    bekannte Bots und Spider habe ich schon von Anbeginn ausgeschlossen leider kriege ich das mit der Filtereinstellung nicht hin. Google ist eine einzige Zumutung, egal um was es geht.

    Antworten
  2. Reza

    Hi, tja, bei uns besteht das Problem auch und mittlerweile taucht es in den Organischen Suchbegriffen auf. Da unterschiedliche urls genutzt werden, haben wir keine Chance das vorab zu filtern. Kommt Freude auf.

    Antworten

Einen Kommentar abschicken

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Die folgenden im Rahmen der DSGVO notwendigen Bedingungen müssen gelesen und akzeptiert werden:
Durch Abschicken des Formulares wird dein Name, E-Mail-Adresse und eingegebene Text in der Datenbank gespeichert. Für weitere Informationen wirf bitte einen Blick in die Datenschutzerklärung.

Newsletter

Du möchtest keinen Beitrag aus unserem Blog verpassen? Dann trage dich in unseren Newsletter ein.

Du möchtest alles über Google Analytics erfahren?
Google Analytics - Das umfassende Handbuch

Das geballte lunapark Google Analytics-Wissen in einem Buch:

Implementierung, Analyse, Optimierung und mehr

Alle neuen Blog Posts in deinem Posteingang!

Ja, ich möchte euren Newsletter mit Neuigkeiten aus dem Blog, Branchennews und wissenswerten Infos zum Digitalen Marketing erhalten.

Interesse

Du hast dich erfolgreich angemeldet. Bitte bestätige die Email in deinem Posteingang!