Nicht jeder Traffic, der in Google Analytics ankommt, ist echter Traffic. Fake-Traffic durch Referrer Spam verfälscht eure Zugriffszahlen. Um eine saubere Statistik aus Google Analytics zu erhalten, ist es wichtig diese ungebetenen Besuche loszuwerden, und zwar so schnell wie möglich. Wir zeigen, mit welchen Filtern man den Spam in Google Analytics stoppt!

Was ist Fake-Traffic durch Referrer Spam?

Es handelt sich hier um keinen echten Website-Besuch. Oft wird er in den Analytics Berichten angezeigt als ein Verweis (engl.: Referrer), z.B. 4webmasters.org, aber er kann ebenfalls als ein Suchbegriff, eine Seite oder als Direktzugriff angezeigt werden.

Es werden wiederholt Anfragen erstellt (evtl. mit einem automatischen Script), damit dieser Verweis in Reports und Logs für diese Webseiten angezeigt wird.

Beispiel Screenshot Referral Spam

Screenshot Referral Spam

Screenshot Referral Spam

Wie wird ein Referrer (Verweis) übergeben?

Ein Verweis (engl. Referrer) ist eine Bezeichnung, welche übergeben wird, wenn ein Browser von einer Website zu einer anderen Website wechselt (durch einen http header) um anzuzeigen, woher der Nutzer kommt.

Wo liegt das Ziel der Ersteller?

Das Ziel des Referrer Spam ist meistens die Generierung von Traffic. Der Mensch ist von Natur aus neugierig und will wissen, was auf seiner Website passiert. Beim Betrachten der Reportings wird er neugierig gemacht und auf die Verweis-URL gelockt. Manchmal um eine andere Website zu bewerben, manchmal um den User zu einem Online Store umzuleiten oder um Schadsoftware oder Trojaner anzubringen.

Diese Spammer treffen tausende von Google Analytics Konten. So kann man sich die Gesamtmenge an Zugriffen vorstellen, welche mit dieser Methode generiert wird.

Wie wird der Spam erzeugt?

Die Spammer benutzen üblicherweise 2 Methoden: Ghost Spam oder Crawler Spam.

Ghost Spam

z.B. hulfingtonpost.com

Bei den meisten Referrer Spams handelt es sich um Ghost Verweise in Google Analytics. Der Name „Ghost Spam“ beruht darauf, dass bei diesen Verweisen niemals eure Website betreten wird; es gibt keine Interaktion mit eurer Website.

Grafik Analytics Spam

Wie kommt Fake Traffic zustande?

Um dies zu ermöglichen, wird das Measurement Protocol ausgenutzt, welches es Entwicklern ermöglicht, Daten direkt zum Google Analytics Server zu schicken. Hierzu wird lediglich eine GA Tracking ID benötigt, der Rest geht fast von alleine. Meist werden die Tracking-IDs zufallsgeneriert. Anschließend wird ein automatisiertes Script benutzt, um Fake-Daten zu den Reports zu schicken.

Crawler Spam

z.B. semalt.com, buttons-for-website.com, best-seo-solution.com

Ein Web-Crawler ist ein Internet Bot, welcher Webseiten absurft, normalerweise um Web Indexierungen vorzunehmen. So wie Google Bots, welche Seiten und Indexe auslesen, so dass diese in der organischen Suche gefunden werden können; hierbei handelt es sich um sinnvolle Crawler.

Ein Crawler Spam surft ebenfalls über Websites aber zu einem anderen Zweck, wie schon oben beschrieben. Dieser Crawler ignoriert alle Regeln wie z.B. die robots.txt, welche vorgeschlagen werden, um bestimmte Bereiche nicht zu crawlen.

Was ist der Unterschied zwischen Ghost und Crawler Spam?

Crawler Spam stattet eurer Website tatsächlich einen Besuch ab. Ghost Spam benutzen einen Fake Hostnamen, da vorab nicht bekannt ist, wessen Website getroffen wird.

Wie kann ich Referrer Spam erkennen?

Verweis-Hostname checken

Um den Hostnamen zu finden, geht ihr im Google Analytics Konto in den Zielgruppebericht – Technologie – Anbieter.
Wählt den Hostnamen als Dimension aus.

Verweis-Hostname

Verweis-Hostname

Ghost Spam hat einen Hostnamen, der nicht zum eigenen Website-Bereich gehört, da dem Ersteller bei dieser Methode nicht bekannt ist, wen er trifft.

Auf dem Screenshot ist der tatsächliche eigene Hostname nicht zu sehen, da er noch nicht einmal unter den Top 8 gelistet ist.

Beispiel Screenshot Crawler Spam

Screenshot Crawler Spam

Screenshot Crawler Spam

Der Crawler Spam hingegen benutzt einen gültigen Hostnamen aus dem eigenen Website-Bereich.

Einige Beispiele für Spammer:

Neueste Spammer

Beispiele für Spammer

Wie stoppe ich den Google Analytics Spam?

Mit folgenden 2 Filtern stoppt ihr nahezu alle Spam Zugriffe in Google Analytics:

  1. Ein Hostname Filter, welcher allen Ghost Spam in Google Analytics filtert (Referral, organisch oder fake Direktzugriffe)
  2. Ein Kampagnenquellen Filter mit einem regulären Ausdruck, welcher allen bekannten Crawler Spam filtert.

Wie erstelle ich den Hostname-Filter?

Wichtig ist hierbei, eine Liste aller gültigen Hostnamen zu erstellen, damit kein legaler Traffic verloren geht.

Im Zweifelsfall gibt es ja noch die Rohdaten-Ansicht ohne jegliche Filterung.

Unser Tipp: Immer eine Rohdaten Ansicht ohne jegliche Filterung von jeder Property anlegen. Wenn ihr einmal Filter in der Datenansicht anwendet, sind die ausgeschlossenen Daten für immer verloren.

  1. Geht in Google Analytics auf Zielgruppe / Technologie / Anbieter und wählt hier den Tab „Hostname“
  2. Dort seht ihr eine Auflistung von Hosts wie in diesem Beispiel:

    Hostname

    Hostname

  3. Findet alle zu eurer Website gehörenden Hostnamen.
    In diesem Beispiel ist es lediglich der 7. Eintrag (es handelt sich um eine einzelne Blogseite).
    Ebenfalls kann es weitere Seiten geben, auf denen ebenfalls dieselbe Tracking ID integriert wurde, z.B. auf Drittanbieter-Seiten für den Warenkorb oder den Zahlungsprozess.
    Wenn man viele Besucher aus unterschiedlichen Ländern hat, welche einen Übersetzungsservice benutzen, dann erscheinen diese ebenfalls als valide Hostnamen.
    Dies sind z.B. translate.googleusercontent.com (Google Translate), webcache.googleusercontent.com (Google’s gecachte Website-Version), translateservice.com, und web.archive.org (das Internet-Archiv)
    Alle anderen Hostnamen, welche man nicht aus der eigenen Website-Umgebung kennt, sind nicht valide. Achtung auch bei bekannt vorkommenden Namen wie google.com oder amazon.com (Spammer benutzen diese Namen, um Nutzer zu täuschen), ebenfalls wenn der Hostname „not set“ ist.
  1. Entwerft mit Hilfe eines regulären Ausdruckes einen Hostnamen-Filter für alle zur Website gehörenden validen Hostnamen. Tipp: Hilfe zur Erstellung von regulären Ausdrücken: Geht in Google Analytics auf Verwalten / Filter

    Filter verwalten

    Filter verwalten

  2. Neuer FilterNeuer Filter
  3. Benennung: gültige Hostnamen
    Filtertyp: benutzerdefiniert
    Einschließen Hostname: regex (xxx)
    Tipp: unbedingt auf Testen klicken, um zu sehen, ob der reguläre Ausdruck funktioniert.

    Filter zu Datenansicht hinzufügen

    Filter zu Datenansicht hinzufügen

Wenn ihr sicher seid, dass alle validen Daten enthalten sind, klickt auf Speichern.

Bitte beachten: Wenn ein neuer Hostname im Website-Bereich integriert wird, dann muss unbedingt auch der Hostnamen Filter angepasst werden.

Bitte beachten: Dieser Filter gilt ab dem Tag der Einrichtung und schützt euch vor zukünftigem Ghost Spam. Um historische Daten gefiltert anzuschauen, müsst ihr mit diesem Filter ein Segment erstellen.

Für uns als Agentur ist es sehr schwierig bei Kunden mit sehr umfangreichen und für uns unübersichtlichen Webangeboten den entsprechenden Filter einzubauen. Dafür nehmen wir hilfsweise den Host-ausschließen-Filter:

Not.set|excite|webmaster|(google.ru)|hulfington|lumb|hide|pandashield|anonym|burble|pr.xy|speedsurfing|ymig|miradis|bing|fanyi |redir

Wie erstelle ich den Kampagnenquellen-Filter?

Kampagnenquellen Filter benutzen zur Filterung von Crawler Spam

Bitte beachten: Diese Filterliste muss regelmäßig aktualisiert werden.

Geht in Google Analytics auf Verwaltung / Filter

Klickt auf Neuen Filter erstellen

Name: Spam Filter

Filter Typ: benutzerdefiniert

Ausschließen Filterfeld: Kampagnenquelle

Fügt eine Regex mit den Spamnamen in das Filterfeld

Kampagnenquellen-Filter

Kampagnenquellen-Filter

In den letzten Monaten wurden viele Spamzugriffe mit Bezug auf Trump erzeugt:

  • Secret.É¢oogle.com You are invited! Enter only with this ticket URL. Copy it. Vote for Trump!
  • o-o-8-o-o.com search shell is much better than google!

Hier eine Liste der derzeitigen Spammer zum Erstellen von Filtern, diese schließt auch den Trump Spam aus (aktualisiert am 28.12.2016):

redd|moth|0481|100doll|error|7×9|abcd|cand|playto|best-seo|biglist|booh|button|chatan|cheap|check|dailyrank|detail|error|event|fix|forum69|free|girlsgo|guardlink|love|monet|semalt|seo.united|serienjun|valu|success|test|tvgrin|for.your.busi|zum.de

Tipp: Unbedingt auf Testen klicken, um zu sehen, ob der reguläre Ausdruck funktioniert.

Nützliche Bots und Spider ausschließen

Nicht alle Crawler sind schlecht, daher solltet ihr diese nicht grundsätzlich blockieren. Dies würde sich negativ auf die Sichtbarkeit und Auffindbarkeit Ihrer Website auswirken (z.B. crawlt Google regelmäßig alle Websites ab).

Aber durch diese Bots und Spider werden ebenfalls Zugriffe erzeugt, welche für Ihre Auswertungen nicht interessant sind.

Daher sollte man auch diese Zugriffe herausfiltern. Dies geht mit der neuen Google-Funktion ganz einfach.

Geht auf Verwalten, wählt die Datenansicht, Einstellungen, macht ein Häkchen bei „Zugriffe von allen bekannten Bots und Spiders ausschließen“. Fertig.

Bots und Spiders ausschließen

Bots und Spiders ausschließen

Fazit

Referrer Spam sollte möglichst herausgefiltert werden.

Hierzu sind 2 Filter hilfreich:

  1. Hostnamen Filter (um den Ghost Span zu entfernen)
  2. Kampagnenquellenfilter (um den Crawler Referrer Spam zu entfernen)

Um historische Daten ohne Spamzugriffe zu sehen, müsst ihr mit diesen Filtereinstellungen Segmente erstellen.

Weitere Tipps zur richtigen Einstellung eures Analytics Kontos findet ihr im Artikel „Google Analytics Konto richtig einrichten„.

 

Bildnachweis: Titelbild © Rawpixel / fotolia.com

Bernadette Hohns

Die neuesten Infos direkt im Posteingang

Die neuesten Infos direkt im Posteingang

Trage dich in unseren Newsletter ein und erhalte regelmäßig unsere neusten Blog-Artikel, Updates und Infos zu Veranstaltungen in deinen Posteingang.

Vielen Dank! Bitte bestätige jetzt die Email, die wir dir geschickt haben.

Share This