Jedem, der im Internet unterwegs ist, ist es bereits passiert, sicher auch schon euch. Ihr klickt auf einen Link oder gebt eine URL in die Adressleiste ein und anstatt auf den gewünschten Inhalt zu gelangen, wird euch die Fehlermeldung „404 – Die Seite konnte nicht gefunden werden“ oder „Error 404 – Page not found“ angezeigt. In dem kommenden Artikel erfahrt ihr, wie es zu einer solchen Meldung kommt, wie ihr herausfinden könnt, welche Seiten den Status 404 ausspielen und wie ihr mit solchen Fehlerseiten umgehen solltet.
Inhaltsverzeichnis
- Was ist eine 404-Fehlerseite?
- Wann wird eine 404-Fehlerseite ausgespielt?
- Welche Bedeutung haben 404-Fehlerseiten für SEO?
- Wie sollte eine 404-Seite idealerweise aufgebaut sein?
- Wie konfiguriert man eine 404-Fehlerseite richtig?
- Warum ist es für SEO wichtig, dass die 404-Fehlerseite richtig konfiguriert ist?
- Wie kann man herausfinden, ob es 404-Seiten auf einer Website gibt?
- Was macht man mit URLs, die einen 404 Statuscode ausspielen?
- Statuscode 404 vs. 410
- Fazit
Was ist eine 404-Fehlerseite?
Eine 404-Fehlerseite wird ausgespielt, wenn eine Unterseite einer Website nicht gefunden werden kann bzw. nicht verfügbar ist.
Bei der Bezeichnung 404 handelt es sich um einen http-Statuscode. http-Statuscodes sind Antworten auf http-Anfragen, die von einem Server geliefert werden. Vereinfacht gesagt wird bei jedem Aufruf einer Website eine http-Anfrage an einen Server geschickt, daraufhin gibt der Server eine Antwort, wie z.B. 200, 302, 301 sowie auch 404. Mit dieser Antwort teilt der Server dem Client, wie bspw. dem Webbrowser mit, ob die Anfrage erfolgreich war oder nicht.
Diese Statuscodes wurden in den 1990er Jahre definiert und sind in folgende fünf Klassen eingeteilt:
- 100-199 sind informative Antworten
- 200-299 sind erfolgreiche Antworten
- 300-399 sind Umleitungen
- 400-499 sind Client-Fehler
- 500-599 sind Server-Fehler
Wenn ihr also eine Seite aufruft, die den Statuscode 200 hat, bedeutet das, dass die Seite ohne Probleme verfügbar ist. Hat die aufgerufene Seite dagegen einen Statuscode 404, dann ist sie nicht oder nicht mehr verfügbar.
Häufig werden 404-Fehlerseiten standardisiert bzw. automatisiert vom CMS ausgespielt, wenn eine Seite nicht mehr verfügbar ist. Allerdings sind diese standardisierten 404-Fehlerseiten oft nicht userfreundlich, da er nicht erfährt, warum eine Seite nicht verfügbar ist und auch keine Möglichkeit hat, zur Website zurückzugelangen.
Aus diesem Grund solltet ihr eine 404-Fehlerseite individuell einrichten und gestalten. Dies hat den Vorteil, dass ihr dem Nutzer Inhalte liefern könnt, die ihm potenziell weiterhelfen, wie z.B. ein Suchfeld, einen erkennbaren Link zur Startseite und ähnliches.
Wann wird eine 404-Fehlerseite ausgespielt?
Wenn ihr im Internet eine 404-Fehlerseite angezeigt bekommt, dann bedeutet das, dass der angeforderte Inhalt bzw. die URL nicht gefunden werden konnte. Dies ist meist dann der Fall, wenn euch ein veralteter Link auf eine Unterseite führt, die nicht mehr existiert, oder ihr euch bei der Eingabe der URL in der Browserleiste vertippt habt. Häufig werden in diesen Fällen Fehlermeldungen wie „Error“, „404 – Page not found“ oder „404 – Seite nicht gefunden“ angezeigt.
Gründe, die dazu führen, dass Nutzer auf einer 404-Seite landen:
- Die Unterseite wurde gelöscht und ist daher nicht mehr verfügbar.
- Der Inhalt der Seite wurde auf eine anderen URL umgezogen und es wurde keine Weiterleitung eingerichtet (zum Beispiel im Zuge eines Relaunchs oder eines Domain-Umzugs).
- URLs wurden umstrukturiert oder geändert. Dies kann beispielsweise dann der Fall sein, wenn URLs oder einzelne Verzeichnisse umbenannt oder gelöscht wurden.
- Die interne Verlinkung einer Website wurde nicht angepasst, nachdem eine URL gelöscht/umbenannt wurde.
- In Suchmaschinen sind noch gelöschte oder umbenannte URLs indexiert, die nicht weiterleiten.
Für Website-Betreiber ist es sehr ungünstig, wenn Nutzer nicht auf der gewünschten URL landen. Dies sorgt für Frust und verringert das Vertrauen in den Anbieter. Trotzdem kommt es häufig vor, dass 404-Fehlerseiten längere Zeit nicht bemerkt werden. Um dies zu vermeiden, ist es ratsam, die interne Verlinkung der eigenen Website regelmäßig zu überprüfen und auch zu kontrollieren, ob Links von anderen Websites auf Fehler-Seiten verweisen.
Welche Bedeutung haben 404-Fehlerseiten für SEO?
Grundsätzlich haben 404-Fehlerseiten keinen direkten negativen Einfluss auf das Ranking einer Website. Wenn ihr also aus einem berechtigten Grund viele Unterseiten auf eurer Website löscht und diese in Folge einen Statuscode 404 ausspielen, ist das nicht unbedingt schädlich.
Anders sieht das aus, wenn der Googlebot beim Abcrawlen eurer Website und der damit verbundenen Prüfung der Links zu häufig auf Fehlerseiten stößt, ihr also im Kontext eurer Website viele nicht existierende URLs verlinkt habt. Dies ist für Google ein Hinweis darauf, dass die Website schlecht gepflegt ist. Im schlimmsten Fall kann dies sogar dazu führen, dass eure Unterseiten nicht mehr richtig indexiert werden. Wenn es auf eurer Website eine hohe Anzahl fehlerhafter URLs gibt, erhöht das zudem den Crawling-Aufwand, was wiederum dazu führen kann, dass weniger Seiten in den Index der Suchmaschine aufgenommen werden. Zusätzlich birgt dies die Gefahr, dass der Crawler wichtige Inhalte nicht mehr erreicht, da er sich zu lange mit den fehlerhaften URLs aufhält.
Aber auch die Nutzersignale spielen hier eine wichtige Rolle. Denn Suchmaschinen wie Google ermitteln unter anderem die Return-to-SERP-Rate. Die Return-to-SERP-Rate sagt aus, wie oft ein Nutzer von einer angeklickten Seite zurück auf die Suchergebnisseite geht und gibt Google einen Hinweis auf die Zufriedenheit mit einem Suchergebnis. Wenn die Return-to-SERP-Rate also durch eine schlechte oder nicht vorhandene Fehlermeldung/-seite ansteigt, liegt die Annahme nahe, dass die Inhalte nicht relevant und die Nutzer mit den gefundenen Inhalten nicht zufrieden waren. Das kann sich ebenfalls negativ auf das Ranking und somit die Auffindbarkeit eurer Website auswirken.
Wie sollte eine 404-Seite idealerweise aufgebaut sein?
Bei vielen Websites wird eine 404-Fehlerseite standardisiert ausgespielt. Dies ist abhängig von dem jeweiligen CMS, das verwendet wird. Grundsätzlich ist es besser eine standardisierte Fehlerseite vom CMS auszuspielen als keine bzw. die Standardfehlerseite des Providers. Eine individuell gestaltete 404-Fehlerseite dient dazu, Besucher zum Bleiben auf eurer Website zu bewegen. Um das zu erreichen, solltet ihr einige Elemente auf eurer Fehlerseite zur Verfügung stellen:
- Der Besucher sollte die Möglichkeit haben auf die Startseite, z.B. über das Logo, oder auf eine andere Unterseite der Website zu gelangen.
- Der Besucher sollte die Möglichkeit haben, mit eurer Seite zu interagieren. Dies könnt ihr z.B. mittels einer Suchfunktion erreichen. Dies ermöglicht dem Besucher, den gesuchten Inhalt oder einen ähnlichen Inhalt doch noch zu finden.
- Das Layout sollte, dem eurer Website entsprechen, damit der Besucher nicht das Gefühl hat auf einer anderen Webpräsenz gelandet zu sein.
Ihr könnt auch weitere Elemente auf eurer individuell gestalteten Fehlerseite nutzen, wie z.B. einen Hinweis auf den Newsletter oder einen FAQ-Bereich. Aber achtet darauf, nicht zu viele Informationen auf die Fehlerseite zu packen, damit die Botschaft der Seite nicht verloren geht. Ansonsten könnt ihr eurer Kreativität freien Lauf lassen.
Wie konfiguriert man eine 404-Fehlerseite richtig?
Mit einer induviduell gestalteten Fehlerseite, holt ihr eure Nutzer schon mal besser ab als mit einer standardisierten. Wenn die Seite allerdings falsch konfiguriert ist, kann das aus SEO-Sicht mehr Schaden anrichten, als das sie euch nutzt. Deshalb gibt es auch aus technischer Sicht, einige Punkte zu beachten:
- Die fehlerhfte URL muss weiterhin aufrufbar sein.
- Die URL sollte nicht auf eine Fehlerseite mit eigener URL weitergeleitet werden, wie z.B. domain.de/404.html. Die URL darf sich nicht verändern. Dies ist nicht immer automatisch der Fall, weshalb es wichtig ist, darauf zu achten.
- Die Seite sollte den Statuscode 404 ausspielen. Es reicht nicht aus, dass auf der Seite steht, dass es eine 404-Seite ist.
- Die Seite darf nicht auf „noindex“ stehen. Durch den Statuscode 404 ist die Seite bereits aus der Indexierung ausgeschlossen.
Um zu überprüfen, ob der Statuscode richtig ausgespielt und somit richtig eingerichtet ist, gibt es einige Tools, wie z.B. das Browserplugin von Chrome „Redirect Path“, mit denen ihr problemlos überprüfen könnt, welcher Statuscode aktuell ausgespielt wird. Wollt ihr den Statuscode von mehreren Seiten gleichzeitig überprüfen, bietet sich hier das Tool https://techseo.de/statuscodes/ an.
Warum ist es für SEO wichtig, dass die 404-Fehlerseite richtig konfiguriert ist?
Wie bereits erwähnt, haben 404-Fehlerseiten oder der Statuscode 404 nicht direkt einen negativen Einfluss auf eure Rankings. Eine sehr wichtige Rolle spielen auch so genannte Soft-404-Fehler. Von einem Soft-404-Fehler spricht man, wenn eine Seite aufgerufen wird, die nicht mehr existiert, aber trotzdem den Statuscode 200 (OK) oder 302 (Found) sendet. Dies kann sich entsprechend negativ auf das Ranking auswirken.
Aber auch Seiten mit sehr wenig Inhalt können von Google als Soft 404 gewertet werden. Grund ist, dass Suchmaschinen dies als ein Betrug über den Inhalt der Seite einordnen. Zudem können Soft-404-Fehler dazu führen, dass URLs doppelt indexiert werden. Übrigens auch Seiten, die nicht mehr existieren und per 301 Redirect auf die Startseite weitergeleitet werden, können als Soft-404-Fehler gewertet werden. Aus diesem Grund sollten Seiten, die entfernt werden, immer auf Seiten weiterleiten, deren Inhalt vergleichbar sind oder eine Fehlerseite angezeigt werden.
Dass eine Website keine Fehlerseite ausspielt, ist eigentlich kaum zu verhindern. Denn schon allein, wenn die URL fehlerhaft in die Adressleiste eingegeben wird, wird eine solche ausgespielt. Deswegen ist es wichtig, immer eine individuelle Fehlerseite zu erstellen.
Wie kann man herausfinden, ob es 404-Seiten auf einer Website gibt?
Es gibt einige Tools, mit denen ihr prüfen könnt, welche URLs auf eurer Website nicht mehr erreichbar sind und wo ein Statuscode 404 ausgespielt wird. Unter anderen könnt ihr dies in der Google Search Console, in Ahrefs oder mit einem Crawling-Tool wie dem Screaming Frog (für 500 URLs kostenlos) prüfen.
Crawling-Tools wie der Screaming Frog
Mit dem Screaming Frog könnt ihr eure interne Linkstruktur auf 404-Seiten überprüfen. Dazu crawlt ihr eure Website ab und das Tool sammelt die Informationen zur Analyse. Um die Seite nach 404-Fehlerseiten zu untersuchen, müsst ihr als erstes in der Konfiguration einstellen, welche Dateien er crawlen soll, wie z.B. nur die HTML-Seiten oder auch Bilder, JavaScript oder CSS. Zu der Konfiguration gelangt ihr über den Menü-Punkt „Configuration > Spider“.
Nachdem ihr die Seite gecrawlt habt, könnt ihr überprüfen, ob URLs mit dem Statuscode 404 auf eurer Website zu finden sind. Hierzu gibt es zwei Wege. Entweder ladet ihr euch die entsprechenden URLs als Excel-Datei herunter. Dies könnt ihr über den Menüpunkt „Bulk Report > Response Codes > Client Error (4xx) Inlinks“ machen.
Oder ihr überprüft die fehlerhaften URLs direkt im Tool. Diese könnt ihr zum einen über den Tap „Response Codes“ und die Filterfunktion nach „Client Error (4xx)“ aufrufen. Zum anderen könnt ihr die reine Anzahl auch über die Seitenleiste ablesen.
Wenn ihr die Liste durchgeht, wird euch auffallen, dass hier ebenfalls URLs angezeigt werden, die nicht zu eurer Website gehören. Dies ist keinesfalls ein Fehler von Screaming Frog, sondern bedeutet, dass von eurer Website auf eine externe, nicht mehr existierende Seite verwiesen wird. Um herauszufinden, von welcher Seite auf die entsprechende Fehlerseite verwiesen wird, klickt ihr auf die URL. Unter dem Fenster mit den URLs befindet sich ein weiteres Fenster.
Wenn ihr die Registerkarte „Inlinks“ öffnet, findet ihr die Auflistung der URLs, die auf die Seite verweisen. Dabei solltet ihr allerdings beachten, dass Fehlerseiten, die fasch konfiguriert wurden, nicht angezeigt werden. Aus diesem Grund solltet ihr vorher prüfen, ob der Statuscode der Seite richtig ist. Dies könnt ihr mit dem bereits erwähnten Browserplugin von Chrome „Redirect Path“ oder https://techseo.de/statuscodes/ machen.
Google Search Console
Mit dem kostenlosen Tool Google Search Console könnt ihr nicht nur die Performance eurer Website in der Google Suche messen, sondern auch Fehler identifizieren. Um zu überprüfen, ob 404-Fehlerseiten eurer Website im Google-Index sind, geht ihr über den Menüpunkt „Abdeckung“ auf der Seitenleiste.
Dort seht ihr, wie viele Seiten bei Google indexiert sind und wieso bestimmte Seiten ausgeschlossen werden. Hier werden euch auch URLs angezeigt, die mit dem Statuscode 404 ausgezeichnet sind.
Wie oben schon beschrieben, ist es nicht grundsätzlich schlimm, wenn hier 404-Seiten erscheinen. Wichtig ist aber, dass ihr nachvollziehen könnt, warum sie hier auftauchen. Beobachtet ihr einen plötzlichen Anstieg ihrer Anzahl, ohne dass ihr entsprechende Änderungen an eurer Website vorgenommen habt (z.B. Relaunch), solltet ihr euch das auf jeden Fall näher ansehen.
Link-Tools wie ahrefs
Zusätzlich bieten Link-Analyse-Tools wie z.B. ahrefs häufig einen Report an, in dem ihr euch fehlerhafte Backlinks anzeigen lassen könnt. Bei fehlerhaften Backlinks handelt es sich in den meisten Fällen um Backlinks, die auf eine 404-Fehlerseite verweisen, sogenannte Broken Backlinks. Aber es kann sich dabei auch um Seiten mit anderen Statuscodes, wie 410, 501, etc. handeln.
Zum Broken-Backlink-Report in ahrefs gelangt ihr über das Submenü auf der linken Bildschirmseite.
Stellt ihr fest, dass Links von wichtigen Websites auf eine 404-Fehlerseite verweisen, dann solltet ihr den Webmaster der Website kontaktieren und ihn bitten, das Link-Ziel zu ändern oder die betroffenen URLs zumindest gezielt weiterleiten.
Zudem könnt ihr überprüfen, ob es ausgehende fehlerhafte Links gibt. Also Verweise bzw. Verlinkungen von eurer Website auf eine 404-Fehlerseite einer anderen Domain. Zu dem Report gelangt ihr wiederum über das Submenü unter „Broken Links“. Solltet ihr hier entsprechende Links finden, die auf eine 404-Fehlerseite verweisen, dann solltet ihr entweder ein neues Link-Ziel setzen oder falls ihr keinen neuen Link habt, der passend ist, die Verlinkung entfernen.
Was macht man mit URLs, die einen 404 Statuscode ausspielen?
Da sich zu viele intern verlinkte 404-Fehlerseiten negativ auf das Crawling und die Indexierung einer Website auswirken können, solltet ihr diese immer Blick haben und beheben, falls ihr welche entdeckt. Und mit extern verlinkten 404-Seiten verspielt ihr einfach Potenzial.
Nachdem ihr eure Website auf 404-Fehlerseiten geprüft habt, muss überlegt werden, wie ihr diese handhaben solltet. Es reicht in der Regel nicht aus, die Seiten grundsätzlich weiterzuleiten, denn hier müsst ihr ebenfalls ein paar Punkte beachten. Deshalb solltet ihr als erstes überprüfen, ob
- die betreffende Fehlerseite intern verlink ist.
- die betreffende Fehlerseite organischen Traffic generiert.
- die betreffende Fehlerseite extern verlinkt ist.
Sind 404-Fehlerseiten innerhalb eurer Website verlinkt, dann reicht es nicht aus, dass diese weitergeleitet werden. Denn das würde unnötiges Crawl-Budget kosten und beeinträchtigt zusätzlich die Ladezeit der Seite. Aus diesem Grund solltet ihr darauf achten, dass ihr intern immer die richtigen Ziel-URLs verlinkt. Habt ihr also Fehlerseiten intern verlinkt oder sind intern Weiterleitungen verlinkt, dann solltet ihr hier die richtige Ziel-URL hinterlegen. Sollte keine passende Seite existieren, dann entfernt die Verlinkung.
Generieren die betreffenden Fehlerseiten keinen organischen Traffic, braucht ihr zunächst nichts machen. Achtet aber dabei darauf, dass sich die 404-Fehlerseiten nicht häufen bzw., dass die Anzahl der Fehlerseiten nicht unnötig steigt und überprüft regelmäßig, ob die 404-Fehlerseiten weiterhin keinen organischen Traffic generieren.
Wenn ihr 404-Fehlerseiten habt, auf die externe Links verweisen, dann solltet ihr diese weiterleiten, um den Linkjuice nicht zu verlieren. Dabei solltet ihr beachten, dass die Fehlerseiten nicht einfach auf irgendeine Seite wie z.B. auf die Startseite weiterleiten. Denn auch dies kann sich negativ auf das Ranking auswirken. Denn wenn eine Seite auf eine unpassende inhaltliche Seite verweist bzw. weitergeleitet wird, anstatt einen 404-Status auszugeben, wird das von Suchmaschinen als „Soft 404“ gewertet und bestehende Rankings gehen verloren.
Aus diesem Grund ist es wichtig darauf zu achten, dass Weiterleitungen nur dann eingerichtet werden, wenn es eine entsprechend passende inhaltliche Seite gibt. Wenn es für die Seite ein Äquivalent gibt, dann sollte diese mit dem Statuscode 301 auf die Seite weiterleiten. Wichtig ist an dieser Stelle, dass hier der Redirect 301 verwendet wird, da so der Linkjuice weitervererbt wird und ihr Google sagt, dass diese Weiterleitung dauerhaft bleibt.
Grundsätzlich ist es ratsam Fehlerseiten weiterzuleiten, aber in manchen Fällen ist es aus SEO-Sicht besser, eine Fehlerseite auszuspielen. Dies betrifft Seiten, deren Inhalt dauerhaft entfernt wurde und für die es keine äquivalente Seite gibt, auf die ein Redirect verweisen bzw. weiterleiten kann. In diesen Fällen empfiehlt es sich, dass die Seite einen Statuscode 404 oder 410 ausspielt und eine Fehlerseite angezeigt wird.
Statuscode 404 vs. 410
Wenn eine Seite nicht mehr existiert, dann sollte die fehlende Seite bzw. Ressource mit dem richtigen Fehlercode ausgezeichnet werden, um Nutzer und Suchmaschinen zu verstehen zu geben, dass es die Seite nicht mehr gibt. Dies ist vor allem dann der Fall, wenn eine Weiterleitung, aus den bereits genannten Gründen, nicht möglich ist.
An dieser Stelle stellt ihr euch sicher die Frage, ob ihr hierzu den Statuscode 404 oder 410 verwendet. Grundsätzlich ist das tatsächlich egal. Denn für Suchmaschinen spielt es kaum eine Rolle, ob eine Seite, die nicht mehr existiert, mit dem Statuscode 404 oder 410 ausgeliefert wird. Allerdings gibt es einen minimalen Unterschied zwischen den beiden Statuscodes.
Der Statuscode 404 sagt aus, dass der Inhalt nicht gefunden werden kann. Dies kann z.B. auch der Fall sein, wenn der Inhalt nur vorübergehend nicht zu erreichen ist. Anders sieht es bei dem Statuscode 410 aus. Dieser Status sagt aus, dass der Inhalt dauerhaft entfernt wurde. Für Google bedeutet dies lediglich, dass die Seite schneller aus dem Index entfernt wird als bei einer Seite mit dem Statuscode 404.
Dies ist deshalb der Fall, weil Google tendenziell Seiten mit einem Statuscode 404 häufiger crawlt, da die Statusmeldung 404, wie bereits erläutert auch, z.B. bei einem Serverfehler ausgespielt wird. Hier überprüft Google entsprechend häufiger, ob die Seite wirklich nicht mehr existiert, weshalb es länger dauert, bis sie aus dem Index entfernt wird, als bei einer Seite mit dem Statuscode 410.
Fazit
Der Umgang mit 404-Fehlern gehört zu den Themen, mit denen sich Websitebetreiber beschäftigen müssen. Hierbei geht es vor allem darum, dass die Enttäuschung der Nutzer durch nicht auffindbare Inhalte so gering wie möglich gehalten wird. Es ist deshalb wichtig, entsprechende Alternativen anzubieten. Hierzu können kreative und humorvolle Fehlerseiten erstellt werden, die dem Nutzer dann auch Spaß machen und seinen Frust vergessen lassen oder zumindest minimieren können, weil er nicht den gewünschten Inhalt bekommen hat. Aber achtet darauf, dass ihr dem Nutzer die Möglichkeit gebt, mit der Seite zu interagieren, damit der Nutzer am Ende doch noch auf die gewünschten Inhalte zugreifen kann.
Wichtig ist auch, dass die Fehlerseite den richtigen Statuscode zurückgibt, damit dadurch nicht unnötige Abstrafungen durch Google und Co. riskiert werden.