Duplicate Content kann zu einer Verschlechterung des Rankings bei Google führen, weshalb du ihn unbedingt vermeiden solltest.
Was Duplicate Content ist, warum er als problematisch angesehen werden muss und wie du ihn verhinderst, erfährst du in diesem Artikel.
Was ist Duplicate Content?
Bei Duplicate Content handelt es sich um dieselben Inhalte, die auf verschiedenen Websites veröffentlicht werden. Duplicate Content steht also für „doppelte Inhalte“.
Man unterscheidet hier zwischen dem externen Duplicate Content und dem internen Duplicate Content. Interner Duplicate Content kommt beispielsweise bei Onlineshops häufig vor, wenn Kategorie- oder Produktbeschreibungen für identische Produkte 1:1 übernommen werden.
Externer Duplicate Content kann beispielsweise auftreten, wenn ein Webseitenbetreiber Texte von einer anderen Seite unrechtmäßig kopiert.
Warum sind doppelte Inhalte problematisch?
Google verwendet Crawler, um eine neue Seite zu indexieren. Gibt es jedoch mehrere Seiten mit identischen Inhalten, kann der Google Bot nicht unterscheiden, welche der Webseiten wichtiger ist.
Deshalb wird es hier früher oder später zu einem Rankingverlust kommen.
Achte daher unbedingt darauf, dass der Großteil der Inhalte auf deiner Website unique – also einzigartig – ist. Dies bedeutet, dass du auch für Unterseiten jeweils eigene Inhalte kreieren musst, damit diese nicht als doppelter Content gewertet werden.
Solltest du bewusst doppelte Inhalte nutzen wollen, was beispielsweise bei Onlineshops der Fall sein kann, dann kannst du den Duplicate Content entsprechend markieren, sodass Google diesen nicht mehr als Problem erachtet.
Welche Arten von Duplicate Content gibt es?
Man unterscheidet zwischen externem Duplicate Content und internem Duplicate Content.
Beispiele für externen doppelten Content:
- Inhalte deiner Website werden widerrechtlich genutzt
Dies bedeutet, dass jemand schlichtweg deine Inhalte klaut, um diese auf seiner eigenen Seite zu veröffentlichen. Abgesehen davon, dass Google dies nicht schätzt, handelt es sich hier auch um eine Urheberrechtsverletzung. - Deine Inhalte werden von anderen geteilt
Angenommen, du bietest einem befreundeten Blogger einen Gastbeitrag an. Dieser veröffentlicht ihn auf seiner Seite. Gleichzeitig veröffentlichst du denselben Inhalt auf deiner Seite. Auch dann handelt es sich um doppelten Content. - Website mit verschiedenen Länderversionen
Wenn du eine Website betreibst, die in verschiedenen Länderversionen zur Verfügung steht und wenn du auf den unterschiedlichen Länderseiten identische Inhalte anbietest, handelt es sich ebenfalls um externen Duplicate Content.
Beispiele für internen doppelten Content:
- Zusätzliche, mobile Website
Wenn du zusätzlich zur Desktop-Version eine mobile Variante deiner Website anbietest, werden die Inhalte kopiert und sind somit doppelt. - Du nutzt die Druckoptimierung
Falls du für deine Website die Druckoptimierung nutzt, handelt es sich um zwei Seiten mit identischen Inhalten. - Deine Website kann über mehrere URLs aufgerufen werden
Heute ist es üblich, dass Websites über mehrere URLs aufgerufen werden können, beispielsweise mit „www.“ oder ohne „www.“ Auch dies kann Google als Duplicate Content werten.
Was passiert, wenn Google Duplicate Content entdeckt?
Sofern du den doppelten Inhalt ordnungsgemäß deklarierst, passiert rein gar nichts.
Weist du den doppelten Content nicht aus, kann dies zu folgenden Problemen führen:
- Google kann die Inhalte nicht indexieren, sodass deine jeweilige Seite nicht gefunden wird.
- Deine Seite wird mit einem Rankingverlust bestraft.
- Google kann die Seite aus den Suchergebnissen entfernen.
Deine Aufgabe im Rahmen der SEO (Suchmaschinenoptimierung) sollte es daher sein, Duplicate Content zu ermitteln und für Google klar ersichtlich zu machen, welcher Inhalt das Original ist.
Im besten Fall vermeidest du doppelten Content natürlich komplett.
So enttarnst du Duplicate Content
Damit du die doppelten Inhalte aufdecken kannst, musst du zunächst wieder zwischen internem und externem Duplicate Content unterscheiden.
Wie du internen, doppelten Content findest
Um doppelte Inhalte auf der eigenen Domain zu finden, kannst du entsprechende Tools verwenden.
Eines der besten Tools, welches dir kostenlos zur Verfügung steht, ist Siteliner.com. Du gibst einfach die URL ein und schon wird deine Seite nach doppelten Inhalten gescannt. Dies kann – je nach Umfang der Seite – einige Minuten dauern.
Anschließend erhältst du eine exakte Aufstellung, aus der du sämtliche doppelten Inhalte entnehmen kannst.
Ein Nachteil des Tools besteht leider darin, dass beispielsweise auch Anreißer zu Blogbeiträgen oder Überschriften als Duplicate Content angezeigt werden. Diese kurzen Ausschnitte, die auf der Website vollkommen normal sind, stellen für Google natürlich kein Problem dar.
Wie du externen, doppelten Content findest
Um externen Duplicate Content zu finden, erweisen sich zwei Methoden als ideal.
- Verwende Copyscape
Copyscape ist ein kostenpflichtiges Tool, welches allerdings sehr gute Dienste leistet.
Du meldest dich an und kannst im Rahmen der „Premium Search“ beispielsweise den Text deiner Webseite eingeben. Copyscape überprüft dann, ob es im Netz weitere Domains mit diesen Inhalten gibt.
Werden entsprechende Inhalte gefunden, zeigt Copyscape sie dir an.
Gerade, wenn du die Vermutung hast, dass jemand von deiner Website klaut, erhältst du hierdurch Gewissheit. Außerdem eignet sich diese Form der Suche, wenn du selbst Texte für deine Website erstellst. Niemand erfindet das Rad neu und um zu verhindern, dass du selbst doppelten Content produzierst, kannst du vor der Veröffentlichung prüfen, ob es ähnliche Inhalte bereits auf einer anderen Seite gibt.
Jede Suche kostet nur wenige Cent, sodass das Budget, welches du vorher kaufen musst, recht lange reicht. - Doppelte Inhalte prüfen mit Google
Eine kostenlose Methode, deine Website auf Duplicate Content hin zu überprüfen, ist die Verwendung von Google.
Gib einfach eine kleine Textpassage in das Suchfeld ein und setze diese in Anführungszeichen. Google überprüft dann, inwieweit ähnlicher Content besteht.
Wird doppelter Content gefunden, lässt Google diesen bei der Anzeige der Suchergebnisse aus, sodass du ggf. neu laden und die entsprechenden Ergebnisse einbinden lassen musst.
Der Vorteil an dieser Methode besteht darin, dass du sie vollkommen kostenlos nutzen kannst. Der große Nachteil ergibt sich jedoch daraus, dass du, wenn du einen langen Text prüfen möchtest und hierfür jeweils nur kurze Passagen eingeben kannst, sehr lange Zeit für die Überprüfung benötigst.
Wie du Duplicate Content vermeidest
Natürlich gibt es einige Tricks, die dir dabei helfen, doppelte Inhalte von Anfang an zu vermeiden, sodass das Risiko einer Abstrafung durch Google gar nicht erst besteht.
Wichtig ist, dass du Google immer in irgendeiner Weise darüber „informierst“, dass für eine bestimmte Seite doppelte Inhalte vorliegen.
Ehe du die entsprechenden Möglichkeiten testest, stelle aber unbedingt sicher, dass die Seiten auch wirklich doppelten Content enthalten. Wie das geht, haben wir weiter oben bereits beschrieben.
Möglichkeit 1: Hinweis auf „noindex“ in den META-Daten hinterlegen
Hierbei handelt es sich um die mit Abstand einfachste Methode.
Angenommen, du schreibst einen Blogbeitrag A. Ein paar Wochen später verfasst du Blogbeitrag B und C, die ähnliche Inhalte aufweisen, sodass ggf. die Gefahr des doppelten Contents besteht.
Dann kannst du beim Erstellen der Inhalte für Blogbeitrag B und C direkt in den META Daten einen „noindex“-Vermerk eintragen.
Dies bedeutet, dass Blogbeitrag A am relevantesten ist und die Blogbeiträge B und C von Google automatisch nicht beachtet werden.
Idealerweise vermeidest du natürlich, derart ähnliche Inhalte zu produzieren.
Möglichkeit 2: Eine Canonical URL verwenden
Canonical Tags bieten dir ebenfalls die Möglichkeit, Google zu zeigen, welche Inhalte wichtig sind und welche nicht.
Dazu fügst du im Quellcode der Kopie der relevanten Seite einen Canonical ein, und zwar im <head>-Element. Dieses kann folgendermaßen aussehen:
<link rel=“canonical“ href=https://beispielseitexyz.de/kategorie1/produkt2/>“
Beachte hierbei, dass jede Seite nur einen Canonical enthalten kann, um von Google richtig erkannt zu werden. Setzt du demzufolge zwei oder mehr Canonicals auf eine Seite, registriert Google lediglich den ersten.
Möglichkeit 3: 301 Redirect in der .htaccess
Wenn du eine alte Domain auf eine neue umleiten möchtest, weil die bisherige Domain nicht mehr existiert, erweist es sich grundsätzlich als kluge Entscheidung, einen 301 Redirect einzurichten. Hierbei handelt es sich um die dauerhafte Weiterleitung.
Der Vorteil des 301 Redirect besteht darin, dass die Linkpower des bisherigen Links erhalten bleibt.
Damit dies gelingt, trägst du den 301 Redirect direkt in der .htaccess-Datei ein.
Dies sieht folgendermaßen aus:
RedirectPermanent / https://beispielseitexyz-neu.de
Möglichkeit 4: die Domain umleiten
Wenn deine Website über mehrere URLs aufgerufen werden kann, also beispielsweise mit „www.“ oder ohne „www.“ – dann wertet Google dies ebenfalls als Duplicate Content.
Um dieses Problem zu vermeiden, kannst du die Domain zielgerichtet umleiten lassen. Dafür richtest du ebenfalls in der .htaccess-Datei eine Umleitung ein, die folgendermaßen aussehen kann:
RewriteEnginge on
RewriteCond %{http_HOST} ^www.beispielseitexyz.de
RewriteRule ^(.*)$ http://beispielseitexyz.de$1 [R=301,L]
Zusammenfassung zum Duplicate Content
Duplizierter Content erweist sich für Google nicht automatisch als Problem, solange du diesen explizit als Duplicate Content ausweist. Hierfür stehen verschiedene Möglichkeiten zur Verfügung.
Findet Google jedoch doppelte Inhalte, die nicht als solche gekennzeichnet sind, kann dies zu einem Rankingverlust, zu einer fehlenden Indexierung oder sogar zum Ausschluss der jeweiligen Seite aus den Suchergebnissen führen.
Ehe du doppelten Content kennzeichnest, solltest du überprüfen, ob es sich wirklich um diesen handelt. Hierzu kannst du beispielsweise die Tools Copyscape und Siteliner nutzen oder in der Google Suche nach doppelten Inhalten suchen.
Im besten Fall vermeidest du jedoch Duplicate Content und sparst dir hierdurch jede Menge Arbeit und ggf. Ärger.