Heute gibt es alle Infos zum Thema Duplicate Content. Ich erkläre dir, was Duplicate Content ist, wie du ihn findest, ihn bereits im Vorfeld vermeidest und warum er deiner Webseite schadet. Die gute Nachricht ist: Ab jetzt wird alles gut, denn du bist auf meiner Seite und ich erkläre dir genau, was zu tun ist. Im letzten Beitrag haben wir gelernt was Content ist, warum er so wichtig ist und wie er wirklich gut wird.
Was ist Duplicate Content?
Fangen wir doch damit an, den Begriff ins Deutsche zu übersetzen: „doppelter Inhalt“. Nicht besonders spannend oder? Doppelte Inhalte, also Duplicate Content sind Texte, Bilder, Grafiken und Videos, die mehrfach und identisch auf mehreren Webseiten vorkommen. Dabei kann aber nicht nur ein bestimmtes Bild oder ein kopierter Text gemeint sein, sondern eventuell sogar die gesamte Webseite. Bei der Suchmaschinenoptimierung wird doppelter Content konsequent abgebaut und vermieden. Die Kurzschreibweise ist „DC“.
Welche Arten von doppelten Inhalten gibt es?
Wir unterteilen Duplicate Content in zwei Bereiche:
- intern
- extern
Interner doppelter Inhalt bedeutet, dass auf beispielsweise deiner Webseite die Inhalte mehrfach vorkommen. Extern bedeutet, dass es eine andere Webseite (Domain) gibt, die identische Inhalte hat. Übrigens das Gegenteil von Duplicate Content ist Unique Content, was einzigartiger Inhalt bedeutet.
Warum ist Duplicate Content ein Problem?
Suchmaschinen, insbesondere Google möchten den Nutzern ein einzigartiges Sucherlebnis bieten. Doppelte Inhalte sind nicht nur für den Nutzer nervig, zumindest langweilig, sondern auch problematisch für die Suchmaschine. Zum einen ist es schwierig, für die Suchmaschine zu beurteilen, welche Webseite wichtig ist und zum anderen kostet das Crawlen enorme Ressourcen, und doppelte Inhalte kann man somit als Ressourcen-Verschwendung ansehen. Wenn du mehr dazu lesen möchtest, dann empfehle ich dir meinen Beitrag Crawling und Indexierung.
Daher werten doppelte Inhalte den Wert deiner Webseite ab. Das schadet deinem Ranking, aber bedeutet nicht, dass du dadurch zwangsläufig keine Sichtbarkeit hast. Im schlimmsten Fall aller Fälle bekommst du von der Suchmaschine eine Strafe, in den meisten Fällen vergeudest du einfach nur Potenzial und hinderst deine Webseite daran, ihre volle Energie freizusetzen. Wenn deine Webseite neben den doppelten Inhalten reichliche Unique Content hat, dann kann sie im Normalfall ein bestimmtes Maß an Duplikaten vertragen und die Suchmaschine filtert ihn einfach raus. Aber du solltest diesen Content wo es geht vermeiden.
Wie kommt es zu doppelten Inhalten?
Es kann viele Gründe für Duplicate Content geben, hier einige Beispiele:
- Texte, Grafiken und Bilder werden kopiert und auf mehreren Webseiten veröffentlicht
- eine einzelne Seite ist unter mehreren URL-Adressen erreichbar (beispielsweise http:// und https:// oder Groß- und Kleinschreibung)
- Paginierungsseiten
- Unnötige Seiten des CMS- oder Shop-Systems
- falscher Einsatz mehrsprachiger Webseiten (hreflang)
Der Klassiker beim doppelten Content ist, dass Texte und Bilder auf anderen Webseiten kopiert werden, um sie dann auf der eigenen hochzuladen. Gerade bei Onlineshop-Betreibern sehe ich häufig, dass die Produktbeschreibungen der Hersteller 1:1 übernommen werden und sich die Betreiber dann wundern, dass die Produkte nicht in der Suche erscheinen oder ihr Ranking besonders schlecht ist.
Häufig hat es aber auch technische Gründe, dass die Webseite doppelten Content produziert. Das muss man sich in einer technischen Analyse genauer ansehen. Mehr über technisches SEO erfährst du in meinem anderen Beitrag.
Wie finde ich Duplicate Content?
Ich persönlich kontrolliere im ersten Schritt stichprobenartig per Hand und nutze im Anschluss SEO-Tools. Per Hand und ohne Tools kopierst du einfach eine Textpassage und gibst diese genau so in die Google-Suche ein. Google markiert bei den Suchtreffern alle Wörter die gleich sind mit fetter Schrift. Im besten Fall kommt auf Platz 1 deine Webseite und bei anderen Webseiten ist wenig bis gar nichts schwarz gefärbt. Du kannst übrigens auch Bilder in der Bildersuche googeln.
Tools zum Finden
Natürlich kann man auch Software nutzen. Diese ist mal mehr und mal weniger zuverlässig. Aber nutzen solltest du sie trotzdem. Die Tools zur Prüfung beziehen sich überwiegend auf internen Duplicate Content. Hier musst du darauf achten, was genau untersucht wird.
Google Search Console
In der Search Console werden dir unter Index -> Abdeckung deine Seiten angezeigt, welche als doppelte Seiten gekennzeichnet werden.
Unter dem Reiter „ausgeschlossene URLs“ wirst du nähere Informationen finden.
Weitere nützliche Tools sind folgende:
- Siteliner
- Copyscape
- articlechecker.com
- webconfs.com/similar-page-checker.php
- Sistrix
- Ryte
- plagium.com
- copygator.com
Ich werde zum Thema Duplicate Content Checker einen weiteren Beitrag machen, in dem ich die Tools teste.
Wie vermeidet man Duplicate Content?
Um die Frage pauschal zu beantworten: Durch eine saubere Technik und Inhalte, die man selber erstellt. Also klau oder kopiere auf keinen Fall Texte von anderen Webseiten! Natürlich hilft diese Aussage erstmal nicht wirklich weiter, deshalb gucken wir uns die Technik noch genauer an.
Crawling-Einstellung
Aktuell ist Google die wichtigste Suchmaschine, um die man sich als SEO kümmern muss. Daher sollte man auch die hauseigenen Tools von Google nutzen. Um Probleme bei der Indexierung zu vermeiden, stellt Google einem bereits wertvolle Tools zur Hand. So kann man die bevorzugte Variante der Webseite angeben (mit www. und ohne www.)
www. als Problem
Noch besser ist es, das Duplikat der Webseite, welche als URL-Variante mit www. und ohne vorkommt, von vornherein zu umgehen.
Wenn meine Webseite beispielsweise in folgenden zwei Schreibweisen existieren würde:
- „https://www.lmn1.de/“
- „https://www.lmn1.de/“
Dann wäre die komplette Seite ein doppelter Inhalt. Aber wenn du nun „https://www.lmn1.de/“ in der Adressleiste eingibst, dann wirst du feststellen, dass meine Webseite zwar unter dieser Adresse erreichbar ist, aber auf „https://www.lmn1.de/“ weiterleitet. Genau so sollte es auch sein. Entscheide dich für eine Schreibweise und leite die anderen Schreibweisen auf die einheitliche URL-Struktur um.
Wenn deine Webseite das nicht bereits von alleine macht, dann kannst du diese Domainregel in der htaccess-Datei mit einer ModRewrite-Umleitung einrichten.
Duplicate Content durch mehrere Webseiten
Es gibt immer noch einige Webseiten-Betreiber, die mehrere Webseiten mit dem gleichen Inhalt haben. Das ist in den meisten Fällen ein Fehler. Du wirst dadurch nicht öfter gefunden, sondern schwächst die Sichtbarkeit, indem du sie auf mehrere Webseiten verteilst. Entscheide dich für eine Domain und mache diese stark. Bei der Domain die du nicht weiter betreibst, leitest du alle URLs per 301er-Weiterleitung auf das entsprechende Pendant der Webseite, welche du weiterbetreiben möchtest, um. Dadurch verlierst du nicht die Sichtbarkeit.
Mehrere Domainendungen aufgrund unterschiedlicher Sprachen
In einigen Fällen werden mehrere Webseiten mit unterschiedlichen Endungen betrieben. Die Begründung ist dann oft, dass es unterschiedliche Sprachen gibt. Der technisch bessere Weg ist es, eine Endung zu wählen und mit dem hreflang-tag zu arbeiten. So kann man der Suchmaschine zeigen, in welchem Land bzw. in welcher Sprache die Seite indexiert werden soll.
Noindex verwenden
Wenn du URLs hast, welche sich nicht auflösen lassen, aber nicht indexiert werden sollen, dann kannst du das noindex-tag verwenden. Damit sagst du der Suchmaschine, dass diese nicht in den Suchergebnissen landen soll. Ein beliebter Fehler von Admins ist es, die Seite gleichzeitig auf nofollow zu stellen. Das ist aber von der Suchmaschine unerwünscht. Der beste Weg ist, den Besuch zu gestatten, aber einfach die Indexierung zu untersagen.
Canonical-Tag nutzen
Mit einem Canonical-Tag kann man bei vielen ähnlichen Seiten die wichtigste Hauptseite bestimmen, welche indexiert werden soll. Wenn du einen Onlineshop betreibst und viele Artikel hast, die sehr ähnlich sind, dann kannst du, hiermit arbeiten. Nehmen wir an, du verkaufst Socken und es gibt die gleiche Socke in unterschiedlichen Größen und Farben. Hierbei kannst du mit einem Vaterartikel und Kindartikeln bzw. Variationskombinationen arbeiten.
<link rel=“canonical“ href=“https://www.beispiel.de/vaterartikelurl/“ />
Das Canonical-Tag der Kindartikel, also der Größen- und Farbkombinationen zeigt hierbei auf den Vater, also den Hauptartikel. Das hat den Vorteil, dass du nicht hunderte Beschreibungen texten musst, sondern deine Energie auf SEO-Texte für den Hauptartikel fokussieren kannst. Die meisten Onlineshop-Systeme bieten diese Funktion von Hause aus.
Doppelte URL-Strukturen abschaffen
Neben den Klassikern, dass eine Webseite mit www. und ohne www. erreichbar ist oder unverschlüsselt mit http:// und https://, gibt es noch weitere URL-Probleme. Beispielsweise, wenn die Webseite doppelte URL-Pfade generiert oder wenn eine Kategorie dazwischen geschaltet wird: beispiel.de/beispielurl und beispiel.de/beispiele/beispielurl. Darüber hinaus findet man auch oft, dass die Startseite einer Webseite unter startseite.de und startseite.de/index.html erreichbar ist. Natürlich gibt es noch viel mehr URL-Fehltritte.
Druckdokumente als doppelter Inhalt
Oft bekommt die Druckversion einer Webseite eine eigene URL, besser ist es, die CSS-Datei der Seite so anzupassen, dass diese einwandfrei druckbar ist.
Zitate als Duplikat
Damit Zitate nicht als Duplicate Content gewertet werden, kannst du sie ganz einfach im HTML-Code mit dem Tag blockquote auszeichnen. Das ist völlig legitim.
Jobangebote und andere Infoseiten
Auch ein Jobangebot auf deiner Webseite, dass du genauso auf anderen Seiten veröffentlichst, ist streng genommen doppelt vorhanden.
Wer zuerst kommt, malt zuerst
Wenn Content interessant ist, aber mehrere Webseiten ihn bereitstellen, dann wird in der Regel die Seite, welche den Text zuerst veröffentlicht hat, auch am höchsten ranken. Daher kannst du, sofern du einen Text selbst geschrieben hast, die Indexierung im Vorfeld in der Search Console beantragen.
Strafen für Duplicate Content
Wenn Google den Eindruck hat, dass doppelte Inhalte produziert werden, um das Ranking zu manipulieren, dann werden diese Webseiten in den Rankings herabgestuft oder aus dem Index entfernt. In den meisten Fällen kommt das nicht vor, da hier schlichtweg kein Betrug vorliegt, aber ein Schaden ist immer da.
Video zum Thema
Fazit zu Duplicate Content
Wenn du eine kleine Webseite betreibst und deine Inhalte alle selber schreibst, dann dürfte doppelter Content kein großes Problem sein. Wenn du beruflich deine Webseite betreibst und diese mehrere tausend URLs hat, dann solltest du ganz genau prüfen, dass deine Webseite keine doppelten Inhalte produziert. Duplicate Content ist nicht immer ein Todesurteil in der Suchmaschine, aber in jedem Fall behindert es deine Webseite, vorne mitzuranken. Wenn du dich um die Duplikate nicht kümmerst, dann riskierst du nicht nur schlechte Suchergebnisse, sondern auch eine Strafe durch die Suchmaschine. Im Regelfall kümmert sich Google eigenständig darum, welche Webseite sehenswert ist und welche nicht. Wenn du die Qualität deiner Webseite hervorheben möchtest, dann solltest du Duplicate Content vermeiden.
0 Kommentare