Duplicate Content in Blogs und Webshops
Wie ich kürzlich schrieb, sind Blogs seit geraumer Zeit wieder voll im Trend. Gefühlt jede zweite Website hat irgendwo einen Blog oder etwas, das mal ein Blog werden sollte. Und auch bei den Online Shops kommen immer noch neue nach. Gerade diese beiden Formen, also Blogs und Webshops, haben jedoch oft ein Problem mit Duplicate Content.
Duplikate Content bedeutet doppelter Inhalt. Er entsteht, wenn derselbe oder sehr ähnliche Inhalte auf unterschiedlichen URLs abrufbar sind. Die meisten User stört das erstmal nicht, da Ihnen egal ist, ob ein Inhalt mehrfach abrufbar ist. Google hingegen hat damit ein größeres Problem und deswegen gilt Duplicate Content aus SEO-Sicht immer als schlecht.
Wie Duplicate Content in Blogs und Shops entsteht
Der Klassiker des Duplicate Contents entsteht durch inkonsistente Websites. Unterschiedliche URLs führen zu denselben Inhalten, weil es einmal eine Version mit und ohne www gibt. Das ist schlecht, aber eben keine besondere Eigenschaft von Blogs oder Webshops. Weitere vier häufige Ursachen von Duplicate Content können sein: 1. Sortierung, 2. Paginierung, 3. Kategorisierung und 4. verschiedene Parameter. Hier liegen aber gerade die Schwächen von Blogs und Online Shops. Denn sowohl Blogs, als auch Shops erzeugen ein Seitenvolumen, das geradezu danach schreit, sortiert, paginiert und kategorisiert zu werden. Nehmen wir nur einmal den bold ventures Blog. Der beinhaltet 232 veröffentlichte Artikel. Diese sind nicht alle auf derselben Seite abrufbar. Das wäre ja nun wirklich sehr unpraktisch, man müsste sehr weit runter scrollen. Stattdessen sind die Übersichtsseiten paginiert. Das heißt, man klickt sich von eins bis unendlich durch die Übersicht. Solche paginierten Seiten haben das Problem, dass sie alle gleich sind. Hier kann Duplicate Content entstehen, der aber wohl eher als ähnlicher Content zu bezeichnen ist, da es sich ja nicht um 100%ige Dubletten handelt. Problematischer wird es dann bei den Kategorieseiten und noch problematischer bei den Übersichtsseiten zu den einzelnen Schlagworten bzw. Tags. Da ein Artikel häufig mehreren Tags oder Kategorien zugeordnet wird, ist er auch auf mehreren Tag oder Kategorieseiten zu finden. Im Ergebnis kann das Duplicate Content bedeuten.
In Online Shops kann das Ganze sogar faktisch identisch werden, wenn es unterschiedliche URLs für denselben Inhalt gibt, der nur anders sortiert ist. Die Sortierung nach Preis auf- oder absteigend ist da nur ein Beispiel von vielen.
Auch die Kommentarfelder, die wiederum in Blogs quasi grundlegend sind, bieten Duplicate Content Verbreitungsmöglichkeiten. Paginierte Kommentare sind ein häufiger Grund für Duplicate Content. Auf eine Seite passen beispielsweise vier Kommentare. Werden aber 16 abgegeben, haben wir also vier Seiten mit jeweils vier Kommentaren. Darüber steht aber immer derselbe Artikel. Dass die Kommentare einen anderen Inhalt haben ist Google weitestgehend egal, denn die Änderung des Inhalts ist aufgrund des textlichen Übergewichts des Artikels nur sehr gering, zumal andere wichtige Indikatoren, wie Titel und Überschriften identisch sind.
Was kann man dagegen tun?
Canonical Tag
Ganz generell ist bei Duplicate-Content-Problemen zunächst immer auf das Canonical Tag zu verweisen. Das Problem ist nur, dass dies in unseren Fällen nicht immer zielführend oder befriedigend ist. Sicher, der doppelte Content lässt sich so zumindest teilweise beseitigen, aber die Methode stößt schnell an ihre Grenzen. So sind zum Beispiel manche der Übersichtsseiten eines Blogs durchaus wichtig und sollten auch im Google Index auftauchen. Ich nenne nur mal die Kategorien. Ein weiteres Problem ist der Verlust an Linkpower. Eine Übersichtsseite, die mit dem Canonical Tag auf eine Haupt-URL verweist, leitet auch den Großteil der Linkpower dahin weiter. Die Seiten die aber eigentlich verlinkt wurden kommen zu kurz. Das ist natürlich bei Überblicksseiten suboptimal.
No-Index und Follow
Eine Möglichkeit doppelten Content zu vermeiden besteht auch darin zu verhindern, dass die Suchmaschinen die betreffenden Seiten indexieren. Ermöglicht wird das, indem man diese Seiten mit dem Meta Element Robots auf No-Index und Follow setzt. Das Ergebnis ist, dass diese Seiten, die doppelte Inhalte enthalten, nicht indexiert werden, aber dennoch ihre Linkpower weitergeben. Allerdings ist auch das nicht optimal, wenn man möchte, dass die Übersichtsseiten indexiert bzw. gefunden werden können.
Bearbeitung der URL Parameter in den Webmaster Tools
Einige der genannten Duplicate-Content-Probleme lassen sich auch mit Hilfe der Google Webmaster Tools beseitigen. Darüber wie das genau geht, hat Viktor Dite am Sonntag eine sehr empfehlenswert Anleitung verfasst.
Rel next/prev
Eine elegante Methode um doppelten Content durch paginierte Seiten zu vermeiden, bieten die Elemente rel=“next“ und rel=“prev“. Seit einiger Zeit kann der Googlebot diese verstehen. Daher indexiert Google so miteinander verbundene paginierte Seiten nicht mehr als Duplicate, sondern erkennt den Zusammenhang. Wir werden demnächst einen eigenen Beitrag dazu veröffentlichen. Wer schon vorher erfahren will wie das geht, sollte mal in den Google Webmaster Blog gucken. Einen etwas konkreteren Ansatz gibt es außerdem im morefire Blog.
Werden so die Probleme gelöst?
Wie ich versucht habe deutlich zu machen, sind das alles mehr oder weniger nur zweitbeste Lösungen. Es kommt eben immer drauf an, wo das Problem liegt und was einem als Websitebetreiber wichtig ist. Man sollte aber auch mal die Kirche im Dorf lassen. Nicht optimierte Übersichtsseiten oder Schlagwortseiten in Blogs sind ärgerlich, reißen aber nicht gleich die dazugehörigen Artikel in den Keller. Das kann man schon in Angriff nehmen, die erste, zweite und vielleicht dritte Priorität sollte aber doch eher auf andere Punkte gelegt werden. Die hier genannten Lösungsmöglichkeiten sind natürlich nicht vollständig und sie sollten mit Bedacht verwendet werden. Außerdem liegt es in der Natur von Blogs und wahrscheinlich auch Online Shops, dass ständig neue Inhalte hinzukommen. Man muss dies also regelmäßig machen, um Duplicate Content dauerhaft zu verhindern.
Danke für die Erwähnung David!