Duplicate Content

Was ist eigentlich Duplicate Content?

Man spricht hier von identischen oder sehr ähnlichen Texten die mehr als einmal auf der gleichen Webseite oder auf verschiedenen Webseiten verwendet wurden, aber über unterschiedliche URLs auffindbar sind. Es handelt sich bei diesen Texten um einen sogenannten doppelten Inhalt, also Duplicate Content/ Duplizierter Content. Die Suchmaschinen wollen dem Nutzer eine positive Nutzerexperience verschaffen und setzen daher auf einmaligen Inhalt. Wird von einer Suchmaschine der Inhalt einer Seite als Duplicate Content erkannt, gilt dies als Täuschungsversuch. Die Webseite wird entweder abgewertet oder direkt aus dem Index entfernt. Man unterscheidet aber noch zwischen Interner und Externer Duplicate Content, dazu später mehr.

Lösung für doppelte Inhalte

Die Vermeidung von Duplicate Content ist in der SEO-Theorie und in der alltäglichen Praxis ein Hauptthema. Die relevantesten Suchmaschinen können Duplicate Content gut filtern und erkennen. Das Crawling und das Scoring der Inhalte wird hierdurch erschwert. Bei Texten unterscheidet man auch noch zwischen exakt doppelten Inhalten und nahezu doppelten Inhalten „Near Duplicate Content“. Google sieht solche Inhalte meistens nicht als Duplicate Content an (Übersetzungen, unterschiedliche Seiten mit gleichem Seitentitel und Descriptions, Content in Apps, regionale Inhalte etc.). Beispiel von duplizierten Inhalten sind z.B. exakt gleicher Inhalt/ große Teile gleichen Inhalts, Inhalte sind auf mehreren Domains, Subdomains bzw. URLs, Tag-Seiten, Pressemitteilungen Syndizierte Inhalte, identische Seitentitel etc.)

Mögliche Quellen und Probleme des Duplicate Contents

Nur das reine Vorhandensein vom Duplicate Content weist nicht direkt auf eine Täuschungsabsicht hin. Um zu vermeiden, dass Texte von Hauptseiten und Unterseiten falsch gewertet werden, nutzt man sogenannte Canonical Links, diese geben an unter welcher Domain die Originalseite zu finden ist. So kann man der Inhaltsdopplung entgegenwirken. Nutzen Sie die 301 Weiterleitung, wenn Sie mit und ohne www. zu erreichen sind. Teilen Sie Google über die Search-Console einfach mit, wie die Webseite indexiert werden soll.

Um Duplicate Content Probleme zu vermeiden, die durch identische Inhalte auf mobilen Landingpages entstehen können, sollte man die unterschiedlichen Google Bots “Google Bot mobile” die mobile Seite ausliefern und dem Standard Google Bot die normale Seite ausliefern nutzen. Inhalte, wie z.B. Produktinformationen, die per RSS Feed eingespielt werden, sind ein Sonderfall. Das reine Scrapen und einspielen von fremden Inhalten bieten dem User keinen Mehrwert.

Wem schadet jetzt der Text-Klau?

Es schadet leider meist nicht nur dem Dieb selbst, sondern auch dem beklauten Opfer. Es gibt Webseiten-Betreiber, die durch bewusste Duplizierung, das Ranking Ihrer eigenen Webseite steigern möchten. Leider wissen die Suchmaschinen nicht, welche die Originalseite dieses Textes ist, im schlimmsten Falle, droht die Entfernung aus dem Index für beide Parteien.

Bestraft Google doppelte Inhalte?

Für internen Duplicate Content gibt es keine Strafen, sogenannte Penaltys. Es gibt ein paar Fälle bei externen Duplicate Content, z.B. (Scraper Sites, Domains, die nahezu aus ausnahmslos geklauten Inhalten bestehen; Spinning Content, von Inhalten anderer Seiten; Doorway Pages / Brückenseiten).

Was ist interner Duplicate Content?

Interner Duplicate Content sind sehr ähnliche oder identische Inhalte innerhalb einer Domain. Zu finden meist im Affiliate-Marketing. Besonders Shopsysteme, aber auch Redaktions-CMS sind hier besonders betroffen. Beispiele für Duplicate-Content-Quellen sind z.B.:

Kategorie-Seiten
Tag-Übersichtseiten
Filter-Übersichtsseiten
Produkteinzelseiten, wenn sie unterschiedlichen Kategorien zugeordnet sind

Es ist sinnvoll Google bei der Priorisierung von URLs zu unterstützen und interne doppelte Inhalte aktiv zu vermeiden, da es nur meist keine Probleme gibt.

Was ist externer Duplicate Content?

Externer Duplicate Content ist sehr ähnlicher oder identischer Inhalt auf unterschiedlichen Domains. Beispiele sind z.B.:

Gesamte Übernahme von Artikel-Beschreibungen
Content-Diebstahl
Content-Scraping
Verbreitung von Pressemitteilungen

Wie erkennt Google doppelte Inhalte?

Google erkennt und filtert doppelte Inhalte an diesen Punkten des Crawling- und Indexierungs-Prozesses. Bei der Indexierung, beim Scheduling und in den Suchergebnissen.

Unser Hauptsitz

Aktuell im Fokus