Die richtige Verwendung von XML-Sitemaps (sitemaps.xml)

Wie wir im Artikel „Was ist eine Suchmaschine?“ andeuten, ist der Vorgang des Crawlings, also der Erfassung aller Unterseiten einer Internetpräsenz, ein äußerst komplexer und aufwändiger Vorgang. Da alle Suchmaschinenbetreiber sich darüber im Klaren sind, haben sie sich darauf geeinigt einen gemeinsamen Standard zu entwickeln, der das Auffinden der relevanten Inhalte einer Internetpräsenz vereinfachen und beschleunigen soll: Die XML-Sitemaps.

Was ist eine XML-Sitemap?

Hierbei handelt es sich um einfach strukturierte XML-Dateien, die alle Seiten der eigenen Internetpräsenz auflisten. Google und zwischenzeitlich auch Bing laden dann diese Datei herunter und analysieren sie. Folgende Daten sind dabei enthalten:

  1. die Adresse der Seite
  2. die Änderungsfrequenz (wie häufig wird diese Einzelseite aktualisiert)
  3. das Änderungsdatum
  4. die Wichtigkeit dieser Seite aus Sicht des Betreibers

Wie ist eine XML-Sitemap aufgebaut?

Eine einfache XML-Sitemap Datei sieht so aus:
 <?xml version=“1.0″ encoding=“UTF-8″?>
 <urlset xmlns:xsi=“http://www.w3.org/2001/XMLSchema-instance“ xsi:schemaLocation=“http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd“ xmlns = „http://www.sitemaps.org/schemas/sitemap/0.9“>
<url>
<loc>https://bold-ventures.de/magazin/mobile-friendly-label/</loc>
<lastmod>2011-07-05T18:57:33+00:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.4</priority>
</url>
</urlset>

Die erste Zeile zeigt, dass es sich um eine XML-Datei handelt. Die zweite Zeile besagt, dass es sich um eine Auflistung von Internetadressen im XML-Sitemap Format handelt. Unterhalb des Urlset Elements kann eine nahezu beliebige Anzahl von URL-Elementen platziert werden. Diese bestehen aus den Elementen loc für die Adresse der Seite, lastmod für das Änderungsdatum, changefreq für die Änderungsfrequenz (zugelassene Werte sind always [ständig], hourly [stündlich], daily [täglich], weekly [wöchentlich], monthly [monatlich], yearly [jährlich], never [nie]), sowie priority für die selbstgewählte Wichtigkeit.

Die Priority wird mit einem Wert zwischen 0.0 (unwichtig) und 1.0 (wichtig) angegeben. Der Wert 1.0 sollte ausschließlich für die Startseite Ihrer Webpräsenz verwendet werden, es sei denn irgendeine Ihrer Unterseiten ist wichtiger als die Startseite. Dies dürfte allerdings nur in den seltensten Fällen zutreffend sein.

Was sind die Vorteile einer XML-Sitemap?

Der allerwichtigste Vorteil von XML-Sitemaps besteht in der Vollständigkeit der Indexierung, insbesondere bei größeren Internetpräsenzen. Dadurch finden Google und die anderen Suchmaschinen wirklich alle Seiten Ihrer Internetpräsenz. Wenn Sie mit mehr Inhalten in den Suchmaschinen vertreten sind, steigen auch Ihre Chancen gefunden zu werden entsprechend.

Ein weiterer entscheidender Vorteil ist die Geschwindigkeit der Indexierung. Unsere Messungen haben ergeben, dass frisch publizierte Seiten, wenn eine XML-Sitemap vorhanden ist, ca. ein bis zwei Minuten nach deren Veröffentlichung im Google Index zu finden sind. Dies ist auf den Umstand zurückzuführen, dass Google nun nicht mehr alle Seiten Ihrer Internetpräsenz auswerten muss um festzustellen, ob und was sich geändert hat, sondern einfach in der XML-Sitemap nachschauen kann.

Wie wird die XML-Sitemap erstellt?

Hierfür gibt es mehrere Möglichkeiten. Sie können die Sitemap in einem herkömmlichen Texteditor verfassen und auf Ihren Webserver hochladen. In den seltensten Fällen werden Sie allerdings die Sitemap manuell erstellen wollen. Viele Content Management Systeme bieten Plugins zur Generierung der Sitemaps. Hier finden Sie eine Auflistung von Plugins für gängige Content-Management-Systeme:

Wie wird die XML-Sitemap den Suchmaschinen bekannt gemacht?

Auch hierfür gibt es unterschiedliche Möglichkeiten. Die einfachste Variante besteht darin, die Sitemap in die robots.txt einzutragen. Erstellen Sie hierzu einfach einen Eintrag mit der Zeile:

Sitemap: http://www.meineseite.de/sitemap.xml

Wenn Sie die Sitemap durch ein Plugin generieren lassen, wird dieser Punkt in der Regel automatisch erledigt.

Zudem kann die Sitemap bekannt gemacht werden indem sie in den Webmastertools von Google eingetragen wird. Dadurch wird sie von Google direkt gefunden. Auf die anderen Suchmaschinen hat das zwar selbstverständlich keinen Einfluss, es ist jedoch trotzdem in jedem Fall empfehlenswert diesen Schritt auszuführen. Loggen Sie sich hierzu in den Google Webmaster Tools mit Ihren Zugangsdaten ein. Die XML-Sitemap können Sie dann im Menüpunkt Website-Konfiguration XML-Sitemaps einreichen.

Am Rande sei noch erwähnt, dass es weitere Varianten von XML-Sitemaps für spezielle Arten von Inhalten gibt. Google unterstützt  Sitemaps für:

  • Videoinhalte
  • Mobilinhalte wie Handy-Websites
  • News
  • Geodaten
  • Google Codesuche
  • Bilder

Das könnte dir auch gefallen

Kommentar hinterlassen

Deine E-Mail Adresse wird nicht veröffentlicht.

13 Kommentare
11.08.2011

Danke für den Beitrag. Ich habe noch eine kleine Anmerkung dazu:
Viele SEO’s verwenden einen anderen Pfad als „/sitemap.xml“ und tragen diese auch nicht in die robots.txt ein, um Mitbewerbern das Analysieren des eigenen Projekts zu erschweren. Ich persönlich teile diesen Ansatz nicht, aber man weiß ja nie, was manche Leute zu verbergen haben ;)

03.11.2012

Danke für den Artikel. Gibt es eine Begrenzung, was die Anzahl der Seiten in einer sitemap.xml betrifft und sollte man dann die Sitemap in mehrere aufteilen?

admin
04.11.2012

@Lothar
Für XML-Sitemaps gelten zwei Beschränkungen:

– Sie dürfen nicht mehr als 50.000 Einträge enthalten

– Sie dürfen nicht mehr als 10MB groß sein

Um dieses Problem zu umgehen, können sitemap-index Dateien angelegt werden. Google beschreibt dies in der Webmaster-Central:

http://support.google.com/webmasters/bin/answer.py?hl=de&answer=71453

Der Index unterliegt der gleichen Beschränkung wie die regüläre Sitemap (50.000 Einträge)

Auf diese Weise sind 50.000 * 50.000 = 2,5 Mrd. URL´s möglich. Außerdem lässt sich nicht nur eine Sitemap an Google übermitteln, wodurch es faktisch keine reelle Beschränkung hinsichtlich der Anzahl gibt.

05.11.2012

Hallo,

vielen Dank für die umfangreiche Antwort. Viele Grüße

07.11.2012

Hallo, kennt jemand ein Programm, mit dem eine spezielle Sitemap nur für Bilder erstellt werden kann?

Kann es ein Problem geben, wenn die Bilder mit in der Sitemap für die Links aufgeführt sind? Da stehen sie unter und nicht unter und werden sicherlich nicht indexiert.
Viele Grüße

23.02.2013

Die Sitemap kann man auch direkt über den Browser bekannt machen. Einfach in der Url Eingabemaske eingeben:

http://www.google.com/webmasters/tools/ping?sitemap=http://www.dieseite.de/sitemap.xml

Wobei dieseite.de mit der eigentlichen Webseite ersetzt werden sollte.