Mikroformate und Mikrodaten
Wir erinnern uns: Microformate sind die kleinen etwas technisch angehauchten Schnipsel, die der eigenen Webseite Superkräfte verleihen sollen. Gefühlt jeder SEO hat schon einmal was dazu geschrieben, sie tauchen in jeden SEO-Konzept auf, aber wirklich angewendet werden sie nicht.
Nun sind Suchmaschinenoptimierer von ihrem Wesen in der Regel eher weniger technisch orientiert. Da wir aber spätestens seit Goethe wissen, dass man sich mit Geschichten durchaus ein angenehmes Leben machen kann, sei das unserer Branche an dieser Stelle verziehen. Nachdem wir das Thema schon mal kurz angerissen haben, werde ich die Thematik heute ausführlicher beleuchten. Das verflixte siebte Jahr von microformats.org hat nämlich einen angenehmen Nebeneffekt: Die Aufmerksamkeit des Jubiläums wird genutzt, um auf Version 2.0 der hauseigenen Spezifikation aufmerksam zu machen, die ab sofort ready-to-test ist. Ich halte das für eine gute Gelegenheit sich jetzt endlich tiefergehend mit dem Thema zu befassen.
Im Verlauf meiner Recherchen bin ich über unterschiedliche Ansätze zum Themenkomplex der Mikroformate gestoßen. Es gibt drei größere Ansätze zu diesem Thema:
- Microformats
- RDFa
- Microdata
Mikroformate – Was ist das?
Im Microformats-Wiki heißt es dazu:
Mikroformate sind kleine HTML-Muster zur Repräsentation häufig publizierter Objekte wie Menschen, Events, Blogbeiträgen, Reviews und Tags in Webseiten.
Mikroformate sind der schnellste und einfachste Weg eine API zu den Daten und Informationen Ihrer Website bereitzustellen (das stimmt wirklich).
Um das Thema etwas anschaulicher zu machen, zeige ich ein Microformat, das nahezu jeder Blogbetreiber und auch jeder Suchmaschinenoptimierer schon einmal gesehen hat:
<a href=“http://twitter.com/bv_rocks“ rel=“me“>@boldventures</a>
Sieht wie ein normaler Link aus. Ist auch einer, die Besonderheit an diesem Link ist aber die Anreicherung mit der Information, dass es sich um eine Seite handelt, die ebenfalls Inhalte von mir enthält. Anders ausgedrückt: Der Link beantwortet nicht nur die Frage nach dem Ziel, sondern darüber hinaus das Verhältnis der Zielseite zur aktuellen Seite. Beim rel Attribut handelt es sich um ein Mikroformat aus der Gruppe XFN. Für meinen Geschmack ist dieses Kürzel etwas unhandlich, aber recht einprägsam, wenn man weiß, was es bedeutet. XFN steht für XHTML Friends Network: Ein Weg den Zusammenhang zwischen unterschiedlichen URLs weitergehend zu definieren. Aus Sicht einer Suchmaschine eine sehr nützliche Sache. In WordPress werden diese Zusammenhänge übrigens schon sehr lange verwendet. In der Verwaltung der Links kann man etwas definieren, das in WordPress „Beziehung“ genannt wird. Das kann durchaus seltsame Blüten treiben. Ich könnte einen Link definieren, der aussagt, dass es sich bei der verlinkten Seite um einen Inhalt handelt, der von jemandem verfasst wurde,
- den ich in der realen Welt schon einmal getroffen habe.
- der gleichzeitig mein Mitarbeiter ist.
- der gleichzeitig mein Nachbar ist.
- der gleichzeitig mein (Lieblings-)Kind ist.
Das rel Attribut dafür sähe so aus: „met co-worker neighbor child sweetheart“
Weitere Informationen zu XFN finden sich im Microformats-Wiki unter XFN.
Fassen wir nochmal kurz zusammen: Mikroformate nutzen Standard-HTML mit ein paar zusätzlichen Konventionen, um Daten aus Standard HTML leichter extrahieren zu können.
Warum wurden Mikroformate erfunden?
Dafür gibt es ein paar recht naheliegende Gründe:
- Es ist ein logischer Schritt in Richtung semantisches Web;
- Mikroformate erlauben es Menschen und Organisationen wichtige Meta-Informationen ohne zentralisierte Services selbstständig zu publizieren und zu pflegen;
- abgesehen von eher spezialisierten Interessengruppen und Einsatzgebieten (z.B. Facebook-Apps) lässt sich durchaus sagen, dass traditionelle Ansätze wie herkömmliche Meta-Tags ihren Zweck entweder verfehlt haben oder nur sehr beschränkt zum Einsatz kamen;
- es handelt sich um einen einfachen Weg Standard-HTML, welches eine extreme Verbreitung hat, mit maschinenlesbaren Daten anzureichern.
Welche Mikroformate gibt es?
Es gibt eine Reihe von fertig spezifizierten Mikroformaten und eine noch etwas längere Liste von Formaten, die derzeit als Entwurf vorliegen (Achtung: diese Aussage betrifft hauptsächlich microformats.org. Es gibt eine Reihe weiterer Formatanbieter. Insbesondere auf Google komme ich später noch zu sprechen). Da der Code durch Einbettung von Mikroformaten nicht in seiner Validität beeinträchtigt wird, spricht nichts gegen den Einsatz von Drafts.
Folgende Mikroformate sind durch microformats.org fertig spezifiziert:
- hCalendar zur Definition von Events;
- hCard zur Definition von Kontaktinformationen aller Art;
- rel-licence zur Definition von Lizenzinformation (für Softwareentwickler und Autoren sehr spannend);
- rel-nofollow dürfte jedem Leser ein Begriff sein. Damit wird definiert, dass ein Linkbewertungsalgorithmus den mit diesem Mikroformat bestückten Link nicht zugunsten der Zielseite bewerten soll;
- rel-tag zur Kennzeichnung von Tags zu einem Artikel der aktuellen Seite. Das Element wird in nahezu jeder Tag-Cloud verwendet;
- VoteLinks zur Bewertung eines ausgehenden Links. VoteLinks liegt das Problem zugrunde, dass wir bei der Diskussion über einen Sachverhalt in der Regel unterschiedliche Meinungen beleuchten müssen. Mit VoteLinks lässt sich also kenntlich machen, dass wir der Meinung, die auf der von uns verlinkten Seite vertreten wird, widersprechen. Die Standard-Praxis in diesem Zusammenhang besteht derzeit häufig darin keinen Link zu setzen, was nicht unbedingt im Sinne der Meinungsbildung ist. Meiner Ansicht nach eines der interessantesten Mikroformate überhaupt;
- XFN zur Definition zwischenmenschlicher Beziehungen;
- XMDP zur Definition der verwendeten Mikroformate. Das Kürzel steht für XHTML Meta Data Profiles und stellt eine Art Document Type Definition für die verwendeten Mikroformate dar;
- XOXO zur Definition strukturierter Daten die sich sowohl vom Browser darstellen, als auch von einem XML-Parser programmatisch lesen lassen. Zugegebenermaßen klingt das etwas abstrakt. Im Wesentlichen definiert das XOXO-Profil eine strukturierte Liste in der Form <ol><li>element</li></ol>.
Folgende Mikroformate befinden sich noch in der Spezifikationsphase:
- adr zur Definition von Adressinformationen;
- geo zur Definition geographischer Koordinaten in Form von Längen- und Breitengrad;
- hAtom zur Definition von „episodischen Inhalten“. Klarer wird das Thema, wenn wir sagen: fortlaufende Inhalte wie beispielsweise in einem Blog;
- hAudio zur Definition von Audioinhalten. Hier geht es insbesondere um all die Meta-Informationen die einem Crawler üblicherweise entgehen würden. Beispiele wären: Beteiligte Autoren, Länge, erste Publikation, Zahlungsinformationen, etc;
- hListing für Katalogeinträge;
- hMedia zur Definition multimedialer Inhalte. Konkret: Bilder, Video- und Audiodaten;
- hNews ist eine Erweiterung von hAtom. Hinzugefügt wurden hier Datentypen zur Vervollständigung von Informationen über die journalistischen Arbeit (z.B. Quellenangaben);
- hProduct zur Definition von Produktinformationen;
- hRecipe zur Definition von Koch und Backrezepten;
- hResume zur Definition von Lebensläufen;
- hReview zur Definition von Rezensionen aller Art (z.B. Bücher, Filme, Produkte, etc);
- rel-directory zu Kenntlichmachung von Verweisen auf ein Verzeichnis, das Inhalte der verlinkenden Seite enthält;
- rel-enclosure zur Kenntlichmachung von Dateianlagen;
- rel-home zur Kenntlichmachung der Home-Seite des aktuellen Dokuments;
- rel-payment zur Kenntlichmachung von Links auf ein Zahlungssystem;
- robots exclusion zur Definition von Seitenbestandteilen, die nicht von einer Suchmaschine gelesen werden sollen. Für Suchmaschinenoptimierer wirklich ein Zauberformat, denn es ermöglicht zum Beispiel den Ausschluss von Werbeblöcken aus dem Crawling;
- xfolk – zur Definition von Social Bookmarks.
Über all diese Mikroformate hinaus existieren zahlreiche, von unterschiedlichen Organisationen definierte Formate zur Auszeichnung von Meta-Informationen. Einige Beispiele ohne Anspruch auf Vollständigkeit:
- Facebook OGP Meta-Tags;
- Twitter Card Meta-Tags;
- OpenMetaData.org;
- Google, Microsoft, Yahoo – Schema.org
Welche Mikroformate werden von Suchmaschinen unterstützt?
Hier kommen wir zu einem erstaunlichen Punkt meiner Recherchen. Wie ich weiter oben schrieb: Jeder redet drüber, keiner macht’s anständig. Und obwohl Mikroformate bzw. Mikrodaten insbesondere für Google eine wichtige Rolle einnehmen, wird der Themenkomplex in der SEO-Szene eher stiefmütterlich behandelt. Das heißt: Es ist tatsächlich möglich sich hier einen Wettbewerbsvorteil zu verschaffen. Wer gerade aufmerksam gelesen hat, wird festgestellt haben, dass es offenbar gemeinsame Formatdefinitionen von Google, Microsoft und Yahoo gibt. Alle drei Suchmaschinenanbieter unterstützen alle diese Formate (vorwiegend um ihre Indizes mit Meta-Informationen anzureichern). Es gibt allerdings einen Einsatzzweck von Mikroformaten der sichtbar ist (zumindest bei Google und Bing):
Rich Snippets
Allein für die Rich-Snippets von Google werden folgende Formate unterstützt (was nicht bedeutet, dass man die anderen nicht auch verwenden sollte):
- Breadcrumbs
- Events
- Musik
- Organisationen
- Menschen
- Produkte
- Rezepte
- Bewertungen
- Reviews
- Software
- Videos
Eine vollständige und meiner Meinung nach sehr beeindruckend lange Liste der von den Suchmaschinengrößen unterstützten Formate findet sich auf schema.org. Dort hält man auch eine recht knappe Dokumentation bereit wie man diese Formate in der eigenen Seite verwenden kann. Kurz zusammengefasst: Es ist spielend einfach wenn man das hier gelesen hat.
Warum sollten Mikroformate bzw. Mikrodaten verwendet werden?
Dafür gibt es eine Reihe von Gründen. Der offensichtlichste findet sich in der Darstellung der Rich-Snippets. Hier entsteht ein tatsächlicher Wettbewerbsvorteil gegenüber Webseitenbetreibern, die Mikrodaten nicht einsetzen. Es wird einfach mehr Aufmerksamkeit im Suchergebnis erzielt. Ergänzend tragen Mikroformate entscheidend zur Verbesserung der Suchqualität bei. Die Suchmaschine versteht einfach besser um welche Art von Inhalt es sich auf der Seite handelt. Das ist ungemein praktisch für die Verbesserung der Ergebnisse.
Wo fange ich an?
Hier.
(Artikel erstmals veröffentlicht am 08.Juli 2012 – Inhalte evtl. nicht mehr aktuell)
Hi,
klasse Zusammenfassung! Vielleicht sollten wir auch mal jeden 10. Blogbeitrag feiern, käme bestimmt Stimmung auf ;-)
Grüße
Gretus