Facebooks EdgeRank – Die Sortierung Deines Newsfeeds
In meiner Wahrnehmung mehren sich in letzter Zeit wieder Berichte über einen mysteriösen Algorithmus bei Facebook. In Analogie zu Googles PageRank fällt in diesem Zusammenhang häufiger die Bezeichnung EdgeRank. Interessant in diesem Zusammenhang ist, dass es diese Bezeichnung innerhalb der Entwicklungsabteilung von Facebook offenbar überhaupt nicht gibt. Oder um es mit den Worten von Phil Zigoris zu sagen, der das System der gesponserten Stories maßgeblich mitentwickelt hat:
„We don’t have a product or system called EdgeRank. The news feed algorithm takes many factors into account when it’s deciding what to show, including how often two people interact, how many people have liked, commented on, or shared a story, and the type of content that is being shown.“
Der erste Fehler in diesem Artikel besteht also schon in der Terminologie. Dummerweise ist sie sehr eingängig und wird überall verwendet. Da ich auch mal an etwas Tollem und Geheimnisvollem teilhaben will, bleibe ich dabei.
Was ist der sogenannte EdgeRank?
Vereinfacht ausgedrückt handelt es sich um einen Algorithmus der bestimmt, welche Posts von Freunden, Bekannten und Unternehmen im Facebook Newsfeed wann und vor allem wem angezeigt werden. Die meisten Facebook-Nutzer stellen sich die Frage eher selten oder gar nicht. Dabei ist es eigentlich auch für sie relevant, wenigstens zu wissen, dass die angezeigten Inhalte, nicht alle sind die es gibt – es befinden sich darunter auch gefilterte. Das nennt man dann Filter Bubble. Über die User in ihrer Blase hat David schon vor längerem eine Serie geschrieben, in der er im letzten Teil auch auf die personalisierten Filter von Facebook, bzw. den sogenannten EdgeRank eingegangen ist.
Heute geht es jedoch eher um Werbetreibende, die ein natürlich hohes Interesse an der Funktionsweise des Facebookalgorithmus haben. Für eine Kampagne ist es eben nicht nur die Reichweite, die interessiert, sondern insbesondere auch die Frage wer erreicht wird und wie oft und vielleicht sogar warum.
Paralleluniversum Google Suche
Die herbeigezauberte Namensähnlichkeit zum PageRank kommt natürlich nicht von ungefähr. Meine Vermutung ist, dass irgendwelche Online-Marketer einen praktischen Begriff suchten, um sich Ausweichstrategien zu überlegen. Es klingt einfach besser den „EdgeRank“ auszuhebeln als den News-Feed-Algorithmus. Mehr EdgeRank gleich bessere Positionierung im Feed. Wie bei Google mit dem PageRank. Beides ist viel zu kurz gegriffen und doch sind sich die Google Suche und das Facebook Newsfeed verblüffend ähnlich. Beide liefern Ergebnisse zu Suchanfragen. Der Unterschied besteht im Wesentlichen in der Suchphrase. Während Google etwa 30% aller Suchanfragen noch nie vorher gesehen hat, kennt das Newsfeed derzeit nur eine Frage (das wird sich bald ändern, aber dazu später mehr): Was von dem belanglosen Kram, der gerade um mich herum passiert, interessiert mich? Und zwar jetzt. Ja, alles hat seine Zeit.
Wir funktioniert der „EdgeRank“?
Das weiß natürlich niemand so genau, weil dieses Thema – ebenso wie die Faktoren der Google Suche – geheim gehalten werden. Da Spammer aller Couleur dazu neigen über ein besseres technisches Verständnis zu verfügen als jeder Online-Marketing-Blog- SocialMedia-Hyper-Professional ist das vermutlich auch besser. Allerdings sollte dabei auch die Mystifizierung der Funktionsweise technischer Systeme nicht vernachlässigt werden: Ich halte es für auffällig und auch bedenklich, dass Unternehmen wie Google oder Facebook mit ihren „Zaubereien“ permanent überschätzt werden. Auf der einen Seite funktionieren viele Systeme gar nicht so gut wie erwartet. Dazu gehört beispielsweise die Erkennung von duplicate content. Andererseits, entschuldigt die Ausdrucksweise, kacken die meisten bei Themen wie WDF*P*IDF mental voll ab. Ich gehe das Thema „EdgeRank“ heute mal etwas anders an, als es sonst üblich ist. Statt mich auf nicht aussagekräftige Beobachtungen zu stützen, kann ich mir als Softwareentwickler doch mal die Frage stellen: Welche Kriterien würde ich heranziehen, um in Facebook´s Newsfeed möglichst nur die relevanten Inhalte darzustellen. Vor allem kann ich dabei hinterfragen, was technisch geht und was eher unwahrscheinlich ist.
Mögliche Kriterien zur Auswahl der Inhalte
Die Auswahlkriterien für das was Ihr seht, haben in meiner Welt drei Dimensionen:
- Die Art der Inhalte
- Euer eigenes Verhalten und Eure Vorlieben
- Das Verhalten und die Vorlieben Eurer Freunde
I. Die Art der Inhalte
Das ist das einfachste Kriterium. Hier kann man von einem festen Regelsatz ausgehen, der die Popularität von Inhalten bewertet. Das lässt sich relativ einfach machen. Hierfür muss sich Facebook nur ansehen, welche Art Inhalte am häufigsten geteilt werden oder mit denen am häufigsten interagiert wird. Zu diesem Thema muss nicht wirklich viel spekuliert werden. Ich gehe einfach mal von folgender Reihenfolge aus:
- Fotos
- Videos
- Links
- Textuelle Meldungen
- Meldungen externer Dienste (unterschiedlich priorisiert – Beispiele sind Foursquare oder Spotify)
Ergänzend ist davon auszugehen, dass längere Postings die Interaktionsquote fördern. Links werden häufiger angeklickt, wenn man sie mit Vertrauen anreichert. Eine Beschreibung, die über zwei Zeilen Text hinausgeht, ist hier durchaus förderlich, denn sie erzeugt einen Facebook seitigen call to action: Den more… Link. Ich habe kurz darüber nachgedacht Videos in der Auflistung vor die Fotos zu setzen. Das haut meiner Meinung nach nicht hin, da davon auszugehen ist, dass Facebook Inhalte innerhalb des Netzwerks bevorzugt behandelt. Das ist bei Videos fast nie der Fall. Darüber hinaus ist die Art des Zugriffs nicht zu vernachlässigen. Die mobile Nutzung ist weiter auf dem Vormarsch und dabei sind Videos, dank der Machenschaften der Mobilfunkbranche eher ein Hindernis.
II. Dein Verhalten, deine Vorlieben
Ein durchaus komplexes Thema ist die Bewertung der Vorlieben des Nutzers. Man könnte auch die Frage stellen: Was weiß Facebook über uns? Fangen wir mit den offensichtlichsten Informationen an:
Das sind zunächst einmal alle Informationen, die wir selbst in unsere Profile geschrieben haben oder die sonst offensichtlich sind. Name, Alter, Beziehungsstatus, Arbeitgeber, Inhalte die wir mögen (like), Inhalte die wir empfehlen (share), Inhalte zu denen wir eine Meinung haben (comment), Inhalte die uns sonst interessieren könnten (click). Weitere sehr interessante Informationen lassen sich aus unseren Privatsphäre-Einstellungen ableiten. Was bist Du für ein Typ? Eher schüchtern, eher extrovertiert, hast Du ein Profilfoto oder versteckst Du Deinen Beziehungsstatus? Wonach Suchst Du? Sind es eher Frauen oder eher Männernamen, die Du in die Suche eintippst? Welche Werbeanzeigen klickst Du an, auch wenn Du nachher nicht auf like drückst? In welchen Gruppen bist Du Mitglied? An welchen Veranstaltungen nimmst Du teil? Und das ist nur die netzwerkinterne Dimension.
Facebook ist nicht einfach nur ein abgeschlossenes Netzwerk. Es ist eine Plattform. Man findet den Like-Button mittlerweile auf fast jeder Internetseite. Also: Auf welchen Seiten surfst Du so ‚rum, die einen Like-Button haben oder die die Kommentarfunktion beinhalten? Welche Musik hörst Du auf spotify, tape.tv oder anderen Plattformen?
III. Das Verhalten und die Vorlieben Deiner Freunde
Was treiben Deine Freunde so? Insbesondere diejenigen, mit denen Du besonderes häufig interagierst? Wessen Inhalte kommentierst Du am häufigsten, wessen Fotos gefallen Dir? Wer lädt Dich am häufigsten ein und wen ignorierst Du? Mit wem bist Du einfach nur befreundet, weil Facebook ihn vorschlug und wem schreibst Du besonders viele Nachrichten? Welche Unternehmen gefallen Deinen Freunden, welche Freunde habt ihr gemeinsam und gibt es dort Überschneidungen bei Likes, Kommentaren, Veranstaltungen? Wurdet ihr auf den gleichen Fotos markiert? Wie reagierst Du auf das, was Deinen Freunden gefällt oder auf deren geteilte Inhalte? Wo markieren sie Dich, wo gehen Sie mit Dir hin?
Auch hier wieder: Wo surfen Deine Freunde, welche Musik hören sie, welche Fotos finden sie gut, welche Videos sehen sie sich an?
IV. Affinität zum Teilenden
Eines der wichtigsten Kriterien ist die Affinität zur Person, die den Inhalt teilt. Dieser Punkt stellt eine Mischung aus den beiden Letztgenannten dar, ist aber so wichtig, dass ich ihn hier separat herausstelle: Wie hoch ist die Wahrscheinlichkeit, dass Du auf etwas reagierst, dass Deine Freunde Teilen? Dazu bedarf es nur recht weniger Informationen, die alle netzwerkintern vorliegen:
- Wie häufig reagierst Du auf die geteilten und durch like markierten Inhalte Deiner Freunde?
- Welche Medientypen sind das?
- Wie oft kommunizierst Du mit Deinen Freunden?
- Wie oft schaust Du Dir Ihre Profile an?
Hast Du eine Kategorisierung vorgenommen z.B. durch die Markierung als „enge Freunde“ – Das ist die Markierung, die ständig dein Handy vibrieren lässt, wenn Du entweder die falschen Leute auswählst oder Deine engen Freunde zu aktiv sind ;-)
Nachdem ich nun eine ganze Reihe von Kriterien vorgeschlagen habe die eine Rolle spielen könnten, sollten wir das Ganze mal nach Prioritäten sortieren. Das ist gar nicht so mysteriös, wie immer getan wird, denn die Herleitung all der genannten Kriterien legt folgende Sortierung nahe:
- Wer postet?
- Magst Du die Ursprungsquelle (z.B. eine Fanpage von der der Inhalt übernommen wurde)?
- Welcher Medientyp wird von der Community für Interaktionen bevorzugt (evtl. regional ermittelt)?
- Welcher Medientyp wird von Dir persönlich für Interaktionen bevorzugt?
- Wie populär ist der Inhalt a) in der gesamten Community (wahrscheinlich regionalisiert) b) in Deinem Freundeskreis?
Alle anderen vorgenannten Punkte spielen eher eine untergeordnete Rolle. Verschieben lassen sich diese Priorisierungen eigentlich nur durch Kategorisierung externer Inhalte. Das ist ein sehr aufwändiger Prozess, für den selbst ein Laden wie Google kaum genug Server kaufen kann (wie bereits oben erwähnt, können die nicht mal zuverlässig doppelte Inhalte erkennen). Hier dürfte die Popularität eines Inhalts eine gewichtige Rolle spielen:
Handelt es sich um einen populären Inhalt, kann sich der Aufwand lohnen diesen zu crawlen, zu kategorisieren und mit den Kategorien aus dem Surfprofil der Nutzers abzugleichen. Das ist die einzige Möglichkeit, den sehr hohen Einfluss sozialer Interaktionen auf die Sortierung der Timeline auszuhebeln. Dass dies nicht stattfindet, kann sich jeder an seiner eigenen Timeline ansehen. Bei der Einblendung der Werbeanzeigen sieht es etwas anders aus. Aber das ist ein Thema für sich…
(Artikel erstmals 2013 veröffentlicht – Inhalt möglicherweise nicht mehr aktuell)