Koehn AI: Firmenlogo

Markov und Shapley: Marketing-Attribution auf Interaktionen / Pfade

17. Januar 2021

Markov-Kette und Shapley-Wert: Im Bereich Marketing werden als Attributionsmodelle häufig First-Click, Last-Click oder Multi-Click-Modelle (Linear oder Bathtub) verwendet, um den Erfolg - beziehungsweise die Wirtschaftlichkeit - der einzelnen Marketingkanäle (SEA, SEO, E-Mail, etc.) zu messen. All diesen Modellen ist gemein, dass sie den Wert einer Konversion (eines Kaufs) auf vordefinierte Weise zwischen den verschiedenen Stationen in der Liste der Interaktionen eines Kunden aufteilen. Verwendet man beispielsweise ein Last-Click-Modell und hat der Kunde nach einem Klick auf eine Facebook-Anzeige ein Produkt gekauft, so wird der Wert dieser Konversion dem Marketingkanal "Facebook" zugerechnet, unabhängig von allen vorherigen Interaktionen des Kunden. Im Bereich der Multi-Click-Modelle wird der Wert einer Konversion nach vordefinierten Gewichten auf alle mit diesem Kauf assoziierten Interaktionen umgelegt. Die Gewichtungen in all diesen Modellen erscheinen jedoch ad-hoc, da sie nun gerade nicht auf präziser Datenanalyse beruhen, sondern im Vorhinein händisch festgelegt werden. An dieser Stelle setzen nun die dynamischen Attributionsmodelle an. Statt im Vorhinein den Interaktionen willkürliche Gewichte zuzuschreiben, ermitteln dynamische Attributionsmodelle diese Gewichte selbstständig anhand der zur Verfügung gestellten Daten. Als State-of-the-Art-Modelle gelten das Markov-Modell sowie das Shapley-Wert-Modell. Auf beide soll im Folgenden näher eingegangen werden. Beide sind so konzipiert, dass sie Ergebnisse auf Kanalebene liefern. Ergebnisse auf Interaktionsebene bzw. Pfadebene zu erhalten, ist zwar etwas aufwändiger, aber auch hier können wir auf erprobte Lösungen zurückgreifen. Gerne implementieren wir Markov- und Shapley-Modelle auch für Ihr Unternehmen.

Markov-Modell

Das grundlegende Objekt im Markov-Modell, auf dem die gesamte Analyse aufbaut, ist der Markov-Graph. Für einen gegebenen Datensatz, welcher die Interaktionspfade verschiedener Kunden enthält (z. B. Start -> Facebook -> Remarketing -> Konversion/Kauf), lässt sich dieser wie folgt konstruieren:

  • Alle im Datensatz vorkommenden Marketing-Kanäle sowie die Begriffe Start, Konversion und Null (keine Konversion) schreibt man einzeln auf eine Karteikarte und verteilt diese im Anschluss auf einer ebenen Fläche.
  • Nun geht man die Interaktionspfade der einzelnen Kunden durch und veranschaulicht diese jeweils, indem man die entsprechenden Karteikarten durch Pfeile miteinander verbindet. Wählt man ein Beispiel mit insgesamt drei Marketingkanälen und vier verschiedenen Interaktionspfaden, so könnte die resultierende Grafik beispielsweise wie folgt aussehen: Markov-Interaktionspfade
  • Anschließend zählt man nun für jeden Marketingkanal die Anzahl der Pfeile, die zu einem fixen anderen Marketingkanal führen und dividiert diese Anzahl durch die Gesamtzahl der von diesem Knoten ausgehenden Pfeile. Im oberen Beispiel erhält man:
    Markov-Übergangswahrscheinlichkeiten Da von drei Pfeilen, die vom Kanal Facebook ausgehen, zwei Richtung Google zeigen und einer Richtung Remarketing, erhält man die Zahlen 2/3 und 1/3. Diese Zahlen stellen die sogenannten Übergangswahrscheinlichkeiten dar, d. h. für einen Kunden, der gerade auf eine Facebook-Anzeige geklickt hat, beträgt die Wahrscheinlichkeit 2/3, dass die nächste Station in seinem Interaktionspfad Google ist, während die Wahrscheinlichkeit dafür, dass die nächste Station Remarketing ist, 1/3 beträgt.
  • Im letzten Schritt berechnet man nun die Gesamtwahrscheinlichkeit für eine Konversion. Im obigen Beispiel gibt es drei Markov-Pfade, welche vom Startpunkt aus zu einer Konversion führen. Betrachtet man z. B. den Pfad Start -> Facebook -> Remarketing -> Konversion, so ergibt sich für dessen Wahrscheinlichkeit 3/4 * 1/3 * 2/3 = 1/6. Entsprechend ergibt sich für die zwei anderen Pfade 1/9 beziehungsweise 2/9, sodass die Gesamtwahrscheinlichkeit für eine Konversion 1/6 + 1/9 + 2/9 = 1/2 beträgt. Um den Erfolg der einzelnen Marketingkanäle zu beziffern, wird nun aus dem Markov-Graph nacheinander jeweils einer der drei Marketingkanäle entfernt und die Rechnung wiederholt. Der Erfolg des Kanals ergibt sich dann mithilfe der Formel
    Markov: Formel 1
    Auch ohne den mathematischen Ausführungen explizit zu folgen, ist es intuitiv klar, dass sich mit dem obigen Markov-Graph die Marketingkanäle nach Wichtigkeit sortieren lassen. Nimmt man beispielsweise den Kanal Remarketing heraus, so bleibt keiner der drei Markov-Pfade mehr übrig. Dieser Kanal ist also in dem hier diskutierten Beispiel essenziell. Entfernt man hingegen Facebook oder Google, so bleibt jeweils noch ein konvertierender Markov-Pfad übrig. Diese beiden Kanäle sind im Vergleich also etwas weniger wichtig. Auf diese Weise lässt sich somit der Erfolg einzelner Marketingkanäle präzise anhand der Kundendaten ermitteln, ohne dass im Vorhinein weitere Annahmen getroffen werden müssen.

Shapley-Wert-Modell

Eine Alternative zum Markov-Modell stellt das Shapley-Wert-Modell dar. Der Shapley-Wert ist ein Konzept, welches dem mathematischen Teilgebiet der Spieltheorie zuzurechnen ist. Das Grundproblem, welches der Shapley-Wert löst, besteht darin, innerhalb eines Spiels, in dem die Spieler Koalitionen bilden können, Gewinne fair zu verteilen. Das Konzept des Shapley-Wertes lässt sich jedoch auch auf das Attributionsproblem anwenden. Dabei fasst man die verschiedenen Marketingkanäle als Spieler auf, welche in einem Interaktionspfad eines Kunden typischerweise zusammenwirken, d. h. eine Koalition bilden. Als zu verteilenden Gewinn kann man beispielsweise die Konversionsrate ansetzen. Diese wird bestimmt, indem man anhand der Kundendaten für jeden prinzipiell möglichen Interaktionspfad bestimmt, zu wie vielen Konversionen beziehungsweise Misserfolgen (keine Konversion) dieser Pfad geführt hat und diese Zahlen ins Verhältnis setzt, d.h. man bildet den Quotienten (Anzahl an Konversionen) / (Anzahl an Konversionen + Anzahl an Nicht-Konversionen). Vereinfacht gesprochen quantifiziert das Shapley-Wert-Modell den Einfluss eines bestimmten Marketingkanals, indem es Interaktionspfade miteinander vergleicht, welche sich nur durch die Präsenz beziehungsweise die Abwesenheit des gerade betrachteten Kanals unterscheiden. Zur Veranschaulichung des Sachverhaltes betrachten wir die folgenden Beispiele:
Hoher Shapley-Wert Beide Interaktionspfade unterschieden sich offensichtlich nur durch die Gegenwart des Kanals „Video Branding“. Während der obere Interaktionspfad jedoch eine Konversionsrate von 10% aufweist, weist der untere Pfad nur eine Konversionsrate von 6% auf. Der Kanal „Video Branding“ erhöht die Konversionsrate relativ gesehen also um ca. 67% (4% absolut) und er erhält als Folge einen hohen Shapley-Wert, da er einen substanziellen Mehrwert generiert. Im zweiten Beispiel verhält sich die Sache nun genau umgekehrt:
Niedriger Shapley-Wert Der Kanal „Display“ sorgt relativ gesehen offensichtlich nur für eine Erhöhung der Konversionsrate um ca. 2% (0.2% absolut). Der Shapley-Wert des Kanals „Display“ ist daher wesentlich geringer, als der des Kanals „Video-Branding“, da der durch diesen Kanal generierte Mehrwert als marginal anzusehen ist.

Im Folgenden soll nun auf die exakte Definition des Shapley-Wertes eingegangen werden. Mathematisch gesehen wird der Shapley-Wert für die einzelnen Marketingkanäle anhand der folgenden Formel ermittelt:
Shapley: Formel 2
Der marginale Beitrag von Kanal i zu einer Koalition ist dabei definiert als die Differenz zwischen dem Gewinn, den eine Koalition S zusammen mit dem Kanal i erwirtschaftet und dem Gewinn, den sie ohne Kanal i erwirtschaftet, d.h.
Shapley: Formel 3
Hierbei ist G die Gewinnfunktion und S eine Kombination aus Marketingkanälen, welche den Kanal i nicht enthält. In den obigen Beispielen ist der marginale Gewinn also genau durch die Differenzen der Konversionsraten gegeben, d. h. 4% im ersten Beispiel und 0.2% im zweiten Beispiel. Zur Berechnung des tatsächlichen Shapley-Wertes eines Kanals wird allerdings nicht nur ein Interaktionspfad betrachtet. Vielmehr wird der Shapley-Wert bestimmt, indem der marginale Beitrag des betrachteten Kanals für alle möglichen Koalitionen berechnet und anschließend der Mittelwert gebildet wird. Die weiteren Faktoren in der zuvor angeführten Formel sorgen also nur für eine korrekte Mittelwertbildung. In Worten gefasst spiegelt der Shapley-Wert also den mittleren Mehrwert wider, den ein Marketing-Kanal generiert.

Eine Subtilität im Shapley-Wert-Modell betrifft die Gewinnfunktion G. Diese ist durch die Definition des Shapley-Wertes nicht vorgegeben, sondern kann unabhängig festgelegt werden. In den angeführten Beispielen wurde als Gewinn im Sinne des Shapley-Wertes die Konversionsrate festgesetzt. Alternativ kann allerdings zum Beispiel auch der durch die Konversionen generierte Nettoumsatz als Shapley-Gewinn herangezogen werden. Oft ist die letztere Version eine geeignete Wahl, wenn der primäre Fokus auf der Bestimmung der Kosten-Umsatz-Relation liegt und der Nettoumsatz daher als die natürlichere Wahl erscheint. Eine Anpassung der Gewinnfunktion ist allerdings jederzeit möglich und eine vergleichende Analyse bezüglich verschiedener Gewinnfunktionen kann weitere wertvolle Einsichten generieren.

Zusammenfassung

Der primäre Vorteil dynamischer Attributionsmodelle liegt darin, dass sie genauere Resultate liefern als die heuristischen Modelle, zu denen auch das Bathtub-Modell gehört. Der Grund dafür ist, dass sowohl das Markov- als auch das Shapley-Wert-Modell ihre Berechnungen nicht anhand von willkürlich festgelegten Gewichten durchführen, sondern die Gewichte der Stationen in den Interaktionspfaden selbstständig anhand der Daten ermitteln. Sie eliminieren folglich den menschlichen Einfluss auf die Analyse und sind den heuristischen Modellen daher klar überlegen. Insbesondere, wenn es um die Berechnung der Kosten-Umsatz-Relation für sehr teure Marketing-Kanäle wie beispielsweise Search-Engine-Advertising (SEA) geht, ist der Einsatz von Modellen der höchsten Präzision geboten, da Fehleinschätzungen zu besonders hohen unnötigen Folgekosten führen.



Bleiben Sie up-to-date mit unserem kostenlosen Newsletter

0 Kommentare

Hinterlassen Sie eine Notiz