Verwenden von Excel-Regressionen zum besseren Verständnis von KPIs

Veröffentlicht: 2021-10-23

Eine Gruppe von uns hier bei Hanapin hat kürzlich an einem kostenlosen 21-tägigen Excel-Kurs teilgenommen, der vom renommierten Microsoft Excel-Experten Dr. Wayne Winston geleitet wurde. Der Kurs selbst fühlte sich zunächst langsam an, enthüllte aber letztendlich mehrere Excel-Funktionen, die ich noch nie gekannt hatte. Am aufregendsten ist für mich die Fähigkeit, mehrere Variablen ohne eine fortschrittliche Statistiksoftware (wie STATA) zu regressieren. In diesem Beitrag teile ich die Schritt-für-Schritt-Anleitung zum Einrichten und Ausführen von Regressionen in Excel und wie dieses Tool bei Ihren PPC-Analysen und der Kontoverwaltung helfen kann.

Entschuldigung, ich mache Rückschritte

Bevor wir uns mit der technischen Umsetzung befassen, fragen Sie sich vielleicht: „Was in aller Welt ist eine Regression?“ Kurz gesagt, Regressionen betrachten die Beziehungen zwischen Variablen. Welcher Satz unabhängiger Variablen („Xs“) trägt für jede abhängige Variable („Y“) zur Variation Y bei und wie viel von diesem Verhalten erklärt das Regressionsmodell? (Siehe hier für einen ausführlichen Überblick über Regressionsanalysen)

Lineare Regressionen (oder multiple lineare Regressionen) sind die gebräuchlichsten und passen in eine Summengleichung der Form:

wobei Y die abhängige Variable ist, X 1 – X n eine Menge von n unabhängigen Variablen darstellen und A 1 – A n die Koeffizientenkonstanten sind, die X 1 – X n entsprechen . Dies ist eine grundlegende statistische Modellerstellung, und daher erkennen wir, dass es bei jeder „y“-Iteration eine gewisse Inkonsistenz zwischen unseren vorhergesagten und beobachteten Ergebnissen geben wird. Daher wird der Fehlerterm „+e“ hinzugefügt, um eine solche Varianz zu berücksichtigen.

Warum Regress in PPC?

Regressionen können in beliebig vielen Analysen verwendet werden. Überlegen Sie beispielsweise, welche Auswirkungen CPC-Gebotsänderungen auf den durchschnittlichen Wert haben. Position, Anteil an entgangenen Impressionen oder Qualitätsfaktor. Sie können prüfen, welches Element (erwartete Klickrate, Nutzererfahrung auf der Zielseite oder Anzeigenrelevanz) den stärksten Einfluss auf Ihren Qualitätsfaktor auf Konto-, Kampagnen- oder Keyword-Ebene hat. Wie wir im folgenden Beispiel sehen werden, möchten Sie vielleicht herausfinden, welche Rolle Such- und Display-CPCs sowie Conversion-Raten beim Gesamt-CPA für Ihr Konto spielen.

Was auch immer Ihr Endziel ist, der Prozess zum Einrichten und Bestimmen des Wertes Ihres Regressionsmodells ist der gleiche.

Schritt 1: Bereiten Sie Ihre Daten vor

Wie bei jeder Analyse erfordert ein gutes Ergebnis qualitativ hochwertige Daten, die korrekt aufbereitet wurden. Für eine gutes Regressionsergebnis, müssen Sie eine ausreichende Menge an Daten (zumindest so viele Datenpunkte als die Anzahl der unabhängigen Variablen, aber je mehr Daten , die Sie zur Verfügung haben, desto genaues Regressionsmodell kann). Um die Anzahl der Datenpunkte zu erhöhen, können Sie Ihre Daten nach Tag, Woche oder Monat (je nach untersuchtem Zeitrahmen) segmentieren.

Für unser Beispiel verwenden wir Daten der letzten 24 Monate in Adwords. Nachdem wir einen (nach Monat segmentierten) Kampagnenbericht heruntergeladen haben, erstellen wir eine Pivot-Tabelle, um Klicks, Kosten und Conversions nach Monat und Kampagnentyp zu untersuchen:

Von hier aus können wir CPA, CPC und CVR für jedes Netzwerk sowie den Gesamt-CPA berechnen. Dann ist es nur noch ein schnelles Kopieren und Einfügen der Daten in ein neues Blatt, und wir können mit der Regression beginnen!

Schritt 2: Erstellen Sie Ihr Modell (Auswahl von Variablen)

Der Modellbau hat zwei Hauptkomponenten: durchdachte Planung und flexible Überarbeitung. Bei einer durchdachten Planung geht es darum, zu überlegen, welche Variablen logisch am besten zu Ihrem Modell passen (und welche Daten zur Verwendung verfügbar sind). Wenn Sie in der Planungsphase etwas mehr Zeit investieren, können Sie später beim Testen und erneuten Testen Ihres Modells Zeit und Nerven sparen. Selbst bei sorgfältiger Vorbereitung müssen Sie Ihr Modell möglicherweise noch flexibel überarbeiten, während Sie sich zurückbilden und signifikante und nicht signifikante Variablen identifizieren.

Zwei wichtige Hinweise bei der Auswahl unabhängiger Variablen:

  • Unabhängige Variablen sollten eine denkbare, logische Beziehung zu der abhängigen Variablen haben (dh der durchschnittliche Niederschlag in Tokio und die Anzahl der Herzinfarkte in Wisconsin wären auf meiner Liste der zu untersuchenden Korrelationen weit unten).
  • Unabhängige Variablen sollten nicht stark miteinander korreliert sein (dh die Einbeziehung von Kosten, Klicks und CPC als unabhängige Variablen innerhalb derselben Regression würde einen Multikollinearitätsfehler im Modell verursachen).

In unserem Beispiel möchten wir uns ansehen, was unseren Konto-CPA antreibt. Wir wissen, dass es zwei Netzwerke gibt, in denen wir Anzeigen in AdWords schalten – Such- und Displaynetzwerk – und wir wissen, dass die beiden Hauptvariablen, die den CPA (Kosten/Conversion) für jedes Netzwerk bestimmen, CPC (Kosten/Klick) und CVR (Conversion/Klick) sind ).

Daher werden wir zunächst den CPA für CPC und CVR für Search und Display separat regressieren, um zu bestimmen, welche unabhängigen Variablen signifikant sind und daher in unser endgültiges Modell aufgenommen werden sollten.

Schritt 3: Regress und überarbeiten

So führen Sie eine Regression in Excel aus:

1. Bevor Sie die Regression in Excel starten, überprüfen Sie zunächst, ob die unabhängigen Variablen (Datenspalten) benachbart sind.

2. Bestätigen Sie als nächstes, dass das Add-on „Analysis ToolPak“ für Excel aktiviert ist (sichtbar im Menüband „Daten“, sobald es aktiviert ist).

3. Wählen Sie in der Toolbox zur Datenanalyse „Regression“.

4. Geben Sie den Bereich der abhängigen Variablen (Y) und den Bereich der unabhängigen Variablen (X) ein und wählen Sie „Labels“, wenn Sie die Spaltenüberschriften einschließen möchten

5. Wählen Sie eine Platzierung für Ihre Regressionsausgabe (ein neues oder vorhandenes Arbeitsblatt)

6. Wählen Sie „Reste“, wenn Sie Ausreißer in den Daten suchen und entfernen möchten

7. Klicken Sie auf „OK“, um die Regression auszuführen. Sie werden automatisch zu dem Blatt mit der Ausgabezusammenfassung und den Details navigiert.

8. Wenn die Untersuchung der Regressionsausgabe unbedeutende unabhängige Variablen (normalerweise ist der p-Wert größer als 0,1) oder ein niedriger als erwartetes R-Quadrat (siehe „A“ unten) aufdeckt, können Sie den Vorgang nach Bedarf wiederholen, um das Modell verfeinern.

Schritt 4: Die Ausgabe verstehen

Wenn Sie sich zum ersten Mal eine Zusammenfassung ansehen, kann dies einschüchternd und entmutigend sein. Zur Vereinfachung sind unten die wichtigsten Abschnitte der Ausgabe hervorgehoben, die Ihnen bei der Bewertung des Modells helfen, das Ihre Regression gerade erstellt hat.

(A) R-Quadrat und bereinigtes R-Quadrat: Dies ist ein Maß dafür, wie gut Ihr Modell zu den Daten passt. Kurz gesagt, R-Quadrat gibt an, wie viel der Variation der abhängigen Variablen durch die ausgewählten unabhängigen Variablen erklärt wird. Das bereinigte R-Quadrat ist im Wesentlichen gleich, berücksichtigt jedoch auch die Anzahl der enthaltenen unabhängigen Variablen, was ein etwas genaueres Maß bietet. (Es gibt kein „gutes“ oder „richtiges“ R-Quadrat, da es von der Art des verwendeten Modells und den Daten abhängt, die Sie verwenden, aber je höher, desto besser).

(B) Standardfehler: Die Quadratwurzel der Summe der quadrierten Differenzen zwischen den vorhergesagten und den tatsächlichen Ergebnissen. Bei einer Normalverteilung sind ungefähr 65 % der Residuen (siehe „E“ unten) kleiner als ein Standardfehler und 95 % kleiner als 2. Residuen, die größer als das Doppelte des Standardfehlers sind, werden in den Daten normalerweise als Ausreißer gekennzeichnet.

(C) Koeffizienten unabhängiger Variablen: Koeffizienten sind die „A“-Terme in Ihrer Regressionsformel. Somit sollte in diesem Beispiel eine Erhöhung des CPC um 1 Einheit einer Erhöhung des CPA um 8,4 entsprechen (unter der Annahme, dass der CVR konstant bleibt).

(D) P-Wert unabhängiger Variablen: In Laien ausgedrückt sagt der P-Wert die Bedeutung der unabhängigen Variablen aus. Niedrige P-Werte sind signifikant (mit dem Ziel von weniger als 0,1), während hohe P-Werte darauf hindeuten, dass die wahrgenommene Korrelation reiner Zufall sein könnte. Unabhängige Variablen mit hohen P-Werten sollten während der Phase „flexible Überarbeitung“ ausgeschlossen werden.

(E) Residuen: Dies zeigt die Differenz zwischen dem vorhergesagten Wert der abhängigen Variablen für jede Iteration und dem tatsächlich aufgezeichneten Wert. Wie oben erwähnt, sollten die meisten Residuen kleiner als 1 Standardfehler sein und fast alle sollten kleiner als der Wert von 2 * Standardfehler sein. Sie können entscheiden, ob identifizierte Ausreißer (Restwerte größer als das Doppelte des Standardfehlers) in Ihr Modell eingeschlossen oder ausgeschlossen werden sollen.

Schritt 5: Zusammenbauen (Der Takeaway-Teil!)

Nach drei Regressionen haben wir die folgenden drei Gleichungen gefunden, die den Such- und Display-CPC und den CVR mit den Netzwerk- und Gesamt-CPAs in Beziehung setzen:

Diese Gleichungen bestätigen, was wir bereits wussten (oder zu wissen glaubten): dass Such- und Display-CPCs sowie CVRs eine bedeutende Rolle für das Verhalten unseres Gesamt-CPAs spielen. Darüber hinaus enthüllten sie jedoch auch 3 Dinge, die eine Standard-Heatmap nicht würde.

  • Ein Anstieg des CPC im Suchnetzwerk hat 3,5-mal höhere Auswirkungen auf den CPA im Suchnetzwerk als ein entsprechender Anstieg des CVR im Suchnetzwerk
  • Schwankungen des Display-CPC haben fast das Fünffache des Einflusses des Display-CVR auf den Display-CPA
  • Insgesamt wirken sich Verschiebungen bei der Leistung des Displaynetzwerks stärker auf den Gesamt-CPA aus als vergleichbare Verschiebungen bei der Leistung des Suchnetzwerks

Daraus geht hervor, dass der Display-CPC das beste Optimierungsziel ist, wenn ich den Gesamt-CPA reduzieren möchte. Search CPC und Display CVR sind die nächsten, wobei Search CVR die geringste meiner Prioritäten ist.

Regressionen sind ein mächtiges Werkzeug und eine großartige Ergänzung des Werkzeuggürtels des PPC-Managers. Dieses grundlegende Beispiel zeigt nur eine von vielen Möglichkeiten, wie Regressionen Ihnen helfen können, die Beziehungen zwischen Ihren beliebten KPIs zu verstehen. Wir hoffen, dass Sie die Regressionsfunktion in Excel testen oder weiterhin verwenden und Ihre Erfahrungen/Gedanken/Erkenntnisse mit uns auf Twitter teilen!