Utilizzo delle regressioni di Excel per comprendere meglio i KPI

Pubblicato: 2021-10-23

Un gruppo di noi qui ad Hanapin ha recentemente partecipato a un corso Excel gratuito di 21 giorni diretto dal rinomato esperto di Microsoft Excel Dr. Wayne Winston. Il corso stesso all'inizio sembrava lento, ma alla fine ha rivelato diverse funzionalità di Excel che non avevo mai conosciuto. Il più eccitante di questi, per me, è la capacità di regredire più variabili senza un software statistico avanzato (come STATA). In questo post, condividerò passo dopo passo l'impostazione e l'esecuzione di regressioni in Excel e come questo strumento può aiutare nelle analisi PPC e nella gestione dell'account.

Scusami, sto regredendo

Prima di approfondire l'implementazione tecnica, potresti chiederti: "Che cosa diavolo è una regressione?" In breve, le regressioni esaminano le relazioni tra le variabili. Per ogni variabile dipendente ("Y"), quale insieme di variabili indipendenti ("X") contribuisce alla variazione Y e quanto di tale comportamento spiega il modello di regressione? (Vedi qui per una revisione approfondita delle analisi di regressione)

Le regressioni lineari (o regressioni lineari multiple) sono le più comuni e si adattano a un'equazione sommata della forma:

dove Y è la variabile dipendente, X 1 – X n rappresentano un insieme di n variabili indipendenti e A 1 – A n sono le costanti dei coefficienti corrispondenti a X 1 – X n . Questa è la costruzione di modelli statistici di base e quindi riconosciamo che ci sarà una certa incoerenza tra i nostri risultati previsti e osservati per ogni iterazione "y". Pertanto, il termine di errore " + e" viene aggiunto per tenere conto di tale varianza.

Perché regredire in PPC?

Le regressioni possono essere utilizzate in qualsiasi numero di analisi. Ad esempio, potresti considerare quale effetto hanno le modifiche all'offerta CPC su Avg. Posizione, quota impressioni perse o punteggio di qualità. Puoi esaminare quale elemento (CTR previsto, esperienza sulla pagina di destinazione o pertinenza dell'annuncio) ha l'impatto maggiore sul punteggio di qualità a livello di account, campagna o parola chiave. Forse, come vedremo nell'esempio seguente, vuoi scoprire il ruolo che i CPC di ricerca e visualizzazione e i tassi di conversione stanno svolgendo nel CPA complessivo del tuo account.

Qualunque sia il tuo obiettivo finale, il processo per impostare e determinare il valore del tuo modello di regressione è lo stesso.

Passaggio 1: prepara i tuoi dati

Come per qualsiasi analisi, un buon risultato richiede dati di qualità che siano stati preparati correttamente. Per ottenere buoni risultati di regressione, hai bisogno di una quantità sufficiente di dati (almeno tanti punti dati quante sono le variabili indipendenti, ma più dati hai a disposizione, più accurato può essere il tuo modello di regressione). Per aumentare il numero di punti dati, potresti prendere in considerazione la segmentazione dei dati per giorno, settimana o mese (a seconda dell'intervallo di tempo esaminato).

Per il nostro esempio, utilizziamo i dati degli ultimi 24 mesi in AdWords. Dopo aver scaricato un report della campagna (segmentato per mese), creiamo una tabella pivot per esaminare clic, costo e conversioni per mese e tipo di campagna:

Da qui, possiamo calcolare CPA, CPC e CVR per ciascuna rete, nonché il CPA totale. Quindi è solo un rapido copia e incolla dei dati in un nuovo foglio, siamo pronti per iniziare a regredire!

Passaggio 2: crea il tuo modello (scelta delle variabili)

La costruzione del modello ha due componenti principali: pianificazione ponderata e revisione flessibile. Una pianificazione ponderata consiste nel considerare quali variabili sarebbero logicamente più adatte al tuo modello (e quali dati sono disponibili per l'uso). Trascorrere un po' di tempo in più nella fase di pianificazione può farti risparmiare tempo e sanità mentale in un secondo momento durante il test e il nuovo test del modello. Anche con un'attenta preparazione, potresti comunque aver bisogno di rivedere in modo flessibile il tuo modello mentre regredisci e identifichi variabili significative e non.

Due note importanti quando si selezionano le variabili indipendenti:

  • Le variabili indipendenti dovrebbero avere una relazione logica e concepibile con la variabile dipendente (ad es. le precipitazioni medie a Tokyo e il numero di infarti nel Wisconsin sarebbero in basso nella mia lista di correlazioni da esaminare)
  • Le variabili indipendenti non devono essere altamente correlate tra loro (ad esempio, l'inclusione di costo, clic e CPC poiché variabili indipendenti all'interno della stessa regressione causerebbe un errore di multicollinearità nel modello)

Nel nostro esempio, vogliamo esaminare cosa sta determinando il CPA del nostro account. Sappiamo che ci sono due reti su cui pubblichiamo annunci in Adwords—Ricerca e Display—e sappiamo che le due principali variabili che determinano il CPA (Costo/Conversione) per ogni rete sono CPC (Costo/Clic) e CVR (Conversione/Clic ).

Pertanto, inizieremo con la regressione del CPA su CPC e CVR per Ricerca e Display separatamente per determinare quali variabili indipendenti sono significative e quindi dovrebbero essere incluse nel nostro modello finale.

Passaggio 3: regredire e rivedere

Per eseguire una regressione in Excel:

1. Prima di avviare la regressione in Excel, verificare innanzitutto che le variabili indipendenti (colonne di dati) siano vicine l'una all'altra.

2. Quindi, confermare che il componente aggiuntivo "Analysis ToolPak" è abilitato per Excel (visibile nella barra multifunzione "Dati" una volta abilitato).

3. All'interno della casella degli strumenti di analisi dei dati, selezionare "Regressione".

4. Inserisci il tuo intervallo di variabili dipendenti (Y) e l'intervallo di variabili indipendenti (X), selezionando "Etichette" se scegli di includere le intestazioni di colonna

5. Seleziona un posizionamento per il tuo output di regressione (un foglio di lavoro nuovo o esistente)

6. Selezionare "residui" se si desidera verificare e rimuovere i valori anomali nei dati

7. Fare clic su "OK" per eseguire la regressione. Verrai automaticamente indirizzato al foglio contenente il riepilogo e i dettagli dell'output.

8. Se l'esame dell'output della regressione rivela variabili indipendenti non significative (in genere, i valori p sono maggiori di .1) o un R-quadro inferiore al previsto (vedere "A" di seguito), è possibile ripetere il processo secondo necessità per perfezionare il modello.

Passaggio 4: comprensione dell'output

Guardare un risultato di riepilogo per la prima volta può intimidire e scoraggiare. Per semplificare, di seguito sono evidenziate le sezioni chiave dell'output per aiutarti a valutare il modello appena creato dalla tua regressione.

(A) R quadrato e R quadrato rettificato: questa è una misura di quanto bene il tuo modello "si adatta" ai dati. In breve, R Square indica quanta parte della variazione nella Variabile Dipendente è spiegata dalle Variabili Indipendenti scelte. R quadrato aggiustato è sostanzialmente lo stesso, ma considera anche il numero di variabili indipendenti incluse, fornendo una misura leggermente più accurata. (Non esiste un quadrato R "buono" o "giusto", in quanto dipende dal tipo di modello e dai dati che stai utilizzando, ma più alto è, meglio è).

(B) Errore standard: la radice quadrata della somma delle differenze al quadrato tra i risultati previsti e quelli effettivi. Per una distribuzione normale, circa il 65% dei residui (vedere "E" di seguito) sarà inferiore a un errore standard e il 95% sarà inferiore a 2. I residui maggiori del doppio dell'errore standard sono generalmente etichettati come valori anomali nei dati.

(C) Coefficienti di variabili indipendenti: i coefficienti sono i termini "A" nella formula di regressione. Pertanto, per questo esempio, un aumento di 1 unità del CPC dovrebbe corrispondere a un aumento di 8,4 del CPA (supponendo che il CVR rimanga costante).

(D) Valore P delle variabili indipendenti: in parole povere, il valore P indica il significato della variabile indipendente. I valori P bassi sono significativi (mirando a meno di .1), mentre i valori P elevati indicano che la correlazione percepita potrebbe essere pura casualità. Le variabili indipendenti con valori P elevati dovrebbero essere escluse durante la fase di "revisione flessibile".

(E) Residui: mostra la differenza tra il valore previsto della variabile dipendente per ogni iterazione e il valore effettivo registrato. Come accennato in precedenza, la maggior parte dei residui dovrebbe essere inferiore a 1 Errore standard e quasi tutti dovrebbero essere inferiori al valore di 2 * Errore standard. Puoi decidere se includere o escludere eventuali outlier identificati (residui maggiori del doppio dell'errore standard) dal tuo modello.

Passaggio 5: metterlo insieme (la parte da asporto!)

Dopo aver eseguito tre regressioni, abbiamo trovato le seguenti tre equazioni relative a CPC e CVR di ricerca e visualizzazione con CPA di rete e totali:

Queste equazioni verificano ciò che già sapevamo (o pensavamo di sapere): che i CPC e i CVR di ricerca e visualizzazione stanno tutti giocando un ruolo significativo nel comportamento del nostro CPA totale. Oltre a ciò, tuttavia, hanno anche rivelato 3 cose che una mappa termica standard non avrebbe.

  • Un aumento del CPC di ricerca ha un impatto 3,5 volte maggiore sul CPA di ricerca rispetto a un aumento equivalente del CVR di ricerca
  • Le fluttuazioni del CPC display hanno quasi 5 volte l'impatto del CVR display sul CPA display
  • Nel complesso, i cambiamenti nelle prestazioni della Rete Display influiscono in modo più significativo sul CPA totale rispetto ai cambiamenti di entità simile nelle prestazioni della rete di ricerca

Da ciò, è chiaro che il CPC display è l'obiettivo numero 1 per l'ottimizzazione se intendo ridurre il CPA totale. CPC di ricerca e CVR di visualizzazione sono i prossimi, con CVR di ricerca l'ultima delle mie priorità.

Le regressioni sono uno strumento potente e un'ottima aggiunta alla cintura degli strumenti di PPC Manager. Questo esempio di base mostra solo uno dei tanti modi in cui le regressioni possono aiutarti a comprendere le relazioni tra i tuoi amati KPI. Ci auguriamo che proverai o continuerai a utilizzare la funzionalità di regressione in Excel e che condividi le tue esperienze/pensieri/scoperte con noi su Twitter!