Usando regressões do Excel para entender melhor os KPIs

Publicados: 2021-10-23

Um grupo de nós aqui na Hanapin recentemente participou de um curso gratuito de 21 dias do Excel dirigido pelo renomado especialista em Microsoft Excel Dr. Wayne Winston. O curso em si pareceu lento no início, mas acabou revelando vários recursos do Excel que eu nunca conheci. O mais empolgante deles, para mim, é a capacidade de regredir múltiplas variáveis ​​sem um software estatístico avançado (como o STATA). Neste post, compartilharei o passo a passo para configurar e executar regressões no Excel e como essa ferramenta pode ajudar em suas análises de PPC e gerenciamento de contas.

Com licença, eu volto

Antes de nos aprofundarmos na implementação técnica, você pode estar se perguntando: "O que no mundo é uma regressão?" Em suma, as regressões examinam as relações entre as variáveis. Para qualquer variável dependente (“Y”), qual conjunto de variáveis ​​independentes (“Xs”) contribui para a variação Y e quanto desse comportamento o modelo de regressão explica? (Veja aqui uma revisão aprofundada das análises de regressão)

As regressões lineares (ou regressões lineares múltiplas) são as mais comuns, cabendo em uma equação somada da forma:

onde Y é a variável dependente, X 1 - X n representam um conjunto de n variáveis ​​independentes e A 1 - A n são as constantes dos coeficientes correspondentes a X 1 - X n . Esta é a construção de um modelo estatístico básico e, portanto, reconhecemos que haverá alguma inconsistência entre nossos resultados previstos e observados para cada iteração “y”. Assim, o termo de erro “+ e” é adicionado para contabilizar tal variação.

Por que regressar no PPC?

As regressões podem ser usadas em qualquer número de análises. Por exemplo, você pode querer considerar o efeito que as alterações de lance de CPC têm sobre o CPC Posição, Quota de impressão perdida ou Índice de qualidade. Você pode examinar qual elemento (CTR esperada, experiência da página de destino ou relevância do anúncio) tem o maior impacto no Índice de qualidade em sua conta, campanha ou palavra-chave. Talvez, como veremos no exemplo a seguir, você queira descobrir a função que os CPCs e as taxas de conversão das Redes de Pesquisa e Display estão desempenhando no CPA geral de sua conta.

Seja qual for o seu objetivo final, o processo para configurar e determinar o valor do seu modelo de regressão é o mesmo.

Etapa 1: Prepare seus dados

Como acontece com qualquer análise, um bom resultado requer dados de qualidade que foram preparados corretamente. Para bons resultados de regressão, você precisa de uma quantidade suficiente de dados (pelo menos tantos pontos de dados quanto o número de variáveis ​​independentes, mas quanto mais dados você tiver disponível, mais preciso seu modelo de regressão pode ser). Para aumentar o número de pontos de dados, você pode considerar segmentar seus dados por dia, semana ou mês (dependendo do período de tempo que está sendo examinado).

Para nosso exemplo, estamos usando dados dos últimos 24 meses no Adwords. Depois de baixar um relatório de campanha (segmentado por mês), criamos uma tabela dinâmica para examinar cliques, custo e conversões por mês e tipo de campanha:

A partir daqui, podemos calcular o CPA, CPC e CVR para cada rede, bem como o CPA total. Então, basta copiar e colar rapidamente os dados em uma nova planilha, estamos prontos para começar a regredir!

Etapa 2: construir seu modelo (escolhendo variáveis)

A construção de modelos tem dois componentes principais: planejamento cuidadoso e revisão flexível. O planejamento cuidadoso consiste em considerar quais variáveis ​​seriam mais adequadas para o seu modelo logicamente (e quais dados estão disponíveis para uso). Gastar um pouco mais de tempo no estágio de planejamento pode economizar tempo e sanidade mais tarde, conforme você testa e reteste seu modelo. Mesmo com uma preparação cuidadosa, você ainda pode precisar revisar com flexibilidade seu modelo à medida que faz a regressão e identifica as variáveis ​​que são significativas ou não.

Duas notas importantes ao selecionar variáveis ​​independentes:

  • As variáveis ​​independentes devem ter uma relação lógica concebível com a variável dependente (ou seja, a precipitação média em Tóquio e o número de ataques cardíacos em Wisconsin estariam no mínimo em minha lista de correlações a serem examinadas)
  • As variáveis ​​independentes não devem ser altamente correlacionadas entre si (ou seja, incluir custo, cliques e CPC como variáveis ​​independentes na mesma regressão causaria um erro de multicolinearidade no modelo)

Em nosso exemplo, queremos ver o que está impulsionando o CPA de nossa conta. Sabemos que existem duas redes nas quais exibimos anúncios no Google AdWords - Pesquisa e Display - e sabemos que as duas variáveis ​​principais que impulsionam o CPA (custo / conversão) para cada rede são CPC (custo / clique) e CVR (conversão / clique )

Portanto, começaremos regredindo CPA em CPC e CVR para Pesquisa e Display separadamente para determinar quais variáveis ​​independentes são significativas e, portanto, devem ser incluídas em nosso modelo final.

Etapa 3: retroceder e revisar

Para executar uma regressão no Excel:

1. Antes de iniciar a regressão no Excel, primeiro verifique se as variáveis ​​independentes (colunas de dados) são vizinhas.

2. Em seguida, confirme se o complemento “Analysis ToolPak” está habilitado para Excel (visível na faixa de opções “Dados” uma vez habilitado).

3. Na caixa de ferramentas de Análise de Dados, selecione “Regressão”.

4. Insira seu intervalo de Variável Dependente (Y) e intervalo de Variáveis ​​Independentes (X), selecionando "Rótulos" se você optar por incluir os cabeçalhos de coluna

5. Selecione um posicionamento para a saída de regressão (uma planilha nova ou existente)

6. Selecione "residuais" se quiser verificar e remover outliers nos dados

7. Clique em “OK” para executar a regressão. Você será automaticamente navegado para a planilha que contém o resumo e os detalhes da saída.

8. Se o exame da saída da regressão revelar variáveis ​​independentes insignificantes (normalmente, os valores p são maiores que 0,1) ou um R quadrado menor do que o esperado (consulte "A" abaixo), você pode repetir o processo conforme necessário para refine o modelo.

Etapa 4: Compreendendo o resultado

Olhar para um Resumo de Saída pela primeira vez pode ser intimidante e desanimador. Para facilitar, destacadas abaixo estão as seções principais da saída para ajudá-lo a avaliar o modelo que sua regressão acabou de construir.

(A) R Quadrado e R Quadrado Ajustado: Esta é uma medida de quão bem o seu modelo “se ajusta” aos dados. Resumindo, R Square informa o quanto da variação na Variável Dependente é explicada pelas Variáveis ​​Independentes escolhidas. O R Square ajustado é basicamente o mesmo, mas também considera o número de variáveis ​​independentes incluídas, fornecendo uma medida um pouco mais precisa. (Não existe um R Square “bom” ou “correto”, pois depende do tipo de modelo e dados que você está usando, mas quanto maior, melhor).

(B) Erro padrão: A raiz quadrada da soma das diferenças quadradas entre os resultados previstos e reais. Para uma distribuição normal, cerca de 65% dos resíduos (consulte “E” abaixo) serão menores que um Erro Padrão e 95% serão menores que 2. Resíduos maiores que duas vezes o Erro Padrão são tipicamente rotulados como outliers nos dados.

(C) Coeficientes de variáveis ​​independentes: os coeficientes são os termos “A” em sua fórmula de regressão. Assim, para este exemplo, um aumento de 1 unidade no CPC deve ser igual a um aumento de 8,4 no CPA (assumindo que o CVR permaneça constante).

(D) Valor P das Variáveis ​​Independentes: Em termos leigos, o valor P indica a significância da variável independente. Os valores P baixos são significativos (visando menos de .1), enquanto os valores P altos indicam que a correlação percebida pode ser puro acaso. Variáveis ​​independentes com altos valores de P devem ser excluídas durante o estágio de “revisão flexível”.

(E) Resíduos: Mostra a diferença entre o valor previsto da Variável Dependente para cada iteração e o valor real registrado. Conforme mencionado acima, a maioria dos resíduos deve ser menor que 1 Erro Padrão e quase todos devem ser menores que o valor de 2 * Erro Padrão. Você pode decidir se deseja incluir ou excluir quaisquer outliers identificados (residuais maiores que duas vezes o erro padrão) de seu modelo.

Etapa 5: juntando tudo (a parte para levar!)

Depois de executar três regressões, encontramos as três equações a seguir, relacionando o CPC e CVR da Rede de Pesquisa e Display à rede e CPAs totais:

Essas equações verificam o que já sabíamos (ou pensávamos que sabíamos): que os CPCs e CVRs da Rede de Pesquisa e Display estão todos desempenhando um papel significativo no comportamento de nosso CPA total. Além disso, no entanto, eles também revelaram 3 coisas que um mapa de calor padrão não revelaria.

  • Um aumento no CPC de pesquisa tem 3,5 vezes mais impacto no CPA de pesquisa do que um aumento equivalente na CVR de pesquisa
  • As flutuações no CPC da Rede de Display têm quase 5x o impacto do CVR da Rede de Display no CPA da Rede de Display
  • Em geral, as mudanças no desempenho da Rede de Display afetam o CPA total de forma mais dramática do que mudanças de magnitude semelhante no desempenho da Rede de Pesquisa

A partir disso, fica claro que o CPC da Rede de Display é o alvo nº 1 para otimização se meu objetivo for reduzir o CPA total. O CPC de pesquisa e o CVR de exibição são os próximos, sendo o CVR de pesquisa a menor das minhas prioridades.

As regressões são uma ferramenta poderosa e um ótimo complemento para o cinto de ferramentas do Gerenciador de PPC. Este exemplo básico mostra apenas uma das muitas maneiras pelas quais as regressões podem ajudá-lo a entender as relações entre seus amados KPIs. Esperamos que você teste ou continue usando o recurso de regressão no Excel e compartilhe sua experiência / pensamentos / descobertas conosco no Twitter!