Uso de regresiones de Excel para comprender mejor los KPI
Publicado: 2021-10-23Un grupo de nosotros aquí en Hanapin participamos recientemente en un curso gratuito de Excel de 21 días dirigido por el reconocido experto en Microsoft Excel, el Dr. Wayne Winston. El curso en sí parecía lento al principio, pero finalmente reveló varias capacidades de Excel que nunca había conocido. Lo más emocionante de estos, para mí, es la capacidad de retroceder múltiples variables sin un software estadístico avanzado (como STATA). En esta publicación, compartiré el paso a paso para configurar y ejecutar regresiones en Excel, y cómo esta herramienta puede ayudarlo en sus análisis de PPC y administración de cuentas.
Disculpe, retrocedo
Antes de profundizar en la implementación técnica, es posible que se pregunte: "¿Qué demonios es una regresión?" En resumen, las regresiones analizan las relaciones entre variables. Para cualquier variable dependiente (“Y”), ¿qué conjunto de variables independientes (“X”) contribuyen a la variación Y, y cuánto de ese comportamiento explica el modelo de regresión? (Consulte aquí para obtener una revisión en profundidad de los análisis de regresión)
Las regresiones lineales (o regresiones lineales múltiples) son las más comunes y encajan en una ecuación sumada de la forma:

donde Y es la variable dependiente, X 1 - X n representan un conjunto de n variables independientes y A 1 - A n son las constantes de coeficientes correspondientes a X 1 - X n . Esta es la construcción de modelos estadísticos básicos, por lo que reconocemos que habrá alguna inconsistencia entre nuestros resultados predichos y observados para cada iteración "y". Por lo tanto, se agrega el término de error "+ e" para tener en cuenta dicha variación.
¿Por qué retroceder en PPC?
Las regresiones se pueden utilizar en cualquier número de análisis. Por ejemplo, es posible que desee considerar el efecto que tienen los cambios en la oferta de CPC en Posición, porcentaje de impresiones perdidas o nivel de calidad. Puede examinar qué elemento (CTR esperado, experiencia en la página de destino o relevancia del anuncio) tiene el mayor impacto en el nivel de calidad de su cuenta, campaña o palabra clave. Tal vez, como veremos en el siguiente ejemplo, desee descubrir la función que desempeñan los CPC de búsqueda y de display y las tasas de conversión en el CPA general de su cuenta.
Cualquiera que sea su objetivo final, el proceso para configurar y determinar el valor de su modelo de regresión es el mismo.
Paso 1: prepare sus datos
Como ocurre con cualquier análisis, un buen resultado requiere datos de calidad que se hayan preparado correctamente. Para obtener buenos resultados de regresión, necesita una cantidad suficiente de datos (al menos tantos puntos de datos como el número de variables independientes, pero cuantos más datos tenga disponibles, más preciso puede ser su modelo de regresión). Para aumentar la cantidad de puntos de datos, puede considerar segmentar sus datos por día, semana o mes (según el período de tiempo que se esté examinando).
Para nuestro ejemplo, estamos usando datos de los últimos 24 meses en Adwords. Después de descargar un informe de campaña (segmentado por mes), creamos una tabla dinámica para examinar los clics, el costo y las conversiones por mes y tipo de campaña:

A partir de aquí, podemos calcular el CPA, CPC y CVR para cada red, así como el CPA total. Entonces es solo una copia rápida de los datos y pegarlos en una nueva hoja, ¡estamos listos para comenzar a retroceder!
Paso 2: construya su modelo (elección de variables)
La construcción de modelos tiene dos componentes principales: planificación cuidadosa y revisión flexible. La planificación cuidadosa consiste en considerar qué variables serían las más adecuadas para su modelo de manera lógica (y qué datos están disponibles para su uso). Dedicar un poco más de tiempo a la etapa de planificación puede ahorrarle tiempo y cordura más adelante mientras prueba y vuelve a probar su modelo. Incluso con una preparación cuidadosa, es posible que deba revisar su modelo de manera flexible a medida que retrocede e identifica variables que son significativas y no.
Dos notas importantes al seleccionar variables independientes:
- Las variables independientes deben tener una relación lógica concebible con la variable dependiente (es decir, la precipitación media en Tokio y el número de ataques cardíacos en Wisconsin estarían bajos en mi lista de correlaciones para examinar)
- Las variables independientes no deben estar altamente correlacionadas entre sí (es decir, incluir el costo, los clics y el CPC como variables independientes dentro de la misma regresión causaría un error de multicolinealidad en el modelo)
En nuestro ejemplo, queremos ver qué está impulsando el CPA de nuestra cuenta. Sabemos que hay dos redes en las que publicamos anuncios en AdWords, Búsqueda y Display, y sabemos que las dos variables principales que impulsan el CPA (costo / conversión) para cada red son CPC (costo / clic) y CVR (conversión / clic ).

Por lo tanto, comenzaremos haciendo una regresión de CPA en CPC y CVR para búsqueda y visualización por separado para determinar qué variables independientes son significativas y, por lo tanto, deben incluirse en nuestro modelo final.
Paso 3: retroceder y revisar
Para ejecutar una regresión en Excel:
1. Antes de iniciar la regresión en Excel, primero verifique que las variables independientes (columnas de datos) estén contiguas entre sí.
2. Luego, confirme que el complemento "Analysis ToolPak" está habilitado para Excel (visible en la cinta de "Datos" una vez habilitado).
3. Dentro de la caja de herramientas Análisis de datos, seleccione "Regresión".

4. Ingrese su rango de Variables dependientes (Y) y el rango de Variables independientes (X), seleccionando "Etiquetas" si elige incluir los encabezados de columna.
5. Seleccione una ubicación para su resultado de regresión (una hoja de trabajo nueva o existente)
6. Seleccione "residuales" si desea verificar y eliminar valores atípicos en los datos

7. Haga clic en "Aceptar" para ejecutar la regresión. Automáticamente se lo dirigirá a la hoja que contiene el resumen de salida y los detalles.
8. Si el examen del resultado de la regresión revela variables independientes insignificantes (típicamente, los valores p son mayores que .1) o un R-cuadrado menor de lo esperado (ver "A" a continuación), puede repetir el proceso según sea necesario para refinar el modelo.
Paso 4: Comprensión del resultado
Mirar un resumen de resultados por primera vez puede resultar intimidante y desalentador. Para hacerlo más fácil, a continuación se destacan las secciones clave del resultado para ayudarlo a evaluar el modelo que acaba de crear su regresión.

(A) Cuadrado R y Cuadrado R ajustado: Esta es una medida de qué tan bien su modelo "se ajusta" a los datos. En resumen, R Cuadrado indica qué parte de la variación en la Variable dependiente se explica por las Variables independientes elegidas. El cuadrado de R ajustado es básicamente el mismo, pero también considera el número de variables independientes incluidas, lo que proporciona una medida un poco más precisa. (No existe un cuadrado R "bueno" o "correcto", ya que depende del tipo de modelo y datos que esté utilizando, pero cuanto más alto, mejor).
(B) Error estándar: La raíz cuadrada de la suma de las diferencias al cuadrado entre los resultados predichos y reales. Para una distribución normal, aproximadamente el 65% de los residuos (ver “E” a continuación) será menos de un error estándar y el 95% será menos de 2. Los residuos mayores al doble del error estándar generalmente se etiquetan como valores atípicos en los datos.
(C) Coeficientes de variables independientes: Los coeficientes son los términos "A" en su fórmula de regresión. Por lo tanto, para este ejemplo, un aumento de 1 unidad en el CPC debería ser igual a un aumento de 8.4 en el CPA (asumiendo que el CVR permanece constante).
(D) Valor P de las variables independientes: En términos sencillos, el valor P indica la importancia de la variable independiente. Los valores P bajos son significativos (apuntando a menos de .1), mientras que los valores P altos indican que la correlación percibida podría ser pura casualidad. Las variables independientes con valores P altos deben excluirse durante la etapa de “revisión flexible”.
(E) Residuos: muestra la diferencia entre el valor predicho de la variable dependiente para cada iteración y el valor registrado real. Como se mencionó anteriormente, la mayoría de los residuos deben ser menores que 1 Error estándar y casi todos deben ser menores que el valor de 2 * Error estándar. Puede decidir si incluir o excluir los valores atípicos identificados (residuos superiores al doble del error estándar) de su modelo.
Paso 5: Armado (¡La parte de conclusiones!)
Después de ejecutar tres regresiones, encontramos las siguientes tres ecuaciones que relacionan el CPC y el CVR de la Red de Búsqueda y Display con los CPA totales y de red:


Estas ecuaciones verifican lo que ya sabíamos (o creíamos saber): que los CPC y CVR de la Red de Búsqueda y Display están desempeñando un papel importante en el comportamiento de nuestro CPA total. Más allá de eso, sin embargo, también revelaron 3 cosas que un mapa de calor estándar no revelaría.
- Un aumento en el CPC de búsqueda tiene 3.5 veces el impacto en el CPA de búsqueda que un aumento equivalente en el CVR de búsqueda
- Las fluctuaciones en el CPC de la Red de Display tienen casi 5 veces el impacto del CVR de la Red de Display en el CPA de la Red de Display
- En general, los cambios en el rendimiento de la Red de Display afectan el CPA total de manera más dramática que los cambios de una magnitud similar en el rendimiento de la Red de búsqueda.
A partir de esto, queda claro que el CPC de la Red de Display es el objetivo n. ° 1 para la optimización si mi objetivo es reducir el CPA total. Los siguientes son el CPC de búsqueda y el CVR de display, y el CVR de búsqueda es la menor de mis prioridades.
Las regresiones son una herramienta poderosa y una gran adición al cinturón de herramientas del PPC Manager. Este ejemplo básico muestra solo una de las muchas formas en que las regresiones pueden ayudarlo a comprender las relaciones entre sus queridos KPI. Esperamos que pruebe o continúe usando la capacidad de regresión en Excel y comparta su experiencia / pensamientos / hallazgos con nosotros en Twitter.
