Excel 회귀를 사용하여 KPI를 더 잘 이해하기
게시 됨: 2021-10-23여기 Hanapin의 우리 그룹은 최근에 유명한 Microsoft Excel 전문가 Dr. Wayne Winston이 지도하는 무료 21일 Excel 과정에 참여했습니다. 과정 자체는 처음에는 느리다고 느꼈지만 궁극적으로 내가 결코 알지 못했던 여러 Excel 기능을 드러냈습니다. 이 중에서 가장 흥미로운 것은 고급 통계 소프트웨어(STATA와 같은) 없이 여러 변수를 회귀할 수 있다는 것입니다. 이 게시물에서는 Excel에서 회귀를 설정하고 실행하는 방법과 이 도구가 PPC 분석 및 계정 관리에 어떻게 도움이 되는지 단계별로 공유합니다.
죄송합니다. 퇴보합니다.
기술 구현에 대해 알아보기 전에 "도대체 회귀란 무엇인가?" 요컨대, 회귀는 변수 간의 관계를 살펴봅니다. 모든 종속 변수("Y")에 대해 어떤 독립 변수 집합("X")이 변동 Y에 기여하며 회귀 모델이 해당 동작을 얼마나 설명합니까? (회귀 분석에 대한 심층 검토는 여기를 참조하십시오)
선형 회귀(또는 다중 선형 회귀)는 다음 형식의 합산 방정식에 맞는 가장 일반적입니다.

여기서 Y는 종속 변수이고 X 1 – X n 은 n개의 독립 변수 집합을 나타내고 A 1 – An 은 X 1 – X n 에 해당하는 계수 상수입니다. 이것은 기본적인 통계 모델 구축이므로 각 "y" 반복에 대해 예측된 결과와 관찰된 결과 간에 약간의 불일치가 있음을 인식합니다. 따라서 이러한 편차를 설명하기 위해 오류 용어 " + e"가 추가됩니다.
PPC에서 회귀하는 이유는 무엇입니까?
회귀는 여러 분석에 사용할 수 있습니다. 예를 들어 CPC 입찰가 변경이 평균에 미치는 영향을 고려할 수 있습니다. 게재순위, 상실 노출 점유율 또는 품질평가점수 계정, 캠페인 또는 키워드 수준 품질평가점수에 가장 큰 영향을 미치는 요소(예상 CTR, 방문 페이지 만족도 또는 광고 관련성)를 조사할 수 있습니다. 아래 예에서 볼 수 있듯이 계정의 전체 CPA에서 검색 및 디스플레이 CPC와 전환율이 어떤 역할을 하는지 알아내고 싶을 수도 있습니다.
최종 목표가 무엇이든 회귀 모델의 값을 설정하고 결정하는 프로세스는 동일합니다.
1단계: 데이터 준비
모든 분석과 마찬가지로 좋은 결과를 얻으려면 올바르게 준비된 양질의 데이터가 필요합니다. 좋은 회귀 결과를 얻으려면 충분한 양 의 데이터가 필요합니다(적어도 독립 변수의 수만큼 많은 데이터 요소가 필요하지만 사용 가능한 데이터가 많을수록 회귀 모델이 더 정확할 수 있음). 데이터 요소 수를 늘리려면 데이터를 일, 주 또는 월별로 분류하는 것을 고려할 수 있습니다(검토 중인 기간에 따라 다름).
이 예에서는 Adwords에서 지난 24개월의 데이터를 사용하고 있습니다. 캠페인 보고서(월별로 분류됨)를 다운로드한 후 월별 및 캠페인 유형별로 클릭수, 비용 및 전환수를 조사하는 피벗 테이블을 만듭니다.

여기에서 각 네트워크에 대한 CPA, CPC 및 CVR과 총 CPA를 계산할 수 있습니다. 그런 다음 데이터를 새 시트에 빠르게 복사하여 붙여넣으면 됩니다. 이제 회귀를 시작할 준비가 되었습니다.
2단계: 모델 구축(변수 선택)
모델 구축에는 신중한 계획과 유연한 수정이라는 두 가지 주요 구성 요소가 있습니다. 사려 깊은 계획은 논리적으로 모델에 가장 적합한 변수(및 사용할 수 있는 데이터)를 고려하는 것입니다. 계획 단계에서 약간의 추가 시간을 투자하면 나중에 모델을 테스트하고 다시 테스트할 때 시간과 정신을 절약할 수 있습니다. 주의 깊게 준비하더라도 회귀하고 유의미한 변수와 그렇지 않은 변수를 식별할 때 모델을 유연하게 수정해야 할 수도 있습니다.
독립 변수를 선택할 때 두 가지 중요한 참고 사항:
- 독립 변수 는 종속 변수에 대해 생각할 수 있고 논리적인 관계가 있어야 합니다(즉, 도쿄의 평균 강우량과 위스콘신의 심장 발작 횟수는 조사할 상관 관계 목록에서 낮을 것입니다)
- 독립 변수 는 서로 높은 상관 관계가 없어야 합니다 (예: 동일한 회귀 내에서 독립 변수로 비용, 클릭 및 CPC를 포함하면 모델에서 다중 공선성 오류가 발생함).
이 예에서는 계정 CPA를 유도하는 요인을 살펴보고자 합니다. 애드워즈에서 광고를 실행하는 네트워크는 검색 및 디스플레이의 두 가지이며 각 네트워크의 CPA(비용/전환)를 유도하는 두 가지 주요 변수는 CPC(비용/클릭) 및 CVR(전환/클릭)이라는 것을 알고 있습니다. ).

따라서 CPC에 대한 CPA와 검색 및 디스플레이에 대한 CVR을 별도로 회귀하여 어떤 독립 변수가 유의하고 따라서 최종 모델에 포함되어야 하는지 결정하는 것으로 시작합니다.
3단계: 회귀 및 수정
Excel에서 회귀를 실행하려면:
1. Excel에서 회귀를 시작하기 전에 먼저 독립변수(데이터 열)가 서로 인접하는지 확인합니다.
2. 그런 다음 Excel에 대해 "Analysis ToolPak" 추가 기능이 활성화되어 있는지 확인합니다(활성화되면 "데이터" 리본에서 볼 수 있음).
3. 데이터 분석 도구 상자에서 "회귀"를 선택합니다.

4. 종속 변수(Y) 범위와 독립 변수(X) 범위를 입력하고 열 머리글을 포함하도록 선택한 경우 "레이블"을 선택합니다.
5. 회귀 결과에 대한 배치를 선택하십시오(새 워크시트 또는 기존 워크시트).
6. 데이터에서 이상치를 확인하고 제거하려면 "잔차"를 선택하십시오.

7. "확인"을 클릭하여 회귀를 실행합니다. 출력 요약 및 세부 정보가 포함된 시트로 자동으로 이동됩니다.
8. 회귀 결과를 조사한 결과 중요하지 않은 독립 변수(일반적으로 p-값이 .1보다 큼) 또는 예상보다 작은 R-제곱(아래 "A" 참조)이 밝혀지면 필요에 따라 프로세스를 반복할 수 있습니다. 모델을 수정합니다.
4단계: 출력 이해하기
요약 출력을 처음 보는 것은 두렵고 낙담할 수 있습니다. 더 쉽게 하기 위해 아래에 강조 표시된 출력의 주요 섹션은 회귀 분석에서 만든 모델을 평가하는 데 도움이 됩니다.

(A) R 제곱 및 조정된 R 제곱: 모델이 데이터를 얼마나 잘 "맞추는지" 측정합니다. 간단히 말해서, R Square는 종속 변수의 변동이 선택된 독립 변수에 의해 설명되는 정도를 알려줍니다. 조정된 R 제곱은 기본적으로 동일하지만 포함된 독립 변수의 수도 고려하여 약간 더 정확한 측정을 제공합니다. ("좋은" 또는 "올바른" R Square는 사용 중인 모델 및 데이터 유형에 따라 다르지만 높을수록 좋습니다.
(B) 표준 오차: 예측 결과와 실제 결과 간의 차이 제곱합의 제곱근. 정규 분포의 경우 잔차의 약 65%(아래 "E" 참조)는 1 표준 오차 미만이고 95%는 2 미만입니다. 표준 오차의 2배보다 큰 잔차는 일반적으로 데이터에서 이상치로 레이블이 지정됩니다.
(C) 독립 변수의 계수: 계수는 회귀 공식에서 "A" 용어입니다. 따라서 이 예의 경우 CPC가 1단위 증가하면 CPA가 8.4 증가해야 합니다(CVR이 일정하게 유지된다고 가정).
(D) 독립변수의 P-값: 평신도의 용어로 P-값은 독립변수의 중요성을 알려줍니다. 낮은 P 값은 중요하지만(.1 미만을 목표로 함) 높은 P 값은 인지된 상관 관계가 순수한 기회일 수 있음을 나타냅니다. P-값이 높은 독립 변수는 "유연한 수정" 단계에서 제외해야 합니다.
(E) 잔차: 각 반복에 대한 종속 변수의 예측 값과 실제 기록된 값 간의 차이를 보여줍니다. 위에서 언급했듯이 대부분의 잔차는 1 표준 오차보다 작아야 하고 거의 모든 것이 2 * 표준 오차 값보다 작아야 합니다. 모델에서 식별된 이상값(표준 오차의 두 배보다 큰 잔차)을 포함할지 제외할지 결정할 수 있습니다.
5단계: 합치기(요점 부분!)
세 번의 회귀 분석을 실행한 후 검색 및 디스플레이 CPC 및 CVR을 네트워크 및 총 CPA와 관련시키는 다음 세 방정식을 찾았습니다.


이 방정식은 검색 및 디스플레이 CPC 및 CVR이 모두 총 CPA의 행동에 중요한 역할을 한다는 사실을 이미 알고 있거나 생각했던 것을 확인합니다. 그러나 그 외에도 표준 히트맵에는 없는 3가지 사항도 공개했습니다.
- 검색 CPC의 증가는 검색 CVR의 동일한 증가보다 검색 CPA에 3.5배 영향을 미칩니다.
- 디스플레이 CPC의 변동이 디스플레이 CPA에 미치는 영향은 디스플레이 CVR의 거의 5배입니다.
- 전반적으로 디스플레이 네트워크 실적의 변화는 검색 네트워크 실적의 유사한 규모 변화보다 총 CPA에 더 큰 영향을 미칩니다.
이를 통해 총 CPA를 줄이는 것이 목표라면 디스플레이 CPC가 최적화 대상 1위라는 것이 분명합니다. 검색 CPC와 디스플레이 CVR이 그 다음이고 검색 CVR이 가장 우선순위가 낮습니다.
회귀는 강력한 도구이며 PPC 관리자의 도구 벨트에 추가됩니다. 이 기본 예는 회귀가 사랑하는 KPI 간의 관계를 이해하는 데 도움이 될 수 있는 많은 방법 중 하나일 뿐입니다. Excel에서 회귀 기능을 테스트하거나 계속 사용하고 경험/생각/결과를 Twitter에서 공유하기를 바랍니다.
