使用 Excel 回歸更好地理解 KPI
已發表: 2021-10-23我們在 Hanapin 的一群人最近參加了由著名的 Microsoft Excel 專家 Wayne Winston 博士指導的為期 21 天的免費 Excel 課程。 課程本身起初感覺很慢,但最終揭示了一些我從未知道的 Excel 功能。 對我而言,其中最令人興奮的是無需高級統計軟件(如 STATA)即可回歸多個變量的能力。 在這篇文章中,我將分享在 Excel 中設置和運行回歸的分步步驟,以及該工具如何幫助您進行 PPC 分析和帳戶管理。
對不起,我退步了
在我們深入研究技術實現之前,您可能會想,“到底什麼是回歸?” 簡而言之,回歸著眼於變量之間的關係。 對於任何因變量(“Y”),哪組自變量(“Xs”)對變異 Y 有貢獻,回歸模型解釋了多少這種行為? (有關回歸分析的深入回顧,請參見此處)
線性回歸(或多元線性回歸)是最常見的,擬合成以下形式的求和方程:

其中 Y 是因變量,X 1 – X n代表一組n 個自變量,A 1 – A n是對應於 X 1 – X n的係數常數。 這是基本的統計模型構建,因此我們認識到每次“y”迭代的預測結果和觀察結果之間會存在一些不一致。 因此,誤差項“+e”被添加以解釋這種差異。
為什麼在 PPC 中回歸?
回歸可用於任何數量的分析。 例如,您可能需要考慮每次點擊費用出價更改對平均點擊費用的影響。 排名、錯失的印象份額或質量得分。 您可以檢查哪個元素(預期點擊率、著陸頁體驗或廣告相關性)對您的帳戶、廣告系列或關鍵字級別的質量得分影響最大。 也許,正如我們將在下面的示例中看到的,您想了解搜索和展示廣告的每次點擊費用和轉化率在您帳戶的整體每次轉化費用中所起的作用。
無論您的最終目標是什麼,設置和確定回歸模型值的過程都是相同的。
第 1 步:準備數據
與任何分析一樣,一個好的結果需要正確準備的高質量數據。 為了獲得良好的回歸結果,您需要足夠數量的數據(至少與自變量的數量一樣多的數據點,但您可用的數據越多,您的回歸模型就越準確)。 要增加數據點的數量,您可以考慮按天、週或月(取決於所檢查的時間範圍)對數據進行分段。
在我們的示例中,我們在 Adwords 中使用了過去 24 個月的數據。 下載活動報告(按月細分)後,我們創建一個數據透視表以按月和活動類型檢查點擊次數、成本和轉化次數:

從這裡,我們可以計算每個網絡的 CPA、CPC 和 CVR,以及總 CPA。 然後只需將數據快速復制並粘貼到新工作表中,我們就可以開始回歸了!
第 2 步:構建模型(選擇變量)
模型構建有兩個主要組成部分:周到的規劃和靈活的修訂。 深思熟慮的計劃是考慮哪些變量在邏輯上最適合您的模型(以及哪些數據可供使用)。 在計劃階段多花一點時間可以節省您以後測試和重新測試模型的時間和理智。 即使進行了仔細的準備,您可能仍然需要在回歸和識別重要和不重要的變量時靈活地修改模型。
選擇自變量時的兩個重要注意事項:
- 自變量應該與因變量具有可想像的邏輯關係(即東京的平均降雨量和威斯康星州的心髒病發作次數在我要檢查的相關性列表中很低)
- 自變量不應相互高度相關(即,將成本、點擊次數和 CPC 作為自變量包含在同一回歸中會導致模型中的多重共線性錯誤)
在我們的示例中,我們想看看是什麼推動了我們的帳戶 CPA。 我們知道我們在 Adwords 中有兩個投放廣告的網絡——搜索網絡和展示廣告網絡——並且我們知道推動每個網絡的 CPA(成本/轉化)的兩個主要變量是 CPC(成本/點擊)和 CVR(轉化/點擊) )。

因此,我們將首先分別對搜索和展示的 CPC 和 CVR 上的 CPA 進行回歸,以確定哪些自變量是重要的,因此應包含在我們的最終模型中。
第 3 步:回歸和修正
在 Excel 中運行回歸:
1. 在 Excel 中啟動回歸之前,首先檢查以確保自變量(數據列)彼此相鄰。
2. 接下來,確認為 Excel 啟用了“分析工具庫”加載項(啟用後在“數據”功能區中可見)。
3. 在數據分析工具箱中,選擇“回歸”。

4. 輸入您的因變量 (Y) 範圍和自變量 (X) 範圍,如果您選擇包括列標題,請選擇“標籤”
5. 為回歸輸出選擇一個位置(新的或現有的工作表)
6. 如果要檢查和刪除數據中的異常值,請選擇“殘差”

7. 單擊“確定”運行回歸。 您將自動導航到包含輸出摘要和詳細信息的工作表。
8. 如果對回歸輸出的檢查顯示自變量不顯著(通常,p 值大於 .1)或低於預期的 R 平方(參見下面的“A”),您可以根據需要重複該過程以細化模型。
第 4 步:了解輸出
第一次查看摘要輸出可能會令人生畏和沮喪。 為方便起見,下面突出顯示了輸出的關鍵部分,以幫助您評估剛剛構建的回歸模型。

(A) R 方和調整後的 R 方:這是衡量模型“擬合”數據的程度。 簡而言之,R 方告訴您選擇的自變量解釋了因變量中的多少變化。 調整後的 R 方基本相同,但也考慮了包含的自變量的數量,提供了稍微更準確的度量。 (沒有“好”或“正確”的 R 方,因為它取決於您使用的模型和數據的類型,但越高越好)。
(B) 標準誤差:預測結果與實際結果之間的平方差之和的平方根。 對於正態分佈,大約 65% 的殘差(參見下面的“E”)將小於 1 標準誤差,95% 將小於 2。大於標準誤差兩倍的殘差通常被標記為數據中的異常值。
(C) 自變量係數:係數是回歸公式中的“A”項。 因此,對於此示例,CPC 增加 1 個單位應等於 CPA 增加 8.4(假設 CVR 保持不變)。
(D) 自變量的 P 值:通俗地說,P 值說明自變量的顯著性。 低 P 值是顯著的(目標是小於 0.1),而高 P 值表明感知的相關性可能是純粹的機會。 在“靈活修訂”階段應排除具有高 P 值的自變量。
(E) 殘差:這顯示了每次迭代的因變量的預測值與實際記錄值之間的差異。 如上所述,大多數殘差應小於 1 標準誤差,幾乎所有殘差都應小於 2 * 標準誤差的值。 您可以決定是在模型中包含還是排除任何已識別的異常值(殘差大於標準誤差的兩倍)。
第 5 步:把它放在一起(外賣部分!)
在運行三個回歸之後,我們發現以下三個方程式將搜索和展示廣告的 CPC 和 CVR 與網絡和總 CPA 相關聯:


這些等式驗證了我們已經知道的(或認為我們知道的):搜索和展示廣告的 CPC 和 CVR 都在我們的總 CPA 行為中發揮著重要作用。 然而,除此之外,他們還揭示了標準熱圖不會的三件事。
- 搜索 CPC 的增加對搜索 CPA 的影響是搜索 CVR 的同等提升的 3.5 倍
- 展示廣告每次點擊費用波動對展示廣告每次轉化費用的影響幾乎是展示廣告視頻轉化費用的 5 倍
- 總體而言,展示廣告網絡性能的變化對總 CPA 的影響比搜索網絡性能的類似變化幅度更大
由此可知,如果我的目標是降低總 CPA,那麼展示廣告網絡每次點擊費用是第一大優化目標。 搜索 CPC 和展示廣告 CVR 緊隨其後,搜索 CVR 是我最不重要的。
回歸是一個強大的工具,也是 PPC 經理工具帶的一個很好的補充。 這個基本示例僅展示了回歸可以幫助您了解您鍾愛的 KPI 之間關係的眾多方式中的一種。 我們希望您在 Excel 中測試或繼續使用回歸功能,並在 Twitter 上與我們分享您的經驗/想法/發現!
