Lazarina Stoy 在 SEO 中開始使用機器學習

已發表: 2022-04-09



您自動化了多少 SEO? 您是否知道將您當前正在做的事情自動化可以幫助您更快、更準確地完成它?

今天,我們將討論在 SEO 中開始使用機器學習的六個步驟,其中一位 SEO 經理專門從事所有技術和數據方面的工作。 她還是內容創建者,共享 Data Studio 儀表板、腳本和其他有用的工具,幫助和激勵其他 SEO 更有效地完成任務。 歡迎來到 Intrepid Digital 的 SEO 和數據科學經理 Lazarina Stoy。

步驟是:
  1. 了解你的局限信念並克服它們
  2. 了解機器學習中的常見任務規範、解決方案規範和數據規範
  3. 每天練習並開始做動作
  4. 評估新任務、解決方案和數據特徵以了解何時需要機器學習
  5. 了解機器學習的局限性並仔細檢查輸出
  6. 協同工作,設定合理期望



SEO機器學習



Lazarina:你好,那裡。 很高興來到這裡。 你好。

D:很高興有你在這裡。 你可以在 lazarinastoy.com 找到 Lazarina。 所以 Lazarina,機器接管 SEO 需要多長時間?

L:我希望在很長一段時間內。 我們需要接管機器,這樣我們才能更有效率。 我希望他們不會接管我們。

D:也許與大腦的神經聯繫會有所幫助。

L:是的,我們會比他們好得多。 我們只需要正確使用它們。 將它們引導到我們需要它們的地方。

D:對你來說有一些積極性。 所以今天我們正在討論在 SEO 中開始使用機器學習的六個步驟。 從第一開始,了解你的限制性信念並克服它們。



1. 了解你的局限信念並克服它們



L:這一小步實際上是在思考是什麼阻止了你真正更多地追求機器學習。 是什麼阻止您開始使用 SEO 自動化並做一些花哨的新腳本和工具之類的事情。 因為很多時候,我聽到很多人真的受到新技術的啟發,他們想嘗試一下。 但是他們有這些限制性的信念阻止他們這樣做。 這不是 SEO 行業獨有的或特定的東西。 實際上,這在機器學習社區中也得到了非常廣泛的認可,因為這是許多開發人員實際遇到的問題,因為他們自己並不是從機器學習開始的。

實際上,在機器學習社區非常有名的數據科學家 Jason Brownlee 實際上已經列出了一些限制性信念,或者一些你沒有開始的原因。 如果我必須將它們放在語句中,通常是我們對自己說的話,比如你必須是 Python 專家才能開始或編碼專家才能開始,或者你必須了解機器學習領域從 A 到Z. 或者每個算法為了開始而做了什麼。 或者,也許你必須有很多空閒時間才能開始,或者你必須有一些時間安排在你的日程安排中,或者是一台完美的電腦,或者你可能告訴自己的任何其他東西。 最難克服的是你認為開始非常困難或具有挑戰性。 雖然大多數機器學習專家實際上會告訴你,執行機器學習模型實際上需要三行代碼。 這是關於了解您的數據,並知道您可以在何時何地應用它。 那是困難的部分。

所以克服這些限制性信念是第一步,因為實際上,開始並不難。 您可以從字面上搜索 Google 機器學習和 10 分鐘教程,從小事做起,每天養成習慣。 這樣一來,如果您只是在等待開始,並且在尚未開始的情況下感到精神受到一些限制,那麼您可以看到這是您需要做的很小的一步。 您只需預訂 10 分鐘的日程並開始使用。 一旦您執行了您的第一個腳本或安裝、庫和所有內容,您就會發現它實際上並沒有那麼具有挑戰性。 然後遊戲發生了一點變化,然後你只需要看看你可以在哪裡將模型應用到 SEO 的日常生活中。 老實說,這就是有趣的部分。

D:明白。 本質上,您所說的是不要讓技術阻止您做事。 在真正開始之前,您不必了解技術的所有方面。

L:這很像 SEO 領域,您不必了解所有內容即可成功。 你只需要有激情和願望去做。

D:我認為挑戰在於許多 SEO 的心態是他們想在做某事之前了解一切。 我認為他們有這樣的大腦,他們需要在做某事之前了解原因。

第二是了解機器學習中常見的任務規範、解決方案規範和數據規範。



2.了解機器學習中常見的任務規範、解決方案規範、數據規範



L:是的,我將首先從數據開始。 你需要知道什麼時候搜索一個特定的……假設你已經通過了第一步,你有一些日常練習,也許是 10 分鐘的教程,你會看到這非常酷和花哨,你已經做一段時間。 現在你在日常生活中遇到了一項任務。 你想看看機器學習是否是幫助你克服所面臨的一些挑戰的正確解決方案。 您需要考慮的三件事是您擁有的數據特徵。 即,您將應用機器學習的數據集。 這可以是文本、數字數據,也可以是基於圖像的數據。 但是我們在這裡討論的是初學者場景,當然,您還有其他東西,例如多模式機器學習,您可以在其中應用視頻或音頻文件,然後將機器學習應用於它們。 但我們在這裡只討論初學者的情況。 大多數時候,作為 SEO,我們給模型的任務將是基於文本的,例如,頁面上的內容,或者它們將是數字的。 例如,如果您嘗試預測自然流量,或者您嘗試預測您將獲得的點擊次數等。

而說到任務特徵,我們知道機器學習有兩個主要領域,有監督和無監督。 我們需要知道在最常見的情況下,您可以用於這些特定類型的任務的主要模型。 所以對我們來說,監督學習意味著你已經標記了數據來驗證模型的輸出。 無監督意味著相反,你沒有辦法驗證結果。 在監督學習中,你有回歸之類的東西,它是關於進行預測的,或者分類,這意味著根據現有的類分成幾組。

只是給你一個關於這兩件事的例子,做出我們已經討論過的預測,比如預測自然流量或類似的事情,是一個很好的例子,特別是當你處理大數據或分類分組時。 例如,如果您已經將博客的一部分分類為特定類別,並且您有新內容想要分類到這些特定組之一,那麼您可以使用分類來幫助您。 在監督學習中,你有聚類降維,它有點高級,你可能會使用它,比如當你有一個非常大的數據集時,或者當你遇到一個你並不真正關心的問題時有辦法驗證。 通常,您也可以將這兩種方法結合起來。

談到解決方案特徵時,最重要的是應該在何時何地應用機器學習。 在我的網站和博客上,對於機器學習初學者指南,我實際上列出了一些流程圖,可以幫助您了解如何應用機器學習的過程以及這是否是正確的用例。 例如,如果您不使用大數據,那麼它就不是機器學習,它實際上可以在電子表格或帶有幾個統計公式的 Google 表格中完成。 因為從本質上講,大多數機器學習模型正是如此。 統計數據。 是的,如果它是關鍵任務,比如你正在做的任務,你根本不應該依賴機器學習。 如果您需要與您的利益相關者、取得結果的方式聯繫起來,或者可能試圖解釋或複制該模型的輸出,那麼您應該避免使用某些模型,例如監督機器學習或深度學習,因為它們中的大多數都像黑匣子一樣工作。 而且這非常困難,尤其是在大數據的情況下,要復制模型所做的工作以達到輸出。

這裡有很多值得深思的地方。 但我只想說,如果你理解了這三件事,並且你能夠針對你的具體問題說,“好吧,我的數據是文本的。我需要的模型是基於回歸的,或者可能是基於分類的或其他的就像你需要確定你的數據是什麼,你的任務是什麼。你需要了解你將要尋找什麼樣的解決方案。如果你能做到,那麼它會容易得多找到適當的資源來幫助您實現目標。

D:第三個是能夠進行日常練習並開始進行動作。



3. 每天練習並開始行動



L:我想我在前面的步驟中提到了這一點,但日常練習至關重要。 這對我個人來說意味著,我想做一些與 Python 相關的事情,因為那是我的首選語言。 但它可以是 JavaScript,也可以是你感興趣的任何其他語言,你可以找到足夠的機器學習資源,並嘗試每天做一些與機器學習相關的事情。 現在,這可能不是每天都在進行的全面項目,因為這可能需要很多時間,尤其是在您從事大型項目的情況下。 但它可能是理解,例如,函數是如何工作的,它可能是基於你擁有的歷史數據運行一個模型,或者可能將機器學習納入你的審計,尋找測試機器學習的新方法。 所以日常練習很重要。 它讓您保持警覺,特別是因為它可以幫助您從本質上了解機器學習可以做什麼。 如果你知道它可以做什麼,那麼當你繼續你的日常角色時,你會更容易找到將機器學習嵌入流程的機會。 我想在這裡強調一下,這並不意味著您應該擁有完全自動化的解決方案,只需單擊一個按鈕,您就可以完全自動化您的工作。 這意味著,如果您可以將您正在從事的特定項目分成 10 個不同的部分,並且如果您可以幫助自己自動化或嵌入機器學習以及這 10 個中的兩個,那麼您可以有更多的時間專注於這 10 項其餘部分的輸出。或者,也許您也可以將這段時間用於職業發展項目,例如提高您的領導力、溝通能力等。 本質上,它是關於知道何時何地使用機器學習。 最好的方法是熟悉它。 所以每天的練習是關鍵。

D:這給我們帶來了第四點,當遇到新任務時,評估任務解決方案和數據特徵,以了解是否真的需要機器學習。



4. 評估新任務、它們的解決方案和數據特徵,以了解何時需要機器學習



L: 是的,再說一次,我之前提到過的東西。 您可以通過多種方式評估是否需要機器學習。 我已經提到了這兩個流程圖。 但本質上,您遇到的每一項任務,例如,編寫元描述,因為這是我們經常做的事情。 好吧,我們不應該在這上面花太多時間。 我們知道它們對 SEO 來說不是很重要,但作為頁面優化項目的一部分,這是你應該做的,你應該優化它們。

讓我們在這裡解構一個任務。 如果您說您的輸入數據是文本的,那意味著是的,頁面內容是文本的。 在這種情況下,任務是什麼? 它是有監督的還是無監督的? 我們知道它是無人監督的。 因為我們無法驗證輸出的結果,所以我們必須自己做,我們沒有自動化的方法來做。 在這種情況下,我們將尋找一個可轉換的模型,例如,獲取頁面文本,並將其轉換為少於 160 個字符的輸出。 所以從文本中提取句子意味著提取,或者也可以是摘要。 但另一種方法是使用像 GPT-3 這樣的生成模型。 我們給它輸入,即頁面上的文本,它生成元描述並從頭開始編寫它們。

回到它是否是關鍵任務,我們知道它不是。 所以機器學習適合這種類型的練習。 有時,當您為相同類型的頁面運行此模型時,您可能會得到不同的輸出,這正常嗎? 例如,如果您運行該模型兩次,您可能會為同一頁面獲得兩個不同的元描述。 那絕對沒問題。 我們可以從兩者中進行選擇。 這根本不是問題。 我們是否需要解釋我們是如何編寫這些元描述的? 一點都不。 我們不需要向我們的利益相關者解釋我們是如何做到這一點的。 它是否優於平均方法? 當您想評估是否要使用機器學習時,這是一個非常重要的問題,我們可以肯定地說是,因為如果您採用此框架並將其應用於您想知道是否應該使用的任務,它會快得多機器學習與否,那麼您可能會很快發現哪些任務適合機器學習,哪些任務不適合。 舉個例子,這也可能取決於利基市場,因為如果我們採取完全相同的例子,對於標題和 H1,我們可能會說,對於一個非常沒有競爭力的利基市場,在以下方面並不重要它不是你的錢或你的生活類型的東西,那麼我們可以說絕對,同樣的立場,它不是關鍵任務。 這些任務可以自動化,我們可以實現機器學習,我們不需要解釋我們是如何編寫標題和 H1 的。 但是,如果我們說,例如,我們的客戶是 HMRC,我們知道這對於做到這一點非常重要。 我們不想建議一些不完全正確的標題或 H1 或元描述。 因此,有時您可能還會覺得您的客戶或您工作的行業或您正在從事的特定站點可能是您無法實施其中一些工具的原因。

D:我認為這很好地把我們帶到了第五位,這是在使用機器學習時,了解它的局限性,並仔細檢查輸出。



5. 了解機器學習的局限性並仔細檢查輸出



L:當然,這個非常重要,因為我多次認為機器學習可以完成某些事情,並且我已經實現了一個模型或測試了一個腳本或類似的東西,因為有很多腳本在那裡。 老實說,如果您知道如何搜索它們,那麼您可以想到的任何任務幾乎都有一個腳本,您只需要知道如何將其用於 SEO 中的特定問題。 而且我測試了一些並最終沒有使用輸出的次數很多。 所以你需要知道機器學習能做什麼。 現在機器學習處於非常擅長狹窄任務的階段,但是大多數模型,它們的訓練方式,作為初學者,你將大部分時間使用預訓練模型,你'不會自己訓練他們。 這本身就是另一個話題。 但是,如果您使用的是預訓練模型,並且您自己沒有訓練它們,那麼大多數時候您會發現他們訓練過的數據集對特定行業並不是特別有用,或者沒有你想要的那麼深入。 對於 NLP 等基於文本的任務尤其如此。

在這裡,你只需要知道兩件事。 首先,即使有一個可以合作的基礎也是一件足夠好的事情。 如果您知道,是的,例如,模型生成的元描述不是那麼好,但可以修復它們。 如果你認為,如果你編輯它們,生成最終輸出會更快,那麼你應該拍拍自己的背,你做得很好,因為你為自己節省了大量時間,即使如此。 如果您認為輸出根本沒有用,那並不意味著所有機器學習都沒有用。 這只是意味著對於這個特定的任務,你使用的這個特定的模型沒有用。 這完全沒問題。 因為您甚至可以對您的利益相關者或您的客戶說我們測試了一些方法,所以我們測試了一種自動化方法。 由於這個和這個原因,它沒有奏效。 然後您甚至可以使用模型的輸出來與您的團隊生成的輸出進行比較和對比。 因此,在所有情況下,實施或嘗試機器學習都會使您的案例更有說服力。 你只需要知道什麼時候說好的,我們試過了,但它沒有用,以及如何利用它來發揮你的優勢。

D: 談到將我們巧妙地帶到第六位的產出,即協同工作並設定合理的期望。



6. 協同工作,設定合理期望



L:這最後一步就是要知道何時需要幫助並知道如何獲得正確的幫助。 在這裡,我認為您可以採取一些措施來獲得所需的幫助。 首先,找個機器學習的小伙伴。 與您屬於同一類型的人。 他們在同一個行業工作。 他們有相同類型的問題。 你們正在思考和遇到問題,你們正在一起研究任務。 當有人發現對角色有用的東西時,他們會與好友分享。 它可以幫助您保持自己的責任感,它可以幫助您保持動力,這確實是一件非常好的事情。

這裡的另一個解決方案是加入一個像機器學習部落這樣的部落。 再一次,我要在這裡給 Jason Brownlee 打電話。 他創建了這張圖表,對不同的機器學習部落進行了細分。 對我們來說,作為 SEO,我們屬於商業部落,所以那些可能是經理,他們試圖查看自動化或機器學習是否是解決他們問題的正確解決方案,或者它是否可以用於他們的團隊或數據部落,例如,試圖更好地理解數據的數據分析師。 而我之所以特別提到這兩種部落,是因為如果你在這樣的一個群體或社區中,你知道那裡的人試圖找到相同類型的結果,但他們解決問題的方法是相似的給你的。 因此,例如,如果您不了解與編碼相關的高級概念或機器學習模型背後的數學,您將不會受到審查。 你將被那些對你所面臨的挑戰類型非常同情的人所包圍。 這可能是不同的挑戰。 例如,如果您在一個有 Python 開發人員的社區中,並且您在問,為什麼我的模型不起作用,結果是逗號或類似的東西。 您可能會感到更加仔細,對您的查詢的回答可能會更加嚴厲,我們不希望您感到沒有動力。 所以這就是為什麼我強調找到正確類型的社區或正確類型的部落。

第三件事是,我認為這是你應該應用的東西,無論你選擇什麼方法。 只要您覺得自己無法自行解決查詢,就應該盡可能地與開發人員聯繫。 如果您在 StackOverflow 上花費了大約 6 個小時,而您只遇到一個錯誤,並且您感到非常沒有動力,請聯繫某人,即使在 SEO 社區中,也有很多超級熟練的 Python 開發人員。 如果您與他們聯繫,他們可能已經遇到過類似的問題,因此他們可能會為您提供指導。 我並不是說要聯繫他們,這樣他們就可以為您編寫腳本。 但他們可以引導你朝著正確的方向前進。 這也可以非常鼓舞人心和激勵人心。

D: Lazarina,那絕對是絕妙的。 我知道您可以談論數週的 SEO 機器學習。 那隻是一個簡單的介紹。 但它確實展示了你的知識。 而且我相信你可以潛入特定領域。 在某個時候讓您回來會很棒,也許我們可以讓您回來並深入研究 Python for SEO 或其他更小眾的主題。





帕累托泡菜 - 分析 SERP 以尋找新機會



讓我們以 Pareto Pickle 結束。 帕累託說,你可以從 20% 的努力中獲得 80% 的結果。 您會推薦哪一項 SEO 活動,以適度的努力提供令人難以置信的結果?

L:我想了很多。 我想說一些我認為我沒有經常看到的事情。 對我來說,這是 SERP 分析。 我們有很多機會來分析搜索引擎結果頁面,尤其是大規模分析。 因此,如果您已經完成了關鍵字研究,並且您知道您的網站可能排名的關鍵字,網站未排名的關鍵字,以及內容差距等等。 我想說,如果您可以使用 DataForSEO 之類的工具進行非常廣泛的 SERP 分析,那麼您就可以很好地了解市場。 比如誰在哪裡排名,你在與哪些品牌競爭,他們如何構建他們的標題,元描述,他們的內容有多長,以及各種類似的分析。 如果在那個級別,您知道何時何地實施機器學習,那麼僅該活動就會影響您的整個內容策略。 它會讓你保持在正軌上,以便你以後也能保持競爭力。 所以這是你為這個特定的客戶做一次並保護的事情,你可以在接下來的幾個月內使用它來指導你並影響你將要執行的許多其他策略。

D:我真的很想深入研究。 我想繼續問你更多問題。 但我知道這將需要額外的半小時左右,而我們現在沒有時間這樣做。 希望我們能在未來的一集中讓你回來。 目前。 我一直是您的主持人大衛·貝恩。 非常感謝您參加 In Search SEO 播客。

L: 非常感謝你邀請我,大衛。 這是我的榮幸。

D:謝​​謝你的聆聽。