Начало работы с машинным обучением в SEO с Лазариной Стой

Опубликовано: 2022-04-09



Какую часть вашего SEO вы автоматизируете? А знаете ли вы, что автоматизация того, что вы сейчас делаете, может помочь вам делать это быстрее и с большей точностью?

Сегодня мы обсудим шесть шагов для начала работы с машинным обучением в SEO с SEO-менеджером, специализирующимся на технических вопросах и данных. Она также является создателем контента, делится информационными панелями, сценариями и другими полезными инструментами Data Studio, помогая другим SEO-специалистам выполнять задачи более эффективно. Добро пожаловать к менеджеру по SEO и науке о данных в Intrepid Digital, Лазарине Стой.

Шаги:
  1. Поймите свои ограничивающие убеждения и преодолейте их
  2. Понимание общих спецификаций задач, спецификаций решений и спецификаций данных в машинном обучении
  3. Практикуйтесь ежедневно и начните выполнять движения
  4. Оценивает новые задачи, их решения и характеристики данных, чтобы понять, когда требуется машинное обучение
  5. Поймите ограничения и внимательно изучите результаты машинного обучения
  6. Работайте вместе и устанавливайте разумные ожидания



SEO машинное обучение



Лазарина: Здравствуйте. Счастлив быть здесь. Привет.

Д: Рад видеть тебя здесь. Вы можете найти Лазарину на lazarinastay.com. Итак, Лазарина, как скоро машины возьмут верх над SEO?

Л: Надеюсь, что надолго. Нам нужно захватить машину, чтобы мы могли быть более эффективными. Надеюсь, они не захватят нас.

Д.: Возможно, нейронная связь с мозгом поможет.

L: Да, мы будем намного лучше, чем они. Нам просто нужно использовать их правильно. Направляем их туда, где они нам нужны.

D: Есть немного позитива для вас. Итак, сегодня мы обсудим шесть шагов для начала работы с машинным обучением в SEO. Начав с первого, поймите свои ограничивающие убеждения и преодолейте их.



1. Понять свои ограничивающие убеждения и преодолеть их



Л: Этот небольшой шаг посвящен тому, чтобы подумать о том, что мешает вам немного больше заниматься машинным обучением. Что мешает вам начать работу с автоматизацией SEO и делать такие вещи, как новые причудливые скрипты, инструменты и тому подобное. Потому что часто я слышу, как многие люди действительно вдохновлены новыми технологиями и хотят их попробовать. Но у них есть ограничивающие убеждения, которые мешают им это делать. И это не что-то уникальное или специфичное для индустрии SEO. На самом деле это то, что было очень широко признано в сообществе машинного обучения, потому что это проблема, с которой на самом деле сталкиваются многие разработчики, поскольку они сами не начинают с машинного обучения.

На самом деле, очень известный в сообществе машинного обучения специалист по данным Джейсон Браунли составил список некоторых ограничивающих убеждений или причин, по которым вы не начинаете. И если мне приходится излагать их в виде утверждений, часто это то, что мы говорим себе, например, что вы должны быть экспертом по Python, чтобы начать, или экспертом по кодированию, чтобы начать, или вы должны знать область машинного обучения от А до Z. Или что делает каждый алгоритм, чтобы начать работу. Или, может быть, у вас должно быть много свободного времени, чтобы начать, или у вас должно быть немного времени в вашем расписании, или идеальный компьютер, или что-то еще, что вы можете себе говорить. Самая трудная для преодоления проблема заключается в том, что вы думаете, что начать работу очень трудно или сложно. В то время как большинство экспертов по машинному обучению на самом деле скажут вам, что выполнение модели машинного обучения буквально занимает три строки кода. Речь идет о понимании ваших данных и знании того, где и когда вы можете их применить. Это сложная часть.

Итак, преодоление этих ограничивающих убеждений — первый шаг, потому что на самом деле начать несложно. Вы можете буквально загуглить машинное обучение и 10-минутные учебные пособия, начать с малого и вырабатывать привычку каждый божий день. И таким образом, если вы просто ждете, чтобы начать, и вы чувствуете некоторые ментальные ограничения, пока вы еще не начали, вы можете увидеть, что это очень маленький шаг, который вам нужно сделать. Вам просто нужно забронировать 10 минут вашего расписания и начать. И как только вы запустите свой первый скрипт или установите, библиотеки и все такое, вы увидите, что на самом деле это не так уж и сложно. А затем игра немного меняется, и вам просто нужно посмотреть, где вы можете применить модели к повседневной жизни оптимизатора. И это самое интересное, если честно.

Д: Понятно. По сути, вы говорите, что не позволяйте технологиям мешать вам что-то делать. Вам не нужно понимать все аспекты технологии, прежде чем вы действительно начнете.

L: Это очень похоже на область SEO, где вам не нужно понимать все, чтобы войти в дверь. Просто нужно иметь страсть и желание этим заниматься.

Д.: Я думаю, проблема в том, что многие SEO-специалисты считают, что они хотят все понять, прежде чем что-то делать. Я думаю, что у них такой мозг, что им нужно понять, почему, прежде чем что-то делать.

Во-вторых, это понимание общих спецификаций задач, спецификаций решений и спецификаций данных в машинном обучении.



2. Понимание общих спецификаций задач, спецификаций решений и спецификаций данных в машинном обучении.



Л: Да, сначала я начну с данных. Вам нужно знать, когда вы ищете что-то конкретное… Скажем, вы уже прошли первый шаг, у вас есть ежедневная практика, может быть, 10-минутные уроки, вы видите, что это очень круто и модно, и вы делать это какое-то время. И теперь вы как бы сталкиваетесь с задачей в своей повседневной жизни. И вы хотите увидеть, является ли машинное обучение правильным решением, которое поможет вам преодолеть некоторые проблемы, с которыми вы сталкиваетесь. Три вещи, о которых вам нужно подумать, — это характеристики данных, которые у вас есть. То есть набор данных, к которому вы собираетесь применять машинное обучение. И это могут быть текстовые, числовые данные или данные на основе изображений. Но мы говорим здесь о сценарии для начинающих, конечно, у вас есть другие вещи, такие как мультимодальное машинное обучение, когда вы применяете видео или аудио файлы, и вы применяете к ним машинное обучение. Но мы говорим здесь только о случае новичка. И большую часть времени, как оптимизаторы, задачи, которые мы даем модели, будут текстовыми, например, контент на странице, или они будут числовыми. Так, например, если вы пытаетесь предсказать органический трафик или количество кликов, которые вы собираетесь получить, и тому подобное.

А когда дело доходит до характеристик задач, мы знаем, что есть две основные области машинного обучения: контролируемое и неконтролируемое. И нам нужно знать основные модели, которые можно, в самом общем случае, использовать для этих конкретных типов задач. Таким образом, для нас контролируемое обучение означает, что у вас есть помеченные данные для проверки выходных данных модели. А неконтролируемый означает обратное, у вас нет возможности проверить результаты. В обучении с учителем у вас есть такие вещи, как регрессия, которая связана с прогнозированием, или классификация, что означает разделение на группы на основе существующих классов.

Просто чтобы привести вам пример обеих этих вещей, прогнозирование, которое мы уже обсуждали, например прогнозирование органического трафика или тому подобное, является хорошим случаем, особенно когда вы работаете с большими данными или классификацией, разбитой на группы. Например, если у вас есть часть вашего блога, которую вы уже классифицировали по определенным категориям, и у вас есть новый контент, который вы хотите отнести к одной из этих конкретных групп, именно здесь вы можете использовать классификацию, чтобы помочь вам. В обучении с учителем у вас есть уменьшение размерности кластеризации, которое является немного более продвинутым, и вы, вероятно, собираетесь использовать его, например, когда у вас очень большой набор данных или когда у вас есть проблема, которую вы на самом деле не решаете. есть способ проверить. И часто вы также можете комбинировать эти два подхода.

Когда дело доходит до характеристик решения, самое важное, что нужно знать, это когда и где следует применять машинное обучение. На моем веб-сайте и в блоге в разделе «Руководство по машинному обучению для начинающих» я фактически перечислил несколько блок-схем, которые могут помочь вам пройти через процесс применения машинного обучения и определить, является ли это правильным вариантом его использования. Например, если вы не работаете с большими данными, то это не машинное обучение, это можно сделать буквально в электронной таблице и/или листе Google с парой статистических формул. Потому что, по сути, большинство моделей машинного обучения именно таковы. Статистика. И да, если это критически важно, например, задачи, которые вы выполняете, вам вообще не следует полагаться на машинное обучение. И если вам нужно связаться со своими заинтересованными сторонами, узнать, как были достигнуты результаты, или, может быть, попытаться объяснить или воспроизвести результаты этой модели, есть определенные модели, которых вам следует избегать, например контролируемое машинное обучение или глубокое обучение. , потому что большинство из них работают как черный ящик. И довольно сложно, особенно с большими данными, воспроизвести то, что сделала модель, чтобы достичь результата.

Здесь много пищи для размышлений. Но я просто хочу сказать, что если вы понимаете эти три вещи и можете сказать о своей конкретной проблеме: «Хорошо, мои данные текстовые. Модель, которая мне нужна, основана на регрессии или, может быть, на классификации или на чем-то это похоже на то, что вам нужно точно определить, какие у вас данные, какова ваша задача. И вам нужно понять, какое решение вы собираетесь искать. И если вы можете это сделать, тогда это будет намного проще. чтобы найти подходящие ресурсы, которые помогут вам в достижении вашей цели.

Д.: И номер три — включить ежедневную практику и начать выполнять движения.



3. Практикуйтесь ежедневно и начните выполнять движения



Л: Кажется, я коснулся этого в предыдущем шаге, но ежедневная практика имеет решающее значение. Лично для меня это означает, что я хотел бы сделать что-то, связанное с Python, потому что это мой любимый язык. Но это может быть JavaScript, это может быть любой другой интересующий вас язык, и вы можете найти достаточно ресурсов для машинного обучения и каждый день пытаться делать что-то, связанное с машинным обучением. Вы знаете, это может быть не полноценный проект каждый день, потому что это может занять много времени, особенно если вы работаете над большим проектом. Но это может быть, например, понимание того, как работают функции, это может быть запуск модели, основанной на имеющихся у вас исторических данных, или, может быть, включение машинного обучения в ваш аудит, поиск новых способов тестирования машинного обучения. Поэтому ежедневная практика имеет решающее значение. И это держит вас в напряжении, особенно потому, что помогает узнать, на что, по сути, может машинное обучение. И если вы знаете, на что оно способно, то, когда вы приступите к своей повседневной работе, вам будет намного проще находить возможности для внедрения машинного обучения в процессы. И я хочу подчеркнуть здесь, что это не означает, что у вас должны быть полностью автоматизированные решения, которые работают одним нажатием кнопки, и вы можете полностью автоматизировать свою работу. Это означает, что если вы можете разделить конкретный проект, над которым вы работаете, на 10 разных частей, и если вы можете помочь себе автоматизировать или внедрить машинное обучение и, возможно, два из этих 10, то у вас будет гораздо больше времени, чтобы сосредоточиться на нем. результат остальных 10. Или, может быть, вы можете использовать это время для проектов по продвижению карьеры, таких как работа над своим лидерством, коммуникацией и тому подобными вещами. По сути, речь идет о том, чтобы знать, когда и где использовать машинное обучение. И лучший способ сделать это — познакомиться с ним. Поэтому ежедневная практика является ключом к этому.

Д.: Что подводит нас к четвертому пункту: при столкновении с новыми задачами оценивать решение задачи и характеристики данных, чтобы понять, действительно ли машинное обучение вообще необходимо.



4. Оценивает новые задачи, их решения и характеристики данных, чтобы понять, когда требуется машинное обучение.



Л: Да, опять же, кое-что, чего я уже касался. Есть разные способы оценить необходимость машинного обучения. И я уже упоминал эти несколько блок-схем. Но, по сути, каждая отдельная задача, с которой вы сталкиваетесь, и возьмем, к примеру, написание метаописаний, потому что это то, что мы делаем довольно часто. Ну, мы не должны тратить на это слишком много времени. Мы знаем, что они не очень важны для SEO, но как часть проекта по оптимизации страницы, это то, что вы должны сделать, вы должны оптимизировать их.

Давайте разберем задачу здесь. Если вы говорите, что ваши входные данные являются текстовыми, это означает, что да, содержимое страницы является текстовым. И какая задача в таком случае? Это под наблюдением или без надзора? Мы знаем, что это без присмотра. Поскольку у нас нет возможности проверить результаты вывода, мы должны сделать это сами, у нас нет автоматизированного способа сделать это. В этом случае мы собираемся искать трансформационную модель, например, брать текст страницы и преобразовывать его в вывод менее 160 символов. Таким образом, взятие предложений из текста означает извлечение или также может быть обобщением. Но еще один способ сделать это — использовать генеративную модель, такую ​​как GPT-3. Мы даем ему входные данные, т. е. текст на странице, и он генерирует метаописания и пишет их, по сути, с нуля.

Возвращаясь к вопросу о том, является ли это критически важным, мы знаем, что это не так. Так что машинное обучение хорошо подходит для такого типа упражнений. Ничего страшного, что иногда, когда вы запускаете эту модель для одного и того же типа страницы, вы можете получить разные результаты? Например, если вы запустите модель дважды, вы можете получить два разных метаописания для одной и той же страницы. Это абсолютно нормально. Мы можем выбрать из них обоих. Это совсем не проблема. Нужно ли нам объяснение того, как мы написали эти метаописания? Нет, совсем нет. И нам не нужно было бы объяснять нашим заинтересованным сторонам, как мы это сделали. Превосходит ли он средние методы? Очень важный вопрос, когда вы хотите оценить, хотите ли вы использовать машинное обучение, и мы можем сказать да, абсолютно, потому что это будет намного быстрее, если вы возьмете эту структуру и примените ее к задачам, которые вы задаетесь вопросом, следует ли вам использовать машинное обучение для них или нет, то вы можете очень быстро найти, какие задачи подходят для машинного обучения, а какие нет. Просто чтобы привести вам пример, это также может зависеть от ниши, потому что, если мы возьмем абсолютно тот же пример для заголовков и H1, мы можем сказать, что для ниши, которая очень неконкурентна, не важна с точки зрения это не ваши деньги или ваша жизнь, тогда мы могли бы сказать, что абсолютно, та же самая позиция, это не критично для миссии. Задачи можно автоматизировать, мы можем внедрить машинное обучение, и нам не нужно давать пояснений, как мы написали заголовки и H1. Но если мы говорим, например, что наш клиент — HMRC, мы знаем, что это очень важно, чтобы сделать это правильно. Мы не хотим предлагать какие-то заголовки, H1 или метаописания, которые не совсем точны. Таким образом, вы также можете иногда чувствовать, что ваш клиент или отрасль, в которой вы работаете, или конкретный сайт, над которым вы работаете, могут быть причиной того, что вы не можете использовать некоторые из этих инструментов.

Д.: Я думаю, это очень хорошо подводит нас к пятому пункту, когда мы работаем с машинным обучением, понимаем его ограничения и тщательно изучаем результат.



5. Поймите ограничения и внимательно изучите результаты машинного обучения



Л: Абсолютно, и это очень важно, потому что я много раз думал, что что-то можно сделать с помощью машинного обучения, и я реализовывал модель или тестировал скрипт или что-то в этом роде, потому что существует так много скриптов. там. Честно говоря, если вы знаете, как их искать, есть почти сценарий для любой задачи, которую вы можете придумать, вам просто нужно знать, как реализовать его для конкретной задачи в SEO. И количество раз, когда я тестировал некоторые из них и в конечном итоге не использовал вывод, много. Поэтому вам нужно знать, на что способно машинное обучение. Сейчас машинное обучение находится на этапе, когда оно очень хорошо справляется с узкими задачами, но большинство моделей, то, как они обучаются, и как новичок, вы будете большую часть времени использовать предварительно обученные модели, вы не собираюсь тренировать их самостоятельно. А это уже отдельная отдельная тема. Но если вы используете предварительно обученные модели и не обучаете их самостоятельно, в большинстве случаев вы обнаружите, что набор данных, на котором они обучались, не особенно полезен для конкретной отрасли или не так подробно, как хотелось бы. И это особенно касается текстовых задач, таких как НЛП и тому подобное.

И здесь вам просто нужно знать две вещи. Во-первых, даже наличие основы для работы уже достаточно хорошо. Если вы знаете, что да, например, метаописания, сгенерированные моделью, не так хороши, но их можно исправить. И если вы думаете, что если вы их отредактируете, то сможете намного быстрее сгенерировать окончательный результат, тогда вы должны похлопать себя по плечу, вы проделали отличную работу, потому что сэкономили себе кучу времени. время, даже с этим. И если вы думаете, что результат просто бесполезен, это не значит, что все машинное обучение бесполезно. Это просто означает, что для этой конкретной задачи эта конкретная модель, которую вы использовали, оказалась бесполезной. И это совершенно нормально. Поскольку вы даже можете сказать своему заинтересованному лицу или клиенту, что мы протестировали несколько подходов, мы протестировали автоматизированный подход. И это не сработало из-за этой и этой причины. И затем вы даже можете использовать выходные данные модели, чтобы сравнить и сопоставить с выходными данными, созданными вашей командой. Так что во всех случаях внедрение или попытка машинного обучения значительно укрепит ваши позиции. Вам просто нужно знать, когда сказать «хорошо», мы пробовали это, но это не сработало, и как использовать это в своих интересах.

Д.: И если говорить о результатах, которые аккуратно выводят нас на шестое место, то есть на совместную работу и установление разумных ожиданий.



6. Работайте сообща и устанавливайте разумные ожидания



Л: Этот последний шаг заключается в том, чтобы знать, когда вам нужна помощь, и знать, как получить правильную помощь. И здесь, я думаю, есть несколько вещей, которые вы можете предпринять, чтобы получить необходимую вам помощь. Прежде всего, найдите напарника по машинному обучению. Кто-то из тех же людей, что и вы. Они работают в одной отрасли. У них такие же проблемы. И вы думаете и сталкиваетесь с проблемами, и вы как бы вместе исследуете задачи. А когда кто-то находит что-то полезное для роли, то делится этим со своим приятелем. Это помогает вам держать себя в руках, это помогает вам сохранять мотивацию, и это действительно очень хорошая вещь.

Другим решением здесь было бы присоединиться к племени, подобному племени машинного обучения. Я снова позвоню сюда Джейсону Браунли. Он создал эту диаграмму с разбивкой по различным племенам машинного обучения, которые там существуют. И для нас, оптимизаторов, мы принадлежим либо к бизнес-племени, так что это могут быть менеджеры, которые пытаются понять, является ли автоматизация или машинное обучение правильным решением их проблемы, или можно ли их использовать для их команды, или данные племена, которые, например, являются аналитиками данных, которые пытаются немного лучше понимать данные. И причина, по которой я упомянул именно эти два типа племен, заключается в том, что если вы состоите в такой группе или сообществе, вы знаете, что люди там пытаются найти такие же результаты, но их подход к проблеме схож. к твоему. Таким образом, вас не будут тщательно проверять, например, если вы не знаете передовых концепций, связанных с кодированием, или математики, лежащей в основе модели машинного обучения. Вы будете окружены людьми, которые очень сочувствуют вашим проблемам. И это могут быть разные задачи. Например, если вы находитесь в сообществе с разработчиками Python и спрашиваете, почему моя модель не работает, а оказывается, что это запятая или что-то в этом роде. Вы можете чувствовать себя немного более внимательно, ответы на ваш вопрос могут быть немного более жесткими, и мы не хотим, чтобы вы чувствовали себя немотивированными. Вот почему я подчеркиваю важность поиска правильного типа сообщества или правильного типа племени.

И третье, и я думаю, это то, что вы должны применять, независимо от того, какой подход вы выберете. Это должно заключаться в том, чтобы просто обращаться к разработчикам всякий раз, когда вы можете, когда вы чувствуете, что не можете решить запрос самостоятельно. Если вы потратили около шести часов на StackOverflow, и вы застряли только на одной ошибке, и вы чувствуете себя супер немотивированным, просто обратитесь к кому-нибудь, есть так много суперквалифицированных разработчиков Python, даже в сообществе SEO. Если вы обратитесь к ним, они, возможно, уже столкнулись с такой проблемой, поэтому они могут дать вам указания. И я не говорю, что надо связаться с ними, чтобы они написали для вас ваш сценарий. Но они могут просто направить вас в правильном направлении. И это может быть очень вдохновляющим и мотивирующим.

Д: Лазарина, это было просто блестяще. Я знаю, что вы можете неделями говорить о машинном обучении для SEO. Это было просто краткое введение. Но это действительно демонстрирует ваши знания. И я уверен, что вы можете погрузиться в конкретные области. Было бы здорово вернуться к вам в какой-то момент, может быть, мы сможем вернуть вас и погрузиться в что-то вроде Python для SEO или какую-то другую более нишевую тему.





The Pareto Pickle — проанализируйте поисковую выдачу на наличие новых возможностей



Давайте закончим рассолом Парето. Парето говорит, что вы можете получить 80% результатов, прилагая 20% усилий. Какое SEO-направление вы бы порекомендовали, чтобы получить невероятные результаты при скромных усилиях?

Л: Я много думал об этом. И я хотел сказать кое-что, что, думаю, я не так часто видел. А для меня это анализ поисковой выдачи. У нас есть много возможностей для анализа страниц результатов поисковых систем, особенно в больших масштабах. Итак, если вы уже провели исследование ключевых слов и знаете ключевые слова, по которым, возможно, ранжируется ваш сайт, те, по которым сайт не ранжируется, пробелы в содержании и все такое. Я бы сказал, что если вы можете провести очень широкомасштабный анализ поисковой выдачи, используя такой инструмент, как DataForSEO, то таким образом вы сможете получить очень хорошее представление о рынке. Например, кто где находится в рейтинге, с какими брендами вы конкурируете, как они структурируют свои заголовки, метаописания, какова длина их контента и тому подобное. И если на этом уровне вы знаете, когда и где внедрить машинное обучение, то одно только это действие повлияет на всю вашу контент-стратегию. И это будет держать вас на правильном пути, чтобы вы могли оставаться конкурентоспособными и позже. Так что это то, что вы делаете один раз для этого конкретного клиента и защищаете, и вы можете использовать это в течение нескольких месяцев, чтобы направлять вас и влиять на вас во многих других стратегиях, которые вы собираетесь использовать.

Д.: Я действительно хочу погрузиться в это. Я хочу продолжить и задать вам больше вопросов. Но я знаю, что это займет еще полчаса или около того, а сейчас у нас нет на это времени. Надеюсь, мы вернемся к вам в будущем эпизоде. Теперь. Я был вашим ведущим Дэвид Бейн. Большое спасибо за участие в подкасте In Search SEO.

Л: Большое спасибо, что пригласили меня, Дэвид. Это было приятно.

Д: И спасибо, что выслушали.