Primeros pasos con Machine Learning en SEO con Lazarina Stoy

Publicado: 2022-04-09



¿Cuánto de su SEO está automatizando? ¿Y sabía que automatizar lo que está haciendo actualmente podría ayudarlo a hacerlo más rápido y con un mayor nivel de precisión?

Hoy, estamos discutiendo los seis pasos para comenzar con el aprendizaje automático en SEO , con un gerente de SEO que se especializa en todos los aspectos técnicos y de datos. También es creadora de contenido, comparte paneles de Data Studio, scripts y otras herramientas útiles, ayuda y aspira a otros SEO a realizar tareas de manera un poco más eficiente. Bienvenido al gerente de SEO y ciencia de datos de Intrepid Digital, Lazarina Stoy.

Los pasos son:
  1. Comprenda sus creencias limitantes y supérelas
  2. Comprender las especificaciones de tareas comunes, las especificaciones de soluciones y las especificaciones de datos en el aprendizaje automático
  3. Practique diariamente y comience a realizar los movimientos
  4. Evalúa nuevas tareas, sus soluciones y las características de los datos para comprender cuándo se necesita el aprendizaje automático
  5. Comprender las limitaciones y examinar el resultado del aprendizaje automático
  6. Trabaje en colaboración y establezca expectativas razonables



Aprendizaje automático de SEO



Lazarina: Hola, allí. Feliz de estar aqui. Hola.

D: Feliz de tenerte aquí. Puedes encontrar a Lazarina en lazarinastoy.com. Entonces Lazarina, ¿cuánto falta para que las máquinas se hagan cargo del SEO?

L: Espero que en mucho tiempo. Tenemos que tomar el control de la máquina para que podamos ser más eficientes. Espero que no se apoderen de nosotros.

D: Tal vez un enlace neural con el cerebro ayude.

L: Sí, vamos a ser mucho mejores que ellos. Solo necesitamos usarlos correctamente. Canalizarlos donde los necesitemos.

D: Hay algo de positividad para ti. Así que hoy estamos discutiendo los seis pasos para comenzar con el aprendizaje automático en SEO. Comenzando con el número uno, comprenda sus creencias limitantes y supérelas.



1. Comprende tus creencias limitantes y supéralas



L: Este pequeño paso se trata de pensar realmente en lo que le impide realmente seguir un poco más el aprendizaje automático. ¿Qué le impide comenzar con la automatización de SEO y hacer cosas que son los nuevos y elegantes scripts y herramientas y cosas por el estilo? Porque a menudo, escucho a muchas personas realmente inspiradas por la nueva tecnología y quieren probarla. Pero tienen estas creencias limitantes que les impiden hacerlo. Y no es algo que sea único o específico de la industria de SEO. En realidad, esto es algo que también ha sido ampliamente reconocido en la comunidad de aprendizaje automático, porque es un problema que muchos desarrolladores tienen, ya que ellos mismos no están comenzando con el aprendizaje automático.

De hecho, un científico de datos que es muy famoso en la comunidad de aprendizaje automático, Jason Brownlee, ha hecho una lista de algunas creencias limitantes o algunas razones por las que no estás comenzando. Y si tengo que ponerlos en declaraciones, a menudo son las cosas que nos decimos a nosotros mismos, como que tienes que ser un experto en Python para empezar o un experto en codificación para empezar, o tienes que conocer el campo de aprendizaje automático de A a Z. O qué hace cada algoritmo para empezar. O tal vez debe tener mucho tiempo libre para comenzar o debe tener algo de tiempo en su agenda, o la PC perfecta o cualquier otra cosa que se esté diciendo a sí mismo. El más difícil de superar es que piensas que es muy difícil o desafiante empezar. Si bien la mayoría de los expertos en aprendizaje automático le dirán que ejecutar un modelo de aprendizaje automático literalmente requiere tres líneas de código. Se trata de comprender sus datos y saber dónde y cuándo puede aplicarlos. Esa es la parte difícil.

Entonces, superar estas creencias limitantes es el primer paso porque, en realidad, no es difícil comenzar. Literalmente, puede buscar en Google aprendizaje automático y tutoriales de 10 minutos y comenzar poco a poco y crear un hábito todos los días. Y de esa manera, si solo está esperando para comenzar y siente algunas limitaciones mentales mientras no ha comenzado, puede ver que es un paso muy pequeño que debe hacer. Solo tienes que reservar 10 minutos de tu horario y empezar. Y una vez que ejecute su primer script o instale, las bibliotecas y todo, verá que en realidad no es tan desafiante. Y luego el juego cambia un poco, solo tienes que ver dónde puedes aplicar los modelos a la vida diaria de un SEO. Y esa es la parte divertida para ser honesto.

D: Entendido. Esencialmente, lo que estás diciendo es que no dejes que la tecnología te impida hacer cosas. No es necesario que comprenda todos los aspectos de la tecnología antes de comenzar.

L: Es muy parecido al campo del SEO, donde no tienes que entenderlo todo para poner el pie en la puerta. Solo hay que tener la pasión y las ganas de hacerlo.

D: Creo que el desafío es que muchos SEO tienen la mentalidad de querer entender todo antes de hacer algo. Creo que tienen ese tipo de cerebro en el que necesitan entender el por qué antes de hacer algo.

El número dos es comprender las especificaciones de tareas comunes, las especificaciones de soluciones y las especificaciones de datos en el aprendizaje automático.



2. Comprender las especificaciones de tareas comunes, las especificaciones de soluciones y las especificaciones de datos en el aprendizaje automático



L: Sí, primero voy a empezar con los datos. Necesitas saber cuándo estás buscando algo específico... Digamos que ya pasaste el paso uno, tienes algo de práctica diaria, tal vez tutoriales de 10 minutos, ves que esto es genial y elegante, y has estado haciéndolo por un tiempo. Y ahora te encuentras con una tarea en tu vida cotidiana. Y desea ver si el aprendizaje automático es la solución correcta para ayudarlo a superar algunos desafíos que enfrenta. Las tres cosas en las que debe pensar son las características de los datos que tiene. Es decir, el conjunto de datos al que va a aplicar el aprendizaje automático. Y pueden ser datos textuales, numéricos o también pueden ser datos basados ​​en imágenes. Pero aquí estamos hablando del escenario para principiantes, por supuesto, tiene otras cosas como el aprendizaje automático multimodal donde aplica archivos de video o audio, y les aplica el aprendizaje automático. Pero aquí solo estamos hablando del caso del principiante. Y la mayoría de las veces, como SEO, las tareas que le asignamos al modelo estarán basadas en texto, por ejemplo, el contenido de la página, o serán numéricas. Entonces, por ejemplo, si está tratando de predecir el tráfico orgánico, o está tratando de predecir la cantidad de clics que obtendrá, y cosas por el estilo.

Y cuando se trata de las características de las tareas, sabemos que hay dos campos principales en el aprendizaje automático, supervisado y no supervisado. Y necesitamos saber los principales modelos que puedes, en el caso más habitual, utilizar para este tipo de tareas concretas. Entonces, para nosotros, el aprendizaje supervisado significa que ha etiquetado los datos para validar el resultado del modelo. Y sin supervisión significa lo contrario, no tienes forma de validar los resultados. En el aprendizaje supervisado, tienes cosas como la regresión, que se trata de hacer predicciones, o la clasificación, lo que significa dividirse en grupos según las clases existentes.

Solo para darle un ejemplo de estas dos cosas, hacer predicciones que ya discutimos, como predecir el tráfico orgánico o cosas así, es un buen caso, especialmente cuando está trabajando con big data o clasificación dividida en grupos. Por ejemplo, si tiene una parte de su blog que ya ha categorizado con categorías específicas, y tiene contenido nuevo que desea clasificar en uno de estos grupos específicos, ahí es donde puede usar la clasificación para ayudarlo. En el aprendizaje supervisado, tiene reducción de dimensionalidad de agrupamiento, que es un poco más avanzada, que probablemente usará, como cuando tiene un conjunto de datos muy grande o cuando tiene un problema que realmente no tiene una forma de validar. Y, a menudo, es posible que también pueda combinar los dos enfoques.

Cuando se trata de las características de la solución, lo más importante que debe saber es cuándo y dónde debe aplicar el aprendizaje automático. En mi sitio web y en un blog, para Beginner's Guide to Machine Learning, en realidad he enumerado un par de diagramas de flujo que pueden ayudarlo a pasar por el proceso de cómo está aplicando el aprendizaje automático y si ese es el caso de uso correcto. Por ejemplo, si no está trabajando con big data, entonces no es aprendizaje automático, se puede hacer literalmente en una hoja de cálculo o en una hoja de Google con un par de fórmulas estadísticas. Porque esencialmente, en esencia, la mayoría de los modelos de aprendizaje automático son exactamente eso. Estadísticas. Y sí, si es de misión crítica, como las tareas que está realizando, no debería confiar en absoluto en el aprendizaje automático. Y si necesita relacionarse con sus partes interesadas, la forma en que se lograron los resultados, o tal vez tratar de explicar o replicar el resultado de ese modelo, hay ciertos modelos que debería evitar, por ejemplo, el aprendizaje automático supervisado o el aprendizaje profundo. , porque la mayoría de ellos funcionan como una especie de caja negra. Y es bastante difícil, especialmente con big data, replicar lo que ha hecho el modelo para llegar al resultado.

Un montón de comida para el pensamiento aquí. Pero solo quiero decir que si comprende estas tres cosas y puede decir para su problema específico: "Está bien, mis datos son textuales. El modelo que necesito está basado en regresión o tal vez basado en clasificación o lo que sea es como si necesita identificar cuáles son sus datos, cuál es su tarea. Y necesita comprender qué tipo de solución va a estar buscando. Y si puede hacer eso, entonces será mucho más fácil. para encontrar los recursos apropiados para ayudarte con tu objetivo.

D: Y el número tres es permitir la práctica diaria y comenzar a realizar los movimientos.



3. Practique diariamente y comience a realizar los movimientos



L: Creo que toqué esto en un paso anterior, pero la práctica diaria es crucial. Y lo que eso significa para mí personalmente es que me gustaría hacer algo relacionado con Python porque ese es mi lenguaje de referencia. Pero podría ser JavaScript, podría ser cualquier otro idioma que le interese, y puede encontrar suficientes recursos para el aprendizaje automático e intentar hacer algo relacionado con el aprendizaje automático todos los días. Ahora, es posible que no sean proyectos completos, ya sabes, todos los días, porque pueden llevar mucho tiempo, especialmente si estás trabajando en un gran proyecto. Pero podría ser entender, por ejemplo, cómo funcionan las funciones, podría estar ejecutando un modelo basado en datos históricos que tiene, o tal vez incorporando el aprendizaje automático en su auditoría, encontrando nuevas formas de probar el aprendizaje automático. Así que la práctica diaria es crucial. Y lo mantiene alerta, específicamente porque lo ayuda a descubrir qué puede hacer el aprendizaje automático, esencialmente. Y si sabe lo que puede hacer, cuando continúe con su función diaria, le resultará mucho más fácil encontrar oportunidades para integrar el aprendizaje automático en los procesos. Y quiero resaltar aquí que no significa que deba tener soluciones completamente automatizadas que funcionen con solo hacer clic en un botón y que pueda automatizar completamente su trabajo. Significa que si puede dividir el proyecto específico en el que está trabajando en 10 bits diferentes, y si puede ayudarse a sí mismo automatizando o incorporando el aprendizaje automático y tal vez dos de estos 10, entonces puede tener mucho más tiempo para concentrarse en el resultado del resto de estos 10. O tal vez también pueda usar este tiempo para proyectos de avance profesional, como trabajar en su liderazgo, comunicación y cosas por el estilo. Esencialmente, se trata de saber cuándo y dónde usar el aprendizaje automático. Y la mejor manera de hacerlo es familiarizándose con él. Así que la práctica diaria es clave para eso.

D: Lo que nos lleva al número cuatro, cuando encuentre nuevas tareas, evalúe la solución de la tarea y las características de los datos para comprender si realmente se necesita el aprendizaje automático.



4. Evaluar nuevas tareas, sus soluciones y características de los datos para comprender cuándo se necesita el aprendizaje automático



L: Sí, de nuevo, algo que mencioné antes. Hay diferentes formas de evaluar si se necesita aprendizaje automático. Y ya mencioné ese par de diagramas de flujo. Pero esencialmente, cada tarea que encuentres, y tomemos, por ejemplo, escribir meta descripciones, porque eso es algo que hacemos con bastante frecuencia. Bueno, no deberíamos dedicarle demasiado tiempo. Sabemos que no son muy importantes para el SEO, pero como parte de un proyecto de optimización on-page, eso es algo que debes hacer, debes optimizarlos.

Vamos a deconstruir una tarea aquí. Si dice que sus datos de entrada son textuales, eso significa que sí, el contenido de la página es textual. ¿Y cuál es la tarea en ese caso? ¿Es supervisado o no supervisado? Sabemos que no está supervisado. Debido a que no hay forma de que podamos validar los resultados de la salida, tenemos que hacerlo nosotros mismos, no tenemos una forma automatizada de hacerlo. En ese caso, vamos a buscar un modelo que sea transformador, por ejemplo, tomar el texto de la página y transformarlo en una salida de menos de 160 caracteres. Entonces, tomar oraciones del texto significa extraer, o también puede ser un resumen. Pero otra forma de hacer esto es usar un modelo generativo como GPT-3. Le damos la entrada, es decir, el texto en la página, y genera las meta descripciones y las escribe desde cero, esencialmente.

Volviendo a si es de misión crítica, sabemos que no lo es. Entonces, el aprendizaje automático es bueno para este tipo de ejercicio. ¿Está bien que a veces, cuando ejecuta este modelo para el mismo tipo de página, puede obtener resultados diferentes? Por ejemplo, si ejecuta el modelo dos veces, puede obtener dos metadescripciones diferentes para la misma página. Eso está absolutamente bien. Podemos elegir entre los dos. Eso no es un problema en absoluto. ¿Necesitamos una explicación de cómo hemos escrito estas meta descripciones? No, en absoluto. Y no necesitaríamos estar explicando a nuestras partes interesadas cómo lo hemos hecho. ¿Supera a los métodos promedio? Una pregunta muy importante cuando desea evaluar si desea usar el aprendizaje automático, y podemos decir que sí, absolutamente, porque es mucho más rápido si toma este marco y lo aplica a las tareas que se pregunta si debería usar. aprendizaje automático para ellos o no, es posible que encuentre muy rápidamente qué tareas son adecuadas para el aprendizaje automático y cuáles no. Solo para darle un ejemplo, eso también podría depender del nicho, porque si tomamos el mismo ejemplo absoluto, para títulos y H1, podríamos decir que para un nicho que es muy poco competitivo, no es importante en términos de no es el tipo de cosas Your Money or Your Life, entonces podríamos decir que absolutamente, la misma postura, no es una misión crítica. Las tareas se pueden automatizar, podemos implementar el aprendizaje automático y no necesitamos dar explicaciones sobre cómo hemos escrito los títulos y los H1. Pero si decimos, por ejemplo, que nuestro cliente es HMRC, sabemos que esto es muy importante para hacerlo bien. No queremos sugerir algunos títulos, H1 o meta descripciones que no estén del todo en lo cierto. Por lo tanto, a veces también puede sentir que su cliente o la industria en la que trabaja, o el sitio en particular en el que está trabajando, podría ser la razón por la que no puede implementar algunas de estas herramientas.

D: Creo que eso nos lleva bastante bien al número cinco, que es cuando se trabaja con el aprendizaje automático, se comprenden sus limitaciones y se examina el resultado.



5. Comprender las limitaciones y examinar el resultado del aprendizaje automático



L: Absolutamente y este es muy importante debido a la cantidad de veces que he pensado que se puede hacer algo con el aprendizaje automático, y he implementado un modelo o probado un script o algo así porque hay tantos scripts. allí afuera. Honestamente, si sabes cómo buscarlos, hay casi un script para cualquier tarea que se te ocurra, solo tienes que saber cómo implementarlo para el problema particular en SEO. Y la cantidad de veces que probé algunos y terminé sin usar la salida es mucha. Entonces, necesita saber qué puede hacer el aprendizaje automático. En este momento, el aprendizaje automático se encuentra en una etapa en la que es muy bueno en tareas limitadas, pero la mayoría de los modelos, la forma en que están capacitados, y como principiante, la mayor parte del tiempo utilizará modelos previamente entrenados, usted No los vas a entrenar tú mismo. Y ese es otro tema por sí solo. Pero si está utilizando modelos previamente entrenados y no los está entrenando usted mismo, la mayoría de las veces verá que el conjunto de datos en el que han sido entrenados no es particularmente útil para la industria en particular, o es no tan profundo como usted podría querer que sea. Y ese es particularmente el caso de tareas basadas en texto como NLP y cosas por el estilo.

Y aquí, solo tienes que saber dos cosas. En primer lugar, incluso tener una base con la que trabajar es algo suficientemente bueno. Si sabes que sí, por ejemplo, las meta descripciones que ha generado el modelo no son tan buenas pero se pueden arreglar. Y si cree que, si los edita, le resultará mucho más rápido generar el resultado final, entonces debería darse una palmada en la espalda, ha hecho un gran trabajo porque se ha ahorrado un montón de tiempo, incluso con eso. Y si cree que el resultado no es útil en absoluto, eso no significa que todo el aprendizaje automático no sea útil. Eso solo significa que para esta tarea específica, este modelo específico que ha utilizado no ha sido útil. Y eso está perfectamente bien. Porque incluso puede decirle a su parte interesada o a su cliente que probamos algunos enfoques, probamos un enfoque automatizado. Y no funcionó por esta y esta razón. Y luego puede incluso usar la salida del modelo para comparar y contrastar con la salida que ha generado su equipo. Entonces, en todos los casos, implementar o probar el aprendizaje automático hará que su caso sea mucho más sólido. Solo tienes que saber cuándo decir bien, lo intentamos, pero no funcionó y cómo usar esto para tu beneficio también.

D: Y hablando de resultados que nos llevan claramente al número seis, que es trabajar en colaboración y establecer expectativas razonables.



6. Trabaje en colaboración y establezca expectativas razonables



L: Este último paso tiene que ver con saber cuándo necesita ayuda y saber cómo obtener la ayuda adecuada. Y aquí creo que hay algunas cosas que puede seguir para obtener la ayuda que necesita. En primer lugar, encuentre un compañero de aprendizaje automático. Alguien que sea del mismo tipo de persona que tú. Trabajan en la misma industria. Tienen el mismo tipo de problemas. Y estás pensando y encontrando problemas y estás investigando para tareas juntos. Y cuando alguien encuentra algo que es útil para el rol, lo comparte con su amigo. Te ayuda a mantenerte responsable, te ayuda a mantenerte motivado y realmente es algo muy bueno para tener.

Otra solución aquí sería unirse a una tribu como una tribu de aprendizaje automático. De nuevo, voy a llamar aquí a Jason Brownlee. Ha creado este gráfico, un desglose de las diferentes tribus de aprendizaje automático que existen. Y para nosotros, como SEO, pertenecemos a una tribu comercial, por lo que podrían ser gerentes que están tratando de ver si la automatización o el aprendizaje automático es la solución correcta para su problema, o si se puede usar para su equipo o datos. tribus, que son, por ejemplo, analistas de datos que intentan ser un poco mejores en la comprensión de los datos. Y la razón por la que mencioné estos dos tipos de tribus específicamente, es que si estás en un grupo o comunidad como ese, sabes que las personas allí están tratando de encontrar el mismo tipo de resultados, pero su enfoque del problema es similar. a tí. Por lo tanto, no será examinado, por ejemplo, si no conoce los conceptos avanzados relacionados con la codificación o las matemáticas detrás del modelo de aprendizaje automático. Estarás rodeado de personas que simpatizarán con el tipo de desafíos que tienes. Y eso podría ser diferentes desafíos. Por ejemplo, si está en una comunidad con desarrolladores de Python y pregunta por qué mi modelo no funciona y resulta ser una coma o algo así. Es posible que sienta un poco más de escrutinio, las respuestas a su consulta pueden ser un poco más duras y no queremos que se sienta desmotivado. Por eso hago hincapié en encontrar el tipo correcto de comunidad o el tipo correcto de tribu.

Y lo tercero es, y creo que esto es algo que deberías aplicar, independientemente del enfoque que elijas. Eso debería ser simplemente comunicarse con los desarrolladores siempre que pueda, cada vez que sienta que no puede resolver la consulta por su cuenta. Si ha pasado como seis horas en StackOverflow, y está atascado en un solo error, y se siente súper desmotivado, solo comuníquese con alguien, hay muchos desarrolladores de Python súper hábiles, incluso en la comunidad de SEO. Si se comunica con ellos, es posible que ya hayan encontrado un problema como ese, por lo que podrían darle instrucciones. Y no estoy diciendo que se comunique con ellos, para que puedan escribir su guión por usted. Pero solo pueden guiarlo en la dirección correcta. Y eso también puede ser muy inspirador y motivador.

D: Lazarina, eso fue absolutamente brillante. Sé que se puede hablar durante semanas sobre aprendizaje automático para SEO. Eso fue solo una breve introducción. Pero realmente demuestra su conocimiento. Y estoy seguro de que puedes sumergirte en áreas específicas. Sería genial recuperarlo en algún momento, tal vez podamos recuperarlo y sumergirnos en algo como Python para SEO o algún otro tema más especializado allí.





The Pareto Pickle - Analice el SERP para nuevas oportunidades



Terminamos con el Pareto Pickle. Pareto dice que puedes obtener el 80% de tus resultados con el 20% de tus esfuerzos. ¿Cuál es una actividad de SEO que recomendaría que proporcione resultados increíbles con niveles modestos de esfuerzo?

L: He pensado mucho en esto. Y quería decir algo que creo que no he visto hacer tan a menudo. Y para mí, es análisis SERP. Tenemos muchas oportunidades para analizar las páginas de resultados de los motores de búsqueda, especialmente a escala. Entonces, si ya ha realizado su investigación de palabras clave, y conoce las palabras clave en las que tal vez su sitio está clasificado, las que el sitio no está clasificando, y la brecha de contenido y todo. Diría que si puede hacer un análisis SERP a gran escala, utilizando una herramienta como DataForSEO, de esa manera, puede obtener una muy buena imagen del mercado. Como quién clasifica dónde, con qué marcas compites, cómo estructuran sus títulos, meta descripciones, cuánto dura su contenido y todo tipo de análisis por el estilo. Y si en ese nivel, sabe cuándo y dónde implementar el aprendizaje automático, entonces esa actividad por sí sola influirá en toda su estrategia de contenido. Y lo mantendrá encaminado para que también siga siendo competitivo más adelante. Así que es algo que haces una vez para este cliente específico y lo proteges y puedes usarlo durante un par de meses más adelante para guiarte e influir en muchas de las otras estrategias que vas a hacer.

D: Realmente quiero sumergirme en eso. Quiero seguir adelante y hacerte más preguntas. Pero sé que eso va a llevar más o menos media hora y no tenemos tiempo para hacerlo ahora. Con suerte, lo recuperaremos en un episodio futuro. Por ahora. He sido su anfitrión David Bain. Muchas gracias por estar en el podcast In Search SEO.

L: Muchas gracias por recibirme, David. Ha sido un placer.

D: Y gracias por escuchar.