Las 5 mejores estadísticas de rastreo en Google Search Console

Publicado: 2021-04-16

Hay un informe en Google Search Console que es increíblemente útil y bastante difícil de encontrar, especialmente si recién está comenzando su viaje de SEO.

Es una de las herramientas más poderosas para todos los profesionales de SEO, aunque ni siquiera puede acceder a ella desde la interfaz principal de Google Search Console.

Estoy hablando del informe de estadísticas de rastreo.

En este artículo, aprenderá por qué este informe es tan importante, cómo acceder a él y cómo usarlo para obtener ventajas de SEO.

¿Cómo se rastrea su sitio web?

El presupuesto de rastreo (la cantidad de páginas que Googlebot puede y quiere rastrear) es esencial para el SEO, especialmente para sitios web grandes.

Si tiene problemas con el presupuesto de rastreo de su sitio web, es posible que Google no indexe algunas de sus páginas valiosas.

Y como dice el refrán, si Google no indexó algo, entonces no existe.

Google Search Console puede mostrarle cuántas páginas de su sitio visita Googlebot cada día.

Armado con este conocimiento, puede encontrar anomalías que pueden estar causando sus problemas de SEO.

Sumérgete en tus estadísticas de rastreo: 5 ideas clave

Para acceder a su informe de estadísticas de rastreo, inicie sesión en su cuenta de Google Search Console y vaya a Configuración > Estadísticas de rastreo .

Estas son todas las dimensiones de datos que puede inspeccionar dentro del informe de estadísticas de rastreo:

1. Anfitrión

Imagina que tienes una tienda de comercio electrónico en shop.website.com y un blog en blog.website.com.

Con el informe de estadísticas de rastreo, puede ver fácilmente las estadísticas de rastreo relacionadas con cada subdominio de su sitio web.

Desafortunadamente, este método actualmente no funciona con subcarpetas.

2. Estado HTTP

Otro caso de uso para el informe de estadísticas de rastreo es mirar los códigos de estado de las URL rastreadas.

Esto se debe a que no desea que Googlebot gaste recursos en rastrear páginas que no sean compatibles con HTTP 200. Es un desperdicio de su presupuesto de rastreo.

Para ver el desglose de las URL rastreadas por código de estado, vaya a Configuración > Estadísticas de rastreo > Desglose de solicitudes de rastreo .

Informe de estadísticas de rastreo de Google Search Console que muestra un desglose de las URL rastreadas por tipo de respuesta HTTP.

En este caso particular, el 16% de todas las solicitudes se realizaron para páginas redirigidas.

Si ve estadísticas como estas, le recomiendo investigar más y buscar redireccionamientos y otros posibles problemas.

En mi opinión, uno de los peores casos que puedes ver aquí es una gran cantidad de errores 5xx.

Para citar la documentación de Google: "Si el sitio se ralentiza o responde con errores del servidor, el límite baja y Googlebot rastrea menos".

Si está interesado en este tema, Roger Montti escribió un artículo detallado sobre los errores 5xx en Google Search Console.

3. Propósito

El informe de estadísticas de rastreo divide el propósito del rastreo en dos categorías:

  • URL rastreadas con fines de actualización (un nuevo rastreo de páginas ya conocidas, por ejemplo, Googlebot está visitando su página de inicio para descubrir nuevos enlaces y contenido).
  • URL rastreadas con fines de descubrimiento (URL que se rastrearon por primera vez).

Este desglose es increíblemente útil, y aquí hay un ejemplo:

Recientemente encontré un sitio web con ~1 millón de páginas clasificadas como "Descubiertas, actualmente no indexadas".

Este problema se informó en el 90% de todas las páginas de ese sitio.

(Si no está familiarizado con él, "Descubierto pero no indexado" significa que Google descubrió una página determinada pero no la visitó. Si descubrió un nuevo restaurante en su ciudad pero no lo probó, por ejemplo .)

Una de las opciones era esperar, con la esperanza de que Google indexara estas páginas de forma paulatina.

Otra opción era mirar los datos y diagnosticar el problema.

Así que inicié sesión en Google Search Console y navegué a Configuración > Estadísticas de rastreo > Solicitudes de rastreo: HTML .

Resultó que, en promedio, Google visitaba solo 7460 páginas en ese sitio web por día.

Un gráfico que muestra las estadísticas de rastreo de un sitio web de comercio electrónico.

Pero aquí hay algo aún más importante.

Gracias al informe de estadísticas de rastreo, descubrí que solo el 35% de estas 7460 URL se rastrearon por motivos de descubrimiento.

Informe de estadísticas de rastreo de Google Search Console que muestra un desglose del propósito del rastreo.

Eso es solo 2611 nuevas páginas descubiertas por Google por día.

2611 de más de un millón.

Google tardaría 382 días en indexar completamente todo el sitio web a ese ritmo.

Descubrir esto fue un cambio de juego. Todas las demás optimizaciones de búsqueda se pospusieron porque nos enfocamos completamente en la optimización del presupuesto de rastreo.

4. Tipo de archivo

Las estadísticas de rastreo de GSC pueden ser útiles para los sitios web de JavaScript. Puede verificar fácilmente la frecuencia con la que Googlebot rastrea los archivos JS que se requieren para una representación adecuada.

Si su sitio está repleto de imágenes y la búsqueda de imágenes es crucial para su estrategia de SEO, este informe también será de gran ayuda: puede ver qué tan bien Googlebot puede rastrear sus imágenes.

5. Tipo de robot de Google

Finalmente, el informe de estadísticas de rastreo le brinda un desglose detallado del tipo de Googlebot utilizado para rastrear su sitio.

Puede averiguar el porcentaje de solicitudes realizadas por Googlebot móvil o de escritorio y bots de imagen, video y anuncios.

Otra información útil

Vale la pena señalar que el informe de estadísticas de rastreo tiene información invaluable que no encontrará en los registros de su servidor:

  1. Errores de DNS.
  2. Tiempos de espera de página.
  3. Problemas del host, como problemas para obtener el archivo robots.txt.

Uso de estadísticas de rastreo en la herramienta de inspección de URL

También puede acceder a algunos datos de rastreo detallados fuera del informe de estadísticas de rastreo, en la Herramienta de inspección de URL.

Recientemente trabajé con un gran sitio web de comercio electrónico y, después de algunos análisis iniciales, noté dos problemas urgentes:

  1. Muchas páginas de productos no estaban indexadas en Google.
  2. No había vinculación interna entre los productos. La única forma en que Google podía descubrir contenido nuevo era a través de mapas de sitio y páginas de categorías paginadas.

El siguiente paso natural fue acceder a los registros del servidor y verificar si Google había rastreado las páginas de categorías paginadas.

Pero obtener acceso a los registros del servidor suele ser realmente difícil, especialmente cuando se trabaja con una organización grande.

El informe de estadísticas de rastreo de Google Search Console vino al rescate.

Déjame guiarte a través del proceso que usé y que puedes usar si tienes problemas con un problema similar:

1. Primero, busque una URL en la Herramienta de inspección de URL. Elegí una de las páginas paginadas de una de las principales categorías del sitio.

2. Luego, navegue hasta Cobertura > Informe de rastreo .

La herramienta de inspección de URL de Google Search Console le permite buscar la última fecha rastreada de una URL determinada.

En este caso, la URL se rastreó por última vez hace tres meses.

¡Tenga en cuenta que esta era una de las páginas de categorías principales del sitio web que no se había rastreado durante más de tres meses!

Profundicé más y revisé una muestra de otras páginas de categorías.

Resultó que Googlebot nunca visitó muchas páginas de categorías principales. Muchos de ellos aún son desconocidos para Google.

No creo que sea necesario explicar lo crucial que es tener esa información cuando se trabaja para mejorar la visibilidad de cualquier sitio web.

El informe de estadísticas de rastreo te permite buscar cosas como esta en cuestión de minutos.

Terminando

Como puede ver, el informe de estadísticas de rastreo es una poderosa herramienta de SEO a pesar de que podría usar Google Search Console durante años sin encontrarlo.

Lo ayudará a diagnosticar problemas de indexación y optimizar su presupuesto de rastreo para que Google pueda encontrar e indexar su contenido valioso rápidamente, lo cual es particularmente importante para sitios grandes.

Le di un par de casos de uso para pensar, pero ahora la pelota está en su cancha.

¿Cómo utilizará estos datos para mejorar la visibilidad de su sitio?

Más recursos:

  • Crawl-First SEO: una guía de 12 pasos a seguir antes de rastrear
  • 7 consejos para optimizar el presupuesto de rastreo para SEO
  • Cómo funcionan los motores de búsqueda

Créditos de imagen

Todas las capturas de pantalla tomadas por el autor, abril de 2021