5 principais insights de estatísticas de rastreamento no Google Search Console

Publicados: 2021-04-16

Há um relatório no Google Search Console que é incrivelmente útil e bastante difícil de encontrar, especialmente se você está apenas começando sua jornada de SEO.

É uma das ferramentas mais poderosas para todo profissional de SEO, mesmo que você não possa acessá-la na interface principal do Google Search Console.

Estou falando do relatório de estatísticas de rastreamento.

Neste artigo, você aprenderá por que esse relatório é tão importante, como acessá-lo e como usá-lo para obter vantagens de SEO.

Como seu site é rastreado?

O orçamento de rastreamento (o número de páginas que o Googlebot pode e deseja rastrear) é essencial para SEO, especialmente para sites grandes.

Se você tiver problemas com o orçamento de rastreamento do seu site, o Google pode não indexar algumas de suas páginas valiosas.

E como diz o ditado, se o Google não indexou algo, então não existe.

O Google Search Console pode mostrar quantas páginas do seu site são visitadas pelo Googlebot todos os dias.

Armado com esse conhecimento, você pode encontrar anomalias que podem estar causando seus problemas de SEO.

Mergulhando em suas estatísticas de rastreamento: 5 principais insights

Para acessar seu relatório de estatísticas de rastreamento, faça login em sua conta do Google Search Console e navegue até Configurações > Estatísticas de rastreamento .

Aqui estão todas as dimensões de dados que você pode inspecionar no relatório de estatísticas de rastreamento:

1. Anfitrião

Imagine que você tenha uma loja de comércio eletrônico em shop.website.com e um blog em blog.website.com.

Usando o relatório de estatísticas de rastreamento, você pode ver facilmente as estatísticas de rastreamento relacionadas a cada subdomínio do seu site.

Infelizmente, esse método não funciona atualmente com subpastas.

2. Status HTTP

Um outro caso de uso para o relatório de estatísticas de rastreamento é analisar os códigos de status dos URLs rastreados.

Isso porque você não quer que o Googlebot gaste recursos rastreando páginas que não são HTTP 200 OK. É um desperdício do seu orçamento de rastreamento.

Para ver o detalhamento dos URLs rastreados por código de status, vá para Configurações > Estatísticas de rastreamento > Detalhamento das solicitações de rastreamento .

Relatório de estatísticas de rastreamento do Google Search Console mostrando um detalhamento dos URLs rastreados por tipo de resposta HTTP.

Neste caso específico, 16% de todas as solicitações foram feitas para páginas redirecionadas.

Se você vir estatísticas como essas, recomendo investigar e procurar saltos de redirecionamento e outros problemas em potencial.

Na minha opinião, um dos piores casos que você pode ver aqui é uma grande quantidade de erros 5xx.

Para citar a documentação do Google: “Se o site ficar lento ou responder com erros do servidor, o limite diminui e o Googlebot rastreia menos”.

Se você estiver interessado neste tópico, Roger Montti escreveu um artigo detalhado sobre erros 5xx no Google Search Console.

3. Objetivo

O relatório de estatísticas de rastreamento divide a finalidade do rastreamento em duas categorias:

  • URLs rastreados para fins de atualização (um novo rastreamento de páginas já conhecidas, por exemplo, o Googlebot está visitando sua página inicial para descobrir novos links e conteúdo).
  • URLs rastreados para fins de descoberta (URLs que foram rastreados pela primeira vez).

Esse detalhamento é incrivelmente útil, e aqui está um exemplo:

Recentemente, encontrei um site com cerca de 1 milhão de páginas classificadas como “Descobertas – atualmente não indexadas”.

Esse problema foi relatado em 90% de todas as páginas desse site.

(Se você não estiver familiarizado com ele, "Descoberto, mas não índice" significa que o Google descobriu uma determinada página, mas não a visitou. Se você descobriu um novo restaurante em sua cidade, mas não experimentou, por exemplo .)

Uma das opções era esperar, torcendo para que o Google indexasse essas páginas aos poucos.

Outra opção era analisar os dados e diagnosticar o problema.

Então, entrei no Google Search Console e naveguei até Configurações > Estatísticas de rastreamento > Solicitações de rastreamento: HTML .

Descobriu-se que, em média, o Google visitava apenas 7.460 páginas naquele site por dia.

Um gráfico que mostra as estatísticas de rastreamento de um site de comércio eletrônico.

Mas aqui está algo ainda mais importante.

Graças ao relatório de estatísticas de rastreamento, descobri que apenas 35% desses 7.460 URLs foram rastreados por motivos de descoberta.

Relatórios de estatísticas de rastreamento do Google Search Console mostrando um detalhamento da finalidade do rastreamento.

São apenas 2.611 novas páginas descobertas pelo Google por dia.

2611 de mais de um milhão.

Levaria 382 dias para o Google indexar totalmente todo o site nesse ritmo.

Descobrir isso foi um divisor de águas. Todas as outras otimizações de pesquisa foram adiadas porque nos concentramos totalmente na otimização do orçamento de rastreamento.

4. Tipo de arquivo

As estatísticas de rastreamento do GSC podem ser úteis para sites JavaScript. Você pode verificar facilmente com que frequência o Googlebot rastreia os arquivos JS necessários para a renderização adequada.

Se o seu site estiver cheio de imagens e a pesquisa de imagens for crucial para sua estratégia de SEO, este relatório também ajudará muito – você pode ver o quão bem o Googlebot pode rastrear suas imagens.

5. Tipo de Googlebot

Por fim, o relatório de estatísticas de rastreamento fornece uma análise detalhada do tipo de Googlebot usado para rastrear seu site.

Você pode descobrir a porcentagem de solicitações feitas pelo Googlebot para dispositivos móveis ou para computadores e pelos bots de imagem, vídeo e anúncios.

Outras informações úteis

Vale a pena notar que o relatório de estatísticas de rastreamento tem informações valiosas que você não encontrará nos logs do servidor:

  1. Erros de DNS.
  2. Tempos limite da página.
  3. Problemas de host, como problemas ao buscar o arquivo robots.txt.

Como usar estatísticas de rastreamento na Ferramenta de inspeção de URL

Você também pode acessar alguns dados de rastreamento granular fora do relatório de estatísticas de rastreamento, na Ferramenta de inspeção de URL.

Trabalhei recentemente com um grande site de comércio eletrônico e, após algumas análises iniciais, notei dois problemas urgentes:

  1. Muitas páginas de produtos não foram indexadas no Google.
  2. Não houve ligação interna entre os produtos. A única maneira de o Google descobrir novos conteúdos era por meio de sitemaps e páginas de categorias paginadas.

Um próximo passo natural foi acessar os logs do servidor e verificar se o Google havia rastreado as páginas de categorias paginadas.

Mas obter acesso aos logs do servidor geralmente é muito difícil, especialmente quando você está trabalhando com uma grande organização.

O relatório de estatísticas de rastreamento do Google Search Console veio em socorro.

Deixe-me guiá-lo pelo processo que usei e que você pode usar se estiver enfrentando um problema semelhante:

1. Primeiro, procure um URL na Ferramenta de inspeção de URL. Escolhi uma das páginas paginadas de uma das principais categorias do site.

2. Em seguida, navegue até Cobertura > Relatório de rastreamento .

A Ferramenta de inspeção de URL do Google Search Console permite que você procure a última data de rastreamento de um determinado URL.

Nesse caso, o URL foi rastreado pela última vez há três meses.

Tenha em mente que esta era uma das principais páginas de categorias do site que não era rastreada há mais de três meses!

Fui mais fundo e verifiquei uma amostra de outras páginas de categorias.

Acontece que o Googlebot nunca visitou muitas páginas de categorias principais. Muitos deles ainda são desconhecidos para o Google.

Acho que não preciso explicar como é crucial ter essas informações quando você está trabalhando para melhorar a visibilidade de qualquer site.

O relatório de estatísticas de rastreamento permite que você veja coisas como essa em minutos.

Empacotando

Como você pode ver, o relatório de estatísticas de rastreamento é uma poderosa ferramenta de SEO, embora você possa usar o Google Search Console por anos sem nunca encontrá-lo.

Ele ajudará você a diagnosticar problemas de indexação e otimizar seu orçamento de rastreamento para que o Google possa encontrar e indexar seu conteúdo valioso rapidamente, o que é particularmente importante para sites grandes.

Eu lhe dei alguns casos de uso para pensar, mas agora a bola está do seu lado.

Como você usará esses dados para melhorar a visibilidade do seu site?

Mais recursos:

  • SEO Crawl-First: um guia de 12 etapas para seguir antes de rastrear
  • 7 dicas para otimizar o orçamento de rastreamento para SEO
  • Como funcionam os mecanismos de pesquisa

Créditos da imagem

Todas as capturas de tela tiradas pelo autor, abril de 2021