Um guia para iniciantes em rastreamento na web
Publicados: 2022-05-02Seja você proprietário de um site ou um profissional de SEO, é essencial entender o rastreamento de sites, como os mecanismos de pesquisa rastreiam sites e páginas da Web e como ele classifica (ou decide não classificar) uma página para uma determinada consulta de pesquisa.
O rastreamento de sites é um processo técnico e, para ser honesto, você não precisa entender o aspecto técnico por trás dele. Apenas entender o conceito principal e o que você pode fazer para facilitar o rastreamento de sites para mecanismos de pesquisa como o Google pode ajudá-lo a tornar seu site mais amigável aos mecanismos de pesquisa, seguir as melhores práticas de SEO e ter uma classificação mais alta nas páginas de resultados dos mecanismos de pesquisa (SERPs).
Neste post, vamos discutir:
- O que é rastreamento de site
- Os diferentes tipos de rastreamento de sites
- Como será o futuro do rastreamento de sites em 2022 e além
- Como você pode facilitar o rastreamento de sites para o Google
Vamos pegar de cima.
O que é rastreamento na web?

Antes de nos aprofundarmos nisso, é crucial entender o que é o rastreamento da web.
O rastreamento refere-se ao processo pelo qual os mecanismos de pesquisa descobrem conteúdo novo e atualizado na Internet. Os mecanismos de pesquisa fazem isso enviando rastreadores (também conhecidos como robôs, bots ou aranhas).
Esses bots “rastreiam” a internet para ver se há uma nova página que eles possam indexar nos SERPs. Da mesma forma, esses bots também procuram páginas que foram atualizadas recentemente com novos conteúdos.
O tipo de “conteúdo” pode variar – de páginas da web a imagens, vídeos e PDFs.
As limitações enfrentadas pelos rastreadores da web
Como você pode imaginar, é um trabalho difícil buscar cada página da web na internet e rastreá-la para novos conteúdos. Isso é assim por causa do grande volume de páginas da web na internet. Além disso, milhões e milhões de novas páginas aparecem na web diariamente.
Isso requer muitos recursos computacionais, o que pode levar a problemas de sustentabilidade. Falaremos mais sobre isso mais adiante neste artigo, o que isso significa para o futuro do rastreamento da web e o impacto potencial dessa limitação em webmasters e profissionais de SEO.
Por enquanto, você deve entender como esses rastreadores ou spiders tentam superar esse problema tornando-se mais eficientes e como você pode aproveitar isso em seu benefício.
As aranhas de rastreamento geralmente buscam algumas páginas da web e as rastreiam. Em seguida, eles seguem os links (links internos e links externos) nessas páginas da Web para encontrar novos URLs para rastrear e indexar. Isso ajuda os rastreadores a se tornarem mais eficientes na construção de um gigantesco banco de dados de URLs.
E é por isso que adicionar links para páginas em suas páginas da web – especialmente links internos contextualmente relevantes para outras páginas é uma prática de SEO recomendada.
Dois tipos de rastreamento na web
De acordo com o Google, existem dois tipos de rastreamento na web:
- Descoberta
- Atualizar
“Quando se trata de engatinhar, temos dois tipos de engatinhar. Uma delas é um rastreamento de descoberta em que tentamos descobrir novas páginas em seu site. E o outro é um rastreamento de atualização em que atualizamos as páginas existentes que conhecemos”, diz John Mueller, do Google.
A frequência de rastreamento — além do tipo de rastreamento — também depende da frequência com que o conteúdo está sendo atualizado em seu site ou página da web. Por exemplo, se a página inicial do seu site for atualizada com mais regularidade do que outras páginas, você provavelmente verá mais atividades de rastreamento nessa página.
E, como explicamos anteriormente, os spiders de rastreamento também encontrarão links na página inicial e rastrearão as páginas que encontrarem com esses links.
Portanto, um rastreamento de atualização (para a página inicial, para verificar se há algum conteúdo novo) também pode levar a um rastreamento de descoberta se um link para uma nova página for encontrado lá.
Um último ponto a entender sobre isso é que o Googlebot é capaz de reconhecer padrões para ajustar seu rastreamento de atualização de acordo.

John Mueller, do Google, explicou isso com o seguinte exemplo:
“Por exemplo, se você tem um site de notícias e o atualiza de hora em hora, devemos aprender que precisamos rastreá-lo de hora em hora. Considerando que, se for um site de notícias atualizado uma vez por mês, devemos aprender que não precisamos rastrear a cada hora.
E isso não é um sinal de qualidade, ou um sinal de classificação, ou qualquer coisa assim. É realmente apenas do ponto de vista técnico que aprendemos que podemos rastrear isso uma vez por dia, uma vez por semana, e tudo bem.”
O Google faz isso para economizar recursos de rastreamento. Como mencionamos anteriormente, o rastreamento é uma tarefa difícil e pode consumir muitos recursos computacionais dia após dia. Isso não é muito sustentável, especialmente porque a Internet continua a crescer.
Isso leva ao nosso próximo ponto.
O futuro do rastreamento da Web em 2022 e além
Em um episódio recente do podcast Search Off the Records, a equipe de relações de pesquisa do Google deu a entender que o Google pode reduzir a taxa de rastreamento da web para economizar recursos computacionais e promover a sustentabilidade.
“A computação, em geral, não é realmente sustentável. Somos livres de carbono desde, nem sei, 2007 ou algo assim, mas isso não significa que não possamos reduzir ainda mais nossa pegada no meio ambiente. E rastejar é uma daquelas coisas que, no início, poderíamos cortar algumas frutas mais fáceis”, disse Gary Illyes, do Google.
Ele elaborou ainda mais como o Google pode atingir essa meta de sustentabilidade reduzindo a taxa de rastreamento de atualização.
“Uma coisa que fazemos, e talvez não precisemos fazer muito, é atualizar rastreamentos. O que significa que, uma vez que descobrimos um documento, uma URL, vamos, rastreamos e, eventualmente, vamos voltar e revisitar essa URL. Isso é um rastreamento de atualização.
E então, toda vez que voltarmos a esse URL, isso sempre será um rastreamento de atualização. Agora, com que frequência precisamos voltar a esse URL?”
O que significa uma taxa de rastreamento reduzida para proprietários de sites e SEOs?

A taxa de rastreamento reduzida para rastreamentos de atualização provavelmente diminuiria as atualizações de indexação e classificação para páginas da Web atualizadas. No entanto, isso não significa necessariamente classificações mais baixas nos mecanismos de pesquisa.
Gary Illyes confirmou durante o podcast que “é um equívoco” pensar que “se uma página for mais rastreada, ela será classificada mais”.
7 dicas sobre como melhorar o rastreamento em seu site
Agora que você sabe o que é o rastreamento da Web e o que o futuro do rastreamento da Web pode trazer, vejamos brevemente algumas dicas que você pode usar para melhorar o rastreamento em seu site.
- Atualize seu conteúdo com frequência. Se você publicar uma postagem por semana, sem outras atualizações de conteúdo em seu site, o Google reconhecerá o padrão e diminuirá o rastreamento de atualização do seu site, como aprendemos anteriormente.
- Atualize o Google assim que seu site for atualizado enviando o URL para reindexação no Google Search Console.
- Crie links mais contextualmente relevantes a partir de sites rastreados regularmente, bem como de páginas da Web rastreadas regularmente em seu site.
- Gaste tempo e esforço para melhorar a velocidade de carregamento do seu site. Se um site for muito lento para carregar, os rastreadores de sites podem abandoná-lo.
- Adicione um mapa do site e mantenha-o atualizado para ajudar o Google no rastreamento da web. Verifique o mapa do site do seu site aqui.
- Reduza o número de páginas órfãs em seu site. Páginas órfãs são aquelas páginas que não possuem nenhum link apontando para elas.
- Reduza as cadeias de redirecionamento
Esperamos que você tenha achado útil este guia para iniciantes sobre rastreamento na web. Se você tiver alguma dúvida ou comentário, informe-nos na seção de comentários abaixo.
