Perguntas frequentes: o conteúdo escrito pela IA pode ser classificado no Google?
Publicados: 2021-11-26
A cada poucos meses nos últimos anos, vemos uma grande notícia nos sites de SEO ou grandes publicações sobre como o copywriting de inteligência artificial dominará a indústria de conteúdo. Os escritores temem por seus meios de subsistência, os proprietários de sites veem cifrões em todo o dinheiro que economizam e – o mais importante – as agências que fazem os redatores de IA impulsionarem a narrativa.
A questão é: o conteúdo de IA pode ser classificado no Google? Isso é realmente o que importa, certo? Se não puder classificar, é inútil para quem não é um spammer. Por outro lado, se puder classificar, talvez seja o "futuro do SEO".

Vamos cavar e olhar para a situação como está atualmente.
De onde vem o conteúdo gerado por IA?
Primeiro, vamos falar um pouco sobre de onde vem o conteúdo de inteligência artificial. Existem duas origens diferentes, dependendo da sua perspectiva.
A primeira é a origem conceitual. O conteúdo gerado por IA é uma extensão da fiação de artigos. A fiação de artigos é o ato de pegar o conteúdo existente e reorganizá-lo para criar algo único. Observe que eu digo "único" aqui e não "novo". Há uma razão para isso, que eu vou falar mais tarde.

A fiação de artigos à moda antiga era realizada mais ou menos manualmente, usando um dicionário de sinônimos e curingas. Você escreveria algo assim:
Sejam todos bem-vindos ao meu (blog sobre marketing de conteúdo|blog de marketing de conteúdo|site de conteúdo)!
O material entre parênteses é substituído por uma das três opções, separadas pelo | bar. Essa linha gera três frases únicas diferentes com esse método chamado Spintax. Uma versão mais avançada pode ser assim:
Bem-vindos (todos|amigos|pessoas) ao meu (blog|site) sobre (marketing de conteúdo|SEO)
Esta versão pode gerar algumas frases únicas diferentes. Três opções vezes duas opções vezes duas opções, ou 3*2*2, é igual a 12 variações diferentes para aquela frase.
Repita isso ao longo de uma postagem de blog inteira. Uma postagem de blog com 500 palavras pode ter centenas dessas substituições, criando milhões, bilhões ou mais variações exclusivas de um único conteúdo.
Existem vários problemas com esta forma de fiação de artigos. Em primeiro lugar, embora possam acabar sendo tecnicamente "únicos", é fácil comparar variações e dizer que são do mesmo estoque. Todo o texto não fiado é o mesmo, nos mesmos padrões e formatos duplicados. Retire as seções giradas e você terá modelos que parecem idênticos.
Outro problema é que você precisa configurar isso manualmente. Você precisa desenvolver em quais seções de um conteúdo adicionar variações e, em seguida, usar o software para gerar as versões exclusivas.
E, claro, o Google pode fazer engenharia reversa disso. Se você der a eles uma amostra de algumas dezenas dessas peças exclusivas de conteúdo, eles poderão identificar os padrões muito rapidamente. Caramba, eles fazem a mesma coisa em seu índice para classificar o conteúdo.
É por isso que você verá as páginas classificadas para consultas de pesquisa, apesar de não usar nenhuma das palavras da pesquisa em si; O Google entende sinônimos e os usa. Assim, na versão abstrata "indexada" do conteúdo, o Google pode nem mesmo ver a singularidade de cada postagem.
O giro de conteúdo evoluiu para ser feito por software automaticamente, usando definições de dicionários de sinônimos e listas de pesquisa de palavras-chave, e se tornou um pouco mais sofisticado, mas esses avanços não são suficientes para evitar que seja detectado por algoritmos de busca.
É aí que entra a IA. A IA é a "próxima grande novidade" para praticamente todas as áreas de tecnologia do mundo. A IA é usada no reconhecimento e geração de imagens e na análise de dados, criptografia e muito mais. Está em toda parte.
Isso nos leva à segunda origem do conteúdo gerado por IA: os sites e empresas que o oferecem como serviço. As duas peças significativas no espaço de conteúdo agora são AnyWord.com e Copy.AI.
Quando você olha para esses sites, você pode ver que eles são praticamente os mesmos. Eles oferecem o mesmo serviço, com o mesmo tipo de isenção de responsabilidade e casos de uso de exemplo, para coisas como cópia do anúncio, páginas de destino, marketing por SMS e assim por diante. Caramba, você pode até ver sinais de que eles correram para ser os primeiros a comercializar; as fotos da equipe Copy.AI são apenas capturas de tela de uma chamada de Zoom, assim como as do Anyword, apenas na seção Sobre.
Existem estudos de caso sobre classificação de conteúdo de IA?
Agora que você tem a introdução, voltamos à questão central em questão. O conteúdo gerado por IA pode ser classificado no Google?
Aqui está um estudo de caso realizado em 2019 pela Semrush:
Neste estudo, a Semrush gerou um site com GPT-2, a rede de conteúdo generativo de IA que alimenta ferramentas de IA como Copy.AI e Anyword. Quase todas as plataformas de escrita que oferecem conteúdo gerado por IA usam esse mecanismo; ele usa o algoritmo de aprendizado de máquina GPT-2 para gerar cópia com linguagem natural, e alguns deles têm pessoas reais para editar e refinar esse conteúdo ou fornecer algum outro upsell.
A Semrush, para este site, gerou cerca de 600 postagens de blog de conteúdo exclusivo usando a rede de IA. Eles o hospedaram em Thismarketingblogdoesnotexist.com, que faz referência a outros geradores de IA e ferramentas de SEO, como ThisPersonDoesNotExist (que faz algo semelhante, mas para imagens de pessoas). Aliás, ThisPersonDoesNotExist é muito usado para fins de chapéu preto, onde são necessárias fotos de perfil com aparência real, e o proprietário não deseja usar fotos rastreáveis. Apropriadamente, Thismarketingblogdoesnotexist.com não existe mais.

Quais foram seus resultados?
- 220 domínios de vinculação exclusivos.
- Mais de 50 desses domínios têm mais de 50 Autoridades de Domínio.
- Classificação para 292 termos de pesquisa.
- Cerca de 60 visitas por mês.
Tudo isso ao longo de 4-5 meses, com 600 páginas de conteúdo geradas.

Esses resultados podem parecer impressionantes para alguém que não é um profissional de marketing de conteúdo, mas uma única postagem de blog escrita por humanos pode facilmente classificar 292 termos de pesquisa e gerar mais de 60 visitantes por mês. Certamente parece que indica que o conteúdo gerado por IA pode classificar e atrair tráfego, certo?
A outra falha é o próprio domínio e todo o enquadramento. É, como um todo, obviamente, um experimento em estratégia de conteúdo gerada por IA. Isso significa que a maioria – se não 100% – dos links e do tráfego que o site obteve foram de sites de marketing digital, sites de notícias e pessoas como eu verificando conteúdo supostamente gerado por IA para ver se é viável.

Isso sugere que não estava classificando por seus próprios méritos e pelo conteúdo em si. Ele estava classificando puramente com base em backlinks de alta potência de sites de autoridade, que só obteve por causa dessa estrutura e porque era um site de alta potência como o Semrush realizando este estudo em primeiro lugar. Existem centenas de métricas e fatores de classificação importantes e, embora a qualidade do conteúdo seja indiscutivelmente a número 1, os backlinks vêm em um segundo lugar próximo.
Em outras palavras, o estudo não prova nada, exceto uma coisa: o Google não o penalizou imediatamente. E realmente, por que eles iriam? O Google provavelmente também reconheceu que não estava tentando ser nada mais do que um experimento óbvio de IA.
Há uma razão pela qual Thispersondoesnotexist.com classifica altamente para suas palavras-chave de destino, mesmo que não haja uma única palavra de conteúdo em todo o site. Ele é classificado por quase 2.500 palavras-chave no Google e tem mais de 100.000 backlinks, e é mencionado em todos os sites de notícias que você pode imaginar. O edifício da ligação é extremamente importante para qualquer estratégia de SEO.
Como é o conteúdo escrito por IA?
Tive a oportunidade de brincar com um dos geradores de conteúdo de IA algumas semanas atrás, e deixe-me dizer:
Compare esses dois.
- Minha postagem no blog sobre se imagens exclusivas beneficiam ou não o SEO
- Conteúdo gerado por IA sobre o mesmo tópico. Texto básico e a seção expandida (vista na imagem abaixo).
O meu fornece informações práticas, conselhos e dados para fazer backup, e a versão de IA não:

A versão AI tem uma tonelada de falhas.
- Dá conselhos terríveis. Por exemplo, sugere que um site informativo deve ser repleto de imagens, enquanto um site focado em fotografia ou design gráfico não deve. Esta recomendação é precisamente o contrário de um bom conselho, e nem sequer é senso comum.
- Ainda tem um absurdo. O que significa "você não quer confundir os clientes ou enviá-los correndo para suas carteiras" ? Além disso, recomendar alterações frequentes de imagem é bastante sem sentido em primeiro lugar.
- Ele deixa de fora pedaços de conteúdo. A seção "que tipos de imagens funcionam melhor" fornece zero informações relevantes. Ele diz "Vou dar X motivos abaixo" e não lista nenhum desses motivos. Nenhum leitor humano vai gostar disso, com certeza!
Eu também tenho alguns nitpicks com ele.
- Ele define SEO entre parênteses duas vezes. É desnecessário repetir essa definição, e provavelmente até uma vez também, já que quem lê este tópico já sabe o que significa SEO.
- Não tem conclusão – apenas zero conclusão para o post, nem mesmo uma tentativa.
- É curto, com menos de 500 palavras. Claro, você pode gerar manualmente mais seções para o artigo, mas quanto mais longo o artigo fica, mais absurdo é gerado e mais desafiador é editar (e mais fácil é para o Google capturá-lo).
No link "seção expandida" acima, eu disse à IA para tornar uma das seções mais longa. O que consegui foi um parágrafo enorme com algumas informações decentes e muitas frases mal abordadas ou repetições do que já dizia. E termina em um pedaço de texto completamente fora do tópico.
Se eu procurasse informações sobre SEO de imagem e visse isso, eu fecharia o site imediatamente, pois ele fala sem sentido e se desvia do tópico. Assim como qualquer leitor perspicaz.
Aqui está outro exemplo, algo que eu gerei espelhando um tópico que escrevi para um dos meus clientes:
Criamos conteúdo de blog que converte - não apenas para nós mesmos, mas também para nossos clientes.
Escolhemos tópicos de blog como fundos de hedge escolhem ações. Então, criamos artigos 10x melhores para conquistar o primeiro lugar.
O marketing de conteúdo tem dois ingredientes - conteúdo e marketing. Conquistamos nossa faixa preta em ambos.

Novamente, vemos uma parede substancial de texto ininterrupto, digressões em conteúdo fora do tópico, muitas das informações que ele possui não fazem sentido ou não são lógicas e até atribuem uma declaração a alguém que quase definitivamente não não faça isso!
Quais são as falhas do conteúdo de IA?
A única falha crítica com o conteúdo gerado por IA – e a falha que provavelmente não será resolvida em nossas vidas, pelo menos não com a tecnologia que temos atualmente – é que ainda é apenas um artigo glorificado girando e carece de reflexão.
Por definição, o conteúdo gerado por IA ainda não pode criar um pensamento original e simplesmente pega o conteúdo que já existe e o formula de novas maneiras. É mais sofisticado do que a fiação de artigos porque pode ter padrões muito mais esotéricos e ocultar sua fonte. Mas:

- Se uma IA lhe dá uma dica, está gerando essa dica de todo o pano. Ou essa dica foi mencionada em outro lugar e a IA a copiou, ou não.
- Se a dica não foi mencionada em outro lugar, pode ou não valer a pena.
Basta pegar o meu exemplo acima, quando a IA recomendou que alguns sites tivessem muito poucas imagens. Isso é bom! Alguns sites não precisam de imagens. Mas recomendar que sites focados especificamente em imagens não usem imagens? Isso não faz sentido. A IA pegou palavras-chave relacionadas a imagens e as colocou ao lado de conselhos relacionados a imagens, mas não teve supervisão cognitiva para entender que estava errado.
A IA fará recomendações de tiro no escuro. Alguns deles acertarão e serão precisos? Claro. Muitos deles serão maus conselhos porque a IA não sabe nada e não pensa em nada; ele apenas gera conteúdo sobre um tópico e continuará até que você diga para parar.
Existem maneiras pelas quais o conteúdo de IA é útil?
Vou dizer que estou sendo um pouco duro com os geradores de conteúdo de IA. Mas estou fazendo isso em resposta a artigos de notícias igualmente animados e com medo do conteúdo de IA. Todas aquelas histórias de "Prezados escritores de conteúdo: seus empregos estão ameaçados" são apenas peças sem sentido, sensacionalistas projetadas para promover o quão bom é o conteúdo de IA. Eles geralmente são escritos por pessoas que ainda não entendem o quão importante é pensar no que você está escrevendo.
A verdade é que meu exemplo também é um pouco deturpado. Isso porque esses geradores de conteúdo não são necessariamente projetados para postagens de blog. Ou, em vez disso, você pode usá-los para postagens de blog, mas quanto mais conteúdo eles escrevem, mais provável é que eles quebrem.

O conteúdo gerado por IA pode ser útil como ponto de partida ou para fazer com que sua criatividade flua para conteúdo de qualidade, desde que duas regras sejam seguidas:
- O conteúdo que você gera é curto, geralmente com menos de 200-300 palavras.
- Há supervisão humana para editar e corrigir problemas que a IA não entende, fornecer valor exclusivo e manter o artigo sobre o assunto.
O conteúdo gerado por IA pode ser útil de várias maneiras.
Você pode usar o conteúdo gerado por IA para escrever uma cópia do anúncio.
A cópia do anúncio é geralmente apenas algumas palavras, talvez algumas dúzias no máximo. Uma IA pode gerar conteúdo que parece e se sente bem nessa quantidade de espaço, e não há espaço suficiente para fluxo lógico, pensamento inovador ou realmente qualquer coisa de valor.

Claro, a IA ainda precisa de supervisão, então você não está gerando conteúdo que promete um recurso específico ou desconto que você não oferece.
Você pode usar o conteúdo gerado por IA para criar um preenchimento avançado de lorem ipsum.
"Lorem ipsum dolor sit amet", yadda yadda SEO benefícios da escrita aleatória. Muitos sites usam "lorem ipsum" como preenchimento para ver como uma página ficaria com texto de "aparência natural", mas pode ser difícil julgar quando você está distraído pelo falso latim. Assim, uma IA pode gerar texto de aparência realista com palavras-chave que você pode fazer coisas como formatar e enfatizar de maneiras realistas para dar uma impressão melhor de como seria o seu site. Não é uma grande vantagem sobre o lorem ipsum, mas é alguma coisa.
Você pode usar o conteúdo gerado por IA para criar um site de site de teste para ver como ele funciona.
Existem dois grupos de sites; o primeiro são os sites onde as pessoas que escrevem são líderes de pensamento, avançando na vanguarda do discurso e tirando conclusões únicas. O segundo grupo contém todos os sites restantes na internet. Qualquer pessoa que tente preencher um site com conteúdo e que não se importe com o fato de ser realmente de ponta ou verdadeiramente único pode usar uma IA para bombear conteúdo. Alguns deles podem até conseguir que sejam úteis e legíveis; novamente, desde que haja supervisão humana para remover informações erradas ou irrelevantes.

Não acho que nenhum site alimentado por conteúdo de IA tenha uma boa classificação por seus próprios méritos. O conteúdo de IA não é bom o suficiente ou valioso o suficiente para ganhar backlinks sem um site ou estrutura significativo que o alimente (como o experimento Semrush). Brincar com o conteúdo de IA em um site de teste é muito mais seguro do que arriscar um site com boa reputação.
Você pode usar o conteúdo gerado por IA como preenchimento de baixo valor para sites finos.
Vamos ser honestos aqui; O conteúdo gerado por IA é atraente para sites que não se preocupam com visitantes humanos de qualidade. Qualquer um que tenha um site afiliado pequeno, um site de spam, uma rede privada de blogs; essas pessoas não se importam com leitores humanos. Eles se importam que o Google não os penalize, o que eles farão se o site usar conteúdo roubado, copiado, fino ou preguiçoso.
Há um problema comum na engenharia e muitas funções focadas nas pessoas. Se você projetasse um sistema de portão de bloqueio projetado para permitir a entrada e saída de humanos, mas que impede os primatas de passar, você encontra esse problema. Algumas pessoas são mais burras que os primatas mais inteligentes; alguns primatas podem passar pelo portão e alguns humanos podem ser trancados do lado de fora.
Em termos mais relevantes online, um software inteligente pode escrever conteúdo melhor do que os piores escritores. Alguns escritores legítimos podem ser penalizados quando o Google pensa que foi gerado automaticamente, e alguns conteúdos de IA podem ter uma classificação alta e ser confundidos como escritos por humanos. É muito desafiador, talvez até impossível, projetar um sistema que possa efetivamente separar conteúdo escrito por humanos de conteúdo não humano.

Eu trago isso porque é um problema que o Google tem com a entrega de resultados de pesquisa relevantes. Algumas das coisas que as pessoas digitam na pesquisa do Google estão tão longe do alvo que é um milagre que elas consigam SERPs relevantes. O Google indexa algumas coisas bobas às vezes por causa disso. O conteúdo de IA também pode se encaixar nessa categoria.
Algumas pesquisas são tão específicas e baseadas em nichos que conteúdo duplicado de baixa qualidade e sites quebrados aparecerão. O Google está se agarrando a canudos tentando dar ao usuário algo relevante, e esses visitantes de baixa qualidade provavelmente não ficarão por muito tempo. Algumas pessoas contam esses visitantes como um sucesso, mas eu não. Eles não têm nenhum valor, a menos que você esteja veiculando anúncios e seja pago por impressão.
Você pode usar conteúdo gerado por IA para vender mais conteúdo gerado por IA.
Por fim, o conteúdo gerado por IA cria hype por meio de jornalismo sensacionalista e experimentos mal formados para vender mais geradores de conteúdo de IA.
O conteúdo de IA ameaça os criadores de conteúdo?
Ele ainda pode ser indexado e pode até receber alguns visitantes. O conteúdo que geramos no Anyword também passou pelo Copyscape, o que foi bastante impressionante. Assim, o conteúdo não é roubado, mesmo que o conteúdo em si seja ruim.

Até onde o público sabe, o Google não desenvolveu ou implementou uma maneira de destruir o conteúdo de IA que também não eliminaria muito conteúdo morno escrito por humanos.
Mas, o conteúdo de IA nunca superará o conteúdo humano sem algo mais como apoio, como backlinks massivamente poderosos de sites que provavelmente sabem que é conteúdo escrito por IA e estão vinculando a ele como exemplo, não como fonte de boa informação.
O conteúdo de IA pode ser classificado no Google?
No curto prazo, sim, pode se seus objetivos se alinharem com o esforço que você coloca nesses artigos.
Aqui estão três cenários para ajudá-lo a determinar em qual você pode se encaixar:
- Profissionais de marketing iniciantes: Este é um indivíduo com conhecimento muito básico de desenvolvimento web, marketing de conteúdo e otimização de mecanismos de pesquisa. Esse tipo de usuário provavelmente está interessado em conteúdo de IA por sua facilidade de uso e velocidade; você fornece entradas mínimas e pronto - você descobriu a automação de conteúdo de SEO. Com a criação de conteúdo em massa, podemos presumir com segurança que muito pouco trabalho adicional será feito para cada postagem do blog - talvez 5 minutos por postagem do blog gerada. Nesse cenário, podemos esperar que essas postagens de blog recebam um pequeno fluxo de visitantes de frases de pesquisa de cauda ultra longa, cliques acidentais, raspadores de software de SEO e pesquisadores internacionais. A taxa de rejeição será alta, o tempo no site será baixo e os artigos não atrairão visitantes engajados. O site pode ser penalizado eventualmente e receberá pouquíssimos visitantes.
- Profissionais de marketing intermediários: Este é um indivíduo com alguma experiência no crescimento de sites de sucesso com visitantes de pesquisa orgânica superando 5.000 visitantes por dia. Eles conhecem os meandros do SEO e são escritores de conteúdo competentes, tendo escrito muitas postagens de blog de alto desempenho. Esses usuários provavelmente verão os prós e os contras do conteúdo de IA, usando-o como uma estrutura para detalhar as postagens do blog. Eles moldarão cuidadosamente a direção do conteúdo de IA, criando cada subtítulo manualmente e brincando com o software por 1-2 horas para levar o conteúdo a um local que faça sentido. Eles entregarão o conteúdo a um editor para o toque humano e adicionarão links e imagens. O editor irá poli-lo bastante antes de ser publicado e otimizá-lo com ferramentas como Grammarly e Clearscope. Uma penalidade não é provável aqui, mas essas postagens provavelmente não terão um desempenho de alto nível. Eles provavelmente serão indexados e classificados para algumas palavras-chave de cauda longa, mas podem ficar desapontados com os resultados pela quantidade de esforço que colocam em seu fluxo de trabalho de conteúdo de IA.
- Profissionais de marketing avançados: Um profissional de marketing de conteúdo avançado ficará impressionado com a capacidade deste software de gerar conteúdo que passa pelo Copyscape com tanta facilidade, mas os problemas com as informações, tom, consistência e relevância do tópico serão imediatamente aparentes. Eles podem usar este software para detalhar os esboços dos artigos ou como inspiração durante a pesquisa de tópicos. Qualquer conteúdo gerado com essas ferramentas nunca seria publicado em seu site, portanto, não há risco de penalidade. Por curiosidade, eles provavelmente tentariam ultrapassar os limites do software e podem até configurar uma demonstração em um novo site para ver como ele funciona.
Como mencionei acima, quanto mais você usa o conteúdo de IA, maior a chance de o software quebrar. Um único artigo de 500 palavras pode ser classificado, mas publicar cinco deles pode começar a fornecer ao Google dados suficientes para saber que a qualidade do seu conteúdo é ruim. A publicação de vinte posts pode dar a eles dados suficientes para entender que seu conteúdo é terrível e seu estilo, vocabulário, nível de leitura, intenção de pesquisa e relevância do tópico são totalmente aleatórios e fora de sintonia - claramente não escritos pela mesma pessoa.
O Google Rankbrain identifica a intenção do usuário e separa o conteúdo relevante do conteúdo fofo; se o seu artigo está ou não focado em seu tópico é inteiramente com você.

(Crédito da imagem: https://backlinko.com/google-rankbrain-seo)
Seu site pode não ser penalizado, mas não vai ficar com os profissionais de marketing de conteúdo legítimos sem que alguém coloque uma quantidade igual de trabalho para reescrevê-lo. Francamente, isso dá tanto trabalho quanto escrever o conteúdo por conta própria.
Algumas pessoas por aí vão me ignorar e mudar para conteúdo escrito por IA de qualquer maneira, e podem até receber alguns visitantes desse conteúdo. Se você me perguntar, estou menos interessado em criar 600 postagens de IA que atraem 60 visitas totais por dia do que em criar um artigo de arranha-céu que atraia 2.000 visitantes de alta qualidade por dia. Qualidade sobre quantidade tem sido o nome do jogo para SEO na última década, e a qualidade do conteúdo de IA ainda não está lá. No entanto, se o tráfego e a qualidade do conteúdo atendem aos objetivos e expectativas do usuário, digo mais poder a eles.
Ainda não encontrei um blog que publique consistentemente conteúdo de IA que tenha algum tráfego significativo. Você estará raspando o fundo do barril, classificando para pesquisas de cauda ultra longa com uma alta taxa de rejeição e pouco tempo no site. O Google é incrivelmente avançado na determinação do valor das páginas da web. Se você acha que a IA pode criar esse tipo de valor com o clique de um botão e enganar os mecanismos de pesquisa e o algoritmo do Google, pode ficar desapontado com a análise de visitantes após o experimento.
O software é muito divertido de se jogar e há muitos casos de uso legítimos.
Apenas não defina suas expectativas muito altas para o conteúdo do blog de IA ainda.
