Ser somente original não garante o primeiro lugar, mas ser mais completo do que todo mundo muda tudo. Compreenda a estratégia de information gain

O mercado de SEO e conteúdo carrega uma premissa que, repetida vezes suficientes, se transforma em dogma: conteúdo original ranqueia melhor. E embora essa afirmação tenha uma lógica sedutora, afinal, se o Google quer ser útil e não repetitivo, deveria premiar quem diz algo novo, ela nunca foi testada com o rigor metodológico necessário para transformá-la em estratégia. Até agora.

Uma pesquisa recente conduzida pela on-page.ai analisou 150 páginas nas três primeiras posições do Google, distribuídas entre 50 palavras-chave em dez indústrias: marketing, SaaS, saúde, finanças pessoais, e-commerce, direito, viagens, culinária, tecnologia e home improvement. O objetivo era medir, com uma métrica concreta, o quanto cada página é diferente e mais completa do que as demais indexadas para aquela busca. E o que a pesquisa encontrou é mais nuançado e, em alguns aspectos, mais útil do que a versão simplificada que o mercado costuma repetir.

O que é o information gain e por que o Google se importa com isso

O conceito de information gain (ganho de informação) tem um endereço formal dentro do Google: uma patente registrada em 2018 (US20200349181A1) que descreve como o buscador pode calcular a quantidade de informação nova que uma página oferece ao usuário em relação ao que ele já consumiu antes naquela sessão de busca. Em termos diretos: quanto mais uma página acrescenta ao que o usuário já sabe, seja por cobrir subtópicos diferentes, adicionar perspectivas novas, trazer entidades semânticas distintas ou responder perguntas que o restante dos resultados ignora, maior seu information gain score.

A lógica por trás disso é comportamental. O Google quer que cada clique valha a pena para o usuário, que ele saia da página tendo aprendido algo que não obteria lendo apenas os resultados anteriores. Um conteúdo que cobre exatamente o mesmo conjunto de pontos que todos os outros concorrentes, nas mesmas proporções e com as mesmas perspectivas, pode até ranquear, mas tem menos razão de existir na SERP do ponto de vista do usuário. O information gain é a forma do Google tentar medir, de maneira programática, se uma página realmente acrescenta algo.

O que a pesquisa encontrou, e o que ela desfaz

A descoberta central da pesquisa é ao mesmo tempo simples e reveladora: a primeira página do Google é, em média, apenas moderadamente original. A nota mediana entre as 150 páginas analisadas foi 52 em uma escala de 0 a 100, onde 70 ou mais representa alto information gain e abaixo de 40 representa baixa originalidade. Isso significa que, na média, cerca de metade do conteúdo nas três primeiras posições traz pontos novos em relação aos demais resultados para aquela mesma busca. Nem muito, nem pouco.

Mais revelador ainda: não houve correlação clara entre ocupar a primeira posição e ter o maior information gain. A nota mediana das páginas em cada posição (primeiro, segundo ou terceiro resultado) foi praticamente a mesma, em torno de 52. O que isso diz é que outros fatores como autoridade do domínio, histórico da página, relevância para a palavra-chave, estrutura do conteúdo, têm mais peso para alcançar a primeira posição do que a originalidade em si.

A pesquisa também desfez outra correlação frequentemente assumida: tamanho de conteúdo não é sinônimo de profundidade ou de originalidade. Páginas com textos longos não necessariamente tiveram scores maiores de information gain do que páginas mais enxutas. O que determina o ganho de informação não é o volume de palavras, mas a diversidade e a especificidade dos pontos cobertos.

O que a pesquisa confirma, e como isso orienta a produção de conteúdo

Se a originalidade não é pré-requisito para ranquear, ela é irrelevante? Não exatamente. A pesquisa identificou que páginas com information gain mais alto tendem a ocupar as primeiras posições com maior consistência entre diferentes nichos, especialmente quando a comparação é feita entre sites de autoridade de domínio semelhante. Em um cenário de empate em outros fatores, a originalidade inclina a balança.

A leitura estratégica mais precisa é esta: conteúdo original não garante a primeira posição, mas aumento consistente do information gain é um dos poucos fatores que uma equipe editorial pode controlar ativamente, ao contrário da autoridade de domínio, que se constrói ao longo de anos, ou de fatores técnicos que dependem de infraestrutura. E o que a pesquisa deixa claro sobre como aumentar esse ganho é mais concreto do que parece.

O caminho não é ser diferente do que já está ranqueando. É ser mais completo. Isso significa identificar o que os dez primeiros resultados cobrem (consenso estabelecido sobre aquele tópico) e ir além: cobrir perguntas que o restante ignora, trazer perspectivas que os concorrentes não incluem, introduzir entidades semânticas relacionadas que ampliam o campo de relevância do conteúdo, e responder objeções ou dúvidas adjacentes que o leitor inevitavelmente vai ter. Um conteúdo que faz isso não está apenas tentando ser original por princípio, está preenchendo lacunas reais que a SERP atual deixa em aberto.

A distribuição dos scores revela o ecossistema real de conteúdo

Um dado que a pesquisa trouxe e que merece atenção estratégica é a amplitude da distribuição dos scores: uma em cada dez páginas ficou com pontuação abaixo de 26 (pouco ou nenhum information gain) e uma em cada dez ficou acima de 79, altamente original. Três páginas ultrapassaram 90. Onze ficaram abaixo de 10.

Isso significa que, mesmo no top 3 do Google, coexistem páginas que praticamente nada acrescentam ao leitor e páginas que oferecem uma cobertura genuinamente distinta do tema. A presença das primeiras não refuta a importância do information gain, ela confirma que o Google ainda pondera uma série de outros sinais na composição do ranqueamento. Mas ela também indica que, para qualquer site que queira diferenciar sua presença editorial ao longo do tempo, o caminho de aumentar progressivamente o information gain de seu portfólio de conteúdo é um dos mais defensáveis como estratégia, justamente porque a maioria dos competidores ainda está produzindo no registro do consenso, não da ampliação.

Indústrias com mais espaço para diferenciação e onde o consenso domina

A pesquisa cobriu dez verticais distintas, e o padrão de distribuição de information gain varia entre elas, embora a on-page.ai não tenha publicado os dados por vertical de forma detalhada nesta primeira rodada exploratória. O que o mercado já sabe empiricamente e que a pesquisa tende a confirmar, é que nichos com alta volumetria de conteúdo genérico (marketing, finanças pessoais, saúde, culinária) tendem a ter um consenso SERP mais consolidado, o que torna o espaço para diferenciação maior para quem ousa sair do roteiro. Nichos mais técnicos ou verticais mais especializadas tendem a ter information gain naturalmente mais alto, porque há menos conteúdo total e cada página tende a cobrir aspectos mais específicos.

Para equipes editoriais, essa leitura tem implicação direta no processo de pesquisa e planejamento de pauta: antes de escrever sobre qualquer tema, mapear o que os dez primeiros resultados cobrem e, mais importante, o que eles não cobrem, é o exercício mais valioso que uma equipe pode fazer para garantir que seu conteúdo entre na SERP com algo a acrescentar, não apenas com mais uma versão do mesmo.


Veredito: o ganho de informação como critério editorial, não como métrica técnica

Por aqui na CH, lemos o conceito de information gain não como um número a ser perseguido em ferramentas de SEO, mas como um critério editorial que deveria orientar cada decisão de pauta. A pergunta “o que esse conteúdo acrescenta ao que já existe?” precisa ser respondida antes que o primeiro parágrafo seja escrito, não depois, quando o único caminho é reformular o que os concorrentes já disseram de formas levemente diferentes.

O que a pesquisa da on-page.ai confirma, com dados, é algo que produtores de conteúdo experientes já sabem intuitivamente: o Google não é ingênuo. Ele tem mecanismos para identificar quando uma página está contribuindo com algo novo para o usuário e, em condições de equilíbrio entre outros fatores, recompensa isso. Não de forma absoluta, não de forma que garanta o primeiro lugar por originalidade apenas. Mas de forma consistente o suficiente para fazer do information gain uma das apostas editoriais mais racionais que uma equipe de conteúdo pode fazer em um mercado onde a maioria ainda está otimizando para o consenso.