O que os Documentos do Julgamento do Google Revelam sobre Cliques, Links e Outros Sinais de Classificação
O julgamento entre o DOJ e o Google finalmente chegou ao fim. O documento de encerramento está repleto de insights interessantes sobre como funcionam os algoritmos do Google. Embora o veredicto final do julgamento seja uma história à parte, os documentos divulgados nos ofereceram uma visão sem precedentes dos sistemas de classificação do Google. Neste artigo, compartilharei o que aprendemos. É impressionante ver quanta informação foi revelada sobre os sinais de classificação do Google!
Resumo: O Google melhora ao aprender com as interações dos usuários. Cada página é armazenada no índice junto com sinais como cliques, consultas e pontuação de spam. Embora o PageRank continue sendo um sinal, ele é apenas um entre muitos e, na verdade, é muito menos importante do que as informações armazenadas sobre a própria página da web. Modelos de IA, como RankEmbed BERT, são ajustados com base na preferência dos usuários e nas pontuações dos avaliadores de qualidade. Dados dos usuários também determinam com que frequência o Google rastreia suas páginas.
Abaixo, apresento os principais aprendizados do julgamento sobre os sinais de classificação do Google.
1. O Google melhora aprendendo com as interações dos usuários
O Google afirma que a chave para sua melhoria é aprender com as interações dos usuários. Aqui estão algumas citações do documento:
- “Aprender com esse feedback dos usuários é talvez a principal forma pela qual a classificação na web melhorou nos últimos 15 anos.”
- “Cada interação [do usuário] nos dá mais um exemplo, mais um dado de treinamento: para esta consulta, um humano acreditou que esse resultado seria o mais relevante.”
- “Toda vez que alguém faz uma pesquisa, fornecemos alguns resultados úteis, mas também obtemos um feedback claro do usuário: este resultado de busca é melhor do que aquele.”
O objetivo deve ser criar conteúdo que as pessoas considerem útil. As diretrizes que o Google nos fornece em sua documentação de conteúdo útil não são uma lista de fatores de classificação, mas sim conselhos gerais sobre o que as pessoas tendem a achar útil. As ações dos usuários ensinam ao Google quais resultados são valiosos.
2. Cada documento no índice tem um DocID
Cada documento recebe um DocID, que possui um conjunto de sinais, atributos ou metadados. Esses sinais incluem a popularidade da página a partir de cliques dos usuários, sua qualidade e autoridade, dados de rastreamento e uma pontuação de spam atribuída. Embora o DocID seja um componente interno crítico para o Google, não é uma métrica visível publicamente para os proprietários de sites.
O DocID é um componente central do índice do Google desde o início do Search. O documento original sobre PageRank afirma: “Cada página da web tem um ID associado chamado docID, que é atribuído sempre que uma nova URL é extraída de uma página da web.” Ao longo dos anos, o Google expandiu o que está incluído no DocID.
Os sinais no DocID incluem:
- popularidade medida pela intenção do usuário, cliques e sistemas de feedback, incluindo Navboost e Glue;
- medidas de qualidade, incluindo autoridade;
- data em que a URL foi vista pela primeira vez;
- data em que a URL foi rastreada pela última vez;
- pontuação de spam;
- marca de tipo de dispositivo;
- quaisquer outros sinais especificados que o [Comitê Técnico] recomenda que sejam tratados como significativos para a classificação dos resultados de busca.
3. Sinais de classificação incluem cliques, conteúdo e consultas
O Google atribui uma pontuação de classificação a cada página e, em seguida, confia em sinais de classificação para diferenciá-las. Alguns dos sinais brutos incluem:
- o número de cliques;
- o próprio conteúdo;
- os termos usados dentro de uma consulta.
É importante notar que isso não significa que a taxa de cliques (CTR) seja um fator de classificação direto! Em vez disso, os cliques que uma página recebe são armazenados e podem ser usados de várias maneiras. Eles são alguns dos sinais que podem ser usados em sistemas que ajudam a determinar as classificações.
No entanto, ganhar cliques de usuários que estão genuinamente satisfeitos com o seu conteúdo é um sinal positivo e poderoso.
4. Glue é um registro de consultas que registra a atividade dos buscadores
O Google Glue é uma tabela que coleta a atividade dos usuários, incluindo:
- O texto da consulta;
- A linguagem, localização e tipo de dispositivo do usuário;
- O que aparece na SERP (incluindo sites e recursos da SERP);
- O que o usuário clicou ou sobre o que passou o mouse;
- O tempo que ficaram na SERP;
- Interpretações e sugestões de consultas, incluindo correção de ortografia e termos salientes da consulta.
O Google aprende com cada busca. Os sistemas preveem quais resultados os usuários acharão úteis, medindo como interagem com esses resultados. Os sistemas de aprendizado de máquina continuam a aprender para melhorar suas previsões.
5. RankEmbed BERT é um modelo de classificação de IA treinado pela atividade do usuário
O RankEmbed BERT é um modelo de classificação que utiliza 70 dias de registros de busca e também as pontuações dos avaliadores de qualidade. Esse modelo avalia a experiência, autoridade e confiabilidade de uma página para medir a qualidade dos resultados de busca orgânica do Google. É um sistema de aprendizado profundo que possui uma forte compreensão da linguagem natural.
Esse sistema também utiliza informações sobre cada consulta em seus cálculos, incluindo os termos salientes que o Google derivou da consulta e as páginas da web recomendadas ao usuário.
6. A própria página da web é mais importante que o PageRank
Este é um dos pontos mais interessantes do documento! Embora o PageRank tenha sido considerado o sinal mais importante, agora sabemos que ele é apenas um entre muitos. Na verdade, a maior parte do sinal de qualidade do Google é derivada da própria página da web. Isso enfatiza a importância de ter um conteúdo de qualidade e relevante.
7. Dados dos usuários determinam a frequência com que suas páginas são rastreadas
Os dados dos usuários são utilizados para determinar quais websites rastrear, em que ordem e com que frequência. É interessante verificar suas estatísticas de rastreamento no Google Search Console, pois isso pode indicar a necessidade de melhorias de qualidade no seu site.
8. Se você não está sendo rastreado, pode ser por causa de sua pontuação de spam
A frequência de rastreamento é determinada por sinais de qualidade e popularidade. Cada site possui uma pontuação de spam que é considerada ao se tratar de rastreamento, e isso pode afetar sua visibilidade.
9. Dados do Chrome são utilizados na classificação
É amplamente especulado que os sinais provenientes do Chrome são utilizados nas decisões de classificação. Embora os detalhes não tenham sido aprofundados, há indícios de que a popularidade é baseada em dados de visita do Chrome e na quantidade de âncoras.
Em resumo, esses documentos revelam muito sobre como o Google ensina seus algoritmos a melhorar continuamente com base nas interações dos usuários e na qualidade do conteúdo. Para os profissionais de SEO, isso reforça a importância de focar em criar experiências de usuário valiosas e conteúdo de alta qualidade.
➡️ Quer melhorar o posicionamento do seu site no Google?
Fortaleça seu SEO com backlinks de autoridade em domínios reais e seguros. Solicite um orçamento personalizado.
