Enganando o GoogleBot
Hoje estava fazendo umas pesquisas e encotrei três resultados de busca que estavam muito bem rankeados, mas não tinham nada sobre o conteúdo que levou ao mecanismo do google colocá-lo em tão privilegiada posição. Fui então saber o que ocorre… Como enganar os indexadores do google para rankear melhor.
Depois de pouco tempo, encontrei a informação de que isso ocorre por que o Googlebot, por exemplo, envia sua assinatura dentro da requisição HTTP (nos cabeçalhos), assim como um navegador comum. O que estes sites fazem é checar a ocorrência desta assinatura e, dinamicamente, mudar seu conteúdo.
Resolvi continuar a pesquisa sobre o assunto e encontrei o Be The Bot, que permite ao visitante entrar com um endereço de um site e verificar como ele se comporta ao receber uma visita do Googlebot, já que o próprio Be The Bot faz a requisição para o servidor web responsável pela URL que você forneceu. O resultado é mostrado ainda dentro do site.
Para fazer isso, em PHP, por exemplo, basta usar as funções get_browser() ou http_get_request_headers() para avaliar o conteúdo da assinatura do navegador que está fazendo aquela requisição ou checar os cabeçalhos completos.
Dei uma rápida olhada nos site que eu estava pesquisando e realmente muito texto aparecia do nada, ou então os headers ficavam completamente carregados… Boa tentativa, realmente funciona. Resta saber quando (e como? semântica?) o Google irá resolver este problema.
Artigos Relacionados:
Sobre este artigo
You’re currently reading “Enganando o GoogleBot,” an entry on Hypercast
- Published:
- 03.15.07 / 7pm
- Category:
- Desenvolvimento
15 Comments
Jump to comment form | comments rss [?] | trackback uri [?]