
<?xml version="1.0" encoding="UTF-8"?><!-- generator="wordpress/2.3.3" -->
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	>
<channel>
	<title>Comments on: Enganando o GoogleBot</title>
	<link>http://hypercast.info/2007/03/15/enganando-o-googlebot/</link>
	<description>por Líus Fontenelle Carneiro</description>
	<pubDate>Tue, 06 Jan 2009 12:13:44 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.3.3</generator>
		<item>
		<title>By: Líus</title>
		<link>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-10101</link>
		<dc:creator>Líus</dc:creator>
		<pubDate>Tue, 25 Mar 2008 16:57:18 +0000</pubDate>
		<guid>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-10101</guid>
		<description>@sabrina: Sim. O 301 é na verdade um código de resposta do servidor HTTP. Esta resposta é devolvida ao cliente (browser) logo depois da requisição ser feita e tratada pelo servidor. O código 301 não é um erro, e sim um aviso de que o recurso (dentro do jargão HTTP) anteriormente encontrado na URI requisitada foi permanentemente movido para outra URI.

Se quiser saber mais sobre isso, veja aqui:
http://en.wikipedia.org/wiki/List_of_HTTP_status_codes</description>
		<content:encoded><![CDATA[<p>@sabrina: Sim. O 301 é na verdade um código de resposta do servidor HTTP. Esta resposta é devolvida ao cliente (browser) logo depois da requisição ser feita e tratada pelo servidor. O código 301 não é um erro, e sim um aviso de que o recurso (dentro do jargão HTTP) anteriormente encontrado na URI requisitada foi permanentemente movido para outra URI.</p>
<p>Se quiser saber mais sobre isso, veja aqui:<br />
<a href="http://en.wikipedia.org/wiki/List_of_HTTP_status_codes" rel="nofollow" onclick="javascript:urchinTracker ('/outbound/comment/en.wikipedia.org');">http://en.wikipedia.org/wiki/List_of_HTTP_status_codes</a></p>
]]></content:encoded>
	</item>
	<item>
		<title>By: sabrina</title>
		<link>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-10063</link>
		<dc:creator>sabrina</dc:creator>
		<pubDate>Sun, 23 Mar 2008 23:11:51 +0000</pubDate>
		<guid>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-10063</guid>
		<description>o erro 301 está relacionado a http?</description>
		<content:encoded><![CDATA[<p>o erro 301 está relacionado a http?</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Raphael Carvalho</title>
		<link>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-643</link>
		<dc:creator>Raphael Carvalho</dc:creator>
		<pubDate>Tue, 20 Mar 2007 13:01:49 +0000</pubDate>
		<guid>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-643</guid>
		<description>Excelente post!!</description>
		<content:encoded><![CDATA[<p>Excelente post!!</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Líus</title>
		<link>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-640</link>
		<dc:creator>Líus</dc:creator>
		<pubDate>Mon, 19 Mar 2007 20:38:05 +0000</pubDate>
		<guid>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-640</guid>
		<description>Ah sim. Até mais!</description>
		<content:encoded><![CDATA[<p>Ah sim. Até mais!</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Paulo Rodrigo Teixeira</title>
		<link>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-639</link>
		<dc:creator>Paulo Rodrigo Teixeira</dc:creator>
		<pubDate>Mon, 19 Mar 2007 19:26:01 +0000</pubDate>
		<guid>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-639</guid>
		<description>Os três que citei é sobre o primeiro parágrafo do seu post.

Se reportar, eles saem do Google.

Grande abraço,</description>
		<content:encoded><![CDATA[<p>Os três que citei é sobre o primeiro parágrafo do seu post.</p>
<p>Se reportar, eles saem do Google.</p>
<p>Grande abraço,</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Líus</title>
		<link>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-627</link>
		<dc:creator>Líus</dc:creator>
		<pubDate>Fri, 16 Mar 2007 20:01:52 +0000</pubDate>
		<guid>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-627</guid>
		<description>Olá Ricardo. Achei bem completa essa ferramenta que você postou. Obrigado pela dica.

Acho que não entendi muito bem seu comentário, mas vamos ver. Primeiro, em sua nota, você falou sobre uma forma possível de identificar a visita do Googlebot, que acho responder adequadamente à sua pergunta no final do post, não?

Sobre os erros: praticamente não tenho experiência com mudanças de sites em relação aos web crawlers. Fiz algo nesta linha quando mudei o Hypercast para o endereço que está atualmente. Antes de começar, fiz uma pesquisa onde conclui que o erro 301 redirecionaria inclusive os bots, e foi realmente o que ocorreu, de acordo com minhas análises dos http referers dos acessos dos bots nos logs do meu web server. Então creio que funciona e de forma confiável.

Quanto à pergunta final, como mencionei anteriormente você mesmo a respondeu. Desculpe se interpretei errado. Para redirecionar apenas os visitantes, creio que basta identificar uma visita de bot. Se não for, retorna-se um erro 301 ou 302.  Existem várias formas de identificar o bot. Uma delas você já citou, que é conseguir alguma informação adicional através do DNS reverso, mas esta forma é passível de erros, assim como as outras. Também é possível identificar o bot através do user agent ou de informações no http referer.

Também é possível verificar isso através de padrões nos logs de acesso. Os bots realizam visitas muito rápidas, e sempre fazem requisição do robots.txt. Falando nele, sugiro que você dê uma lida sobre as possibilidades do robots.txt. Pode ser que nele esteja a resolução do seu problema. Obrigado!</description>
		<content:encoded><![CDATA[<p>Olá Ricardo. Achei bem completa essa ferramenta que você postou. Obrigado pela dica.</p>
<p>Acho que não entendi muito bem seu comentário, mas vamos ver. Primeiro, em sua nota, você falou sobre uma forma possível de identificar a visita do Googlebot, que acho responder adequadamente à sua pergunta no final do post, não?</p>
<p>Sobre os erros: praticamente não tenho experiência com mudanças de sites em relação aos web crawlers. Fiz algo nesta linha quando mudei o Hypercast para o endereço que está atualmente. Antes de começar, fiz uma pesquisa onde conclui que o erro 301 redirecionaria inclusive os bots, e foi realmente o que ocorreu, de acordo com minhas análises dos http referers dos acessos dos bots nos logs do meu web server. Então creio que funciona e de forma confiável.</p>
<p>Quanto à pergunta final, como mencionei anteriormente você mesmo a respondeu. Desculpe se interpretei errado. Para redirecionar apenas os visitantes, creio que basta identificar uma visita de bot. Se não for, retorna-se um erro 301 ou 302.  Existem várias formas de identificar o bot. Uma delas você já citou, que é conseguir alguma informação adicional através do DNS reverso, mas esta forma é passível de erros, assim como as outras. Também é possível identificar o bot através do user agent ou de informações no http referer.</p>
<p>Também é possível verificar isso através de padrões nos logs de acesso. Os bots realizam visitas muito rápidas, e sempre fazem requisição do robots.txt. Falando nele, sugiro que você dê uma lida sobre as possibilidades do robots.txt. Pode ser que nele esteja a resolução do seu problema. Obrigado!</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Ricardo Vaz Monteiro</title>
		<link>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-626</link>
		<dc:creator>Ricardo Vaz Monteiro</dc:creator>
		<pubDate>Fri, 16 Mar 2007 18:42:59 +0000</pubDate>
		<guid>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-626</guid>
		<description>Caro Líus:

Obrigado pelo link! 
Nesse ínterim eu Googei e achei um site bem legal que simula várias spiders... e estou sugerindo seu link: http://www.smart-it-consulting.com/internet/google/googlebot-spoofer/index.htm

Nota: Uma opção também é usar o comando que mostra o host a partir do ip do visitante, ou seja, o DNS reverso, e se "google" estiver contido no host... bem, ai é uma "google visit". Outra coisa interessante que eu li é que vc pode até redirect para outra página desde que vc produza um erro HTTP 302 (redirect temporário) e não um 301. Porém não sei se é confiável. 

Vc tem experiência nisso ? Existe como fazer um redirect para visitas que não sejam do Googlebot sem que o Googlebot perceba ?

att

Ricardo</description>
		<content:encoded><![CDATA[<p>Caro Líus:</p>
<p>Obrigado pelo link!<br />
Nesse ínterim eu Googei e achei um site bem legal que simula várias spiders&#8230; e estou sugerindo seu link: <a href="http://www.smart-it-consulting.com/internet/google/googlebot-spoofer/index.htm" rel="nofollow" onclick="javascript:urchinTracker ('/outbound/comment/www.smart-it-consulting.com');">http://www.smart-it-consulting.com/internet/google/googlebot-spoofer/index.htm</a></p>
<p>Nota: Uma opção também é usar o comando que mostra o host a partir do ip do visitante, ou seja, o DNS reverso, e se &#8220;google&#8221; estiver contido no host&#8230; bem, ai é uma &#8220;google visit&#8221;. Outra coisa interessante que eu li é que vc pode até redirect para outra página desde que vc produza um erro HTTP 302 (redirect temporário) e não um 301. Porém não sei se é confiável. </p>
<p>Vc tem experiência nisso ? Existe como fazer um redirect para visitas que não sejam do Googlebot sem que o Googlebot perceba ?</p>
<p>att</p>
<p>Ricardo</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Líus</title>
		<link>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-625</link>
		<dc:creator>Líus</dc:creator>
		<pubDate>Fri, 16 Mar 2007 18:31:39 +0000</pubDate>
		<guid>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-625</guid>
		<description>Olá novamente Paulo!

Obrigado pelo comentário, mas eu não entendi sobre estes "três resultados" que você mencionou. Poderia explicar um pouco melhor?</description>
		<content:encoded><![CDATA[<p>Olá novamente Paulo!</p>
<p>Obrigado pelo comentário, mas eu não entendi sobre estes &#8220;três resultados&#8221; que você mencionou. Poderia explicar um pouco melhor?</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Paulo Rodrigo Teixeira</title>
		<link>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-623</link>
		<dc:creator>Paulo Rodrigo Teixeira</dc:creator>
		<pubDate>Fri, 16 Mar 2007 15:27:36 +0000</pubDate>
		<guid>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-623</guid>
		<description>Oi Líus,

O nome da técnica é Cloaking.

É considerada Black Hat SEO e cabível de punição.

Não vale o esforço.

Se este três resultados forem denunciados, adeus site do Google.

Grande abraço,</description>
		<content:encoded><![CDATA[<p>Oi Líus,</p>
<p>O nome da técnica é Cloaking.</p>
<p>É considerada Black Hat SEO e cabível de punição.</p>
<p>Não vale o esforço.</p>
<p>Se este três resultados forem denunciados, adeus site do Google.</p>
<p>Grande abraço,</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Araceli</title>
		<link>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-620</link>
		<dc:creator>Araceli</dc:creator>
		<pubDate>Fri, 16 Mar 2007 12:38:37 +0000</pubDate>
		<guid>http://hypercast.info/2007/03/15/enganando-o-googlebot/#comment-620</guid>
		<description>Muito interessante, Líus!</description>
		<content:encoded><![CDATA[<p>Muito interessante, Líus!</p>
]]></content:encoded>
	</item>
</channel>
</rss>
