Google code search e a falta de conhecimento básico de HTTP
Esta semana o google lançou mais uma ferramenta, o Google code search. Não é a primeira ferramenta de busca de códigos, mas tem aquele “G” maiúsculo azul que, às vezes, pode fazer toda a diferença.
Funciona de maneira simples, da mesma forma que a busca normal por páginas na web. Com o google code seach você pode procurar por pedaços de código, uma função pra resolver aquele problema que apareceu aos 45 do segundo tempo e você tem esperança de que alguém em algum lugar já tenha resolvido e colocado o código disponível em algum lugar público, ou simplesmente se divertir com comentários e nomes de funções engraçadas que podem revelar desde o amor (ou ódio) por determinado browser ou linguagem de programação até o nível de álcool no sangue do programador.
Além disso, você pode achar senhas de conexão com bancos de dados por aí.
Opa, mas então, ai meu deus, quer dizer que alguém pode descobrir minhas senhas procurando no google? Tenho que tirar minhas senhas de dentro dos meus arquivos PHP? É o fim da web como a conhecemos, o fim do mundo, onde está minha toalha?
É engraçado como ainda tem gente por aí que não tem o mínimo conhecimento do que há de mais básico (e mais importante) nisso que chamamos de web. O protocolo HTTP. Acabei de ver em uma lista de discussão um pessoal desesperado, mais ou menos como no parágrafo acima, achando que o google está vasculhando seus arquivos PHP (ou qualquer outra linguagem) e revelando suas senhas pra quem estiver afim de buscar.
Ora, isso é tão absurdo. Se você não consegue ver o código do seu script no seu browser, o google também não consegue. Um arquivo PHP é processado pelo servidor, e o que vai para a saída é alguma outra coisa, resultado desse processamento. Essa alguma outra coisa pode ser um documento HTML, uma aplicação XML, um PDF ou até mesmo um código PHP em formato texto.
As senhas expostas são resultado do descuido de desenvolvedores que compactam seus códigos e deixam em locais públicos, que podem ser acessados por qualquer um. Se você não faz isso, pode ficar despreocupado. Se faz, trate de mover esses arquivos para um diretório que esteja protegido por senha ou que esteja excluído via robots.txt (sendo a primeira opção mais segura).
O google é poderoso, disso não temos dúvida. Mas não vamos exagerar, por favor.
A propósito, se algum de vocês pensou que o google poderia vasculhar seus códigos e revelar suas senhas, reserve uns minutos do seu tempo para ler meus textos sobre HTTP no O básico da web, principalmente a Introdução ao HTTP, que podem ajudá-lo a esclarecer algumas dúvidas sobre este protocolo tão importante.
[update] Se você acha improvável que exista gente que acha que o google tem o poder de vasculhar o código-fonte de scripts de servidor, dê uma lida nesse post e nos comentários.
O mais interessante é que o post usa como referência um outro post, em espanhol, que, por sua vez, cita um outro, em inglês, que — esse sim — explica como a “mágica” funciona. Tipo telefone sem fio, saca?
Cada vez mais eu vejo que o “O básico da web” tem um público potencial gigantesco. Preciso dedicar um pouco mais de tempo a ele…
Compare preços de: bateria infantil, Livro Lua Nova, esteira ergometrica, Notebook Acer, jogos de playstation 2 e 3, Livros Harry Potter, Notebook Positivo, Livros Crepúsculo, Notebook Sony Vaio
Leia também:
- Grandes sites de busca anunciam suporte a sitemaps autodiscovery
- Como não contabilizar suas próprias visitas em seu blog wordpress
- Como saber a quantidade de assinantes de um feed no Google Reader
- Logo eles, que corrigem tão bem nossos erros de digitação…
- Google Reader? Pfff…
- Hospedagem de sites Dreamhost: 50% de desconto


Google é Google, mas ainda prefiro o Krugle (www.krugle.com)