Google code search e a falta de conhecimento básico de HTTP
Esta semana o google lançou mais uma ferramenta, o Google code search. Não é a primeira ferramenta de busca de códigos, mas tem aquele “G” maiúsculo azul que, à s vezes, pode fazer toda a diferença.
Funciona de maneira simples, da mesma forma que a busca normal por páginas na web. Com o google code seach você pode procurar por pedaços de código, uma função pra resolver aquele problema que apareceu aos 45 do segundo tempo e você tem esperança de que alguém em algum lugar já tenha resolvido e colocado o código disponÃvel em algum lugar público, ou simplesmente se divertir com comentários e nomes de funções engraçadas que podem revelar desde o amor (ou ódio) por determinado browser ou linguagem de programação até o nÃvel de álcool no sangue do programador.
Além disso, você pode achar senhas de conexão com bancos de dados por aÃ.
Opa, mas então, ai meu deus, quer dizer que alguém pode descobrir minhas senhas procurando no google? Tenho que tirar minhas senhas de dentro dos meus arquivos PHP? É o fim da web como a conhecemos, o fim do mundo, onde está minha toalha?
É engraçado como ainda tem gente por aà que não tem o mÃnimo conhecimento do que há de mais básico (e mais importante) nisso que chamamos de web. O protocolo HTTP. Acabei de ver em uma lista de discussão um pessoal desesperado, mais ou menos como no parágrafo acima, achando que o google está vasculhando seus arquivos PHP (ou qualquer outra linguagem) e revelando suas senhas pra quem estiver afim de buscar.
Ora, isso é tão absurdo. Se você não consegue ver o código do seu script no seu browser, o google também não consegue. Um arquivo PHP é processado pelo servidor, e o que vai para a saÃda é alguma outra coisa, resultado desse processamento. Essa alguma outra coisa pode ser um documento HTML, uma aplicação XML, um PDF ou até mesmo um código PHP em formato texto.
As senhas expostas são resultado do descuido de desenvolvedores que compactam seus códigos e deixam em locais públicos, que podem ser acessados por qualquer um. Se você não faz isso, pode ficar despreocupado. Se faz, trate de mover esses arquivos para um diretório que esteja protegido por senha ou que esteja excluÃdo via robots.txt (sendo a primeira opção mais segura).
O google é poderoso, disso não temos dúvida. Mas não vamos exagerar, por favor.
A propósito, se algum de vocês pensou que o google poderia vasculhar seus códigos e revelar suas senhas, reserve uns minutos do seu tempo para ler meus textos sobre HTTP no O básico da web, principalmente a Introdução ao HTTP, que podem ajudá-lo a esclarecer algumas dúvidas sobre este protocolo tão importante.
[update] Se você acha improvável que exista gente que acha que o google tem o poder de vasculhar o código-fonte de scripts de servidor, dê uma lida nesse post e nos comentários.
O mais interessante é que o post usa como referência um outro post, em espanhol, que, por sua vez, cita um outro, em inglês, que — esse sim — explica como a “mágica” funciona. Tipo telefone sem fio, saca?
Cada vez mais eu vejo que o “O básico da web” tem um público potencial gigantesco. Preciso dedicar um pouco mais de tempo a ele…
Google é Google, mas ainda prefiro o Krugle (www.krugle.com)