Esse texto apresenta uma série de técnicas utilizáveis na maior das máquinas de busca, o Google. Entretanto, ainda que exista um domínio do Google para pesquisas em páginas exclusivamente em português e brasileiras, as principais funcionalidades e aplicações ainda não foram incorporadas na versão www.google.com.br
Assim, o texto torna-se útil principalmente para aqueles que já estão familiarizados com a utilização da máquina e seus padrões originais, no www.google.com (sem ponto bê érre).
Como utilizar o Google com eficiência

Por: Sudar Muthu
Tradução de Moreno Barros

O básico do Google

A Internet é uma vasta coleção de informação escondida em mais de 2 bilhões de páginas. Mas o volume crescente de conteúdo torna difícil encontrar informações pertinentes a um assunto desejado. Pesquisar na internet é como procurar uma agulha em uma palheiro. As máquinas de buscas surgiram, para auxílio. Elas evoluiram rápido, tentando cercar todas as nuances de bilhões de documentos online, e ainda continuam a evoluir hoje.

Google entrou na roda em 1998. Sua página principal é ilusoriamente simples com um campo de preenchimento para busca, e alguns botões. A interface básica tão fascinante em sua simplicidade desmente o poder da máquina do Google por baixo, e a riqueza de informações a sua disposição. E se você utiliza a sintaxe de busca do Google em sua plenitude, a Web é a sua ostra. Nesse artigo você encontrará técnicas que irão lhe auxiliar no uso das ferramentas do Google com eficiência.


Busca textual

O básico das Booleanas.

Sempre que você pesquisar por duas (ou mais) palavras chave de uma só vez, as máquinas de buscas utilizam um método padronizado para lidar com essas palavras. Deve a máquina pesquisar pelas duas palavras separadamente ou juntas? A resposta se chama padrão Booleano; as máquinas de busca podem padronizar as booleanas AND (pesquisará pelas duas palavras juntas) ou a booleana OR (pesquisará pelas duas palavras separadamente). Claro, mesmo que o padrão de uma máquina de busca seja pesquisar pelas duas palavras juntas (AND) você poderá utilizar um comando especial para instruir a pesquisa pelas palavras separadamente (OR).
O padrão booleano do Google é AND; isso significa que se você pesquisar por duas ou mais palavras, o Google vai pesquisar por todas elas. Se você pesquisar por: Operadoras de telefones celulares
o Google pesquisará por todas as três palavras (desconsiderando os artigos e preposições). Se você quer especificar que qualquer uma das palavras é aceitável, você pode colocar um OR entre elas: Operadoras OR telefones OR celulares

Se você quer definitivamente um termo, e um ou dois mais outros termos aceitáveis (ou termos não definitivos), você pode agrupá-los dentro de parentese, assim: Operadoras (Vivo OR Claro OR Oi)

Essa frase busca pela palavra "Vivo" ou "Claro" ou "Oi" juntamente com a palavra "Operadoras". Outro caracter que pode ser utilizado em substituição ao OR é a função | do teclado, como em: Operadoras (TIM | "telefones celulares")

Se você quer especificar que um item de busca não deve aparecer nos seus resultados, utilize um - (sinal de menos). Operadoras de telefones celulares - Vivo

Essa frase vai pesquisar por páginas que contenham tanto as palavras "operadoras", "telefones" e "celulares", mas não a palavra "Vivo".

As sintaxes especiais

Em adição ao básico AND, OR e palavras entre aspas, o Google oferece algumas sintaxes especiais para otimização das buscas de seus usuários.O Google sendo uma máquina de busca de textos completos, indexa páginas da Web integralmente ao invés de apenas títulos e descrições. Comandos adicionais, chamados de sintaxes especiais, permitem que os usuários do Google busquem por partes específicas de páginas da Web, ou específicos tipos de informação. Isso é vantajoso quando você está lidando com 2 bilhões de páginas e precisa de todas as oportunidades para melhorar os resultados de sua busca. Especificar que suas palavras chave para a pesquisa devem aparecer apenas no título ou URL de uma página encontrada é uma grande maneira de otimizar seus resultados sem ter que tornar suas palavras chaves propriamente muito específicas.

Eis algumas das palavras chaves comuns que você pode adicionar a sua pesquisa no Google.

intitle:
Restringe sua busca a títulos de páginas da Web. A variação, allintitle: encontra páginas onde todas as palavras especificadas constituem o título da página. Mas é melhor evitar o uso da variação allintitle: , porque não combina muito bem com algumas das outras sintaxes.

Exemplo:
 
intitle:"Roberto Jefferson"
allintitle:"cpi mista" dos correios
inurl:
Restringe sua pesquisa as URLs das páginas. Essa sintaxe costuma funcionar bem para encontrar páginas de busca e de ajuda, porque tende a ser regular em suas composições. Uma variação allinurl: encontra todas as palavras listadas em um URL, mas também não funciona muito bem com outras sintaxes especiais.

Exemplo:
 
inurl:ajuda
allinurl:pesquisa ajuda
intext:
Pesquisa apenas o conteúdo textual (ignora links, URLs e títulos). Existe uma variação allintext: mas novamente, não gosta muito de brincar com as outras sintaxes. Apesar de seu uso ser limitado, é perfeito para encontrar palavras chave que poderiam ser muito comuns em URLs ou links de títulos.

Exemplo:
 
intext:"yahoo.com"
intext:html
inanchor:
Pesquisa por texto nas âncoras dos links de uma página. Uma âncora de link é o texto descritivo desse link. Por exemplo, o âncora do link no código HTML é "ExtraLibris Tecnológica".

Exemplo:
 
inanchor:"Elio Gaspari"
site:
Permite que você limite sua pesquisa tanto por domínio de um site ou domínio de nível elevado. AltaVista, por exemplo, possui duas sintaxes para essa função (host: e domain:), mas o Google possui apenas um.

Exemplo:
 
site:extralibris.info
site:moreno.extralibris.info
site:gov
site:bn.br
link:
Retorna uma lista de páginas que fazem ligação a uma URL especificada. Digite link:www.google.com e você receberá uma lista de páginas que fazem link ao Google. Não se preocupe em incluir o http:// ; não é necessário, e na verdade, o Google parece ignorá-lo mesmo que você insira. link: funciona também com URLs extensas - http://www.oglobo.com.br/segundocaderno ... ldojabour/ por exemplo ? bem como com URLs de nível elevado, como globo.com.

Exemplo:
 
link:www.google.com
cache:
Encontra uma cópia da página que o Google indexou mesmo se essa página não se encontra mais disponível em sua URL original ou modificou completamente seu conteúdo desde então. Isso é particularmente útil para páginas que se modificam com frequência. Se o Google retornar um resultado que aparentemente não tem muito a ver com a sua busca, você quase que certamente encontrará o que está procurando na última versão em cache dessa página no Google.

Exemplo:
 
cache:www.yahoo.com
daterange:
Limita sua pesquisa em uma data particular ou variação de datas em que uma página foi indexada. É importante notar que a busca não é limitada a data de criação da página e sim quando foi indexada pelo Google. Então se uma página foi criada em 2 de fevereiro e não indexada pelo Google antes de 11 de abril, poderá ser encontrada com daterange: busca em 11 de abril. Note que o daterange: funciona com datas Julianas e não Gregorianas (as que utilizamos no dia-dia).

Exemplo:
 
"George Bush" daterange:2452389-2452389
neurocirurgia daterange:2452389-2452389
filetype:
Pesquisa os sufixos ou extensões de nomes de arquivos. Esses são geralmente, mas não necessariamente, diferentes tipos de arquivos. Eu prefiro fazer essa distinção, porque pesquisar pelo filetype:htm e filetype:html fornece diferentes números de resultados, apesar de serem o mesmo tipo de arquivo. Você pode pesquisar por diferentes geradores de páginas, como ASP, PHP, CGI, e daí por diante ? presumindo que o site não está escondendo arquivos por trás de redirecionamentos e proxy. O Google indexa diversos formatos diferentes da Microsoft, incluindo: PowerPoint (PPT), Excel (XLS), and Word (DOC).

Exemplo:
 
artigos filetype:pdf
"indicadores econômicos" filetype:ppt
related:
Encontra páginas que estão relacionadas com a página especificada. Nem todas as páginas são relacionadas a outras páginas. Essa é uma boa maneira de encontrar categorias de páginas; uma busca por related:google.com retorna uma variedade de máquinas de busca, incluindoHotBot, Yahoo!, e Northern Light.

Exemplo:
 
related:www.yahoo.com
related:www.cnn.com
info:
Fornece uma página de links contendo mais informações sobre uma URL especificada. Inclui um link para o cachê da URL, uma lista de páginas que fazem ligação aquela URL, páginas que são relacionadas aquela URL, e páginas que contêm a URL. Note que essa informação é dependente das indexações do Google. Se o Google não indexou essa URL, informação obviamente será reduzida.

Exemplo:
 
info:www.biblio.crube.net
info:www.uol.com.br/musica
Encontrando a terminologia tecnológica

Vocabulários especializados permanecem, na maioria dos casos, como palavras estáticas que normalmente não modificam seus significados de uma hora pra outra. Isso não se aplica aos jargões relacionados à computação. Parece que a cada 12 segundos alguém aparece com um termo novo relacionado a computadores ou Internet, e então 12 minutos depois se torna obsoleto ou significa algo completamente diferente ? geralmente mais de uma coisa ao mesmo tempo. Talvez não seja tão mau assim. Apenas sentimos dessa maneira. O Google pode te ajudar em duas maneiras; ajudando a encontrar palavras e ajudando a encontrar as palavras que você não conhece, mas que precisa conhecer.

Começando pelo começo: pelamordedeus, não coloque simplesmente a abreviação dentro do campo de busca! Por exemplo, se você pesquisa por XSLT, receberá 900.000 resultados em troca. Utilizando combinações que o Google fornece, pode-se descobrir que existe muito mais vida do que isso. Ao invés, adicione "stands +for" [?significa?] ao campo de pesquisa se o que você procura é uma abreviação ou acrônimo. "XSLT stands +for" [?XSLT significa?] retorna mais ou menos 29 resultados, e o primeira da lista é um glossário tutorial. Se você ainda está recebendo muitos resultados ("XML stands +for" fornece 1,000 resultados) tente adicionar ?beginners? [?iniciantes?] , que retorna 35 resultados, o primeiro sendo "XML for beginners" [?XML para iniciantes]. Se ainda assim você não está conseguindo os resultados desejáveis, tente "What is X?" [?O que é X??] ou "X +is short +for" [?X + é redução + de?] ou X beginners FAQ, onde X é o acrônimo ou termo.

Esses devem ser considerados métodos de segundo-escalão, porque muitos sites tendem a não utilizar frases tipo "What is X?" em suas páginas. "X is short for" é linguagem incomum, e X pode ser tão novo (ou tão obscuro) que ainda não possui uma entrada FAQ. Novamente, seus resultados podem variar e vale a pena arriscar; existe muita terminologia por aí. Se você possui terminologia específica de hardware- ou software ? tente a palavra ou frase junto com quaisquer coisas que você conhece sobre sua utilização. Por exemplo, DynaLoader é uma terminologia específica de software; é um módulo Perl. Sabendo isso, apenas dê às duas palavras uma combinação: DynaLoader Perl. Se os resultados que você encontrar forem muito avançados, assumindo que você já sabe o que DynaLoader é, comece a brincar com as palavras ?beginners?, ?newbie? [?novato?], e similares para lhe aproximar a informações para iniciantes:
DynaLoader Perl Beginners


Google Groups

Os grupos da Usenet, grupos de discussão com base textual cobrindo literalmente centenas de milhares de assunto, existem desde antes mesmo a criação da World Wide Web. E agora eles estão disponíveis para busca e utilização como o (http://groups.google.com/). O arquivo do Google Groups começa em 1981 e cobre até os dias de hoje. Mais de 200 milhões de mensagens estão arquivadas. Como você pode imaginar, é um arquivo bem grande, cobrindo literalmente décadas de discussão. Se perdeu em uma fase de um jogo de vídeo-game das antigas? Precisa de ajuda com uma máquina de costura que comprou em 1982? Você pode encontrar respostas aqui. Google Groups também permite que você participe das discussões da Usenet.

Existem hierarquias regionais e menores, mas as principais são: alt, biz, comp, humanities, misc, news, rec, sci, soc, e talk. Muitos dos grupos da Web são criados através de um processo de votação e são colocados sob hierarquias que mais se aplicam ao tópico.

Navegando pelos grupos

Na página principal do Google Groups, você pode navegar por uma lista de grupos escolhendo uma hierarquia na página principal. Você verá que existem subtópicos, sub-subtópicos, sub-sub-subtópicos e ? bom, você já entendeu. Por exemplo, na hierarquia comp (computadores) você encontrará subtópico comp.sys, redução de ?computer systems?. Sob ele existem 75 grupos e subtópicos, incluindo comp.sys.mac, uma parte da hierarquia devotada ao sistema de computador Macintosh. Existem 24 subtópicos Mac, um deles comp.sys.mac.hardware, que possui, além, 3 grupos abaixo. Quando você já tiver trilhado todos os grupos específicos de seus interesses, o Google Groups apresenta as mensagens propriamente, sortidas em ordem cronológica inversa. Essa estratégia funciona bem quando você quer ler um grupo lento (baixo tráfego) ou moderado, mas quando você quer ler um grupo volumoso, livre-para-qualquer-usuário, você pode desejar utilizar a máquina de busca do Google Groups. A busca na página principal funciona similarmente à pesquisa regular no Google; a única diferença perceptível é o botão do Google Groups e cada resultado possui um grupo associado e data de postagem.
Sintaxes especiais e Google Groups.

Você pode fazer pesquisas precisas na página de buscas avançadas do Google Groups. E, como no Google regular, você possui algumas sintaxes a sua disposição. Google Groups é um arquivo de conversações. Então, quando você pesquisar, você obterá mais sucesso se tentar procurar por linguagem informal e de conversação, não a linguagem cuidadosamente estruturada que encontra em sites da Internet (bom, pelo menos alguns sites...)

intitle:
Pesquisa por palavras nos títulos de mensagens.

Exemplo:
 
intitle:futebol
group:
Restringe sua busca a um grupo específico ou conjunto de grupos (tópico). O caracter * (asterisco) modifica uma sintaxe group: para incluir tudo sob o grupo ou assunto especificado. comp.lang* [comp lang de computer language, ?linguagem computacional? em Português] encontrará resultados no grupo comp.lang, bem como em comp.lang.php, comp.lang.perl, e em diante.

Exemplo:
 
group:comp.lang*
group:alt*
group:comp.lang.perl.misc
author:
Especifica o autor de uma mensagem no grupo. Pode ser nome completo ou parcial, ou um endereço de email.

Exemplo:
 
Eg: author:fred
author:fred flintstone
author:flintstone@bedrock.gov
Google Images
Tire uma folga da busca textual e dê uma olhada no Google Images (http://images.google.com/), um índice com mais de 390 milhões de imagens disponíveis na Web. A busca de imagens do Google começa com uma busca simples por palavras chave. Imagens são indexadas sob uma variedade de palavras chave, algumas mais amplas do que outras, mais específicas o possível. Se você está pesquisando por gatos, não utilize gatos como palavra chave a não ser que você não se importe em receber resultados que incluem ?escaneamento de gatos? ? [algumas pessoas escaneam seus gatos, literalmente, e expõem as fotos na internet]. Utilize palavras que são mais unicamente relacionadas aos gatos, como felino ou bichano. Especifique sua busca ao máximo, utilizando o menor número de palavras possível. Uma busca por dente felino, que lhe traz mais de 3000 resultados no Google, não traz nenhum resultado no Google Image Search; nesse caso, dente de gato funciona melhor. (Construir frases para pesquisa de imagens exige muita paciência e experimentação). Resultados de busca incluem um thumbnail [imagem em pequena escala], nome, tamanho (tanto pixels e kilobytes), e a URL onde a imagem se encontra. Clicando sobre a imagem apresenta uma página enquadrada, o thumbnail do Google para a imagem no topo, e a página onde a imagem originalmente apareceu na parte de baixo.

Pesquisar no Google Images pode ser frustrante, porque é difícil construir buscas com múltiplas palavras, e pesquisas com palavras únicas levam a milhares de resultados. Você tem mais opções para otimizar a pesquisa tanto através da interface do Advanced Image Search como das sintaxes especiais do Google Image Search.

Sintaxes especiais do Google Images

Google Images oferece algumas sintaxes especiais:

intitle:
Encontre palavras chave no título da página. Esse é um excelente meio para otimizar os resultados de buscas.

Exemplo:
 
Eg: intitle: Grande Muralha da China
filetype:
Encontre imagens de um tipo particular. Isso funciona apenas para JPEG e GIF, não BMP, PNG, ou qualquer outro formato que o Google não indexa. Note que para pesquisa por filetype:jpg e filetype:jpeg não trará diferentes resultados, porque a filtragem é baseada nas extensões de arquivo, e não um tipo de entendimento profundo daquele tipo de arquivo.

Exemplo:
 
Eg: filetype:jpeg Albert Einstein
site:
Como na busca no Google regular, restringe seus resultados para um específico site ou domínio. Não utilize para restringir resultados para um único domínio a não ser que você tenha certeza do que exista lá. Ao invés, utilize para restringir resultados a certos domínios. Por exemplo, pequise por futebol.site:br e depois pesquise por futebol.site:com é um bom exemplo de como o uso do site: pode fazer diferença.


Google News

Pesquisa no Google permite que você busque por notícias de várias fontes na internet. O campo de busca funciona como a busca no Google regular ? todas as buscas são padronizadas AND. Os resultados são apresentados em clusters [emaranhados], fornecendo título, fonte, data e um breve sumário (o link para a notícia completa está incluído no título). O pesquisador pode selecionar suas buscas por relevância ou data.

Sintaxes especiais
Pesquisa no Google News suporta duas sintaxes especiais.

intitle:
Encontra palavras no cabeçalho de uma notícia.

Exemplo:
 
Eg: intitle:furacão
site:
Encontra artigos de uma fonte particular. (Google News possui mais de 4,000 fontes).

Exemplo:
 
Eg: furacão site:reuters.com
Tirando proveito do Google News
A melhor coisa sobre o Google News é sua capacidade de cluster. Em uma máquina de busca comum, uma notícia impactante pode afogar os resultados de busca. Por exemplo, em julho de 2002, circulou uma história de que terapia de substituição de hormônios pode aumentar o risco de câncer. Rapidamente a utilização de máquinas de busca de notícias para encontrar a frase ?câncer de mama? se tornou um exercício de futilidade, porque dúzias de notícias sobre o mesmo tópico estavam agrupadas nas páginas de resultados. Isso não acontece quando você pesquisa a máquina de busca de notícias do Google, porque o Google agrupa notícias similares por tópico. Você poderia encontrar um largo cluster de notícias sobre terapia de substituição de hormônios, mas eles estariam em um único lugar, deixando você pesquisar outras notcias sobre câncer de mama. Algumas buscas agrupam com facilidade; elas são especializadas e tendem a gerar tópicos limitados. Mas outras buscas ? como ?George Bush? ? geram muitos resultados e vários agrupamentos diferentes. Se você precisa pesquisar por um nome famoso ou um tópico geral (como crime, por exemplo) otimize seus resultados de busca através dos seguintes modos:

Adicione um tópico modificador que irá significantemente otimizar seus resultados de busca, como em: ?George Bush? palestra na ONU. Limite sua busca com uma das sintaxes especiais, por exemplo: intitle:"George Bush". Limite sua busca a um site particular. Esteja ciente que, enquanto isso funciona bem para uma notícia de grande impacto, você pode perder notícias locais. Se você está pesquisando por uma grande notícia nos Estados Unidos, CNN é uma boa escolha (site:cnn.com). Se a noticia que você está pesquisando é mais internacional, BBC funciona bem (site:bbc.co.uk).

Conclusão:
Como você viu, o Google é mais do que uma máquina de busca com base textual e devotando um pouco de tempo na especificação do termo de busca, você pode especificar sua pesquisa e acessar a informação desejada dentro de um universo de 2 bilhões de páginas no menor tempo possível. Estas pequenas técnicas que você aprendeu agora certamente vão auxiliar no acesso integral ao poder do Google e fazendo isso, toda a Internet vai se tornar seu playgroung. Boas Googladas.

Texto original disponível em: Googlemyway

Resumo dos operadores avançados.

 
Operador: site:
Resultado da Busca: Todas as páginas de um domínio e todos os subdomínios se você não usar o www.
Aplicações no SEO: Ver quantas páginas foram indexadas.
 
Operador: cache:
Resultado da Busca: A Versão em cache de uma página.
Aplicações no SEO: Ver uma cópia da ultima versão indexada de uma página.
 
Operador: info: ou id
Resultado da Busca: Mostra as informações que o Google possui sobre a URL determinada.
Aplicações no SEO: Usada para ver algumas informações que o Google tem sobre essa página.
 
Operador: related:
Resultado da Busca: Páginas que são similares a página especificada.
Aplicações no SEO: Usado para ver um pequeno indicativo do que o Google considera ser conteúdo relacionado.
 
Operador: define:
Resultado da Busca: Páginas que possuem uma definição da keyword pesquisada.
Aplicações no SEO: Usado basicamente como um dicionário da web. Pode ser usado para definição das suas keywords.
 
Operador: link:
Resultado da Busca: Páginas que linkam para uma URL específica. (No Yahoo, deve-se usar http://.)
Aplicações no SEO: Usado para ver o número(não mostra todos os links nem uma porcentagem fixa, é aleatório) e a qualidade dos inbound links para o site do seu cliente e dos seus competidores.
 
Operador: filetype: ou ext:
Resultado da Busca: Páginas de um determinado tipo de arquivo que contenha sua keyword.
Aplicações no SEO: Usado para analizar o uso de PDF’s, Flash, Documentos do Word e Exel em determinado domínio.
 
Operador: allintitle
Resultado da Busca: Páginas que contenham todas suas keywords no seu título.
Aplicações no SEO: Usado para analisar os títulos de uma página.
 
Operador: intitle:
Resultado da Busca: Páginas que contenham sua keyword no seus títulos.
Aplicações no SEO: Usado para analisar os títulos de uma página.
 
Operador: allinurl:
Resultado da Busca: Páginas que contenham todas as suas keywords na URL.
Aplicações no SEO: Usado para analisar os títulos de uma página.
 
Operador: inurl:
Resultado da Busca: Páginas que contenham sua keyword na URL.
Aplicações no SEO: Usado para analisar os títulos de uma página.
 
Operador: allinanchor
Resultado da Busca: Páginas que contenham inbound links com sua keyword.
Aplicações no SEO: Usado para analisar o texto âncora dos inbound links.
 
Operador: intext:
Resultado da Busca: Páginas que tenham textos que contenham suas keywords.
Aplicações no SEO: Usado para analisar os textos de uma página.
 
Operador: allintext:
Resultado da Busca: Páginas que tenham textos que contenham suas keywords.
Aplicações no SEO: Usado para analisar os textos de uma página.
 
Operador: inanchor:
Resultado da Busca: Páginas que contenham inbound links com sua keyword.
Aplicações no SEO: Usado para analisar o texto âncora dos inbound links.