Como a indexação do meu site é feita pelo Google?

Como a indexação do meu site é feita pelo Google?

Indexação do meu site e Rastreamento

Uma consulta começa antes mesmo que você digite sua pesquisa, com o rastreamento e a indexação de trilhões de documentos pela Web.

Como a pesquisa funciona

Estes processos estabelecem o alicerce. Eles são a forma como reunimos e organizamos as informações de modo a retornar os resultados mais úteis para você. Nosso índice ultrapassa os 100.000.000 de gigabytes e exigiu mais de um milhão de horas de computação para ser construído. Saiba mais sobre os fundamentos com este breve vídeo.

Localização de informações por meio da indexação

Usamos programas conhecidos como “rastreadores da Web” para descobrir páginas disponíveis publicamente. O rastreador mais conhecido é chamado de “Googlebot”. Os rastreadores analisam as páginas da Web e seguem os links contidos nelas, como você faz ao navegar na Internet. Eles avançam de link em link e transmitem aos servidores do Google os dados destas páginas da Web.

O processo de rastreamento começa com uma lista de endereços da Web de rastreamentos anteriores e mapas de sites fornecidos pelos proprietários de websites. Ao acessar esses websites, nossos rastreadores procuram por links para outras páginas a visitar. O programa dá atenção especial a estes novos sites, a alterações em sites existentes e a links inativos.

Programas de computador determinam os sites a rastrear, a frequência do rastreamento e o número de páginas em cada site. O Google não aceita pagamentos para aumentar o rastreamento de um site para os resultados de pesquisa na Web. Estamos mais preocupados em oferecer os melhores resultados possíveis. Pois a longo prazo isto é o melhor para os usuários e, consequentemente, para nossa empresa.

Organização de informações por meio da indexação

A Web é como uma biblioteca pública em constante expansão, com bilhões de livros e nenhuma administração centralizada. O Google reúne as páginas durante o processo de rastreamento e cria um índice para encontrar o que procuramos. De forma muito semelhante ao índice na parte de trás de um livro, o índice do Google inclui informações sobre as palavras e onde podem ser encontradas. Quando você realiza uma pesquisa no nível mais básico, nossos algoritmos procuram os termos de sua pesquisa no índice para localizar as páginas adequadas.

O processo de pesquisa torna-se muito mais complexo a partir daí. Quando você procura por “cães” ,você não quer ver uma página com a palavra “cães” escrita centenas de vezes. Você provavelmente quer imagens, vídeos ou uma lista de raças. Os sistemas de indexação do Google levam em consideração vários aspectos diferentes das páginas, como sua data de publicação, seu conteúdo em termos de fotos e vídeos, e muito mais. Com o Painel do conhecimento, continuamos a ir além da mera associação de palavras-chave para compreender melhor as pessoas, lugares e coisas que importam para você.

Opções dos proprietários de websites

A maioria dos sites não precisa configurar restrições de rastreamento, indexação ou veiculação para que suas páginas estejam qualificadas para exibição nos resultados de pesquisa. Apesar disso, os proprietários de sites têm diversas opções relacionadas ao rastreamento e indexação de seus sites pelo Google, disponíveis por meio das Ferramentas do Google para webmasters e de um arquivo chamado “robots.txt“. Com o arquivo robots.txt, os proprietários de sites podem optar por bloquear o rastreamento do Googlebot ou fornecer instruções mais específicas para o processamento de suas páginas.

Os proprietários de sites possuem opções granulares e podem determinar o método de indexação do conteúdo por página. Por exemplo, podem preferir que suas páginas sejam exibidas sem snippets ou sem versões em cache. Os webmasters também podem optar por integrar a pesquisa em suas próprias páginas por meio da Pesquisa personalizada.

Matéria completa:
www.google.com/intl/pt-BR_ALL/insidesearch/howsearchworks/crawling-indexing.html
O conteúdo publicado aqui é espelhado de um conteúdo original que pode ser visualizado no link acima.

 

Deixe uma resposta

Fechar Menu
Entre em contato!