sitemap.xml

O sitemap é um arquivo que informa aos motores de busca as páginas e arquivos de um site que devem ser rastreados e a relação entre eles. Ele é utilizado para que os crawlers entendam a estrutura do site e o rastreiem de maneira mais eficaz. É possível incluir informações como a última data de modificação, a frequência de alteração, a prioridade de cada uma das páginas e versões alternativas em línguas diferentes. Além disso, quando falamos de arquivos de mídia, por exemplo, é possível apontar a classificação etária e duração de um vídeo ou o assunto e licença de uma imagem.

Navegação

Para que serve o sitemap?

Sitemaps são úteis para os rastreadores em diversas situações. Por exemplo, se seu site é muito grande, muito novo ou possui páginas que não fazem referência umas às outras, o sitemap ajuda os rastreadores a entender a hierarquia do site como um todo e localizar páginas que são dificilmente acessadas através da navegação.

Como criar um sitemap?

Você pode criar o sitemap do seu site manualmente, mas há ferramentas que podem fazer isso por você. Para sites em WordPress, o Yoast SEO é uma boa pedida. Também não deixe de conferir essa lista curada pelo Google, que traz mais algumas opções. Se você utilizar uma plataforma de e-commerce, é provável que o seu sitemap já tenha sido gerado automaticamente. Para confirmar, entre em contato com a equipe responsável pela plataforma.

Caso você opte por utilizar algumas dessas ferramentas, é só pular para a quinta parte do passo a passo abaixo e enviar o sitemap para os motores de busca. Se preferir criar o seu sitemap manualmente, é só seguir o passo-a-passo abaixo.

Primeiro passo: mapear o site

Para começar, você deve mapear todas as páginas do seu site e decidir quais delas devem ser rastreadas. Por exemplo, se você tem uma página de login, é provável que você não queira que ela seja rastreada, então é uma boa ideia deixá-la de fora do sitemap.

Caso você tenha páginas com conteúdo semelhante, é necessário definir páginas canônicas. Ao realizar esse processo, você estará indicando ao Google quais páginas não devem ser reconhecidas como URLs duplicadas e, assim, devem ser rastreadas com mais frequência do que as outras.

Segundo passo: conhecer as diretrizes universais de sitemaps

Mesmo que você possa utilizar diferentes formatos de sitemaps, algumas orientações sempre continuam as mesmas. Fique de olho:

  • Há um limite de tamanho para sitemaps. O seu arquivo não deve ultrapassar 50 mil URLs e 50MB (não compactado). Se o seu site for maior do que isso, você deve criar um arquivo de índice de sitemaps.
  • As URLs devem estar completas. Nada de suprimir o HTTP ou o WWW, pois os motores de busca rastrearão os links exatamente como eles estiverem escritos.
  • Informe os motores de busca caso haja páginas específicas para idiomas ou regiões. É possível fazê-lo através do atributo hreflang.
  • Utilize UTF-8. Os motores de busca só conseguirão ler arquivos decodificados em UTF-8. Além disso, as URLs devem estar codificadas com escape de acordo com a tabela abaixo.
Caractere Código de escape
E comercial & &
Aspas simples '
Aspas duplas "
Maior que > >
Menor que < &lt;

Definir o formato do sitemap

Não há apenas um jeito de formatar sitemaps: você pode escolher a maneira mais adequada à sua própria estratégia.

  • XML: É o formato mais utilizado para sitemaps. Todos os protocolos e orientações necessárias para a criação do arquivo estão disponíveis em sitemap.org, mas você pode conferir um exemplo abaixo. Note que é sempre necessário abrir e fechar com a tag <urlset> e utilizar a tag <url> como tag pai para <loc> em cada uma das URLs. Atributos como <lastmod> (última modificação), <changefreq> (frequência de modificação) e <priority> (prioridade) são opcionais.

<?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

<url>

<loc>http://www.example.com/</loc>

<lastmod>2019-09-01</lastmod>

<changefreq>weekly</changefreq>

<priority>0.5</priority>

</url>

</urlset>

  • RSS, mRSS e Atom 1.0: Se você tem um blog com um feed, é só usar a URL dele como sitemap. O problema é que muitos dos feeds só fornecem URLs recentes, deixando páginas mais antigas de fora, o que pode prejudicar o rastreamento.
  • Texto: Caso você opte pela simplicidade, é possível apenas listar as URLs do site, uma por linha, em um arquivo de texto (extensão .txt). Mas preste atenção: todas as URLs devem ser de páginas da web, excluindo arquivos.

Se você possuir um site com bastante conteúdo em imagem e vídeo, você pode usar extensões de sitemaps para indexar esses tipos de mídia alternativos.

  • Sitemaps de imagens: Você pode criar um novo sitemap para as imagens do seu site ou adicioná-las a um sitemap existente. Não deixe de aprender sobre a sintaxe na Ajuda do Search Console e de seguir as práticas recomendadas do Imagens do Google.
  • Sitemaps de vídeo: Assim como sitemaps de imagens, para sitemaps de vídeo é possível criar um sitemap novo apenas para vídeos ou incorporá-lo a um sitemap já existente. É importante notar que os rastreadores precisam ter acesso aos arquivos de origem e aos players, então eles não podem estar bloqueados pelo robots.txt. Saiba mais sobre a sintaxe na Ajuda do Search Console.

Quarto passo: hospedar o sitemap

Antes de enviar o sitemap para os motores de busca, você precisa hospedá-lo no seu site. É recomendado que o sitemap fique na raiz do site, pois um sitemap localizado em http://www.exemplo.com.br/site/sitemap.xml pode conter apenas URLs que comecem com http://www.exemplo.com.br/site/. Não seria possível inserir URLs como http://www.exemplo.com/categoria/, por exemplo. Além disso, é importante notar que um sitemap não pode estar em um protocolo diferente do protocolo do site ou em um subdomínio.

Quinto passo: enviar o sitemap para os motores de busca

Quando você terminar o sitemap, é necessário informar os motores de busca das suas novas diretrizes de rastreamento. Há algumas maneiras de fazer isso:

  • Utilizar a interface dos próprios motores de busca: Para o Google, por exemplo, é só acessar a ferramenta relatório de sitemaps, disponível no Search Console.
  • Atualizar o robots.txt: É só inserir Sitemap: http://www.exemplo.com/sitemap.xml. Para saber mais sobre o arquivo e aprender a criar um robots.txt para o seu site, confira este post.
  • Enviar uma solicitação HTTP: Utilize a função ping para solicitar a indexação do seu sitemap da seguinte forma: http://www.google.com/ping?sitemap=https://exemplo.com/sitemap.xml

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Conheça a Mateada
acessar