C’est quoi un sitemap XML ?

Un sitemap XML est tout simplement une liste des URLs de votre site internet. Il sert de guide pour indiquer aux moteurs de recherche le contenu disponible et la manière de l’atteindre.

Les sitemap XML ont une capacité particulièrement importante à aider les robots d’indexation à accélérer l’indexation des sites web qui :

  • Ont des milliers de pages et/ou une architecture de site web profonde,
  • Ajoutent fréquemment de nouvelles pages ou modifient le contenu des pages existantes,
  • Ont des pages orphelines ou peu de liens internes,
  • Ne possèdent pas des backlink solide.
  • Même si, techniquement, les moteurs de recherche peuvent trouver vos URL sans sitemap XML, en utilisant ce dernier, vous leur indiquez les pages que vous considérez de qualité.

Bien qu’il n’y ait aucune garantie qu’un sitemap XML permette à vos pages d’être explorées, et encore moins indexées ou classées, le fait d’en soumettre augmente certainement vos chances.

Fichier Sitemap XML

Voici un exemple d’une page utilisant toutes les balises disponibles pour un sitemap XML :

Nous vous expliquons ci-dessous comment utiliser chacune de ces balises en décrivant l’éventuelle valeur ajoutée des métadonnées pour améliorer votre référencement.

Balise Loc (Localisation)

Cette balise obligatoire contient la version absolue et canonique de l’emplacement de l’URL. Elle doit refléter avec précision le protocole de votre site (http ou https) et si vous avez choisi d’inclure ou d’exclure le www ou pas.

Pour les sites internet internationaux, c’est également ici que vous pouvez mettre en œuvre votre traitement des langues avec l’attribut hreflang. Par ailleurs, en utilisant l’attribut xhtml:link pour indiquer les variantes de langues et de régions pour chaque URL, vous réduisez le temps de chargement de la page, ce que les autres implémentations des éléments de lien dans les en-têtes <head> ou HTTP ne peuvent pas offrir.

Balise Lastmod (dernière modification)

La balise Lastmod est facultative mais fortement recommandée pour communiquer la date et l’heure de la dernière modification du fichier.

C’est un moyen efficace pour remonter aux moteurs de recherche les modifications significatives apportées au contenu de vos pages. En occurrence, il n’est pas recommandé de mettre à jour cette balise pour les modifications mineures.

Essayer de faire croire aux moteurs de recherche que votre contenu est frais, alors qu’il ne l’est pas, peut entraîner une pénalité de Google (comme une désindexation d’une ou plusieurs pages de votre site internet).

Balise Changefreq (Fréquence des modifications)

Cette balise a toujours été facultative pour indiquer aux moteurs de recherche la fréquence à laquelle le contenu de l’URL était censé changer. Elle ne joue pas un rôle important dans les sitemap.

Balise de priorité

Cette balise facultative indique ostensiblement aux moteurs de recherche l’importance d’une page par rapport à vos autres URLs sur une échelle de 0,0 à 1,0. Elle n’a jamais été qu’un indice pour les moteurs de recherche.

Remarque : Le protocole officiel d’utilisation des sitemap est disponible via ce lien : Protocole des sitemaps.

Les principaux types de sitemaps

Sitemap XML index

Les sitemaps XML ont quelques limitations, notamment le nombre d’URLs qui ne doit pas dépasser 50 000 URL et la taille maximale des fichiers non compressés correspond à 50 Mo

Par ailleurs, les sitemaps peuvent être compressés à l’aide de gzip afin d’économiser la bande passante du serveur d’hébergement. Mais une fois décompressé, le sitemap ne peut toujours pas dépasser l’une ou l’autre des 2 limitations citées ci-dessus. Sinon, il sera nécessaire de répartir les URL sur plusieurs sitemaps XML.

Ces sitemaps peuvent ensuite être combinés en un seul fichier sitemap XML d’index. Il s’agit essentiellement d’un sitemap pour sitemaps.

Pour les sites web avec, particulièrement, un grand nombre de pages, il est conseillé d’adopter une approche plus granulaire, en créant plusieurs fichiers d’index sitemap, un par catégorie de contenu (articles, produits, services, …).

Afin que les moteurs de recherche puissent facilement trouver tous vos fichiers sitemap en une seule fois, vous il est recommandé de :

  • Soumettre votre (vos) index sitemap à Google Search Console et Bing Webmaster Tools,
  • Spécifier l’URL de votre (vos) index sitemap dans votre fichier robots.txt. Pointer les moteurs de recherche directement vers votre sitemap en les invitant à le parcourir,
  • Vous pouvez également soumettre des sitemaps en les envoyant à Google.

Sitemap d’image XML

Dans le cadre de référencement de votre site internet, les images sont intégrées au contenu de la page et seront donc explorées avec l’URL de la page. Par ailleurs, les sitemaps d’images ont été conçus pour améliorer l’indexation du contenu des images.

En outre, il est préférable d’utiliser le balisage JSON-LD schema.org/ImageObject pour indiquer les propriétés des images aux moteurs de recherche, car il fournit plus d’attributs qu’un sitemap XML d’image.

Pour cette raison, un plan de site XML pour les images est inutile pour la plupart des sites web. L’inclusion d’un sitemap d’images ne ferait que gaspiller le budget consacré à l’exploration par les robots des moteurs de recherche.

L’exception à cette règle est le cas où les images contribuent à votre activité.  Par exemple, un site internet de photos d’archives ou une boutique en ligne qui obtient des sessions de pages de produits grâce à la recherche d’images sur Google.

Sachez que les images ne doivent pas nécessairement se trouver sur le même domaine que votre site web pour être soumises dans un sitemap. Vous pouvez utiliser un CDN, à condition qu’il soit vérifié dans Google Search Console.

Sitemap vidéo XML

Comme pour les images, si les vidéos sont essentielles à votre activité, créez un sitemap vidéo XML. Dans le cas contraire, un sitemap vidéo est inutile.

Conservez votre budget d’exploration pour la page dans laquelle la vidéo est intégrée, en veillant à baliser toutes les vidéos avec JSON-LD en tant que schema.org/VideoObject.

Sitemap de Google Actualités

Si vous publiez régulièrement du contenu, que vous souhaitez qu’ils soient enregistrés auprès de Google New, vous devez utiliser ce sitemap. Sinon, ce dernier n’a pas de valeur ajoutée à vous apporter. Il est recommandé d’inclure les articles publiés au cours des deux derniers jours, dans la limite de 1000 URL par sitemap, et mettre à jour avec de nouveaux articles dès qu’ils sont publiés.

Sitemap mobile

Ce type de Sitemap n’est pas nécessaire pour la plupart des sites internet. Ils ne sont destinés qu’aux pages de téléphonie mobile. Pas pour la compatibilité avec les smartphones.

Donc, à moins que vous n’ayez des URLs uniques spécialement conçues pour les téléphones mobiles, un plan de site mobile ne sera ainsi d’aucune utilité.

Sitemap HTML

Les sitemaps HTML répondent aux besoins des moteurs de recherche. Ils ont été conçus pour aider les utilisateurs humains à trouver du contenu.

Les sitemaps HTML sont généralement liés dans les pieds de page des sites internet. Il s’agit de tirer parti de l’équité des liens de chaque page de votre site web.

Si peu d’humains l’utilisent et les moteurs de recherche n’en ont pas besoin puisque vous avez des liens internes forts et un Sitemap XML. Ce Sitemap HTML a-t-il une raison d’exister ? Je dirais que non.

Bonnes pratiques des sitemaps XML

Pour vous aider dans l’optimisation de vos sitemap XML, voici une To-Do-List qui vous permet de vérifier les points les plus implorants et tirer profit de cet élément dans votre stratégie de référencement naturel :

  • Inclure l’attribut hreflang dans les sitemaps XML,
  • Inclure les balises <loc> et <lastmod>,
  • Compresser les fichiers sitemap à l’aide de gzip,
  • Utiliser un fichier d’index de sitemap,
  • N’utiliser les sitemaps d’images, de vidéos et de Google News que si l’indexation est le moteur de vos indicateurs clés de performance,
  • Générer dynamiquement des sitemaps XML,
  • S’assurer que les URLs ne sont incluses que dans un seul sitemap,
  • Référencer les URLs de l’index sitemap dans robots.txt,
  • Soumettre l’index sitemap à la fois à Google Search Console et aux Bing Webmaster Tools,
  • Inclure uniquement les pages pertinentes pour le référencement dans les sitemaps XML.
  • Corriger toutes les erreurs et tous les avertissements,
  • Analyser les tendances et les types de pages valides,
  • Calculer les taux d’indexation des pages soumises,
  • Traiter les causes d’exclusion des pages soumises

Conclusion

Les sitemaps XML représentent une brique importante dans votre stratégie SEO. Il est donc nécessaire de prendre le temps de bien l’optimiser et l’adapter aux objectifs et à la typologie de votre site internet. Cet article regroupe les points importants à prendre en compte pour vous guider dans cette tâche.
De même, INOPULSE peut vous accompagner dans l’optimisation, l’élaboration et l’implémentation d’une stratégie de référencement sur mesure.

Leave a comment

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *