12 avr 2022
Le sitemap est l'un des éléments incontournables du SEO. C’est un fichier qui présente les URL des différentes pages de votre site et qui permet, s’il est bien mis en place, de mieux vous positionner sur les moteurs de recherche.
Malheureusement, la majorité des propriétaires de sites web ignorent son importance et ne lui prêtent aucune attention, ce qui peut leur coûter beaucoup en termes de SEO.
Les sitemaps sont des documents qui regroupent toutes les pages importantes d’un site web ainsi que les relations entre elles. Pour comprendre ce que fait exactement un sitemap, il faut d’abord savoir comment fonctionne un site web.
Un siteweb dans sa forme la plus simple n’est qu’un ensemble de pages interconnectées et hébergées sous le même nom de domaine. Ces pages sont généralement organisées en catégories et sous catégories qui sont chacune stockées dans des répertoires spécifiques sur le serveur du site web.
L’organisation hiérarchique de ces différentes pages et catégories est ce qui détermine la structure du site. Cette structure doit être optimale car elle joue un rôle primordial dans la bonne exploration du site web à la fois pour les utilisateurs et les moteurs de recherche.
Les sitemaps regroupent toutes ces informations dans un format structuré en définissant exactement les pages des sites et comment les trouver. C’est une sorte de plan ou carte où chaque destination est l’URL d’une page sur votre site. Il existe 2 types de sitemaps.
C’est généralement un index de liens HTML des pages les plus importantes du site à destination des utilisateurs. Il se trouve souvent sur une page spécifique ou sur une section du site comme le footer.
L’objectif est de permettre aux visiteurs d'un site de trouver plus facilement les pages les plus pertinentes et ainsi améliorer leur expérience utilisateur.
Le développement de solutions de structuration et de présentation des informations sur les sites (menus de navigation, filtres, taxonomie, etc.) a rendu moins nécessaires les sitemap HTML. Il est donc plus rare de les trouver sur les sites, qu’il y a quelques années.
Ce sont des fichiers XML qui regroupent les URL du site et représentent sa structure. En plus de ces informations essentielles, un sitemap XML peut contenir d’autres données complémentaires comme la date de mise à jour de chaque URL ainsi que son degré d'importance pour le site.
Ces sitemaps, à la différence de leurs cousins en HTML, ne sont pas conçus pour les utilisateurs mais pour permettre aux moteurs de recherche comme Google de mieux crawler et indexer un site et ses pages les plus importantes. Et c’est sur ce dernier type de sitemaps que nous allons nous concentrer dans cet article.
Pour les petits sites vitrines ne contenant que quelques pages, il n’est pas vraiment indispensable de disposer un sitemap XML. Mais pour les plus gros sites, ces fichiers deviennent incontournables dans le processus du crawling et d'indexation.
Voici les raisons pour lesquelles vous devez absolument créer et optimiser votre sitemap XML :
Parce qu’il est très coûteux de crawler et d'indexer les pages web, Google affecte un budget d’exploration à chaque site et essaye de l’optimiser.
C’est ce qu’on appelle le crawl budget, et il signifie que Google ne va pas forcément explorer toutes les URL d’un site web dans un crawl. Il essaye de prioriser et d’optimiser l’exploration pour se concentrer sur les pages les plus importantes et laisser les autres pour un prochain crawl.
Pour les gros sites, il est très fréquent d’avoir un grand nombre de pages dupliquées ou non pertinentes. Et une configuration technique non optimale du site signifie que Google va gaspiller ses ressources dans l’exploration de pages n’ayant aucune valeur (pages dupliquées, pages avec peu de contenus, archives non pertinentes) et ne pourra par conséquent pas trouver et indexer les pages les plus utiles.
Créer et soumettre un sitemap à Google avec les bonnes URL lui permet de trouver plus rapidement les pages que vous voulez qu’il indexe.
Mais attention ! Nous ne disons pas que les sitemaps XML sont une alternative à l’optimisation SEO technique.
Si vous soupçonnez que votre site souffre de sérieux problèmes techniques, effectuez un audit SEO et réglez ceux que vous identifiez. Ensuite consolidez les changements avec les bonnes URL dans votre sitemap.
Les moteurs de recherche crawlent le web et donc votre site, en suivant les liens entrants vers les pages. Les robots suivent d’abord les liens externes qui pointent vers le site. Et une fois sur le site, ils suivent les liens internes pour découvrir et indexer les différentes pages.
La structure du site joue un rôle primordial dans la réussite de ce processus. Elle permet aux moteurs de recherches de comprendre les relations logiques entre les différentes pages et catégories et ainsi les contenus les plus importants.
Le sitemap XML représente ces relations d’une façon simple et structurée permettant aux moteurs de recherche de les comprendre plus facilement.
Vous utilisez un CMS comme WordPress, Magento, Wix, Squarespace, le sitemap de votre site est soit généré automatiquement pour vous soit vous pouvez utiliser un plugin pour le faire.
Par exemple sur WordPress les plugins SEO comme Yoast SEO vous permettent de créer facilement votre sitemap XML, il vous suffit pour cela d’activer la fonctionnalité.
L'avantage de ces outils c’est qu’ils permettent la création et la mise à jour automatique du sitemap au fur et à mesure que vous modifiez les contenus du site.
Si vous utilisez une solution sur mesure pour votre site, vous pourrez avoir besoin de créer votre sitemap vous-même. Mais rassurez-vous vous n’aurez pas à copier une à une les URL de votre site.
Il existe plein d’outils comme Screaming Frog qui permettent de crawler votre site et de créer votre sitemap XML que vous téléchargez ensuite et installez au bon endroit sur votre serveur.
Nous vous conseillons de demander l’assistance d’un développeur pour effectuer cette manipulation.
Après avoir créé votre sitemap, il ne vous reste plus qu’à le soumettre à Google pour le prendre en compte dans le prochain crawl. Vous faites cela avec Google Search Console dans l’onglet Sitemaps.
Il vous suffit de coller l’URL du sitemap et de cliquer sur “Envoyer”
Il n’est pas nécessairement difficile de mettre en place un sitemap XML, mais il faut être très prudent et suivre les best practices pour éviter des erreurs qui peuvent avoir un impact négatif sur votre SEO.
Voici quelques conseils pour mettre en place votre sitemap correctement.
Le nombre d'URL et la taille du fichier sont parmi les contraintes techniques à prendre en compte lors de la création d’un sitemap XML.
Ainsi un seul sitemap XML ne doit pas contenir plus de 50000 URL et le fichier ne doit pas dépasser le poids de 50MB sans compression.
Une configuration qui ne respecte pas ces exigences peut rendre difficile le crawling du sitemap par les moteurs de recherche.
Si vous avez un site trop gros et que votre sitemap dépasse ces limites, pensez à le diviser en plusieurs sitemaps et utiliser un index de sitemap pour référencer le tout.
Veillez à ce que votre plan Sitemap XML donne une image actualisée de votre site Web. Chaque fois qu'une page est supprimée, elle doit également être retirée de votre sitemap XML.
Votre sitemap ne doit contenir que les pages que vous souhaitez voir indexées. Cela signifie que vous devez laisser de côté toutes les autres pages comme les pages redirigées (code 301), les pages introuvables (code 404) ou encore les pages avec une URL canonique.
Il faut aussi s’assurer du bon format des URL contenues dans le sitemap. Elles doivent être des URL absolues décrivant le chemin complet de la page avec le protocole web utilisé.
(Ex : https://www.araoo.fr)
Dans la mesure du possible, conservez l'emplacement et le nom de fichier par défaut pour votre sitemap (/sitemap.XML) et votre index sitemap (/sitemap_index.XML). Cela permet aux moteurs de recherche de les trouver plus facilement.
Votre sitemap ne servira à rien si les moteurs de recherche ne peuvent pas le trouver et l’ouvrir. C’est pour cela qu’il est indispensable d’ajouter l’URL du sitemap dans le fichier robots.txt pour assurer sa prise en compte par les robots des moteurs.
La création et l’envoi du sitemap ne doit pas vous prendre plus de quelques minutes, mais son impact est durable sur votre référencement naturel. Ne négligez donc pas cet élément, notamment après avoir fait de gros changements sur votre site comme dans le cas d’une migration.