Qu’est-ce qu’un sitemap ?
Un sitemap est un fichier qui répertorie les différentes pages d’un site web afin d’aider les moteurs de recherche à explorer et à indexer son contenu. En tant qu’agence SEO nous pouvons vous assurer que le sitemap est un outil indispensable encore trop souvent oublié. Il est obligatoire pour optimiser le référencement naturel, particulièrement pour les sites complexes ou riches en contenu.
Sitemap XML
Le sitemap XML est destiné aux moteurs de recherche. Ce format standardisé décrit les URL importantes du site et inclut des métadonnées comme la date de mise à jour, la fréquence des modifications ou la priorité des pages.
Sitemap HTML
Contrairement au format XML, le sitemap HTML est conçu pour les utilisateurs.
Ce site map est souvent visible en pied de page.
Il offre une vue d’ensemble des pages du site et facilite la navigation, particulièrement sur les sites volumineux.
Pourquoi créer un sitemap ?
Le sitemap est un élément STRA-TE-GIQUE en SEO, il fait partie des bases techniques d’un site qui sont primordiales avant même de penser à la création de contenu SEO ou au netlinking.
Assurer une indexation complète de votre site
Les moteurs de recherche ne sont pas infaillibles. Sur les sites volumineux, complexes ou régulièrement mis à jour, il est fréquent que certaines pages importantes ne soient pas explorées ou indexées. Un sitemap agit comme une feuille de route, garantissant que toutes vos pages essentielles (produits, articles, catégories) sont signalées aux moteurs de recherche.
Exemple concret : Imaginez un site e-commerce avec des milliers de produits. Sans sitemap, les pages récemment ajoutées pourraient être ignorées, elles pourraient mettre des mois avant d’être explorées puis indexées.
Optimiser le crawl budget
Le « budget de crawl » correspond à un “budget temps” que s’accorde Google pour visiter et analyser un site. Sans un sitemap structuré, les robots peuvent gaspiller ce budget en visitant des pages inutiles (erreurs 404, pages dupliquées, contenu non indexable) plutôt que de se concentrer sur celles qui apportent de la valeur.
En clair : Un sitemap permet de guider les robots directement vers les pages stratégiques, maximisant ainsi le retour sur investissement de votre SEO.
Améliorer la visibilité des pages complexes ou isolées
Certaines pages, comme celles situées en profondeur dans l’architecture du site ou mal liées au maillage interne, peuvent rester inaccessibles aux moteurs de recherche. Le sitemap offre une visibilité directe à ces pages en les listant. Cela leur donne de meilleures chances d’être explorées et indexées.
Illustration : Pour un blog avec de nombreux articles anciens mais toujours pertinents, le sitemap garantit que les articles restent visibles et ne tombent pas dans l’oubli numérique.
Informer les moteurs de recherche des changements et mises à jour
Un sitemap XML inclut des métadonnées précieuses (date de dernière modification, fréquence de mise à jour) qui aident les moteurs à prioriser le contenu récent ou actualisé. Cela accélère leur prise en compte dans les SERP (pages de résultats).
Cas pratique : Si vous modifiez un article pour inclure une nouvelle tendance ou un mot-clé pertinent, le sitemap aide Google à détecter rapidement cette mise à jour et à réévaluer la pertinence de votre contenu.
Où doit se situer le sitemap ?
- À l’échelle du site : Le fichier sitemap doit être placé à la racine du domaine, accessible via www.monsite.com/sitemap.xml.
- Dans le fichier robots.txt : Mentionner l’emplacement du sitemap dans le fichier robots.txt facilite sa découverte par les moteurs de recherche.
- Dans la Google Search Console : La soumission manuelle du sitemap via cet outil permet de vérifier son statut et de détecter d’éventuelles erreurs.
Comment paramétrer le plan du site dans Google Search Console
- Connectez-vous à la Google Search Console.
- Allez dans la section Sitemaps.
- Ajoutez l’URL de votre sitemap (sitemap.xml).
- Validez et suivez l’état d’exploration via l’interface.
Que contient le sitemap ?
Un sitemap bien conçu inclut :
- Les URL principales du site (pages, articles, catégories).
- Les images et vidéos si elles jouent un rôle stratégique.
- Les métadonnées sur la fréquence de mise à jour et les priorités.
Comment le créer ?
Génération automatique
Cette méthode est idéale pour les utilisateurs de CMS (Content Management System) comme WordPress, Shopify, ou Joomla, ou ceux qui préfèrent les solutions faciles à configurer.
- Via des plugins pour CMS : Si vous utilisez WordPress, des extensions comme Yoast SEO, SEOPress, ou Rank Math peuvent créer automatiquement un sitemap pour votre site. Une fois installés et activés, ces outils génèrent un fichier sitemap à jour, accessible à une URL prédéfinie, par exemple www.monsite.com/sitemap.xml. Vous n’avez qu’à vérifier que toutes les pages importantes sont incluses.
- Outils en ligne : Des générateurs comme XML-Sitemaps.com ou Screaming Frog permettent de créer un sitemap en entrant simplement l’URL de votre site. Ces outils parcourent vos pages et produisent un fichier XML téléchargeable que vous pourrez ensuite uploader à la racine de votre site. Veillez à maintenir le fichier à jour très régulièrement
Manuellement en XML
Si votre site est petit ou si vous préférez avoir un contrôle total, vous pouvez créer un sitemap manuellement. Cette méthode implique de rédiger un fichier XML en suivant une structure spécifique.
Étapes :
- Ouvrez un éditeur de texte comme Notepad ou Visual Studio Code.
- Rédigez le code suivant en remplaçant les valeurs par vos propres URLs :
3. Sauvegardez ce fichier sous le nom sitemap.xml.
4. Téléversez-le à la racine de votre site (www.monsite.com/sitemap.xml) via un logiciel FTP comme FileZilla.
Cette méthode permet un contrôle précis des métadonnées (fréquence de mise à jour, priorités, etc.) mais elle est très chronophage et tout simplement impossible pour les sites de moyenne ou grande taille.
Par développement
Pour les sites complexes ou personnalisés, comme les plateformes e-commerce ou les sites multilingues, une approche sur mesure est souvent nécessaire.
Principe : Un développeur programme un script ou une fonction au sein du site pour générer automatiquement le sitemap. Ce script parcourt la base de données du site pour extraire les URLs, les métadonnées (date de mise à jour, priorité, etc.), et génère un fichier XML mis à jour dynamiquement.
Exemple d’application :
- Pour un site e-commerce avec des milliers de produits, le script peut inclure automatiquement chaque nouvelle fiche produit dès qu’elle est ajoutée au site.
- Les pages expirées ou supprimées sont exclues du sitemap en temps réel.
Les erreurs à éviter dans votre sitemap
- Ne pas respecter les contraintes techniques : un seul fichier XML de 50MB max ou 50 000 URLs.
- Oublier de mettre à jour le sitemap après des modifications.
- Référencer des URLs non indexables (404, noindex).
- Duplication des URLs dans le fichier.
- Changer l’emplacement ou le nom du fichier sans mise à jour dans le robots.txt.
- Ne pas indiquer l’URL du sitemap dans le fichier robots.txt.
Quels risques à ne pas avoir de sitemap ?
- Pages non indexées ou partiellement explorées par les moteurs de recherche.
- Perte d’opportunités de trafic organique.
- Mauvaise utilisation du crawl budget.