Audit d'indexation et de crawl Shopify

Découvrez comment optimiser le crawl et l'indexation de votre boutique Shopify : budget de crawl, pages à facettes, canonicals et sitemap pour un SEO e-commerce performant.

Sur cette page
  1. Définition courte
  2. Résumé opérationnel
  3. Comprendre le budget de crawl sur Shopify
  4. Gérer les pages à facettes pour un crawl efficace
  5. Configurer les balises canoniques pour prévenir le contenu dupliqué
  6. Optimiser le sitemap XML Shopify
  7. Analyser les logs de crawl et les rapports Google Search Console
  8. déjouer les pièges courants des paramètres d'URL Shopify
  9. Structurer les collections pour un crawl optimal
  10. Utiliser les applications SEO pour automatiser l'audit
  11. Mesurer l'impact de l'audit sur le trafic organique
  12. Plan d'action en 30 jours pour maîtriser l'indexation et le crawl Shopify
  13. Checklist
  14. Questions fréquentes
Comparatif des applications SEO Shopify pour l'audit d'indexation
ApplicationFonctionnalités clésPrix indicatifPoints de vigilance
SEO ManagerGestion des balises canoniques, robots.txt, sitemap, pages à facettesÀ vérifier sur la page officiellePeut ajouter des scripts lourds si mal configuré
Plug in SEOAnalyse automatique des erreurs SEO, correction des facettes et variantesÀ vérifier sur la page officielleVersion gratuite limitée, nécessite un abonnement pour les fonctionnalités avancées
Smart SEOGénération de balises canoniques dynamiques, optimisation du sitemapÀ vérifier sur la page officielleInterface moins intuitive pour les débutants
SEO OptimizerGestion des paramètres d'URL, pagination, facettesÀ vérifier sur la page officielleMise à jour régulière nécessaire pour rester compatible avec Shopify
Budget de crawl : exemple de répartition avant et après audit
Type de pageNombre d'URLs avant auditNombre d'URLs après auditImpact sur le crawl
Pages de collection principales5050Crawl priorisé (inchangé)
Pages de facettes (filtres, tris)50000Budget libéré pour les pages produits
Pages de variantes de produits30000Évite la duplication
Pages de pagination20020Seule la première page est indexée
Pages de blog10020Seules les pages stratégiques restent
Pages statiques (CGV, contact)1010Inchangé
Total8360100Réduction de 98% du budget de crawl gaspillé
Comparatif des stratégies de gestion des pages à facettes
StratégieAvantagesInconvénientsRecommandation
Blocage dans robots.txtSimple à mettre en œuvre, libère tout le budget de crawlEmpêche Google d'explorer même les facettes utilesÀ utiliser pour les facettes non stratégiques
Balise noindex, followPermet le crawl des liens sans indexation, conserve le jus de lienNécessite une modification du thème ou une applicationIdéal pour les facettes avec liens internes
Canonical vers la collection principaleÉvite la duplication tout en laissant Google explorerPeut être ignoré si mal configuréComplémentaire au noindex
Limitation du nombre de facettesRéduit le nombre d'URLs à la sourcePeut limiter l'expérience utilisateur si trop restrictifÀ combiner avec une navigation par catégories

Diagnostic e-commerce

Envie de savoir quoi améliorer en priorité ?

Partagez votre boutique : on repère les leviers SEO, UX et conversion à fort impact, et on vous donne l'ordre dans lequel les activer.

Définition courte

En bref

L'audit d'indexation et de crawl Shopify consiste à analyser et optimiser la façon dont les moteurs de recherche explorent et indexent les pages d'une boutique en ligne, en maîtrisant le budget de crawl, en gérant les pages à facettes, en configurant les balises canoniques et en structurant le sitemap.

Résumé opérationnel

L'essentiel

Pour maîtriser votre budget de crawl Shopify, commencez par auditer votre fichier robots.txt et votre sitemap XML. Bloquez les pages à facettes inutiles via robots.txt ou en les rendant non indexables. Utilisez les balises canoniques pour prévenir le contenu dupliqué sur les variantes de produits et les filtres. Priorisez les pages à fort potentiel commercial dans le sitemap et surveillez les logs de crawl via des outils comme Google Search Console ou des solutions tierces. Enfin, réduisez le nombre d'URLs indexables en limitant les paramètres d'URL et en consolidant les pages similaires.

Sur le terrain

Cas fréquent observé : les boutiques Shopify génèrent des milliers d'URLs de facettes (par couleur, taille, prix) qui consomment le budget de crawl sans valeur ajoutée. Dans les faits, les propriétaires de boutique négligent souvent la configuration des balises canoniques sur les pages produits avec variantes, ce qui entraîne une duplication massive. En accompagnement, la difficulté réelle réside dans l'équilibre entre une navigation riche pour l'utilisateur et une architecture crawlable pour Google, surtout quand le catalogue dépasse 500 produits.

Comprendre le budget de crawl sur Shopify

Le budget de crawl représente le nombre de pages que Google explore sur votre site lors de chaque passage. Sur Shopify, ce budget est limité et doit être utilisé efficacement pour indexer les pages à fort potentiel commercial. Les pages à facettes, les filtres, les variantes de produits et les pages de collection génèrent souvent des centaines d'URLs inutiles.

Pour maîtriser ce budget, identifiez d'abord les pages qui consomment le plus de crawl via Google Search Console (rapport 'Pages indexées' et 'Statistiques de crawl'). Les pages à facettes (ex : /collections/robes?couleur=rouge&taille=M) sont les principales responsables. Bloquez-les dans robots.txt ou utilisez la balise 'noindex' pour éviter qu'elles ne soient explorées.

Un audit régulier (mensuel) du budget de crawl permet de détecter les nouvelles pages à facettes créées par des applications tierces (filtres, upsell).

Gérer les pages à facettes pour un crawl efficace

Les pages à facettes sont générées dynamiquement par Shopify lorsqu'un utilisateur applique des filtres (couleur, taille, prix). Chaque combinaison de filtres crée une nouvelle URL, ce qui peut rapidement saturer le budget de crawl. Par exemple, une collection de 50 produits avec 4 filtres peut générer plusieurs centaines d'URLs.

Pour les maîtriser, adoptez une stratégie en trois étapes :

Exemple concret : une boutique de vêtements avec 200 produits et 5 filtres (couleur, taille, matière, prix, marque) passe de 10 000 URLs potentielles à 200 URLs utiles après blocage des facettes. Résultat : Google explore 10 fois plus vite les pages produits.

Configurer les balises canoniques pour prévenir le contenu dupliqué

Les balises canoniques indiquent à Google quelle version d'une page est l'originale. Sur Shopify, le contenu dupliqué est fréquent à cause des variantes de produits (ex : /products/chemise-blanche?variant=123 et /products/chemise-blanche?variant=456). Chaque variante a sa propre URL mais le contenu est identique.

Pour configurer correctement les canoniques :

Astuce technique : dans le fichier theme.liquid de Shopify, vous pouvez dynamiquement définir la balise canonique en fonction de l'URL. Par exemple, pour les pages produits : '<link rel="canonical" href="{{ canonical_url }}" />' mais assurez-vous que 'canonical_url' ne contient pas de paramètres. Utilisez un filtre Liquid pour extraire l'URL de base.

Optimiser le sitemap XML Shopify

Le sitemap XML aide Google à découvrir toutes les pages importantes de votre boutique. Shopify génère automatiquement un sitemap à l'adresse /sitemap.xml, mais il inclut par défaut toutes les pages : collections, produits, blogs, pages statiques. Cela peut inclure des pages à faible valeur ajoutée.

Pour optimiser le sitemap :

Exemple de structure idéale : un sitemap qui contient 50 pages de collection principales, 200 produits phares, et 10 pages de blog stratégiques, au lieu de 5000 URLs inutiles. Cela réduit le temps de crawl de 70%.

Analyser les logs de crawl et les rapports Google Search Console

Google Search Console fournit des données précieuses sur la façon dont Google explore votre site. Le rapport 'Statistiques de crawl' montre le nombre de pages explorées par jour, le temps de téléchargement, et les erreurs rencontrées. Le rapport 'Pages indexées' liste les URLs indexées et les problèmes d'indexation.

Pour un audit complet :

Utilisez des outils comme 'Screaming Frog' ou 'Sitebulb' pour crawler votre site comme le ferait Google. Comparez les résultats avec les données de Search Console pour détecter les écarts. Par exemple, si Google explore 1000 pages par jour mais que votre sitemap n'en contient que 200, cela indique un gaspillage de budget.

déjouer les pièges courants des paramètres d'URL Shopify

Shopify ajoute automatiquement des paramètres d'URL pour les variantes, les filtres, les tris et les pages de pagination. Ces paramètres créent des URLs multiples pour le même contenu, ce qui dilue le PageRank et gaspille le budget de crawl.

Les paramètres les plus courants :

Exemple concret : une collection avec 10 pages de pagination et 5 options de tri génère 50 URLs. En bloquant les tris et en utilisant la pagination canonique, vous réduisez à 10 URLs. Pour aller plus loin, utilisez l'application 'SEO Optimizer' qui gère automatiquement ces paramètres.

Structurer les collections pour un crawl optimal

Les collections Shopify sont les pages les plus importantes pour le SEO, car elles regroupent les produits par catégorie. Une mauvaise structure peut noyer Google dans des centaines de collections similaires.

Pour optimiser :

Exemple : une boutique de décoration avec 50 collections manuelles bien décrites sera mieux indexée qu'une boutique avec 200 collections automatiques sans contenu. Google considère chaque collection comme une page d'atterrissage potentielle.

Utiliser les applications SEO pour automatiser l'audit

Plusieurs applications Shopify facilitent l'audit d'indexation et de crawl. Elles permettent de gérer les balises canoniques, les robots.txt, les sitemaps et les pages à facettes sans compétences techniques avancées.

Applications recommandées :

Attention : certaines applications ajoutent des scripts supplémentaires qui peuvent ralentir le site. Testez toujours l'impact sur la vitesse après installation. Un audit manuel reste nécessaire pour vérifier que les applications ne créent pas de nouvelles URLs indésirables.

Mesurer l'impact de l'audit sur le trafic organique

Après avoir optimisé le crawl et l'indexation, mesurez les résultats pour valider les améliorations. Les indicateurs clés :

Exemple : une boutique de vêtements a réduit ses pages indexées de 15 000 à 800 après audit. Le trafic organique a augmenté de 35% en 3 mois, car Google a mieux exploré les pages produits. Utilisez Google Analytics pour suivre l'évolution des sessions organiques par page.

Plan d'action en 30 jours pour maîtriser l'indexation et le crawl Shopify

Semaine 1 — Diagnostic et analyse
  • Auditer le fichier robots.txt actuel et le sitemap XML via Google Search Console
  • Identifier les URLs de facettes, variantes et paramètres via un crawl avec Screaming Frog
  • Analyser les statistiques de crawl et les pages indexées dans Google Search Console
  • Lister les pages à forte valeur ajoutée (collections principales, produits best-sellers)
Semaine 2 — Configuration des balises et blocages
  • Bloquer les URLs de facettes inutiles dans robots.txt (Disallow : /collections/*?*)
  • Ajouter des balises canoniques sur les pages produits pour les variantes
  • Configurer les balises 'noindex, follow' sur les pages de facettes stratégiques
  • Optimiser le sitemap XML en excluant les pages non essentielles (via application ou API)
Semaine 3 — Structuration et contenu
  • Réduire le nombre de collections automatiques et créer des collections manuelles avec contenu unique
  • Ajouter des descriptions textuelles de 200 à 500 mots sur chaque collection principale
  • Vérifier que chaque page de collection a une balise title et meta description unique
  • Limiter les options de filtrage à 3-4 facettes maximum par collection
Semaine 4 — Suivi et ajustements
  • Soumettre le nouveau sitemap dans Google Search Console et surveiller les erreurs
  • Analyser l'évolution du nombre de pages indexées et du taux de crawl après 2 semaines
  • Corriger les erreurs 404 et 301 identifiées dans Search Console
  • Planifier un audit mensuel pour maintenir l'optimisation

Checklist

Questions fréquentes

Qu'est-ce que le budget de crawl et pourquoi est-il important sur Shopify ?

Le budget de crawl est le nombre de pages que Google explore sur votre site lors de chaque passage. Sur Shopify, il est limité, surtout pour les gros catalogues. Si vous ne le maîtrisez pas, Google peut explorer des milliers de pages inutiles (facettes, variantes) au lieu de vos pages produits et collections, ce qui réduit votre visibilité organique.

Comment bloquer les pages à facettes sur Shopify sans perdre le trafic des filtres ?

Utilisez la balise 'noindex, follow' sur les pages de facettes. Cela permet à Google de suivre les liens (pour le jus de lien) mais sans indexer la page. Vous pouvez aussi les bloquer dans robots.txt si vous n'avez pas besoin du jus de lien. L'idéal est de combiner les deux : noindex pour les facettes stratégiques, robots.txt pour les autres.

Les balises canoniques sont-elles automatiques sur Shopify ?

Shopify ajoute une balise canonique par défaut sur les pages produits, mais elle peut pointer vers l'URL avec le paramètre '?variant=' si mal configurée. Il est recommandé de personnaliser le thème pour que la balise canonique pointe toujours vers l'URL sans paramètre. Utilisez un filtre Liquid pour extraire l'URL de base.

Mon sitemap Shopify est-il automatiquement mis à jour ?

Oui, Shopify génère et met à jour automatiquement le sitemap à chaque ajout ou modification de page. Cependant, il inclut par défaut toutes les pages, y compris celles à faible valeur. Vous devez donc optimiser manuellement en excluant les pages inutiles via une application SEO ou en modifiant le fichier de sitemap via l'API.

Combien de pages dois-je avoir dans mon sitemap Shopify pour un bon SEO ?

Idéalement, votre sitemap doit contenir uniquement les pages que vous voulez voir indexées : collections principales, produits phares, pages de blog stratégiques. Pour une boutique de taille moyenne (500 produits), visez 100 à 200 URLs dans le sitemap. Évitez d'inclure les pages de facettes, les variantes, et les pages de pagination.

Quels sont les signes que mon budget de crawl est gaspillé ?

Les signes incluent : un nombre élevé de pages indexées par rapport à votre nombre réel de pages utiles, des pages de facettes ou de variantes apparaissant dans les résultats de recherche, un taux de crawl faible pour vos pages principales dans Google Search Console, et une baisse de trafic organique malgré un contenu de qualité.

Faut-il utiliser une application SEO pour gérer l'indexation sur Shopify ?

Oui, surtout si vous n'avez pas de compétences techniques. Les applications comme SEO Manager ou Plug in SEO automatisent la gestion des balises canoniques, du robots.txt et du sitemap. Cependant, vérifiez toujours leur impact sur la vitesse du site et complétez avec un audit manuel régulier pour détecter les nouvelles URLs indésirables.

Diagnostic e-commerce

Envie de savoir quoi améliorer en priorité ?

Partagez votre boutique : on repère les leviers SEO, UX et conversion à fort impact, et on vous donne l'ordre dans lequel les activer.

Sources : Google Search Central · Google — Core Web Vitals · Shopify — performance.

À lire aussi