Découvrez comment optimiser le crawl et l'indexation de votre boutique Shopify : budget de crawl, pages à facettes, canonicals et sitemap pour un SEO e-commerce performant.
| Application | Fonctionnalités clés | Prix indicatif | Points de vigilance |
|---|---|---|---|
| SEO Manager | Gestion des balises canoniques, robots.txt, sitemap, pages à facettes | À vérifier sur la page officielle | Peut ajouter des scripts lourds si mal configuré |
| Plug in SEO | Analyse automatique des erreurs SEO, correction des facettes et variantes | À vérifier sur la page officielle | Version gratuite limitée, nécessite un abonnement pour les fonctionnalités avancées |
| Smart SEO | Génération de balises canoniques dynamiques, optimisation du sitemap | À vérifier sur la page officielle | Interface moins intuitive pour les débutants |
| SEO Optimizer | Gestion des paramètres d'URL, pagination, facettes | À vérifier sur la page officielle | Mise à jour régulière nécessaire pour rester compatible avec Shopify |
| Type de page | Nombre d'URLs avant audit | Nombre d'URLs après audit | Impact sur le crawl |
|---|---|---|---|
| Pages de collection principales | 50 | 50 | Crawl priorisé (inchangé) |
| Pages de facettes (filtres, tris) | 5000 | 0 | Budget libéré pour les pages produits |
| Pages de variantes de produits | 3000 | 0 | Évite la duplication |
| Pages de pagination | 200 | 20 | Seule la première page est indexée |
| Pages de blog | 100 | 20 | Seules les pages stratégiques restent |
| Pages statiques (CGV, contact) | 10 | 10 | Inchangé |
| Total | 8360 | 100 | Réduction de 98% du budget de crawl gaspillé |
| Stratégie | Avantages | Inconvénients | Recommandation |
|---|---|---|---|
| Blocage dans robots.txt | Simple à mettre en œuvre, libère tout le budget de crawl | Empêche Google d'explorer même les facettes utiles | À utiliser pour les facettes non stratégiques |
| Balise noindex, follow | Permet le crawl des liens sans indexation, conserve le jus de lien | Nécessite une modification du thème ou une application | Idéal pour les facettes avec liens internes |
| Canonical vers la collection principale | Évite la duplication tout en laissant Google explorer | Peut être ignoré si mal configuré | Complémentaire au noindex |
| Limitation du nombre de facettes | Réduit le nombre d'URLs à la source | Peut limiter l'expérience utilisateur si trop restrictif | À combiner avec une navigation par catégories |
Diagnostic e-commerce
Partagez votre boutique : on repère les leviers SEO, UX et conversion à fort impact, et on vous donne l'ordre dans lequel les activer.
L'audit d'indexation et de crawl Shopify consiste à analyser et optimiser la façon dont les moteurs de recherche explorent et indexent les pages d'une boutique en ligne, en maîtrisant le budget de crawl, en gérant les pages à facettes, en configurant les balises canoniques et en structurant le sitemap.
Pour maîtriser votre budget de crawl Shopify, commencez par auditer votre fichier robots.txt et votre sitemap XML. Bloquez les pages à facettes inutiles via robots.txt ou en les rendant non indexables. Utilisez les balises canoniques pour prévenir le contenu dupliqué sur les variantes de produits et les filtres. Priorisez les pages à fort potentiel commercial dans le sitemap et surveillez les logs de crawl via des outils comme Google Search Console ou des solutions tierces. Enfin, réduisez le nombre d'URLs indexables en limitant les paramètres d'URL et en consolidant les pages similaires.
Cas fréquent observé : les boutiques Shopify génèrent des milliers d'URLs de facettes (par couleur, taille, prix) qui consomment le budget de crawl sans valeur ajoutée. Dans les faits, les propriétaires de boutique négligent souvent la configuration des balises canoniques sur les pages produits avec variantes, ce qui entraîne une duplication massive. En accompagnement, la difficulté réelle réside dans l'équilibre entre une navigation riche pour l'utilisateur et une architecture crawlable pour Google, surtout quand le catalogue dépasse 500 produits.
Le budget de crawl représente le nombre de pages que Google explore sur votre site lors de chaque passage. Sur Shopify, ce budget est limité et doit être utilisé efficacement pour indexer les pages à fort potentiel commercial. Les pages à facettes, les filtres, les variantes de produits et les pages de collection génèrent souvent des centaines d'URLs inutiles.
Pour maîtriser ce budget, identifiez d'abord les pages qui consomment le plus de crawl via Google Search Console (rapport 'Pages indexées' et 'Statistiques de crawl'). Les pages à facettes (ex : /collections/robes?couleur=rouge&taille=M) sont les principales responsables. Bloquez-les dans robots.txt ou utilisez la balise 'noindex' pour éviter qu'elles ne soient explorées.
Un audit régulier (mensuel) du budget de crawl permet de détecter les nouvelles pages à facettes créées par des applications tierces (filtres, upsell).
Les pages à facettes sont générées dynamiquement par Shopify lorsqu'un utilisateur applique des filtres (couleur, taille, prix). Chaque combinaison de filtres crée une nouvelle URL, ce qui peut rapidement saturer le budget de crawl. Par exemple, une collection de 50 produits avec 4 filtres peut générer plusieurs centaines d'URLs.
Pour les maîtriser, adoptez une stratégie en trois étapes :
Exemple concret : une boutique de vêtements avec 200 produits et 5 filtres (couleur, taille, matière, prix, marque) passe de 10 000 URLs potentielles à 200 URLs utiles après blocage des facettes. Résultat : Google explore 10 fois plus vite les pages produits.
Les balises canoniques indiquent à Google quelle version d'une page est l'originale. Sur Shopify, le contenu dupliqué est fréquent à cause des variantes de produits (ex : /products/chemise-blanche?variant=123 et /products/chemise-blanche?variant=456). Chaque variante a sa propre URL mais le contenu est identique.
Pour configurer correctement les canoniques :
Astuce technique : dans le fichier theme.liquid de Shopify, vous pouvez dynamiquement définir la balise canonique en fonction de l'URL. Par exemple, pour les pages produits : '<link rel="canonical" href="{{ canonical_url }}" />' mais assurez-vous que 'canonical_url' ne contient pas de paramètres. Utilisez un filtre Liquid pour extraire l'URL de base.
Le sitemap XML aide Google à découvrir toutes les pages importantes de votre boutique. Shopify génère automatiquement un sitemap à l'adresse /sitemap.xml, mais il inclut par défaut toutes les pages : collections, produits, blogs, pages statiques. Cela peut inclure des pages à faible valeur ajoutée.
Pour optimiser le sitemap :
Exemple de structure idéale : un sitemap qui contient 50 pages de collection principales, 200 produits phares, et 10 pages de blog stratégiques, au lieu de 5000 URLs inutiles. Cela réduit le temps de crawl de 70%.
Google Search Console fournit des données précieuses sur la façon dont Google explore votre site. Le rapport 'Statistiques de crawl' montre le nombre de pages explorées par jour, le temps de téléchargement, et les erreurs rencontrées. Le rapport 'Pages indexées' liste les URLs indexées et les problèmes d'indexation.
Pour un audit complet :
Utilisez des outils comme 'Screaming Frog' ou 'Sitebulb' pour crawler votre site comme le ferait Google. Comparez les résultats avec les données de Search Console pour détecter les écarts. Par exemple, si Google explore 1000 pages par jour mais que votre sitemap n'en contient que 200, cela indique un gaspillage de budget.
Shopify ajoute automatiquement des paramètres d'URL pour les variantes, les filtres, les tris et les pages de pagination. Ces paramètres créent des URLs multiples pour le même contenu, ce qui dilue le PageRank et gaspille le budget de crawl.
Les paramètres les plus courants :
Exemple concret : une collection avec 10 pages de pagination et 5 options de tri génère 50 URLs. En bloquant les tris et en utilisant la pagination canonique, vous réduisez à 10 URLs. Pour aller plus loin, utilisez l'application 'SEO Optimizer' qui gère automatiquement ces paramètres.
Les collections Shopify sont les pages les plus importantes pour le SEO, car elles regroupent les produits par catégorie. Une mauvaise structure peut noyer Google dans des centaines de collections similaires.
Pour optimiser :
Exemple : une boutique de décoration avec 50 collections manuelles bien décrites sera mieux indexée qu'une boutique avec 200 collections automatiques sans contenu. Google considère chaque collection comme une page d'atterrissage potentielle.
Plusieurs applications Shopify facilitent l'audit d'indexation et de crawl. Elles permettent de gérer les balises canoniques, les robots.txt, les sitemaps et les pages à facettes sans compétences techniques avancées.
Applications recommandées :
Attention : certaines applications ajoutent des scripts supplémentaires qui peuvent ralentir le site. Testez toujours l'impact sur la vitesse après installation. Un audit manuel reste nécessaire pour vérifier que les applications ne créent pas de nouvelles URLs indésirables.
Après avoir optimisé le crawl et l'indexation, mesurez les résultats pour valider les améliorations. Les indicateurs clés :
Exemple : une boutique de vêtements a réduit ses pages indexées de 15 000 à 800 après audit. Le trafic organique a augmenté de 35% en 3 mois, car Google a mieux exploré les pages produits. Utilisez Google Analytics pour suivre l'évolution des sessions organiques par page.
Le budget de crawl est le nombre de pages que Google explore sur votre site lors de chaque passage. Sur Shopify, il est limité, surtout pour les gros catalogues. Si vous ne le maîtrisez pas, Google peut explorer des milliers de pages inutiles (facettes, variantes) au lieu de vos pages produits et collections, ce qui réduit votre visibilité organique.
Utilisez la balise 'noindex, follow' sur les pages de facettes. Cela permet à Google de suivre les liens (pour le jus de lien) mais sans indexer la page. Vous pouvez aussi les bloquer dans robots.txt si vous n'avez pas besoin du jus de lien. L'idéal est de combiner les deux : noindex pour les facettes stratégiques, robots.txt pour les autres.
Shopify ajoute une balise canonique par défaut sur les pages produits, mais elle peut pointer vers l'URL avec le paramètre '?variant=' si mal configurée. Il est recommandé de personnaliser le thème pour que la balise canonique pointe toujours vers l'URL sans paramètre. Utilisez un filtre Liquid pour extraire l'URL de base.
Oui, Shopify génère et met à jour automatiquement le sitemap à chaque ajout ou modification de page. Cependant, il inclut par défaut toutes les pages, y compris celles à faible valeur. Vous devez donc optimiser manuellement en excluant les pages inutiles via une application SEO ou en modifiant le fichier de sitemap via l'API.
Idéalement, votre sitemap doit contenir uniquement les pages que vous voulez voir indexées : collections principales, produits phares, pages de blog stratégiques. Pour une boutique de taille moyenne (500 produits), visez 100 à 200 URLs dans le sitemap. Évitez d'inclure les pages de facettes, les variantes, et les pages de pagination.
Les signes incluent : un nombre élevé de pages indexées par rapport à votre nombre réel de pages utiles, des pages de facettes ou de variantes apparaissant dans les résultats de recherche, un taux de crawl faible pour vos pages principales dans Google Search Console, et une baisse de trafic organique malgré un contenu de qualité.
Oui, surtout si vous n'avez pas de compétences techniques. Les applications comme SEO Manager ou Plug in SEO automatisent la gestion des balises canoniques, du robots.txt et du sitemap. Cependant, vérifiez toujours leur impact sur la vitesse du site et complétez avec un audit manuel régulier pour détecter les nouvelles URLs indésirables.
Diagnostic e-commerce
Partagez votre boutique : on repère les leviers SEO, UX et conversion à fort impact, et on vous donne l'ordre dans lequel les activer.
Sources : Google Search Central · Google — Core Web Vitals · Shopify — performance.