Qu’est-ce que c’est et comment l’utiliser

Ophélia Pol Blog
02/04/2022 - Mis à jour le 02/04/2022 6:21 PM

Diagnostiquer les problèmes techniques sur votre site Web peut être l’un des aspects les plus ...

Diagnostiquer les problèmes techniques sur votre site Web peut être l’un des aspects les plus longs mais les plus importants de la gestion d’un site Web.

Pour aggraver les choses, Google vous permet uniquement d’inspecter une URL à la fois pour diagnostiquer les problèmes potentiels sur votre site Web (cela se fait dans Google Search Console).

Heureusement, il existe désormais un moyen plus rapide de tester votre site Web : entrez dans l’API d’inspection d’URL de la console de recherche Google…

Qu’est-ce que l’API d’inspection d’URL de Google Search Console ?

le Google API d’inspection d’URL de la console de recherche est un moyen de vérifier en bloc les données que Google Search Console a sur les URL. Son but est d’aider les développeurs et les référenceurs à déboguer et optimiser plus efficacement leurs pages en utilisant les propres données de Google.

Voici un exemple où j’utilise l’API pour vérifier si quelques URL sont indexées et soumises dans mon sitemap :

Sous forme de tableau, l'API indiquant que les URL de Chris sont indexées mais non soumises dans le plan du site

Quel type de données pouvez-vous obtenir de l’API d’inspection d’URL de Google Search Console ?

L’API d’inspection d’URL de Google Search Console vous permet d’extraire un large éventail de données. Vous trouverez ci-dessous une liste de certaines des fonctionnalités les plus discutées :

lastCrawlTime

Avec ce champ, vous pouvez savoir exactement quand Googlebot a exploré votre site Web pour la dernière fois. Ceci est extrêmement utile pour les référenceurs et les développeurs pour mesurer la fréquence d’exploration de leurs sites par Google. Auparavant, vous ne pouviez accéder à ce type de données que via l’analyse des fichiers journaux ou la vérification ponctuelle d’URL individuelles avec Google Search Console.

robotsTxtState

Avec ce champ, vous pouvez comprendre si vous avez des règles robots.txt qui bloqueront Googlebot. C’est quelque chose que vous pouvez vérifier manuellement, mais pouvoir le tester à grande échelle avec les propres données de Google est un pas en avant fantastique.

googleCanonical et userCanonical

Dans certaines situations, Google est connu pour sélectionner un canonique différent de celui qui a été spécifié dans le code. Dans cette situation, avoir la possibilité de comparer les deux (côte à côte et à l’échelle) à l’aide de l’API est utile pour vous permettre d’apporter les modifications appropriées.

crawledAs

Ce champ vous permet de comprendre quel user agent est utilisé pour un crawl de votre site : Mobile/Desktop. Les codes de réponse sont ci-dessous pour référence :

  • BUREAU – Agent utilisateur de bureau
  • MOBILE – Agent utilisateur mobile

pageFetchState

Comprendre le pageFetchState peut vous aider à diagnostiquer les erreurs de serveur, les 4xx introuvables, les soft 404, les erreurs de redirection, les pages bloquées par robots.txt et les URL non valides. Une liste de réponses est ci-dessous pour référence.

Champ Ce que cela veut dire
PAGE_FETCH_STATE_UNSPECIFIED État de récupération inconnu
RÉUSSI Récupération réussie
SOFT_404 Doux 404
BLOCKED_ROBOTS_TXT Bloqué par robots.txt
PAS TROUVÉ Non trouvé (404)
ACCÈS REFUSÉ Bloqué en raison d’une demande non autorisée (401)
ERREUR DU SERVEUR Erreur de serveur (5xx)
REDIRECT_ERROR Erreur de redirection
ACCÈS INTERDIT Bloqué car accès interdit (403)
BLOQUÉ_4XX Bloqué en raison d’un autre problème 4xx (pas 403, 404)
INTERNAL_CRAWL_ERROR Erreur interne
URL INVALIDE URL invalide

indexingState

L’état d’indexation vous indique l’état actuel de l’indexation des URL. Outre les réponses Pass et Fail plus évidentes, il existe d’autres réponses :

  • NEUTRE équivaut au message “Exclu” dans la Search Console.
  • PARTIEL équivaut au message “Valide avec avertissements” dans la Search Console.
  • VERDICT_UNSPECIFIED signifie que Google n’est pas en mesure de se prononcer sur la ou les URL en question.

couvertureÉtat

Cela vous indique si une URL a été soumise dans votre sitemap et indexée.

URL de référence

Cela vous permet de voir d’où chaque page est liée, selon Google.

Plan du site

Cela vous permet de comprendre quelles URL sont incluses dans le(s) sitemap(s).

Autres utilisations de l’API

Vous pouvez également utiliser l’API pour inspecter votre site AMP, si vous en avez un.

Comment utiliser l’API d’inspection d’URL de Google Search Console étape par étape

L’utilisation de l’API d’inspection d’URL de Google Search Console implique de faire une demande à Google. Les paramètres de requête que vous devez définir sont l’URL que vous souhaitez inspecter ainsi que l’URL de la propriété dans Google Search Console.

Le corps de la requête contient des données avec la structure suivante :

Structure des données

Si vous êtes curieux d’en savoir plus sur l’utilisation de l’API, Google a une documentation complète à ce sujet.

Vous trouverez ci-dessous un exemple du type de réponse que vous pouvez obtenir de l’API :

Réponse de code de l'API

Si vous n’êtes pas à l’aise avec le code ou si vous voulez simplement l’essayer immédiatement, vous pouvez utiliser l’outil gratuit Google Bulk Inspect URLs de valentin.app. L’outil fournit un moyen rapide d’interroger l’API sans aucune compétence en codage !

Voici comment l’utiliser. Tu peux:

  1. Accédez à https://valentin.app/inspect.html, autorisez l’accès à votre compte Google et sélectionnez la propriété Search Console que vous souhaitez tester. Collez ensuite vos URL dans le champ ci-dessous. (Les données seront traitées dans votre navigateur et ne seront pas téléchargées sur un serveur ni partagées avec qui que ce soit.)
  2. Cliquez sur le bouton “Inspecter les URL”. Les données commenceront à être extraites de l’API.
  3. Exportez les données sous forme de fichier CSV ou Excel en cliquant sur le bouton.
  4. Analysez les données et recherchez tout problème potentiel.

Comment pouvez-vous utiliser l’API d’inspection d’URL de Google Search Console dans la pratique ?

En théorie, l’API d’inspection d’URL de Google Search Console semble être un excellent moyen d’en savoir plus sur votre site Web. Cependant, vous pouvez extraire tellement de données qu’il est difficile de savoir par où commencer. Voyons donc quelques exemples de cas d’utilisation.

1. Migration du site – diagnostiquer les problèmes techniques

Les migrations de sites peuvent causer toutes sortes de problèmes. Par exemple, les développeurs peuvent accidentellement empêcher Google d’explorer votre site ou certaines pages via robots.txt.

Heureusement, l’API d’inspection d’URL de Google Search Console fait de l’audit de ces problèmes un jeu d’enfant.

Par exemple, vous pouvez vérifier si vous empêchez Googlebot d’explorer les URL en bloc en appelant robotsTxtState.

Voici un exemple d’utilisation de l’API d’inspection d’URL de Google Search Console (via valentin.app) pour appeler robotsTxtState afin de voir l’état actuel de mes URL.

Sous forme de tableau, l'API affiche l'état des URL de Chris comme "permis"

Comme vous pouvez le voir, ces pages ne sont pas bloquées par robots.txt, et il n’y a aucun problème ici.

POINTE

Les migrations de sites peuvent parfois entraîner des problèmes techniques de référencement imprévus. Après la migration, nous vous recommandons d’utiliser un outil, tel que l’audit de site d’Ahrefs, pour vérifier si votre site Web contient plus de 100 problèmes de référencement prédéfinis.

2. Comprendre si Google a respecté vos canoniques déclarées

Si vous modifiez les balises canoniques sur votre site, vous voudrez savoir si Google les respecte ou non.

Vous vous demandez peut-être pourquoi Google ignore le canonique que vous avez déclaré. Google peut le faire pour plusieurs raisons, par exemple :

  • Votre canonique déclaré n’est pas https. (Google préfère https pour les canoniques.)
  • Google a choisi une page qu’il considère comme une meilleure page canonique que votre page canonique déclarée.
  • Votre canonique déclaré est une page sans index.

Vous trouverez ci-dessous un exemple d’utilisation de l’API d’inspection d’URL de Google Search Console pour voir si Google a respecté mes canoniques déclarés :

Sous forme de tableau, l'API montrant que Google respecte les canoniques de Chris

Comme nous pouvons le voir sur la capture d’écran ci-dessus, il n’y a aucun problème avec ces pages particulières et Google respecte les canoniques.

POINTE

Pour voir rapidement si googleCanonical correspond à userCanonical, exportez les données de l’outil Google Bulk Inspect URLs vers CSV et utilisez un SI formule dans Excel. Par exemple, en supposant que vos données googleCanonical se trouvent dans la colonne A et que votre userCanonical se trouve dans la colonne B, vous pouvez utiliser la formule =IF(A2=B2, “Auto-référencement”, “Non auto-référencement”) pour vérifier les canoniques qui ne correspondent pas.

3. Sachez quand Google effectue une nouvelle exploration après avoir apporté des modifications à votre site

Lorsque vous mettez à jour de nombreuses pages de votre site Web, vous souhaitez connaître l’impact de vos efforts. Cela ne peut se produire qu’après que Google a réexploré votre site.

Avec l’API d’inspection d’URL de Google Search Console, vous pouvez voir l’heure précise à laquelle Google a exploré vos pages en utilisant lastCrawlTime.

Si vous ne parvenez pas à accéder aux fichiers journaux de votre site Web, il s’agit d’une excellente alternative pour comprendre comment Google explore votre site.

Voici un exemple de moi vérifiant ceci:

Sous forme de tableau, API montrant "dernier crawl" date et heure pour chaque URL

Comme vous pouvez le voir dans la capture d’écran ci-dessus, lastCrawlTime affiche la date et l’heure à laquelle mon site Web a été exploré. Dans cet exemple, le crawl le plus récent de Google est la page d’accueil.

Comprendre quand Google explore à nouveau votre site Web suite à des modifications vous permettra de savoir si les modifications que vous avez apportées ont ou non un impact positif ou négatif après l’exploration de Google.

FAQ

Comment contourner les limites de l’API d’inspection d’URL de Google Search Console ?

Bien que l’API d’inspection d’URL de Google Search Console soit limitée à 2 000 requêtes par jour, cette limite de requêtes est déterminée par la propriété Google.

Cela signifie que vous pouvez avoir plusieurs propriétés sur un site Web si elles sont vérifiées séparément dans Google Search Console, ce qui vous permet de contourner la limite de 2 000 requêtes par jour.

Google Search Console vous permet d’avoir 1 000 propriétés dans votre compte Google Search Console, donc cela devrait être plus que suffisant pour la plupart des utilisateurs.

Puis-je utiliser l’API d’inspection d’URL de Google Search Console sur n’importe quel site Web ?

Un autre facteur limitant potentiel est que vous ne pouvez exécuter l’API d’inspection d’URL de Google Search Console que sur une propriété que vous possédez dans Google Search Console. Si vous n’avez pas accès à la propriété, vous ne pouvez pas l’auditer à l’aide de l’API d’inspection d’URL de Google Search Console.

Cela signifie donc que l’audit d’un site auquel vous n’avez pas accès peut être problématique.

Quelle est la précision des données ?

La précision des données elles-mêmes a été un problème pour Google au cours des dernières années. Cette API vous donne accès à ces données. On peut donc dire que l’API d’inspection d’URL de Google Search Console est aussi bonne que les données qu’elle contient.

Tim Guillot partage un tweet avec John Mu sur les problèmes de données ;  Tim ajoute que les problèmes sont "non fixé"

Comme nous l’avons déjà montré dans notre étude sur l’exactitude de Google Keyword Planner, les données de Google ne sont souvent pas aussi précises que les gens le supposent.

Dernières pensées

L’API d’inspection d’URL de Google Search Console est un excellent moyen pour les propriétaires de sites d’obtenir des données en masse directement de Google à une plus grande échelle que ce qui était auparavant possible à partir de Google Search Console.

Daniel Waisberg et l’équipe à l’origine de l’API d’inspection d’URL de la console de recherche Google ont certainement fait un excellent travail pour la diffuser dans la nature.

Mais l’une des critiques de l’API d’inspection d’URL de Google Search Console de la part de la communauté SEO est que la limite de taux de requête est trop faible pour les sites plus grands. (Il est plafonné à 2 000 requêtes par jour et par propriété.)

Pour les grands sites, cela ne suffit pas. De plus, malgré les solutions de contournement possibles, ce nombre semble toujours être faible.

Quelle est votre expérience d’utilisation de l’API d’inspection d’URL de Google Search Console ? Vous avez d’autres questions ? Envoyez-moi un ping sur Twitter. 🙂



Source

Vous voulez en savoir plus sur le SEO ?

Recevez gratuitement nos actus hebdomadaires sur le référencement naturel.

Ophélia Pol

Passionnée depuis des années par le SEO et le marketing de contenu en général, je partage sur ce blog mes réflexions sur le référencement naturel et les derniers articles et actus du marketing digital.

Vous pourriez aussi aimer

-15% sur tout le site avec le code : SEP15J'en profite !