G

Maîtriser Google Sheets : Utiliser les Regex et le XPath pour le SEO

Résumé de l'article :
SEO

Cet article détaillé expose l'utilisation avancée de Google Sheets pour le SEO, en mettant l'accent sur deux outils particulièrement puissants: les regex et le xpath. Contrairement à Excel, Google Sheets propose des fonctions uniques et pratiques pour traiter et collecter des données. Après une introduction sur les fonctionnalités de base et les modules complémentaires, l’article plonge dans les fonctions spécifiques comme REGEXMATCH, REGEXEXTRACT et REGEXREPLACE, qui permettent de manipuler des expressions régulières pour diverses tâches SEO. Le texte explore également les fonctions d'importation de données telles qu’IMPORTXML, qui nécessite une compréhension du xpath pour extraire des informations d'une page web. Des exemples concrets illustrent comment utiliser ces outils pour extraire des liens follow ou des identifiants de produits, rendant l'automatisation des tâches SEO plus accessible. Enfin, l’article aborde rapidement d'autres fonctions import, comme IMPORTHTML et IMPORTRANGE, tout en soulignant les pratiques et astuces pour optimiser l'usage de Google Sheets. Pour un aperçu complet des potentialités offertes par ces outils, l'article propose des cas pratiques et des liens vers des ressources complémentaires. Parfait pour les professionnels du SEO cherchant à tirer le meilleur parti de Google Sheets.

Tout LIRE 👇

Après une longue introduction aux fonctions et modules utiles sur Google Sheets pour le SEO, examinons des fonctions un peu plus avancées qui nécessitent une certaine connaissance des expressions régulières (regex) et du xpath. Un avantage particulier de Google Sheets par rapport à Excel réside dans ces fonctionnalités uniques et pratiques.

Les regex : Utilisation avancée sur Google Sheets

Si vous n'êtes pas familier avec les regex, commencez par comprendre leur fonctionnement à travers divers guides disponibles en ligne. Pour ce faire, Google Sheets propose trois fonctions principales :

  • REGEXMATCH(texte; expression): Cette fonction examine si un texte correspond à une expression régulière donnée. Elle retourne VRAI ou FAUX.
  • REGEXEXTRACT(texte; expression): Celle-ci vous permet d'extraire une portion spécifique de texte en fonction de l'expression régulière.
  • REGEXREPLACE(texte; expression; remplacement): Fonction utilisée pour remplacer une portion de texte correspondant à une expression régulière par une autre valeur.

Applications Pratiques des Regex

La fonction REGEXREPLACE est particulièrement utile en SEO, comme pour tester des réécritures d’URL et s'assurer que toutes les possibilités sont couvertes. Par exemple, pour changer "nom prénom" en "prénom nom", cette formule peut être employée :

=REGEXREPLACE(A2; "([A-Z- ]+[A-Z- ]*) ([A-Z][a-z- ]+[A-Z]?[a-z-]*)"; "$2 $1")

Cette manipulation est très pratique pour transformer des données structurées.

Extraction ciblée avec REGEXEXTRACT

REGEXEXTRACT permet de cibler des parties spécifiques dans un texte. Prenons un exemple simple : extraire le prénom d'une liste de noms. Utilisez cette formule :

=REGEXEXTRACT(A2; "[A-Z- ]+[A-Z- ]* ([A-Z][a-z- ]+[A-Z]?[a-z-]*)")

Pour extraire des identifiants produits à partir d'URL, cette fonction est également d'une grande aide.

Scraping avec les Fonctions Import (importhtml, importxml, importfeed, etc.)

Google Sheets inclut plusieurs fonctions pour importer des données depuis des sources externes.

Utilisation d'Importxml

IMPORTXML est une des fonctions les plus polyvalentes pour le scraping sur Google Sheets. Pour bien l'utiliser, il est nécessaire de comprendre le xpath. Voici comment procéder :

Une requête xpath se lit de droite à gauche, chaque slash (/) représente un nœud ou une étape dans le document HTML. Par exemple, pour extraire tous les liens follow d'une page web, utilisez :

//a[not(contains(@rel, 'nofollow'))]/@href

Construction de Requêtes xpath

Décomposer les éléments est primordial. Pour les liens follow :

  • Les liens se trouvent dans les balises a sans attribut rel contenant nofollow.
  • Syntaxe complète : //a[not(contains(@rel, 'nofollow'))]/@href

Utilisez cette syntaxe dans IMPORTXML :

=IMPORTXML(URL, "//a[not(contains(@rel, 'nofollow'))]/@href")

Autres Fonctions Import

  • IMPORTHTML(url; requête; index) : Pour extraire des tableaux ou des listes à partir d'une page web.
  • IMPORTRANGE : Pour importer des données d'un autre Google Sheet. Exemple :
  =IMPORTRANGE("https://docs.google.com/spreadsheets/d/abcd123abcd123"; "Feuille1!A1:C10")
  • IMPORTDATA et IMPORTFEED : Pour importer des fichiers CSV ou des flux RSS. Syntaxes respectivement :
  =IMPORTDATA("url")
  =IMPORTFEED("url")

Importation de JSON

Malheureusement, l'importation de JSON n'est pas native dans Google Sheets. Pour ce faire, vous devez soit utiliser un module complémentaire, soit créer une fonction personnalisée via Apps Scripts.

Pour explorer davantage ces outils, consultez les ressources complémentaires et guides disponibles en ligne. Ces fonctions avancées rendent Google Sheets particulièrement puissant pour le SEO, en facilitant l'automatisation et la manipulation des données de manière efficace et efficiente.

D'autres articles qui devraient vous plaire

SEO

Améliorations massives de la qualité de recherche de Google avec la mise à jour de mars 2024 et de nouvelles politiques anti-spam

Google a lancé une mise à jour majeure de la qualité des recherches en mars 2024, accompagnée de multiples mises à jour anti-spam. La mise à jour de contenu utile, désormais intégrée au système de base, a permis de réduire de 40% les contenus non pertinents dans les recherches. Cette mise à jour est la plus complexe à ce jour, avec des ajustements importants de plusieurs systèmes fondamentaux, entraînant des fluctuations substantielles dans les classements. De nouvelles politiques anti-spam, y compris contre les abus de domaines expirés et le "Parasite SEO", sont également en vigueur, ciblant les contenus de faible valeur créés à grande échelle pour manipuler les classements. Pour en savoir plus sur les détails de cette mise à jour révolutionnaire et ses impacts potentiels, continuez la lecture de l'article complet.
👉 Lire l'article
SEO

SEO : Impact de l'algorithme Google sur les critiques de produits et les guides d'achat

En avril 2021, Google a introduit un nouvel élément dans son algorithme visant spécifiquement les pages d'avis sur les produits et les guides d'achat. L'objectif est d'évaluer la qualité et la pertinence des contenus pour améliorer les résultats de recherche. Cet article, bien que daté, reste une ressource riche en informations sur la Product Reviews Update, illustrant notamment les attentes de Google concernant la rédaction d'avis de produits. Des conseils pratiques sont également fournis pour optimiser ces avis, en insistant sur l'expertise, la précision et la transparence des informations. De plus, il est suggéré que cet algorithme pourrait impacter des contenus similaires, même non définis comme des avis produits. Pour les sites générant des revenus via des liens affiliés, des recommandations spécifiques sont données pour maintenir la crédibilité et éviter les pénalités. Préparez-vous dès maintenant pour d'éventuelles mises à jour futures ! Vous voulez en savoir plus ? Découvrez tous les détails dans l'article complet.
👉 Lire l'article
SEO

Mises à jour des scores Google PageSpeed avec Lighthouse 8.0 : Changements et impacts

Google a récemment annoncé la sortie de Lighthouse 8.0, une mise à jour qui mélange des critères d'évaluation plus stricts et d'autres plus indulgents, permettant à la majorité des sites de bénéficier de meilleures notes de performance. Parmi les principaux changements, on note une réévaluation du poids des différentes métriques de vitesse, rendant certaines plus rigoureuses comme le Total Blocking Time (TBT) et le First Contentful Paint (FCP), tandis que le Cumulative Layout Shift (CLS) devient moins strict. Lighthouse, outil incontournable pour les éditeurs, développeurs et experts SEO, alimente également l'outil PageSpeed Insights et est intégré directement dans Chrome. La version 8.0 sera déployée dans Chrome 93, mais est déjà disponible sur PageSpeed Insights. Les changements apportés à Lighthouse 8.0 signifient que 60% des sites verront un score amélioré, tandis qu'environ 20% pourraient observer une baisse jusqu'à cinq points. Les modifications de l'API et les ajustements aux principales métriques visent à offrir une évaluation plus précise et utile de la performance des pages. Avec cette mise à jour, Google continue de peaufiner ses outils pour fournir des résultats pertinents et optimiser l'expérience utilisateur. Pour découvrir ces nouvelles évaluations et comprendre en détail les ajustements effectués, consultez l'article complet.
👉 Lire l'article

plus de 73% de nos clients nous ont choisi par recommandation.

Nous avons accompagné
+300 entreprises.
En moyenne, 1 client nous
recommande à 2  entreprises.

Nos Growth News

3  articles & 1 outil
growth MARKETING
chaque semaine.

Le must have pour ceux qui souhaitent rester à
la page et des growth surprises en plus !

Merci,
vous allez recevoir un e-mail de confirmation.
Oops! Something went wrong while submitting the form.