Cet article détaillé expose l'utilisation avancée de Google Sheets pour le SEO, en mettant l'accent sur deux outils particulièrement puissants: les regex et le xpath. Contrairement à Excel, Google Sheets propose des fonctions uniques et pratiques pour traiter et collecter des données. Après une introduction sur les fonctionnalités de base et les modules complémentaires, l’article plonge dans les fonctions spécifiques comme REGEXMATCH, REGEXEXTRACT et REGEXREPLACE, qui permettent de manipuler des expressions régulières pour diverses tâches SEO. Le texte explore également les fonctions d'importation de données telles qu’IMPORTXML, qui nécessite une compréhension du xpath pour extraire des informations d'une page web. Des exemples concrets illustrent comment utiliser ces outils pour extraire des liens follow ou des identifiants de produits, rendant l'automatisation des tâches SEO plus accessible. Enfin, l’article aborde rapidement d'autres fonctions import, comme IMPORTHTML et IMPORTRANGE, tout en soulignant les pratiques et astuces pour optimiser l'usage de Google Sheets. Pour un aperçu complet des potentialités offertes par ces outils, l'article propose des cas pratiques et des liens vers des ressources complémentaires. Parfait pour les professionnels du SEO cherchant à tirer le meilleur parti de Google Sheets.
Tout LIRE 👇Après une longue introduction aux fonctions et modules utiles sur Google Sheets pour le SEO, examinons des fonctions un peu plus avancées qui nécessitent une certaine connaissance des expressions régulières (regex) et du xpath. Un avantage particulier de Google Sheets par rapport à Excel réside dans ces fonctionnalités uniques et pratiques.
Les regex : Utilisation avancée sur Google Sheets
Si vous n'êtes pas familier avec les regex, commencez par comprendre leur fonctionnement à travers divers guides disponibles en ligne. Pour ce faire, Google Sheets propose trois fonctions principales :
REGEXMATCH(texte; expression)
: Cette fonction examine si un texte correspond à une expression régulière donnée. Elle retourne VRAI ou FAUX.REGEXEXTRACT(texte; expression)
: Celle-ci vous permet d'extraire une portion spécifique de texte en fonction de l'expression régulière.REGEXREPLACE(texte; expression; remplacement)
: Fonction utilisée pour remplacer une portion de texte correspondant à une expression régulière par une autre valeur.
Applications Pratiques des Regex
La fonction REGEXREPLACE
est particulièrement utile en SEO, comme pour tester des réécritures d’URL et s'assurer que toutes les possibilités sont couvertes. Par exemple, pour changer "nom prénom" en "prénom nom", cette formule peut être employée :
=REGEXREPLACE(A2; "([A-Z- ]+[A-Z- ]*) ([A-Z][a-z- ]+[A-Z]?[a-z-]*)"; "$2 $1")
Cette manipulation est très pratique pour transformer des données structurées.
Extraction ciblée avec REGEXEXTRACT
REGEXEXTRACT
permet de cibler des parties spécifiques dans un texte. Prenons un exemple simple : extraire le prénom d'une liste de noms. Utilisez cette formule :
=REGEXEXTRACT(A2; "[A-Z- ]+[A-Z- ]* ([A-Z][a-z- ]+[A-Z]?[a-z-]*)")
Pour extraire des identifiants produits à partir d'URL, cette fonction est également d'une grande aide.
Scraping avec les Fonctions Import (importhtml, importxml, importfeed, etc.)
Google Sheets inclut plusieurs fonctions pour importer des données depuis des sources externes.
Utilisation d'Importxml
IMPORTXML
est une des fonctions les plus polyvalentes pour le scraping sur Google Sheets. Pour bien l'utiliser, il est nécessaire de comprendre le xpath
. Voici comment procéder :
Une requête xpath se lit de droite à gauche, chaque slash (/
) représente un nœud ou une étape dans le document HTML. Par exemple, pour extraire tous les liens follow d'une page web, utilisez :
//a[not(contains(@rel, 'nofollow'))]/@href
Construction de Requêtes xpath
Décomposer les éléments est primordial. Pour les liens follow :
- Les liens se trouvent dans les balises
a
sans attributrel
contenantnofollow
. - Syntaxe complète :
//a[not(contains(@rel, 'nofollow'))]/@href
Utilisez cette syntaxe dans IMPORTXML
:
=IMPORTXML(URL, "//a[not(contains(@rel, 'nofollow'))]/@href")
Autres Fonctions Import
IMPORTHTML(url; requête; index)
: Pour extraire des tableaux ou des listes à partir d'une page web.IMPORTRANGE
: Pour importer des données d'un autre Google Sheet. Exemple :
=IMPORTRANGE("https://docs.google.com/spreadsheets/d/abcd123abcd123"; "Feuille1!A1:C10")
IMPORTDATA
etIMPORTFEED
: Pour importer des fichiers CSV ou des flux RSS. Syntaxes respectivement :
=IMPORTDATA("url")
=IMPORTFEED("url")
Importation de JSON
Malheureusement, l'importation de JSON n'est pas native dans Google Sheets. Pour ce faire, vous devez soit utiliser un module complémentaire, soit créer une fonction personnalisée via Apps Scripts.
Pour explorer davantage ces outils, consultez les ressources complémentaires et guides disponibles en ligne. Ces fonctions avancées rendent Google Sheets particulièrement puissant pour le SEO, en facilitant l'automatisation et la manipulation des données de manière efficace et efficiente.