En bref: Une analyse des lacunes de contenu trouve chaque page sur laquelle un concurrent se positionne et pas vous, puis répartit le résultat sur trois équipes. Récupérez les mots clés et pages de destination du concurrent avec DataForSEO pour quelques dollars, laissez un LLM associer leurs pages aux vôtres, et les lignes sans correspondance deviennent des correctifs SEO, des idées d'expansion d'assortiment, des campagnes payantes et du contenu. La correspondance n'a pas besoin d'être parfaite — la valeur, ce sont les lacunes.
Tout le jeu en une phrase
Trouvez les pages sur lesquelles vos concurrents se positionnent et que vous n’avez même pas dans votre portefeuille — puis transformez cette liste en trois gains : plus de visibilité SEO, des campagnes sur le Réseau de Recherche visant des pages de destination qui vous manquaient, et du trafic non commercial que vous n’auriez jamais touché autrement. Une seule carte, trois bénéfices différents, qui atterrissent sur trois équipes différentes. C’est ça, toute l’analyse ; tout ce qui suit, c’est comment y arriver concrètement.
Chaque présentation SEO a la diapo qui vous dit de faire ça — analysez la concurrence, trouvez les lacunes dans votre contenu et vos catégories. Presque personne ne la suit, parce que l’ancienne méthode était un calvaire : exporter les mots clés d’un concurrent, deviner à l’œil vers quelles pages de destination ils menaient, les aligner à la main contre votre sitemap, et débattre des correspondances dans un tableur pendant une semaine. Alors la diapo est restée une diapo.
Deux choses ont changé. Récupérer les données a cessé d’être cher : DataForSEO fait pour quelques centimes ce que Semrush fait pour un abonnement mensuel. Et la mise en correspondance a cessé d’être manuelle : un LLM associe les pages d’un concurrent aux vôtres en quelques minutes, et il n’a pas besoin d’être parfait pour être utile.
Ce qui reste, c’est la partie qui a toujours été la vraie valeur — et ça n’a jamais vraiment été une tâche SEO. Une lacune de contenu, c’est une page de catégorie manquante, une gamme de produits que vous ne stockez pas, un blog qui alimente une liste de remarketing. Ça touche le SEO, le payant, l’assortiment et la stratégie de contenu à la fois. Voici comment je la mène.
L'analyse en une boîte
- Ce qu'on cherche Chaque page sur laquelle un concurrent se positionne et pas vous
- Outils API DataForSEO · n'importe quel LLM · un crawler de site
- Coût Quelques dollars de crédit API, aucun abonnement
- Ce que vous obtenez Une liste courte classée de lacunes de contenu, d'assortiment et de campagnes
Une boutique, quatre concurrents — à quoi ça ressemble dans la vraie vie
Avant la mécanique, la forme de la chose. Disons qu’ABC est un e-shop de matériel outdoor de taille moyenne : tentes, chaussures de trail, vestes de pluie, sacs à dos. Vous récupérez son véritable ensemble de concurrents et quatre noms ressortent — et le plus intéressant, c’est pourquoi chacun bat ABC en organique :
- Concurrent 1 tient un blog vraiment bon sur comment choisir une chaussure de trail running. Il attire des milliers d’acheteurs au stade de la recherche — avant même qu’ils ne cherchent un produit.
- Concurrent 2 détient le contenu pratique sur réimperméabiliser une veste de pluie — un sujet sur lequel ABC n’a jamais écrit une seule ligne, et que pourtant chaque propriétaire de veste finit par chercher.
- Concurrent 3 a une arborescence de catégories profonde : des pages de destination séparées pour les vestes de pluie enfant, les tentes 3 saisons, les sacs à dos ultralégers — des pages granulaires qu’ABC regroupe actuellement dans une seule liste générique.
- Concurrent 4 dépense simplement plus que tout le monde sur les termes de marque. C’est du bruit, pas une lacune de contenu — abandonnez-le.
Cette seule carte offre à ABC trois mouvements concrets :
- Contenu — écrire les guides chaussures de trail et entretien des vestes, capter le trafic au stade de la recherche que les blogs dévorent, et déposer ces lecteurs dans une liste de remarketing.
- Payant — une fois les pages de destination granulaires créées, pointer les campagnes sur le Réseau de Recherche vers elles (
vestes de pluie enfant→ la page des vestes de pluie enfant) plutôt que de déverser chaque clic sur une seule page de catégorie grossière. - Assortiment & structure — construire les pages de catégorie manquantes pour les gammes qu’ABC stocke déjà mais auxquelles elle n’a jamais donné de vraie place, et signaler les gammes de produits qu’un concurrent propose et qu’ABC n’a pas.
Même analyse, trois équipes, trois budgets. (Exemple illustratif.) Voici maintenant comment produire cette carte.
Le flux, de bout en bout
Identifier les vrais concurrents — de trois façons
Pas qui vous pensez être concurrent — qui apparaît réellement là où va votre argent. Utilisez trois signaux ensemble. Un : passez vos requêtes de recherche les plus importantes dans DataForSEO et notez qui apparaît en payant et en organique. Deux : lisez les Auction Insights dans Google Ads — le chevauchement aux enchères vous dit à quel point un rival est réellement proche. Trois : récupérez les données de chevauchement de mots clés, où le nombre de requêtes partagées avec un domaine est un bon indicateur de parenté. Trois listes se condensent en une seule liste courte de concurrents authentiques. Pourquoi en premier : ratez cette étape et toutes les suivantes héritent de l’erreur — vous mapperiez vos lacunes contre un rival qui n’a jamais vraiment concouru pour votre argent.
Récupérer les mots clés et pages de destination du concurrent
Pour chaque concurrent, récupérez ses principaux mots clés organiques — jusqu’à ~100k — et, point crucial, sur quelle page de destination chaque mot clé se positionne. À partir de position × volume de recherche, vous pouvez estimer le trafic qui afflue vers chacune de leurs pages. Pourquoi les pages, pas les mots clés : un mot clé est une abstraction ; une page est quelque chose que vous pouvez copier, reconstruire, ou vers quoi pointer une campagne. Vous condensez donc la liste de mots clés en une carte : page du concurrent × trafic estimé × les mots clés qui l’alimentent. Une ligne pourrait dire : rival.com/trail-running-shoes · mot clé principal trail running shoes · ~8 000 visites estimées/mois. (Exemple illustratif.)
Cartographier votre propre site
Il vous faut l’image miroir de vos propres pages. Pourquoi cette étape : vous ne pouvez qualifier quelque chose de « lacune » que si vous êtes certain que ça manque de votre côté — votre propre carte doit donc être complète, sinon vous courrez après des « lacunes » qui ne sont en fait que des pages que votre inventaire a oublié de lister. Crawlez le site (Screaming Frog, ou un crawler Python jetable qu’un LLM écrit en cinq minutes), exportez les catégories depuis votre plateforme e-shop, lisez le flux de produits, ou parsez le sitemap XML — généralement une combinaison. Un avertissement : ne faites pas confiance au sitemap seul. Il rate régulièrement les pages paramétriques, les vues de catégorie filtrées et le blog — exactement les surfaces qui intéressent une analyse de lacunes.
Laisser l'IA associer leurs pages aux vôtres
C’est l’étape qui prenait une semaine. Confiez les deux inventaires à un LLM — un modèle open source convient — et faites-lui associer chaque page du concurrent à votre équivalent le plus proche. Vous n’avez pas besoin d’une précision de 100 % ; vous avez besoin des lignes sans correspondance. Le résultat est le trésor : les pages qu’ils ont, qui leur rapportent du trafic et des positions, et que vous n’avez tout simplement pas.
Décider ce que signifie chaque lacune — c'est là que ça cesse d'être du SEO
Une lacune n’est pas une chose unique. Triez-en chacune dans une catégorie : produits que vous vendez déjà mais sans page de catégorie → corrigez votre structure de pages de destination. Produits que vous ne vendez pas mais que votre fournisseur propose → une liste courte d’expansion d’assortiment avec la demande chiffrée. Un blog non commercial fort d’un concurrent qui attire votre audience exacte → une stratégie de contenu. Chaque catégorie atterrit sur une équipe différente — et plusieurs d’entre elles alimentent directement vos campagnes.
Par exemple : leur page /cordless-drills attire ~12 000 visites/mois, vous vendez des perceuses sans fil mais seulement sur une page générique /power-tools — c’est un correctif de structure de pages de destination, pas un nouvel article de blog. La ligne sans correspondance suivante, /drill-bit-buying-guide, est du contenu pur. Même carte des lacunes, deux équipes différentes. (Exemple illustratif.)
La correspondance n’a pas besoin d’être parfaite. Les gens bloquent ici en attendant une précision de 100 %. Vous n’en avez pas besoin. Quelques paires mal étiquetées ne vous coûtent rien ; la valeur est dans les pages de concurrents clairement sans correspondance, et celles-là survivent très bien à une correspondance bruitée. Livrez l’analyse à 90 % et agissez dessus, plutôt que de peaufiner un modèle qui n’a toujours été qu’un moyen d’aboutir à une liste courte.
Regardez-la tourner : ce que chaque étape recrache vraiment
Les cinq étapes ci-dessus sont la carte ; ceci est le terrain. Voici l’artefact concret que chaque étape vous remet — ce que vous fixez littéralement avant de passer à la suite. Les formes sont exactement ce que renvoient les outils ; les lignes sont illustratives, pas un vrai client. (Exemples illustratifs partout.)
Étape 1 → une liste courte de concurrents, notée. Vous passez les trois signaux et les condensez en un tableau. Les marques que vous auriez nommées à l’instinct ne sont pas toujours celles qui survivent aux trois :
Domain Paid/Org Overlap Shared Verdict
rival-a.com yes/yes 71% 4,120 core
niche-c.com yes/yes 44% 2,300 core
rival-b.com no /yes 12% 3,880 content-only rival
bigbox.com yes/yes 9% 910 too broad — drop
Trois sur quatre survivent ; le mégastore qui « évidemment » concourt est abandonné parce que le chevauchement n’est que du bruit.
Étape 2 → une carte de pages avec de l’argent attaché. Pour chaque concurrent survivant, un appel API renvoie les mots clés classés et la page de destination que chacun touche. Agrégez par page et vous arrêtez de regarder les mots clés :
Page Keyword Pos Vol Visits/mo
/trail-shoes trail running shoe 2 18,100 ~8,000
/waterproof-jackets waterproof jacket 4 12,000 ~3,200
/blog/clean-shoes clean trail shoes 1 2,400 ~1,500
/gaiters running gaiters 6 900 ~640
Chaque ligne est une page qui rapporte du vrai trafic à un concurrent — une cible, pas une requête.
Étape 3 → votre propre inventaire, et combien le sitemap a raté. Reflétez-le pour votre site à partir de crawl + flux + export de catégories. L’intérêt de récupérer quatre sources est visible dès qu’on les compte :
Source Pages found
XML sitemap 412
Screaming Frog crawl 938
Product feed 1,205 SKUs
Category export 64
Deduped own-site map 1,010 URLs
Le sitemap a vu 412 pages. La vraie carte en compte 1 010. L’analyse vit dans les ~600 que le sitemap ne vous a jamais montrées.
Étape 4 → les lignes NO MATCH, classées. Confiez les deux inventaires au LLM avec le prompt de correspondance. Il renvoie un verdict par page de concurrent ; vous ne gardez que les lacunes, triées par trafic :
Competitor page Closest OURS Verdict Visits/mo
/trail-shoes /running-shoes MATCH —
/waterproof-jackets — NO MATCH 3,200
/blog/clean-shoes — NO MATCH 1,500
/gaiters — NO MATCH 640
Une MATCH disparaît ; trois lacunes classées restent. Ce tableau de quatre lignes est tout le livrable en germe.
Étape 5 → la carte des lacunes avec un responsable. Étiquetez chaque lacune avec une catégorie et l’équipe sur laquelle elle atterrit. Maintenant ce n’est plus un rapport SEO — c’est un ordre de travail :
Gap Visits/mo Bucket Lands on
/waterproof-jackets 3,200 sell it, no LP SEO / web
/blog/clean-shoes 1,500 non-commercial Content + ads
/gaiters 640 don't stock it yet Assortment
Une carte, trois équipes, chaque ligne dimensionnée par le trafic. C’est le moment où une « analyse des lacunes de contenu » cesse d’être une corvée SEO pour devenir un plan transversal.
Semrush vs. DataForSEO : pourquoi l’écart de prix compte
La raison pour laquelle cette analyse est passée de « on devrait » à « on l’a fait », c’est le coût — et le chiffre Semrush qui compte ici est plus élevé que le prix affiché que les gens citent. Le plan Pro à 139,95 $/mois lance une vérification de lacunes de contenu dans l’interface, à la main, avec des plafonds d’export. Mais l’analyse de cet article est programmatique : un appel API par domaine concurrent, ~100k mots clés classés et leurs pages de destination à la fois. Semrush met son API derrière le plan Business à 499,95 $/mois — et même là vous démarrez avec zéro unité API. Vous les achetez séparément (environ 50 $ par million d’unités, ~10 unités par ligne de mot clé classé), en plus de l’abonnement. DataForSEO fonctionne au paiement à l’usage : une recharge de 50 $ dure des mois, il n’y a aucun siège à louer ni palier à débloquer, et vous ne payez que les requêtes que vous récupérez réellement.
| Semrush | DataForSEO | |
|---|---|---|
| Modèle de tarification | Abonnement forfaitaire ; API facturée en sus | Crédit au paiement à l'usage |
| Plan d'entrée UI | 139,95 $/mois (Pro), récurrent, export plafonné | — (aucun siège ; API uniquement) |
| Accès programmatique / API | Business 499,95 $/mois + unités API achetées séparément | Inclus — vous payez juste par appel |
| SERP organiques, pour 1 000 requêtes | Inclus dans le siège | 0,60 $ (Regular) – 3,50 $ (Advanced, live) |
| Une analyse de lacunes ponctuelle | Un mois de Business + unités, récurrent | Quelques dollars de crédit |
Pour un travail ponctuel et profondément technique comme une récupération de lacunes de contenu, c’est la différence entre débloquer un palier API à 500 $/mois et dépenser l’équivalent d’un café en crédit. La qualité des données est au rendez-vous pour cet usage ; l’économie, elle, n’a rien de comparable.
Deux histoires de vingt ans à faire ça
La mécanique est nouvelle. Les jeux qu’elle débloque, je les regarde fonctionner depuis deux décennies — ils étaient juste trop laborieux à mettre en place avant.
Le blog pour enfants devenu canal de vente
Un client dans le segment enfants se faisait battre sur une classe de requêtes qui n’avait rien à voir avec les produits. Le concurrent tenait un blog solide — coloriages, histoires du soir — avec un volume de recherche énorme visant exactement l’audience cible : les parents. L’analyse des lacunes a fait remonter tout le cluster. Le client a adopté la stratégie, construit le contenu, attiré le trafic, déposé ces visiteurs dans du remarketing, et transformé une lacune de contenu « non commerciale » en achats. (Anonymisé.)
Des recettes pour un régime qui vend des box repas
Une entreprise de meal-prep et de coaching jouxtait une catégorie aux deux belles propriétés : les requêtes de recettes ont un volume de recherche extrême et des CPC de quelques centimes. Les concurrents stratégiques avaient bâti des sections de recettes structurées — et récolté un flux de gens qui, par définition, voulaient mieux manger. De là, il n’y a qu’un pas vers un produit ou une offre de coaching. L’analyse des lacunes est ce qui a rendu l’opportunité visible et l’a dimensionnée. (Anonymisé.)
Le coup que personne ne joue : emprunter à un marché plus fort
Voici l’angle qui transforme ça d’un audit défensif en avantage déloyal.
Disons que vous êtes le leader d’un petit marché sans concurrence sérieuse dont apprendre. L’analyse des lacunes à domicile ne renvoie rien d’utile — il n’y a personne devant vous à copier. Alors ne la lancez pas à domicile. Lancez exactement la même analyse contre le marché étranger le plus fort et le plus concurrentiel de votre catégorie.
La langue n’est pas une barrière : le LLM associe leurs catégories et leur contenu aux vôtres quelle que soit la langue dans laquelle ils sont écrits. Vous importez les stratégies que les leaders d’un marché mature ont déjà éprouvées — structures de catégories, angles de contenu, idées d’assortiment — dans un marché où littéralement personne ne les fait encore. Vous devenez le premier arrivé à domicile en copiant l’avenir venu d’ailleurs. Ça se marie naturellement avec une analyse complète d’expansion de marché quand vous décidez où se trouve ce marché plus fort.
Pourquoi ça boucle la boucle
Remarquez ce qui vient de se passer. On a commencé par une tâche SEO bien rangée — « trouver les lacunes de contenu » — et ça a débordé sur des décisions d’assortiment, des campagnes payantes, des audiences de remarketing et une stratégie de contenu. Ce n’est pas une dérive de périmètre. C’est la forme réelle du travail.
Les données ont toujours été récupérables ; personne ne s’en donnait la peine, parce que le coût manuel l’emportait sur le gain. Maintenant la récupération est bon marché et la mise en correspondance est automatisée. Ce qui reste comme ingrédient rare, c’est ce qui a toujours été rare : l’idée — la séniorité de regarder une carte des lacunes et de savoir que le blog de coloriages d’un concurrent est en réalité un canal de remarketing, et l’envergure de relier SEO, payant et assortiment dans une seule tête. L’exécution est devenue facile. Le jugement, c’est le métier.
La partie que vous pouvez voler
Prompt d’association de pages — associe les pages d’un concurrent aux vôtres et signale les lacunes :
You are a site-structure analyst. You get two lists of pages:
COMPETITOR (url, top keywords, estimated monthly traffic) and OURS (url, title).
For each COMPETITOR page, return the single closest OURS page, or "NO MATCH".
Then output only the NO MATCH rows, sorted by estimated traffic descending.
Match on intent and topic, not exact wording. Cross-language matches are allowed.
100% precision is not required — never invent a match to avoid "NO MATCH".Mots clés classés + pages de destination — DataForSEO Labs, un appel par domaine concurrent :
curl -s "https://api.dataforseo.com/v3/dataforseo_labs/google/ranked_keywords/live" \
-u "$LOGIN:$PASSWORD" -H "Content-Type: application/json" \
-d '[{"target":"competitor.com","location_code":2840,"language_code":"en","limit":1000}]'Trois choses qui vous épargnent un après-midi perdu :
- Ne faites jamais confiance au sitemap seul pour votre propre carte. Il saute les pages paramétriques, les vues filtrées et le blog — les surfaces exactes où se cachent les lacunes. Combinez crawl + flux + export de catégories.
- Livrez à la correspondance « assez bonne ». La valeur, ce sont les pages de concurrents sans correspondance ; quelques paires fausses ne changent pas la liste courte. Ne peaufinez pas le modèle — agissez sur la liste.
- Lancez-la sur un marché étranger quand le domicile est trop facile. Pas de concurrent local fort signifie pas de lacunes à trouver. Empruntez plutôt au marché le plus fort de votre catégorie.
FAQ
N'ai-je vraiment pas besoin d'une précision de correspondance à 100 % ?
Exact. Vous traquez les pages du concurrent sans équivalent de votre côté — les lignes sans correspondance. Une poignée de paires mal étiquetées ne change pas cette liste courte. Exiger la perfection ici ne fait que retarder le passage à l’action sur une liste qui était déjà assez bonne.
Pourquoi DataForSEO plutôt que Semrush ?
La structure de coûts, et derrière quelle porte se trouve l’API. Les outils de lacunes de contenu de Semrush vivent dans l’interface du plan Pro à 139,95 $/mois ; la récupération programmatique utilisée dans cet article exige le plan Business à 499,95 $/mois plus des unités API achetées en sus (vous démarrez à zéro). DataForSEO fonctionne au paiement à l’usage à partir d’un crédit de 50 $ qui dure des mois, à 0,60–3,50 $ pour 1 000 requêtes SERP. Pour une récupération technique ponctuelle, c’est quelques dollars contre le déblocage d’un siège Business récurrent.
Comment choisir quels concurrents analyser ?
Trois signaux ensemble : qui apparaît en payant et en organique pour vos requêtes clés (via DataForSEO), qui se chevauche avec vous dans Google Ads Auction Insights, et qui partage le plus de mots clés avec vous dans les données des outils. L’intersection est votre véritable ensemble de concurrents — souvent pas les marques que vous auriez nommées.
N'est-ce pas juste du SEO ?
Ça ressemble à du SEO et ça n’en est pas. Les lacunes se répartissent en structure de pages de destination (SEO), produits que vous devriez stocker (assortiment), audiences qui valent du remarketing (payant) et sujets qui valent d’être écrits (contenu). L’analyse est la même ; les actions atterrissent sur quatre équipes différentes.
Puis-je vraiment faire ça à travers les langues et les marchés ?
Oui — c’est la version la plus forte. Le LLM associe les pages par intention, pas par formulation, donc il fait correspondre sans problème les catégories d’un concurrent étranger aux vôtres. Si votre marché domestique n’a aucune concurrence dont apprendre, lancez l’analyse sur un marché étranger plus fort et importez ce qui fonctionne.
Mon sitemap liste toutes mes pages — n'est-ce pas suffisant pour mon côté ?
Non. Les sitemaps omettent régulièrement les URL paramétriques, les vues de catégorie filtrées et des parties du blog — précisément là où vivent les lacunes. Construisez la carte de votre propre site à partir d’un crawl plus le flux de produits plus un export de catégories, et traitez le sitemap comme une entrée parmi d’autres, pas comme la source de vérité.
CTA : Curieux de savoir sur quoi votre concurrent le plus fort se positionne et pas vous ? Récupérons ensemble la carte des lacunes.