ChatGPT Search cite moins de domaines. Cela change la visibilité dans l’IA

Publication :
15/5/2026

ChatGPT Search devient plus sélectif, pas plus généreux. De nouvelles recherches de rétro-ingénierie suggèrent qu’après le basculement par défaut vers GPT-5.3 Instant le 4 mars, la réponse moyenne citait environ 15 domaines uniques au lieu de 19, tandis que le nombre d’URL uniques est passé de 24 à 19. Pour les marques, cela signifie que la visibilité dans l’IA vient de se resserrer : la boîte de réponse semble toujours riche, mais moins de sites sont choisis pour la remplir.

Le changement le plus profond est technique. ChatGPT Search semble désormais s’appuyer sur un outil appelé web.run, transformer une seule requête en plusieurs requêtes fan-out, et envoyer le crawler ChatGPT-User pour récupérer les pages qu’il veut réellement lire. Si votre site ne fait pas partie de ce chemin de récupération, votre contenu peut rester invisible, même s’il est techniquement crawlable.

Qu’est-ce qui a changé à l’intérieur de ChatGPT Search ?

Le grand changement, c’est la concentration. La recherche a suivi 400 requêtes quotidiennes sur 14 semaines et a constaté qu’une fois ChatGPT passé de GPT-4o/5.2 à GPT-5.3 Instant, le nombre moyen de domaines cités a chuté de plus de 20 %.

Cela compte parce que la zone visible des citations n’a pas soudainement disparu. Elle est simplement partagée entre moins d’éditeurs. Imaginez le même espace d’étagère, mais avec moins de produits dessus.

Un exemple simple rend ce basculement clair. Si une réponse citait auparavant 19 domaines et n’en cite plus que 15, quatre éditeurs perdent de la visibilité alors même que l’utilisateur voit toujours une réponse complète. Pour les équipes de contenu, ce n’est pas une mise à jour cosmétique. C’est un changement de part de marché.

Pourquoi moins de domaines gagnent-ils maintenant ?

Parce que ChatGPT Search semble resserrer sa sélection de sources plutôt que réduire la profondeur de crawl par site. La recherche indique que le ratio URL/domaine est resté stable à 1,26, ce qui suggère que le système ne lit pas soudainement moins en profondeur dans un site choisi. Il choisit simplement moins de sites dès le départ.

L’étude appelle cela le « Bigfoot Effect », en reprenant l’ancien schéma de recherche où un petit nombre de domaines dominait la page. Dans ChatGPT Search, la même logique apparaît autrement : moins de sites obtiennent une place à table, tandis que les gagnants peuvent toujours obtenir plusieurs URL récupérées.

Il existe aussi un angle lié au comportement du modèle. GPT-5.4 Thinking utiliserait des opérateurs site: pour cibler des domaines de confiance et répartir la récupération sur plus de 10 requêtes fan-out pour une seule réponse. À l’inverse, GPT-5.3 Instant ne lance généralement que deux ou trois tours.

La recherche soutient aussi que la conception du produit joue un rôle. Plus de 90 % des utilisateurs hebdomadaires sont sur l’offre gratuite, et l’expérience par défaut semble déclencher moins de recherches web, moins de requêtes et moins de citations. En pratique, cela signifie que la visibilité peut baisser non seulement parce que votre page est moins forte, mais aussi parce que l’utilisateur est orienté vers un chemin de récupération plus léger.

Que fait réellement web.run ?

web.run semble être la couche interne d’orchestration web derrière ChatGPT Search. C’est le mécanisme qui recherche, ouvre des pages, trouve du texte, clique dans les résultats et renvoie des sources au modèle pour qu’il les synthétise.

D’après la recherche, ce système a changé de format après GPT-5.3. Les versions précédentes utilisaient des commandes compactes séparées par des barres verticales. Les versions plus récentes utilisent du JSON structuré avec des paramètres typés. Cela peut sembler être un détail d’implémentation, mais cela signale quelque chose de plus important : le modèle n’émet plus de simples instructions de recherche. Il coordonne un flux de récupération plus explicite.

Les opérations documentées incluent désormais des actions comme search_query, open, find, click, screenshot et product_query, ainsi que des widgets spécialisés pour des domaines comme le sport, la finance et la météo. En d’autres termes, ChatGPT Search n’est pas une seule requête de recherche suivie d’un seul résumé. C’est une chaîne de petites décisions.

Un exemple concret tiré de la recherche montre comment cela fonctionne pour des requêtes d’achat. Pour une requête comme « meilleur imprimante 3D à acheter en 2026 », ChatGPT semble d’abord lancer une réécriture fan-out pour constituer un ensemble de candidats, puis lancer un fan-out d’achat distinct pour chaque produit afin de collecter les caractéristiques, les avis et les prix. Avant GPT-5.3, ces recherches produits étaient davantage regroupées. Désormais, chaque candidat peut déclencher son propre chemin de récupération.

Quel crawler lit réellement vos pages ?

L’agent de récupération clé semble être ChatGPT-User. Dans l’expérience de honeypot de l’étude, ce crawler a récupéré le contenu des pages pendant la navigation conversationnelle, tandis que OAI-SearchBot a été décrit comme l’agent utilisé pour construire l’index de recherche de ChatGPT.

Cette distinction compte. L’indexation et la récupération ne sont pas la même chose. Une page peut être connue du système à un niveau, tout en échouant à devenir la page ouverte et synthétisée dans une réponse en direct.

Pour les marques, cela pose une question d’audit pratique : lorsque ChatGPT cherche sur votre sujet, peut-il réellement récupérer la page qui vous intéresse, extraire le message principal et le restituer fidèlement ? La recherche suggère que vous pouvez le tester directement en demandant à ChatGPT d’effectuer une recherche spécifique à un site, d’ouvrir les URL retournées et de résumer ce qu’il a trouvé.

Étape 1 : rechercher votre domaine sur un sujet cibleÉtape 2 : ouvrir les pages les mieux classéesÉtape 3 : demander le titre, le sujet principal et les points clés de chaque page

Si le résultat est brouillon, incomplet ou passe à côté de votre message principal, votre problème n’est pas seulement le classement. C’est la récupérabilité.

Le point de vue de BotRank

C’est exactement pourquoi la visibilité dans l’IA ne peut pas être traitée comme un contrôle de classement ponctuel. Si une même requête peut citer des sources différentes selon GPT-5.3 Instant, GPT-5.4 Thinking et des expériences gratuites plus légères, alors la question « suis-je visible dans ChatGPT ? » n’est pas la bonne. La vraie question est : où, à quelle fréquence et dans quelles conditions de modèle ma marque apparaît-elle réellement ?

La fonctionnalité AI Visibility de BotRank est conçue pour cette réalité opérationnelle. Les équipes peuvent créer des requêtes réutilisables, les exécuter sur plusieurs LLM, suivre la visibilité dans le temps, comparer les modèles et examiner les entités, le sentiment, les mots-clés et les sources citées qui apparaissent dans les réponses. C’est important ici, car une marque peut paraître forte dans un modèle et faible dans un autre sans changer une seule page de son site. La bonne approche n’est pas de deviner. C’est de mesurer l’écart, repérer la baisse et corriger les pages et les récits les plus susceptibles d’influencer la récupération.

Pourquoi le test modèle par modèle est-il désormais obligatoire ?

Parce que « GPT-5 » n’est pas un environnement de citation stable unique. La recherche indique que GPT-5.2, 5.3 et 5.4 partagent tous la même date de coupure de connaissances d’août 2025 et appartiennent à la même famille de modèles, et pourtant une même requête peut produire des requêtes fan-out, des listes de sources et des passages cités différents.

Cette différence vient probablement du post-entraînement et du comportement d’inférence, pas seulement du préentraînement. L’article évoque des facteurs tels que le shaping de récompense, le fine-tuning, la configuration du prompt système et le budget de calcul. GPT-5.4 Pro, par exemple, est décrit comme bénéficiant de plus de calcul pour réfléchir davantage, ce qui peut changer ce qu’il cite.

Voici l’implication pratique : une marque peut apparaître dans GPT-5.4 Thinking pour une requête concurrentielle, puis disparaître dans GPT-5.3 Instant sur exactement la même question. Si vous ne testez qu’un seul modèle une seule fois, vous ne mesurez pas la visibilité. Vous mesurez une seule capture d’un seul chemin de récupération.

Que sont la visibilité paramétrique et la visibilité dynamique ?

La recherche distingue la visibilité de l’IA en deux couches : la visibilité paramétrique et la visibilité dynamique. Cette distinction est l’une des idées les plus utiles de toute l’analyse.

La visibilité paramétrique, c’est ce que le modèle sait déjà sans chercher sur le web. C’est la mémoire de marque construite à partir des données d’entraînement, façonnée par des signaux comme la couverture médiatique, la présence sur Wikipédia et les mentions sur des sites à forte autorité.

La visibilité dynamique, c’est ce que le modèle récupère en direct lorsque la recherche est activée. Elle est plus volatile, plus dépendante du modèle et plus exposée aux changements soudains du comportement des outils ou de la logique de sélection des sources.

Le lien entre les deux est la partie inconfortable. Le modèle semble formuler des requêtes web autour des sources et des entités qu’il reconnaît déjà. Donc, si votre marque est faible dans la mémoire paramétrique, vous risquez de ne jamais devenir une candidate probable dans la récupération dynamique. On peut le voir ainsi : si le modèle ne connaît pas déjà votre nom, il ne prendra peut-être jamais la peine de chercher votre page.

La recherche présente même les mises à jour de date de coupure des connaissances comme le « Google Dance » des LLM. Elles peuvent redistribuer massivement la visibilité paramétrique, mais elles se produisent lentement parce que le réentraînement coûte cher. La visibilité dynamique, en revanche, peut changer du jour au lendemain.

Que doivent faire les marques maintenant ?

Les marques doivent considérer ChatGPT Search comme un système à surveiller, et non comme une boîte noire. La stratégie gagnante n’est pas de courir après un « facteur de classement IA » universel. C’est de construire une boucle d’observation reproductible.

  • Testez les requêtes sur plusieurs modèles. Un résultat dans GPT-5.4 ne garantit pas la même visibilité dans GPT-5.3 Instant ou dans une expérience gratuite plus légère.
  • Auditez la récupérabilité, pas seulement le crawl. Demandez à ChatGPT de rechercher votre site, d’ouvrir les pages et de les résumer. Voyez ce qu’il peut réellement extraire.
  • Surveillez la concentration des citations. Si moins de domaines gagnent, le benchmarking concurrentiel devient plus important, car les pertes seront plus nettes.
  • Renforcez l’autorité de marque en dehors de votre site. La visibilité paramétrique est façonnée par le corpus global, pas seulement par vos propres pages.
  • Suivez les changements dans le temps. Une mise à jour du modèle peut effacer des gains de visibilité qui semblaient stables une semaine plus tôt.

Cette approche fonctionne bien pour diagnostiquer la performance de recherche IA en direct, mais elle a ses limites. Elle ne vous donnera pas un score permanent unique, parce que le système lui-même évolue. C’est précisément pour cela qu’une surveillance continue compte davantage qu’un rapport ponctuel.

FAQ : ce que les marketeurs doivent savoir sur la visibilité de ChatGPT Search

Moins de citations signifie-t-il que ChatGPT Search est moins bon ?

Pas nécessairement. Cela signifie que le système semble concentrer la confiance et la récupération sur un ensemble plus restreint de sources. Cela peut améliorer la cohérence pour les utilisateurs tout en rendant la visibilité plus difficile pour les autres.

Qu’est-ce qu’une requête fan-out, en termes simples ?

Une requête fan-out, c’est lorsqu’une seule demande utilisateur est décomposée en plusieurs recherches plus ciblées. Au lieu de lancer une seule recherche large, le modèle répartit la récupération sur plusieurs recherches précises afin de collecter et comparer des sources.

Le fait d’être crawlable par OAI-SearchBot suffit-il ?

Non. La recherche suggère que ChatGPT-User est le crawler qui récupère le contenu des pages pendant la navigation conversationnelle en direct. Une page peut être connue du système tout en échouant à devenir celle que ChatGPT lit réellement.

Pourquoi une même requête peut-elle citer des sources différentes selon les modèles GPT-5 ?

Parce que le comportement de récupération change après le préentraînement. Des versions différentes peuvent utiliser des stratégies fan-out, des budgets de calcul et une logique de sélection des sources différents, même si elles partagent la même date de coupure des connaissances.

Que dois-je suivre en premier si je me soucie de la visibilité dans l’IA ?

Commencez par un ensemble fixe de requêtes critiques pour le business, testez-les sur plusieurs modèles et notez si votre marque apparaît, comment elle est décrite et quelles sources sont citées. Ensuite, comparez votre visibilité à celle de vos concurrents et identifiez les pages ou les narratifs à améliorer.

ChatGPT Search n’est plus seulement une boîte noire dans laquelle on espère apparaître. C’est un système de récupération au comportement observable, avec un espace de citation qui se réduit et des différences claires entre les modèles. Si votre marque dépend de la découverte dans les réponses IA, c’est le moment de mesurer cette visibilité comme un véritable canal. BotRank peut vous aider à le faire avec beaucoup plus de rigueur que le simple hasard.

Autres actualités