Fichier llms.txt : un standard pour sa visibilité LLM
Description
Le fichier llms.txt est un nouveau standard (non officiel) proposé en septembre 2024 qui présente le contenu le plus important d'un site dans un format clair et structuré pour les LLM.
Placé à la racine du domaine, il contient une version épurée et contextuelle des contenus principaux en Markdown, facilitant leur compréhension par les modèles d'IA.
Pourquoi est-ce important pour l'IA ?
Le llms.txt agit comme une carte pour l'IA, indiquant aux systèmes quelles URL contiennent du contenu de haute qualité adapté aux LLM.
Ce fichier résout les limitations des fenêtres de contexte des LLM en évitant qu'ils aient à traiter des éléments HTML complexes, scripts et navigation.
Il est donc probable qu'il augmente significativement les chances qu’un contenu soit cité dans les réponses génératives en présentant directement les informations essentielles dans un format optimisé pour l'inférence.
Détails techniques
- Accessibilité du fichier llm.txt
- Format du fichier llm.txt (Type MIME)
- Contenu et structure du fichier llm.txt
- Ressources et liens utiles
1. Accessibilité du fichier llm.txt
Le fichier llm.txt est donc un nouveau standard proposé pour permettre aux développeurs de contrôler la manière dont les modèles de langage de grande taille (LLM) et les moteurs d'IA générative accèdent et interprètent le contenu d'un site web. Sa présence et son accessibilité sont fondamentales pour une optimisation GEO efficace.
- Emplacement : Le fichier llm.txt doit être situé à la racine du domaine. Il peut être nommé /llm.txt ou /llms-full.txt. Par exemple, pour le domaine example.com, le fichier doit être accessible via https://example.com/llm.txt ou https://example.com/llms-full.txt.
- Accessibilité HTTP/HTTPS : Le fichier doit être accessible via les protocoles HTTP et HTTPS. Il est recommandé de s'assurer que la version HTTPS est la version canonique et que toute requête HTTP est redirigée vers HTTPS.
- Code de Statut HTTP : Le serveur doit retourner un code de statut HTTP 200 OK lors de la requête du fichier llm.txt. Un code 404 Not Found ou tout autre code d'erreur empêchera les LLM de traiter vos directives.
2. Format du fichier llm.txt (Type MIME)
Pour garantir une interprétation correcte par les moteurs d'IA, le fichier llm.txt doit être servi avec le type MIME approprié.
- Type MIME : Le serveur doit renvoyer le fichier llm.txt avec le type MIME text/plain. Tout autre type MIME pourrait entraîner une interprétation incorrecte ou un rejet du fichier par les LLM.
- Encodage : Le fichier doit être encodé en UTF-8 pour assurer la compatibilité avec tous les caractères et éviter les problèmes d'interprétation.
- Contenu minimal : Le fichier llm.txt ne doit pas être vide. Au minimum, il devrait contenir un titre et un bref résumé pour indiquer sa fonction et son contenu.
3. Contenu et structure du fichier llm.txt
Le fichier llm.txt doit être structuré de manière à fournir des informations claires et concises aux modèles d'IA. Il doit inclure un titre, un résumé, des sections détaillées et des liens pertinents.
Titre : Le fichier doit commencer par un titre clair, utilisant le format Markdown de niveau 1 (#). Ce titre doit refléter le sujet principal du document.
# Titre de la documentation llm.txt
Bref résumé : Intégrez un bref résumé au début du fichier, juste après le titre. Ce résumé doit contenir les informations clés nécessaires à la compréhension du reste du fichier par un LLM, comme l'objectif du site ou le type de contenu qu'il propose.
Sections : Le fichier doit être organisé en sections claires, utilisant des titres de niveau 2 ou 3 (## ou ###). Chaque section peut contenir des paragraphes ou des listes pour présenter les éléments clés du site, tels que les thèmes abordés, les produits phares, ou les services offerts. Exemple de section :
## À propos de notre entreprise. Notre entreprise est spécialisée dans [description de l'activité]. Nous offrons [liste de produits/services].
Liens vers des pages en Markdown : le fichier doit contenir des liens vers des pages importantes de votre site, formatées en Markdown. Ces liens permettent aux LLM de découvrir et d'explorer le contenu pertinent de manière structurée. Exemple de lien :
Pour en savoir plus sur nos services, visitez notre [page de services](https://www.example.com/services).
Notes relatives aux liens : ajoutez des notes ou des descriptions courtes pour chaque lien afin de fournir un contexte supplémentaire aux LLM. Cela les aide à comprendre la pertinence du contenu lié. Exemple de note :
[Page de services](https://www.example.com/services) : Découvrez l'ensemble de nos offres et comment nous pouvons vous aider.
Ressources & liens utiles
Be the answer in AI search!
Boostez votre visibilité dans les résultats de recherche IA
ChatGPT, Perplexity, Gemini, Mistal, Claude...
