Ce que voient les crawlers d'IA – et ce qu’ils ne voient pas
Beaucoup de choses considérées comme acquises dans le quotidien du SEO sont invisibles pour les LLM en mode conversation. La nouvelle étude Writesonic 2026 a analysé six grands crawlers de LLM (ChatGPT, Claude, Gemini-Conversation, Perplexity, Bing Copilot, Google AI Overviews) et confirme : tous les contenus doivent être livrés de manière à rester compréhensibles sans JavaScript, sans défaufilement (scroll) excessif et sans métadonnées dans le Head.
Les trois niveaux de crawlers (HTML-only / Headless / Full-Browser)
Pour s'y retrouver, un schéma simple permet de classer les crawlers de LLM actuels, qui tombent généralement dans les niveaux 1 ou 2 :- Niveau 1 : Analyseurs HTML-only – ils lisent le HTML statique, suivent les liens de manière limitée, n'exécutent pas de JavaScript et ne scrollent pas.
- Niveau 2 : Headless Light – ils peuvent analyser le HTML de manière plus robuste, prendre en compte certains replis (ex.
- Niveau 3 : Full-Browser – ils exécutent le JavaScript et le rendu complexe, et scrollent. Cependant, dans l'étude, les comportements des niveaux 1 et 2 dominent.
Ce que les 6 LLM voient de manière fiable — et ce qu'ils ne voient pas
Les tests de Writesonic révèlent des schémas clairs :- 3 LLM sur 6 n'exécutent pas de JavaScript. Les contenus en JS-only (SPA, avis injectés côté client, contenus en Lazy-Load) restent invisibles.
- 0 LLM sur 6 ne lit le JSON-LD en mode conversation en direct. Important : le JSON-LD reste pertinent pour l'index de recherche Google – deux mondes différents.
- 0 LLM sur 6 ne lit la Meta-Description ou les tags OG en mode conversation.
- 5 LLM sur 6 lisent la balise
de manière fiable. C'est donc l'élément le plus important du Head pour la lecture par les LLM. - 0 LLM sur 6 ne scrolle. Les contenus « below the fold » (sous la ligne de flottaison) et les images/blocs de texte chargés en lazy-load sont ignorés.
- 4 LLM sur 6 lisent les alternatives
- Le contenu caché par CSS (ex. display:none, accordéons) est visible ; les pseudo-contenus ::before/::after sont invisibles.
- Les Microdata dans le Body sont mieux lues que le JSON-LD dans le Head.
La balise Title est le nouvel or — recommandation pratique
Si 5 crawlers sur 6 lisent le titre de manière fiable, il devient un levier central. Recommandations :- Précis, riche en informations, moins de 60 caractères ; évitez les formules creuses.
- Proposition de structure : Sujet principal | avantage concret | marque.
- Variez selon le type de page (catégorie, produit, guide), mais gardez une terminologie cohérente.
- Placez les termes les plus forts en premier ; le nom de la marque à la fin, sauf s'il y a une forte demande pour la marque.
- Synchronisez sémantiquement le H1 et le Title sans en faire une copie conforme : le Title condense, le H1 explique.
Le JSON-LD n'est pas mort, mais les Microdata l'emportent pour la lecture LLM
L'étude montre qu'en mode conversation, le JSON-LD n'est pas lu, alors que les Microdata dans le Body le sont davantage. Conseil d'action :- Conservez le JSON-LD pour l'index de recherche (produits, FAQ, organisation, fil d'Ariane).
- Répliquez également les faits critiques sous forme de Microdata directement dans le Body visible (prix, disponibilité, avis), en parfaite adéquation avec le JSON-LD.
- Évitez les contradictions entre les données structurées et le texte visible.
- Utilisez des éléments HTML sémantiques (article, header, nav, main, footer) pour structurer proprement le contenu du Body pour les analyseurs.
Lazy Loading & Below-the-fold — les tueurs sous-estimés
Comme 0 LLM sur 6 ne scrolle, les mécanismes de Lazy-Load coupent des contenus essentiels de la perception. Conséquences :- Placez le message principal, les USP du produit, les prix et les appels à l'action primaires au-dessus de la ligne de flottaison.
- Chargez les images/textes critiques (hero) sans Lazy-Load (ou avec un fallback en ligne côté serveur). N'utilisez pas d'injection purement côté client pour les contenus principaux.
- Proposez des alternatives
- Vérifiez les SPA et les widgets d'avis : sans rendu côté serveur, ils restent invisibles.
Ce que notre audit en retire
Nous enrichissons les audits techniques de quatre vérifications ciblées et ajustons modérément les pondérations :- title_tag_present : vérifie l'existence, la longueur et la précision de la balise Title par URL.
- lazy_loaded_main_content : alerte si les contenus essentiels sont exclusivement chargés en lazy-load ou ne deviennent visibles qu'après interaction.
- noscript_fallback_present : détecte si une alternative
- css_generated_critical_content : signale un risque si des textes de vente pertinents sont générés via des pseudo-éléments CSS (::before/::after).