Was AI-Crawler sehen – und was nicht
Vieles, was im SEO-Alltag als selbstverständlich gilt, ist für LLMs im Gesprächsmodus unsichtbar. Die neue Writesonic-Studie 2026 hat sechs große LLM-Crawler (ChatGPT, Claude, Gemini-Conversation, Perplexity, Bing Copilot, Google AI Overviews) analysiert und bestätigt: Alle Inhalte müssen so ausgeliefert werden, dass sie ohne JavaScript, ohne viel Scrollen und ohne Metadaten im Head verständlich bleiben.
Die drei Crawler-Tiers (HTML-only / Headless / Full-Browser)
Zur Einordnung hilft ein einfaches Raster, in dem heutige LLM-Crawler meist in Tier 1–2 fallen:- Tier 1: HTML-only Parser – lesen statisches HTML, folgen Links begrenzt, führen kein JavaScript aus, scrollen nicht.
- Tier 2: Headless Light – können HTML robuster parsen, einzelne Fallbacks (z. B.
- Tier 3: Full-Browser – führen JavaScript und komplexes Rendering durch und scrollen. In der Studie dominieren jedoch Verhaltensweisen aus Tier 1–2.
Was alle 6 LLMs zuverlässig sehen — und was nicht
Die Writesonic-Tests offenbaren klare Muster:- 3 von 6 LLMs führen kein JavaScript aus. JS-only-Inhalte (SPAs, clientseitig injizierte Reviews, Lazy-Load-Inhalte) bleiben unsichtbar.
- 0 von 6 LLMs lesen JSON-LD im Live-Conversation-Modus. Wichtig: JSON-LD bleibt für den Google-Suchindex relevant – zwei Welten.
- 0 von 6 LLMs lesen Meta-Description oder OG-Tags im Conversation-Modus.
- 5 von 6 LLMs lesen das
-Tag verlässlich. Es ist damit das wichtigste Head-Element für LLM-Read. - 0 von 6 LLMs scrollen. Inhalte „below the fold“ und lazy-geladene Bilder/Textblöcke werden ignoriert.
- 4 von 6 LLMs lesen
- CSS-versteckter Content (z. B. display:none, Akkordeons) ist sichtbar; ::before/::after-Pseudoinhalte sind unsichtbar.
- Microdata im Body wird besser gelesen als JSON-LD im Head.
Title-Tag ist das neue Gold — praxisnahe Empfehlung
Wenn 5 von 6 Crawlern den Title zuverlässig lesen, wird er zum zentralen Hebel. Empfehlungen:- Präzise, informationsdicht, unter 60 Zeichen; vermeiden Sie leere Floskeln.
- Strukturvorschlag: Primäres Thema | konkreter Nutzen | Marke.
- Variieren Sie nach Seitentyp (Kategorie, Produkt, Ratgeber), aber halten Sie Terminologie konsistent.
- Platzieren Sie die stärksten Begriffe zuerst; Markenname ans Ende, sofern keine starke Brand-Nachfrage besteht.
- Synchronisieren Sie H1 und Title semantisch, ohne Blindkopie: Der Title verdichtet, die H1 erläutert.
JSON-LD ist nicht tot, aber Microdata gewinnt im LLM-Read
Die Studie zeigt: Im Conversation-Modus wird JSON-LD nicht gelesen, Microdata im Body hingegen eher. Handlungsempfehlung:- Behalten Sie JSON-LD für den Suchindex bei (Produkte, FAQs, Organisation, Breadcrumbs).
- Spiegeln Sie kritische Fakten zusätzlich als Microdata direkt im sichtbaren Body (Preise, Verfügbarkeit, Bewertungen), inhaltlich deckungsgleich mit dem JSON-LD.
- Vermeiden Sie Widersprüche zwischen strukturierten Daten und sichtbarem Text.
- Nutzen Sie semantische HTML-Elemente (article, header, nav, main, footer), um den Body-Inhalt für Parser sauber zu gliedern.
Lazy Loading & Below-the-fold — die unterschätzten Killer
Da 0 von 6 LLMs scrollen, schneiden Lazy-Load-Mechanismen zentrale Inhalte von der Wahrnehmung ab. Konsequenzen:- Platzieren Sie die Kernaussage, Produkt-USPs, Preise und primäre Handlungsaufforderungen oberhalb der ersten Viewport-Höhe.
- Laden Sie hero-relevante Bilder/Textinhalte ohne Lazy-Load (oder mit serverseitigem Inline-Fallback). Verwenden Sie für Hauptinhalte keine rein clientseitige Injektion.
- Bieten Sie für kritische Assets
- Prüfen Sie SPAs und Review-Widgets: Ohne serverseitiges Rendern bleiben sie unsichtbar.
Was unser Audit daraus macht
Wir erweitern technische Audits um vier gezielte Checks und passen Gewichtungen moderat an:- title_tag_present: Prüft Existenz, Länge und Präzision des Title-Tags pro URL.
- lazy_loaded_main_content: Warnung, wenn wesentliche Inhalte ausschließlich lazy-geladen oder erst nach Interaktion sichtbar werden.
- noscript_fallback_present: Erfasst, ob für kritische Bilder/Textmodule ein
- css_generated_critical_content: Meldet Risiko, wenn relevante Copy via CSS-Pseudoelementen (::before/::after) erzeugt wird.