Seiten für ChatGPT strukturieren: Leitfaden zur Extrahierbarkeit
Zusammenfassung: Extrahierbarkeit ist die Fähigkeit einer Seite, in autonome und für ein LLM verständliche Segmente zerlegt zu werden. ChatGPT „chunkt" Ihre Seiten in Blöcke von 200-500 Wörtern, bevor es sie analysiert. Ein gut extrahierbarer Inhalt besteht aus Zusammenfassungen am Anfang jedes Abschnitts, selbsterklärenden H2/H3-Titeln (verständlich ohne Kontext), Absätzen mit maximal 3-4 Sätzen, strukturierten Listen und einer abschließenden FAQ. Der Extrahierbarkeitsscore einer Seite ist in weniger als 20 Minuten messbar. Eine Verbesserung der Extrahierbarkeit erhöht die Zitierquote im Durchschnitt um 40-60% laut BlastGEO-Benchmarks.
Was ist KI-Chunking?
Wenn ChatGPT Search eine Webseite abruft, analysiert sie diese nicht auf einmal als Ganzes. Sie wird in semantische Segmente (Chunks) von 200-500 Wörtern zerlegt, dann werden die relevantesten Chunks für die aktuelle Anfrage ausgewählt.
Ein ideales Chunk ist:
- Autonom: verständlich ohne vorherige Abschnitte zu lesen
- Fokussiert: behandelt ein einziges Thema oder eine einzelne Frage
- Sachlich: enthält überprüfbare und konkrete Informationen
- Abgegrenzt: klar von benachbarten Chunks durch Titel getrennt
Die Strukturelemente einer extrahierbaren Seite
Zusammenfassung am Seitenanfang/Abschnitt (die „Zusammenfassung")
Eine 50-100 Wörter lange Zusammenfassung am Anfang eines Artikels oder Abschnitts ermöglicht ChatGPT, die Hauptkonklusionen zu extrahieren, ohne den gesamten Inhalt zu analysieren. Dies ist das wirkungsvollste Element in Bezug auf Extrahierbarkeit.
Selbsterklärende H2/H3-Titel
Ein Titel wie „3. Hebel der externen Autorität" ist außerhalb des Kontexts bedeutungslos. Besser: „Hebel der externen Autorität für ChatGPT: Pressezitate und Backlinks". Der Titel sollte wie ein autonomes Chunk funktionieren.
Kurze und fokussierte Absätze
Ideal: 3-4 Sätze pro Absatz. Eine Hauptidee pro Absatz. Keine 10-15 Zeilen langen Absätze, die mehrere Konzepte vermischen.
Strukturierte Listen
Aufzählungslisten und nummerierte Listen sind nativ mit dem Antwortformat von ChatGPT kompatibel. Es formatiert und nutzt sie direkt um.
FAQ am Ende des Artikels
Eine FAQ mit 5-10 Fragen/Antworten am Ende eines Artikels vervielfacht die Wahrscheinlichkeit, dass die Seite für Long-Tail-Anfragen zitiert wird, um das Zwei- bis Dreifache.
Extrahierbarkeitscheckliste in 10 Punkten
- Zusammenfassung von 50-100 Wörtern am Seitenanfang
- Alle H2/H3 sind selbsterklärend
- Kein Absatz überschreitet 100 Wörter
- Listen verwenden Aufzählungszeichen oder Nummern (keine Pseudo-Listen in Prosa)
- FAQ mit 5+ Fragen am Ende des Artikels
- Schema.org Article + FAQPage implementiert
- Kein wichtiger Inhalt in nicht-gerendertem JavaScript
- Bilder mit aussagekräftigem und detailliertem Alt-Text
- Keine komplexen Tabellen mit verschmolzenen Zellen
- Tabellenspaltentitel sind aussagekräftig und selbsterklärend