Combien de prompts faut-il dans un panel ?

Entre 50 et 300 selon la taille de l'entreprise et la diversité des cibles. En dessous de 30, les variations statistiques rendent la mesure peu fiable.

Faut-il tester tous les moteurs IA ?

Non. Concentrez-vous sur les cinq principaux (ChatGPT, Claude, Gemini, Perplexity, Copilot) puis ajoutez les moteurs verticaux pertinents pour votre secteur.

À quelle fréquence rafraîchir le panel ?

Une revue trimestrielle suffit pour la plupart des secteurs. Sur les marchés à évolution rapide, une revue bimestrielle est préférable.

Peut-on mesurer en interne sans outil dédié ?

Oui pour démarrer, avec un panel limité et une simulation manuelle. Au-delà de 50 prompts par mois, l'investissement dans un outil devient rentable.

Quel KPI prioriser au démarrage ?

Le taux de citation moyen, qui donne une vue d'ensemble simple à interpréter. La part de voix concurrentielle vient en second.

AI-Sichtbarkeit von Marken messen: Methoden und Indikatoren

Zusammengefasst: Die Messung der Markensichtbarkeit in KI-Systemen basiert auf drei komplementären Säulen: einem repräsentativen Prompt-Panel (50 bis 300 je nach Unternehmensgröße), einer systematischen Simulation auf den wichtigsten generativen Motoren (ChatGPT, Claude, Gemini, Perplexity, Copilot) und einem strukturierten KPI-Set (Zitierungsrate, Share of Voice, Kontextqualität, Position in der Antwort). Die minimale Messfrequenz ist monatlich, idealerweise wöchentlich für umkämpfte Märkte. Ohne diese Infrastruktur basiert das GEO-Management auf unbewiesenen Vermutungen. Mit ihr werden redaktionelle und budgetäre Entscheidungen faktisch und vor der Geschäftsleitung verteidigbar.

Eine Frage taucht in Vorstandssitzungen immer wieder auf: „Erscheint unsere Marke in ChatGPT oder nicht?". Diese Frage wirkt einfach. Sie ist tückisch. In ChatGPT zu erscheinen bedeutet je nach getesteter Engine, formuliertem Prompt, simuliertem Nutzerprofil, Modellversion und Testzeitpunkt etwas völlig anderes. Ohne Messmethodik schwankt die Antwort zwischen ungerechtfertigtem Optimismus und grundlosem Pessimismus.

Ein Messinstrument aufzubauen ist kein Luxus für große Unternehmen. Es ist die Grundvoraussetzung für Steuerung. Marken, die in GEO investieren ohne zu messen, ähneln einem Ladeninhaber, der sein Schaufenster renoviert, ohne zu wissen, wie viele Passanten in den Laden kommen. Dieser Artikel beschreibt Methode für Methode, wie man Sichtbarkeit objektiviert, welche Indikatoren man wählt, in welcher Frequenz und mit welchen wirtschaftlichen Abwägungen.

Warum GEO-Messung nicht wie SEO-Messung funktioniert

SEO wird durch Positionen bei Keywords und generierten Traffic gemessen – zwei stabile und gut instrumentierte Dimensionen. GEO-Messung folgt einer radikal anderen Logik. Ein identischer Prompt, zweimal innerhalb einer Stunde gestellt, kann leicht unterschiedliche Antworten erzeugen. Derselbe Prompt auf ChatGPT und Claude gestellt liefert fast immer unterschiedliche Quellen. Die Engine kann eine Marke wörtlich zitieren, sie paraphrasieren ohne Zuordnung, oder sie in einer Argumentation erwähnen ohne sie zu nennen.

Diese Variabilität lässt sich nicht durch mehr Tests lösen: sie wird durch statistische Stichprobenziehung bewältigt. Man simuliert eine große Anzahl von Prompts über mehrere Durchläufe, aggregiert und verfolgt Trends statt Einzelwerte. Der Monatsbericht ist keine Momentaufnahme, sondern ein Durchschnitt, der über die Zeit an Bedeutung gewinnt.

Was sind die Säulen einer zuverlässigen Messung?

Säule 1 — Das Prompt-Panel

Das Panel ist das wertvollste Kapital der GEO-Messung. Es sammelt die Fragen, die Zielkäufer tatsächlich an eine KI stellen, in ihrer natürlichen Sprache. Sein Aufbau erfordert Zuhören: Kundeninterviews, Analyse von Support-Tickets, Lektüre von Branchenforen, Erkundung von Auto-Complete-Vorschlägen. Ein ausgereiftes B2B-Panel enthält 100 bis 200 Prompts, die die gesamte Customer Journey abdecken, vom Stadium „ich erkenne ein Problem" bis „ich vergleiche drei Anbieter".

Säule 2 — Die Multi-Engine-Simulation

Jeder Prompt aus dem Panel wird auf jeder Ziel-Engine ausgeführt. Spezialisierte Tools automatisieren diesen Prozess, manche verwalten bis zu 20 Engines parallel. Die Simulation muss das echte Nutzerprofil nachahmen: geografischer Standort, Sprache, kurzer oder langer Konversationsverlauf. Eine Simulation von Paris aus liefert nicht dieselben Antworten wie eine von New York aus – ein wichtiger Faktor für internationale Marken.

Säule 3 — Das KPI-Raster

Vier Indikatoren strukturieren ein seriöses Dashboard. Die Zitierungsrate, die den Prozentsatz der Prompts ausdrückt, bei denen die Marke erscheint. Der Wettbewerbs-Share of Voice, der Zitierungen der eigenen Marke zu denen der drei oder fünf direkten Konkurrenten ins Verhältnis setzt. Die Kontextqualität, die bewertet, ob die Marke positiv, neutral oder negativ zitiert wird. Die Position in der Antwort, die misst, ob die Marke in der ersten Erwähnung, zweiten oder am Ende begraben erscheint.

Ein solides AI-Sichtbarkeits-Monitoring aufzubauen erfordert, die drei Säulen zu kombinieren, niemals eine ohne die anderen. Ein Panel ohne Simulation bleibt theoretisch, eine Simulation ohne KPI-Raster bleibt unlesbar.

AI-Sichtbarkeitsscore: Testen Sie Ihre Website Finden Sie heraus, ob Ihre Marke in den Antworten von ChatGPT, Claude und Gemini erscheint. Kostenloses Audit in 2 Minuten. Automatisierte kostenpflichtige Maßnahmen. Mein kostenloses Audit starten

Wie man ein relevantes Prompt-Panel aufbaut

Der Aufbau des Panels folgt einer dreiteiligen Logik. Zunächst die Rohsammlung: man trägt alle Formulierungen zusammen, die man von Kundenseite, Support, Vertrieb hört, und alle Anfragen, die die KIs selbst per Auto-Suggest vorschlagen (konversationaler „People also ask"-Effekt). In dieser Phase denkt man groß, 300 bis 500 Kandidaten.

Dann die Qualifizierung: man behält die Prompts, die echten kommerziellen Intentionen für die Marke entsprechen, wirft zu generische oder irrelevante heraus. Die Qualifizierung basiert auf zwei Kriterien: geschätztes Suchvolumen und Business-Potenzial.

Schließlich die Schichtung: man verteilt die ausgewählten Prompts nach Kaufphase (TOFU, MOFU, BOFU), nach Persona, nach Marksegment. Ein gut geschichtetes Panel ermöglicht segmentierte Analysen ohne alles bei jedem Bericht neu zu machen.

Die vierteljährliche Panel-Überprüfung verhindert Veralterung. Prompts entwickeln sich mit den Usages – ein vor sechs Monaten moderner Begriff kann verschwunden sein, eine neue Formulierung kann sich durchsetzen. Ohne Überprüfung wird das Panel langsam von der Realität abgekoppelt.

Welche Tools verwenden und was kostet das?

Es gibt mehrere Tool-Kategorien. Vollständige GEO-Monitoring-Plattformen (BlastGEO, Profound, Otterly, Peec.ai, AthenaHQ und andere) bieten Panel, Simulation, Dashboard und Reporting. Die Kosten liegen zwischen 200 und 3.000 Euro pro Monat je nach Prompt-Volumen und Engines.

Halbmanuelle Lösungen stützen sich auf hausgemachte Skripte, die die APIs der LLMs abfragen, Responses parsen und KPIs berechnen. Die direkten Kosten sind niedrig (API-Gebühren), aber der Zeitaufwand ist erheblich – ein Senior-Analyst in Teilzeit über drei bis sechs Monate zum Aufbau der Infrastruktur, dann einige Tage pro Monat zum Betreiben.

Manuelle Ansätze schließlich eignen sich für KMUs und Start-Phasen. Man führt manuell 30 bis 50 Prompts pro Monat auf 3 oder 4 Engines durch und notiert die Ergebnisse in einer Tabelle. Das ist langsam und ungenau, gibt aber bereits eine nützliche Steuerungsgrundlage.

Zwei konkrete Branchenbeispiele

Ein B2B-Buchhaltungssoftware-Anbieter hat im März 2025 ein Panel von 140 Prompts eingeführt, wöchentlich simuliert auf ChatGPT, Claude, Gemini und Perplexity. Zu Beginn lag seine durchschnittliche Zitierungsrate bei 6%. Nach fünf Monaten, nach einer Umgestaltung des Blogs in Frage-Antwort-Blöcke und Hinzufügen von Schema.org, stieg diese Rate auf 31%. Die Monatsberichte ermöglichten es, das Budget vor der Geschäftsleitung zu rechtfertigen und zwischen Projekten abzuwägen (Redaktionelle Umgestaltung > Backlinks > Wikidata, in dieser Reihenfolge).

Eine Pariser Business School startete ohne spezialisiertes Tool: Panel von 60 Prompts, manuelle monatliche Simulation. Nach zwei Monaten offenbarte die Analyse, dass sie niemals in Vergleichsantworten zwischen Schulen erschien, obwohl sie regelmäßig in informativen Anfragen zu Diplomen auftauchte. Diese einfache, aber wertvolle Erkenntnis lenkte ein Programm von redaktionellen Branchenvergleichen, das ihren Share of Voice bei Vergleichs-Prompts in vier Monaten verdoppelte.

Welche Fallstricke vermeiden?

Mehrere Fehler tauchen regelmäßig auf. Zu früh messen, ohne Zeit zu geben, dass Signale hochkommen – mindestens vier Wochen zwischen einer GEO-Maßnahme und ihrer Messung. Ein zu enges Panel testen (unter 30 Prompts), das Variationen statistisch schwach macht. Panel-Segmente ignorieren und nur auf dem Gesamtdurchschnitt rechnen. Citation mit positiver Erwähnung verwechseln – eine Marke kann für ihre Mängel zitiert werden.

Fundamentaler ist der größte Fehler: GEO-Messung vom Rest des Marketing isolieren. GEO-Indikatoren müssen mit eingehenden Leads, Sales-Terminen, Prospect-NPS gekreuzt werden, um zu validieren, dass AI-Sichtbarkeit ein Pipeline-Effekt hat. Eine steigende Zitierungsrate ohne jeglichen Business-Effekt ist ein Signal, das Panel oder den redaktionellen Winkel neu zu qualifizieren.

Zusammenfassend: Die Messung der AI-Sichtbarkeit erfordert ein repräsentatives Prompt-Panel, systematische Multi-Engine-Simulation und ein strukturiertes KPI-Raster. Die Frequenz ist mindestens monatlich, idealerweise wöchentlich für umkämpfte Märkte. Spezialisierte Tools automatisieren ab 200 Euro pro Monat, halbmanuelle oder manuelle Ansätze eignen sich für Start-Phasen. Isolierte Messung hat keinen Wert: sie gewinnt volle Aussagekraft, wenn sie redaktionelle Entscheidungen und globale Business-Indikatoren speist.

Zusammenfassung

Drei Säulen: Prompt-Panel, Multi-Engine-Simulation, KPI-Raster.
Vier strukturierende KPIs: Zitierungsrate, Share of Voice, Kontextqualität, Position in der Antwort.
Mindestens monatliche Frequenz, ideal wöchentlich für umkämpfte Märkte.
Kosten der Plattformen: 200 bis 3.000 Euro pro Monat je nach Volumen.
GEO-Messung wertet nur in Kombination mit Business-Indikatoren.

Fazit

GEO-Messung wandelt eine noch vage Disziplin in steuerbarer Praxis um. Sie objektiviert Entscheidungen, rechtfertigt Budgets, lenkt redaktionelle Anstrengungen. Ohne sie bleibt GEO eine Intuition. Mit ihr wird es ein messbarer Kanal wie SEO oder SEA. Der richtige Moment zu investieren ist nicht in sechs Monaten, sondern vor dem nächsten Budgetzyklus – damit die ersten Zahlen auf dem Tisch liegen, wenn die Abwägungen für 2027 beginnen.

Analysieren Sie Ihre AI-Sichtbarkeit kostenlos Finden Sie heraus, ob Ihre Marke in den Antworten von ChatGPT, Claude und Gemini erscheint. Kostenloses Audit in 2 Minuten. Automatisierte kostenpflichtige Maßnahmen. Mein kostenloses Audit starten

Häufig gestellte Fragen

Wie viele Prompts sollten in einem Panel sein? ▼

Zwischen 50 und 300 je nach Unternehmensgröße und Zielvielfalt. Unter 30 ist die Messung aufgrund statistischer Schwankungen wenig zuverlässig.

Muss man alle AI-Motoren testen? ▼

Nein. Konzentrieren Sie sich auf die fünf Hauptmotoren (ChatGPT, Claude, Gemini, Perplexity, Copilot) und fügen dann branchenspezifische vertikale Motoren hinzu.

Wie oft sollte man das Panel aktualisieren? ▼

Eine vierteljährliche Überprüfung reicht für die meisten Branchen. In schnell wachsenden Märkten ist eine zweimonatliche Überprüfung vorzuziehen.

Kann man intern ohne spezialisiertes Tool messen? ▼

Ja, zum Start mit einem begrenzten Panel und manueller Simulation. Beyond 50 Prompts pro Monat wird die Tool-Investition rentabel.

Welcher KPI sollte zu Beginn Priorität haben? ▼

Die durchschnittliche Zitierungsrate, die eine einfache Gesamtsicht ermöglicht. Der Wettbewerbs-Share of Voice folgt als zweiter.

← Zurück zu Insights

AI-Sichtbarkeit messen: Methoden, Tools, KPIs