Hoe meet je je zichtbaarheid in ChatGPT concreet?
Samengevat: Je zichtbaarheid in ChatGPT meten vereist een herhaalbare procedure: een panel identieke prompts uitvoeren in anonieme modus, over meerdere runs verspreid in de tijd, op de huidige modelversie, waarbij je het profiel van de doelgebruiker imiteert. Variaties tussen runs vereisen een gemiddelde over minimaal drie uitvoeringen. De KPI's om uit te putten: aanwezigheid of afwezigheid, positie in het antwoord, klikbare link of simpele tekstuele vermelding, context (aanbeveling, vergelijking, neutrale citatie). De methode kost een halve dag tot een dag, afhankelijk van het panelvolume. Speciale tools industrialiseren de operatie vanaf enkele honderden euro's per maand.
Een geïmproviseerde test van vijf minuten — je merknaam in ChatGPT typen en concluderen — meet niets. Het stelt gerust of bezorgd zonder iets te leren. Om deze intuïtie in bruikbare informatie om te zetten, moet je een procedure formaliseren, die rigoureus toepassen en accepteren dat meten meer tijd kost dan een kopje koffie.
Het goede nieuws is dat de procedure op één pagina past. Eenmaal onder de knie, wordt het een auditreflex die elk marketingteam kan industrialiseren. Hier is hoe het opgebouwd wordt.
Welke procedure volgen stap voor stap?
Stap 1 — De testomgeving voorbereiding
ChatGPT personaliseert zijn antwoorden. Eerdere gesprekken, geactiveerde herinneringen en het gebruikersprofiel vertekenen de resultaten. Om objectief te meten, heb je twee opties: een lege, aan monitoring toegewezen account gebruiken, of de incognito-modus van je browser gebruiken met een account zonder geschiedenis. Herinneringen en gepersonaliseerd leren uitschakelen is verplicht. Zonder deze voorzorg zijn tests systematisch vertekend ten gunste van merken waarmee de account al heeft geïnteracteerd.
Stap 2 — Het promptpanel uitvoeren
Elke prompt uit het panel wordt in een nieuw gesprek gesteld, koud, zonder voorafgaande context. De regel is strikt: geen vervolgvragen, geen extra precisering. Slechts één formulering, één antwoord, dat je documenteert. Het steekproefvenster is kort — idealiter alle uitvoeringen op dezelfde dag, om variaties tussen modelversies of RAG-laagontwikkelingen te vermijden.
Stap 3 — De resultaten coderen
Voor elk ontvangen antwoord vul je een gestandaardiseerd grid in. Wordt het merk genoemd? Zo ja, op welke positie in het antwoord? Met een klikbare link of als eenvoudige vermelding? In welk register (expliciete aanbeveling, neutrale vermelding, nadelige vergelijking)? Welke concurrenten worden in plaats daarvan of aanvullend genoemd? Dit grid produceert het ruwe materiaal dat vervolgens de KPI's zal voeden.
Stap 4 — Herhalen voor betrouwbaarheid
Één enkele uitvoering volstaat niet. ChatGPT kan twee licht verschillende antwoorden geven op dezelfde prompt met 24 uur ertussenin. De praktische regel: minimaal drie runs verspreid over drie dagen. Aggregeer vervolgens de resultaten als voortschrijdend gemiddelde.
Welke KPI's eruit halen?
Vier belangrijkste indicatoren komen voort uit de codering. Het citaatpercentage, verhouding van prompts waarin het merk minstens eenmaal voorkomt over de drie runs. De gemiddelde positie, die aangeeft of het merk vroeg (eerste alinea), in het midden of aan het einde van het antwoord wordt genoemd — positie weegt zwaar op gebruikersaandacht. Het percentage klikbare link versus eenvoudige vermelding, dat aangeeft of het merk potentiële verkeer genereert of alleen naamsbekendheid. De gemiddelde toon, gecodeerd als positief/neutraal/negatief, die je waarschuwt voor nadelige antwoorden.
Deze vier indicatoren kruisen geeft een genuanceerde lezing. Een merk kan een citaatpercentage van 40% hebben maar een zeer lage gemiddelde positie, wat betekent dat het verschijnt maar zelden de eerste aanbeveling is. Om een volledige GEO-meting te structureren, moet je deze hoeken combineren in plaats van je tevreden te stellen met één getal.
Ben je zichtbaar op ChatGPT? Controleer het nu Ontdek of je merk in antwoorden van ChatGPT, Claude en Gemini verschijnt. Gratis audit in 2 minuten. Betaalde acties automatisch. Start mijn gratis audit
Moet je ChatGPT testen met of zonder webzoeking ingeschakeld?
Beide modi geven verschillende en aanvullende resultaten. ChatGPT zonder webzoeking steunt alleen op de trainingsbestanden van het model — dus op het langetermijngeheugen. De antwoorden weerspiegelen de positie van het merk in de "hersenen" van het model. ChatGPT met zoekopdracht activeert de RAG-laag, die het web in real-time bevraagt — de antwoorden weerspiegelen de huidige zichtbaarheid.
Het ideaal is om elke prompt in beide modi te testen. Als het merk met zoekopdracht verschijnt maar niet zonder, betekent dit dat het dynamisch wordt gevonden maar niet onthouden — een zwak signaal. Als het zonder zoekopdracht verschijnt, is het verankerd in de bestanden, wat een duurzaam voordeel oplevert.
Hoeveel tijd kost dit in de praktijk?
Voor een panel van 50 prompts over drie runs, dus 150 uitvoeringen in totaal, plan je ongeveer een volledige werkdag in handwerk in: 15 seconden per prompt om uit te voeren en te lezen, plus de tijd om het antwoord te coderen. Voor een panel van 200 prompts duurt de operatie drie tot vier dagen. Daarboven wordt industrialisatie per tool economisch gerechtvaardigd.
Twee concrete voorbeelden
Een HR SaaS-softwarebedrijf voerde in mei 2025 voor het eerst interne metingen uit: panel van 80 prompts, drie handmatige runs over vier dagen. Resultaat zonder zoekopdracht: citaatpercentage 4%. Resultaat met zoekopdracht: percentage 18%. Het gat onthulde dat het sterk afhankelijk was van de RAG-laag en niet in het geheugen van het model verankerd was. Het management wijdde een budget toe voor gespecialiseerde persrelaties en een Wikidata-programma, met driemaandelijkse meting.
Omgekeerd had een Frans organisch cosmeticamerk uitstekende verankering in het modelgeheugen (40% citaten zonder zoekopdracht) maar leed onder vergelijkingsquery's, waar drie concurrenten het systematisch overtroefden. De diagnose stuurde een programma met gestructureerde vergelijkingen en partnerschappen met erkende beautymediums, wat zijn voice share van 22% naar 41% in vijf maanden bracht.
Samengevat: je zichtbaarheid in ChatGPT concreet meten vereist een rigoureuze procedure — geneutraliseerde omgeving, consistent panel, herhaalde uitvoering, systematische codering. Vier belangrijkste KPI's: citaatpercentage, gemiddelde positie, linkpercentage, toon. Testen met en zonder webzoeking geeft twee aanvullende lezingen. Een werkdag volstaat voor een panel van 50 prompts; daarboven wordt tooling noodzakelijk. Meting wordt een nuttige auditreflex voor elk marketingteam.
Kort samengevat
- Neutraal account verplicht, zonder herinneringen of geschiedenis.
- Minimaal drie runs verspreid over drie dagen voor betrouwbaarheid.
- Vier KPI's: citaatpercentage, positie, klikbare link, toon.
- Testen in modi met en zonder zoekopdracht om geheugen en RAG te onderscheiden.
- Een dag voor 50 prompts, tooling rentabel boven de 100.
Conclusie
Deze procedure is niet vast. Hij verrijkt zich door ervaring, veldterugkoppeling en motorontwikkelingen. Maar zijn structuur — voorbereiding, uitvoering, codering, herhaling — blijft geldig. Het zet een koffiekrantje-vraag ("zijn we zichtbaar of niet?") om in meetbare, vergelijkbare en defendeerbare informatie voor het management. Dit verschil onderscheidt een serieuze GEO-benadering van een vaag voornemen.
Gratis GEO-audit — 50 query's geanalyseerd Ontdek of je merk in antwoorden van ChatGPT, Claude en Gemini verschijnt. Gratis audit in 2 minuten. Betaalde acties automatisch. Start mijn gratis audit
Veelgestelde vragen
Heb je een ChatGPT Plus-account nodig om te meten? ▼
Nee, maar het gratis account beperkt het dagelijkse testvolume en de toegang tot bepaalde versies. Een Plus-account is handiger voor panels boven de 30 prompts.
Vervalsen ChatGPT-herinneringen echt de meting? ▼
Ja, sterk. Een account dat je sector al heeft besproken, zal systematisch vertekend zijn ten gunste van genoemde merken. Herinneringen uitschakelen is verplicht.
Kun je meting via de OpenAI-API automatiseren? ▼
Ja, het is zelfs de voorkeurweg om te industrialiseren. De API weerspiegelt echter niet exact het gedrag van de openbare chat, er zijn verschillen.
Hoeveel runs zijn echt nodig? ▼
Minimaal drie, idealiter vijf voor kritieke panels. De variabiliteit tussen runs rechtvaardigt gemiddelde aggregatie in plaats van één enkele uitvoeringswaarde.
Hoe codeer je de toon van een antwoord? ▼
Met een eenvoudig drieniveausgrid: positief (expliciete aanbeveling), neutraal (feitelijke vermelding), negatief (kritiek of nadelige vergelijking). Een dubbelgecodeerd monster stelt je in staat het grid betrouwbaar te maken.