Wie Webappski prüft, ob KI Ihre Website empfiehlt — das ehrliche AEO-Audit für Kunden (und warum es einen geschlossenen Score schlägt)
Wenn ein Käufer ChatGPT, Gemini oder Claude nach dem besten Anbieter Ihrer Branche fragt — stehen Sie in der Antwort? Das AEO-Audit von Webappski liest die Antwort jeder Engine auf die echten Kauffragen Ihrer Kunden, lässt Sie jedes Ergebnis aufklicken und die wortwörtliche Antwort der Engine dahinter lesen und nennt schwarz auf weiß, was es nicht misst. Genau dieses Audit fahren wir auf einer Kundendomain — hier an einem echten Lauf gezeigt — und der Grund, warum ein nachprüfbarer Bericht einen geschlossenen Dashboard-Score schlägt.

Um zu prüfen, ob KI Ihre Website empfiehlt, stellen Sie den Engines Ihre echten Kauffragen und lesen Sie die wortwörtlichen Antworten — nicht einen geschlossenen Score. Genau das ist ein Webappski-AEO-Audit: Wir richten unser offenes Tool auf Ihre Domain und geben Ihnen einen Bericht, in dem sich jedes Ergebnis per Klick zur wortwörtlichen Antwort der Engine öffnet — er zeigt, wo ChatGPT, Gemini und Claude Sie nennen, wo einen Wettbewerber, und was wir nicht gemessen haben.
Ein AEO-Audit ist ein strukturiertes Auslesen dessen, wie KI-Antwort-Engines reagieren, wenn ein Käufer nach dem besten Anbieter Ihrer Kategorie fragt. Keine Schätzung und kein Schaufenster-Dashboard: Es stellt jeder Engine genau die Fragen, die Ihre Kunden stellen, hält fest, ob Ihre Marke genannt oder zitiert wird, und bewahrt die Antwort der Engine Wort für Wort, damit jedes Ergebnis erneut nachprüfbar ist. Webappski ist ein Answer-Engine-Optimization-Studio; dieses Audit fahren wir auf der Website eines Kunden genauso wie auf unserer eigenen Marke — mit demselben offenen Tool und derselben Ehrlichkeit über seine Grenzen.
Dieser Artikel ist ein Käufer-Rundgang durch dieses Audit, keine Tool-Führung. Wir zeigen, wie wir das Audit für eine Kundendomain und einen regionalen Polen/DACH-Fragenkorb konfigurieren, es ausführen und was der Kunde tatsächlich erhält. Die Interna des Tools — warum der Score nachprüfbar ist, wie wir Zitate zuordnen, warum eine einzelne Null als Intervall berichtet wird — verdichten wir unten zu Ein-Absatz-Vertrauensbelegen, mit der vollen Technik verlagert in unseren Begleitbeitrag dazu, ob man einem KI-Sichtbarkeits-Score trauen kann.
Wie prüfe ich, ob KI meine Website empfiehlt?
Stellen Sie den Engines die Fragen, die Ihre Käufer stellen, und lesen Sie die Antworten — trauen Sie keiner einzelnen Zahl. Eine echte Prüfung heißt, jede KI-Engine auf den Kauffragen Ihrer Kategorie laufen zu lassen ("beste Werkzeugmaschinen-Lieferanten 2026", "[Wettbewerber]-Alternativen") und je Frage und je Engine festzuhalten, ob Ihre Marke genannt wird, ob Ihre Domain als Quelle zitiert wird und welcher Wettbewerber den Platz nahm, den Sie wollten.
Sie können das von Hand tun — öffnen Sie ChatGPT, Gemini und Claude, stellen Sie die Frage und lesen Sie, wen sie empfehlen. Genau so beginnt jedes ehrliche Audit, und Sie sollten es einmal tun, bevor Sie jemanden bezahlen. Webappski macht daraus ein strukturiertes Audit der Reproduzierbarkeit wegen: Eine einmalige Handprüfung ist eine einzelne Stichprobe eines nichtdeterministischen Systems und sagt über einen Trend fast nichts. Ein konfiguriertes Audit friert die Fragen ein, fragt die API jeder Engine mit Ihren Schlüsseln ab und speichert jede Rohantwort, sodass der Lauf in einem Monat mit dem heutigen vergleichbar ist. Das ist der Unterschied zwischen einem Screenshot und einer Messung.
Was konfiguriert Webappski vor einem Kunden-Audit?
Wir konfigurieren dem Kunden drei Dinge: seine Domain, seine echten Kauffragen und die Region seiner Käufer. Das Audit wird von einer einzigen Konfigurationsdatei (.aeo-tracker.json) gesteuert, die Marke und registrierbare Domain des Kunden, die abzufragenden Engines und einen Fragenkorb aus den Prompts nennt, die die Kunden des Kunden wirklich in einen KI-Assistenten tippen.
Die Fragen sind das Audit. Ein schwacher Korb aus Eitelkeitsphrasen liefert eine schmeichelhafte, nutzlose Zahl; ein Korb echter Kaufentscheidungsfragen liefert eine Zahl, die Umsatz vorhersagt. Deshalb bauen wir den Korb aus Kategorie und Vertriebsgesprächen des Kunden — und frieren ihn ein, damit jeder spätere Lauf denselben Boden misst. Für einen deutschen B2B-Hersteller sind das Fragen wie "bester Lieferant für [Branche] für Unternehmen 2026" oder "Alternative zu [Marktführer]".
Für europäische Kunden ergänzen wir eine regionale Achse. Das Audit kann jede Frage marktlokalisiert über --lang und --geo stellen — etwa den Polen/DACH-Korb in der Sprache des Käufers. Wir kennzeichnen das ehrlich als Soft-Geo: Es lokalisiert den Prompt, es täuscht keine deutsche oder polnische IP vor, ist also ein gerichtetes Regionalsignal statt einer Garantie dessen, was ein eingeloggter Nutzer in München sieht. Diese Grenze zu benennen ist der Kern — ein geschlossenes Tool ließe die Regionalzahl mehr scheinen, als sie ist.
Was steht wirklich im Bericht — und wie prüfen Sie jede Zahl selbst?
Der Bericht ist eine eigenständige HTML-Datei, die die Sichtbarkeitszahl, die Matrix aus Engines gegen Fragen, die wortwörtliche Antwort hinter jeder Zelle, die Wettbewerber, die die Plätze nahmen, und eine Kopfzeile zeigt, die genau nennt, was der Lauf gemessen hat und was nicht. Jede Zahl gehört Ihnen — zum Behalten, erneuten Öffnen und erneuten Ausführen; nichts ist hinter einem Login eingeschlossen.
Konkret öffnet der Bericht mit einem Faktensatz — im illustrativen Durchgang unten "Genannt in 5 von 18 Antworten" — gefolgt von einem Raster. Jede Zelle des Rasters ist klickbar: Öffnen Sie sie und Sie lesen die Antwort der Engine Wort für Wort auf diese Frage, sodass Sie sehen, warum eine Zelle ein Treffer oder ein Fehlschlag ist, statt einem Parser zu trauen, den Sie nicht prüfen können. Und weil KI-Antworten nichtdeterministisch sind, lässt sich jede Zelle mehrfach abfragen: Der Bericht zeigt die Präsenzrate mit einem Wilson-Konfidenzintervall, sodass eine einzelne glückliche oder unglückliche Antwort nie über Ihre Zahl entscheidet. Die Wettbewerbertabelle listet nur Marken, die zwei unabhängige Modelle beide extrahierten — das schützt sie vor von einem Modell halluzinierten Namen.
Unten steht ein illustrativer Ausschnitt, der die Form einer Kundendomain-Audit-Lieferung zeigt — aufgebaut um einen fiktiven CDN-Anbieter, den wir Northwind CDN (northwind.example) nennen, auf einem eingefrorenen CDN-Kaufkorb. Illustratives Beispiel — synthetische Daten, kein echter Kundenlauf, nur gezeigt, um die Form des Berichts zu demonstrieren. Die erfundene Marke ist Absicht: Layout, Belege und Ehrlichkeitsmarker sind genau das, was eine Kundenlieferung trägt, während keine Zahlen eines echten Dritten erscheinen.
| Berichtselement | Was der Kunde in der Lieferung sieht |
|---|---|
| Kopfzeilen-Fakt | Genannt in 5 von 18 Antworten (28% Präsenzrate auf dem eingefrorenen CDN-Korb) — illustrative Zahlen |
| Eine Treffer-Zelle — aufgeklickt | Gemini, "best low-latency video streaming CDN 2026": "Northwind CDN: eine starke Wahl für Echtzeit-Streaming mit extrem niedriger Latenz, mit einem großen globalen Edge-Netzwerk..." (illustrativ — keine echte Engine-Antwort) |
| Ein zweiter Treffer auf einer anderen Engine — aufgeklickt | Claude, "best CDN providers 2026": "...erwägenswert ist auch Northwind CDN wegen seines Edge-Netzwerks..." (illustrativ — keine echte Engine-Antwort) |
| Eine Fehlschlag-Zelle — aufgeklickt | ChatGPT, "best GPU cloud for AI inference 2026": Antwort nennt Anbieter A, Anbieter B und eine Hyperscaler-GPU-Cloud; die auditierte Marke fehlt — eine im Rohtext sichtbare Lücke, kein Parser-Fehler (illustrativ) |
| Zitat-Zuordnung (Ihre Domain als Quelle zitiert) | Gemini zitierte die eigene Domain der Marke (northwind.example) als Quelle bei "best CDN providers 2026" — dem Kunden gutgeschrieben, weil es seine registrierbare Domain ist |
| Wettbewerber, die die Plätze nahmen (zwei-Modell-verifiziert) | CDN A, CDN B, CDN C, ein Hyperscaler-CDN und ein Nischen-CDN (illustrative generische Labels) |
| Mess-Oberflächen-Disclaimer (Kopfzeile) | API-Oberfläche mit Ihren Schlüsseln (ChatGPT, Gemini, Claude) — ein reproduzierbarer Proxy, nicht die Consumer-Apps; ohne Google AI Overviews / Copilot, die keine Abfrage-API haben, und Perplexity, das nicht Teil dieses reproduzierbaren API-Laufs ist und nur per manuellem Einfügen verfügbar ist |
Dieser Ausschnitt ist das ganze Argument. In einer echten Lieferung sind die 28% keine Zahl auf Treu und Glauben — darunter liegt der genaue Gemini-Satz, der die Marke nennt, und die genaue ChatGPT-Antwort, die sie auslässt, sodass der Kunde beides mit eigenen Augen prüft und das Audit mit eigenen Schlüsseln wiederholt. (Die Zahlen oben sind illustrativ; auf Ihrer eigenen Domain sind die Belege die echten Worte Ihrer Engines.)
Warum ist dieses Audit vertrauenswürdiger als ein geschlossener Sichtbarkeits-Score?
Weil jede Zahl darin durch Belege gestützt ist, die Sie wieder herleiten können, und der Bericht seine eigenen blinden Flecken nennt. Sechs technische Entscheidungen machen das Audit ehrlich; jede fassen wir hier in einem Absatz, mit der vollen Mechanik im Begleitbeitrag, damit dieser Rundgang um Ihre Website geht, nicht um unser Werkzeug.
Es nennt, was es nicht misst. Jeder Bericht trägt eine feste Disclaimer-Zeile: Er misst die API-Oberfläche jeder Engine mit Ihren Schlüsseln — ein reproduzierbarer Proxy — nicht die Consumer-App, die ein Mensch nutzt, und deckt Google AI Overviews / AI Mode oder Microsoft Copilot nicht ab, die keine First-Party-API haben. Kein geschlossener Tracker, den wir sahen, nennt, was er auslässt; eine Zahl, die ihre Grenze verbirgt, verkauft, statt zu messen.
Der Score ist nicht proprietär — und das ist ein Vorteil für Sie. Die Sichtbarkeitszahl ist eine schlichte Präsenzrate nach offener Formel, aus den gespeicherten Antworten mit Ihren Schlüsseln nachprüfbar. Den geschlossenen Dashboard-Score eines Wettbewerbers können Sie nicht wieder herleiten; unseren leiten Sie aus den Dateien auf der Platte her — genau deshalb ist er vertrauenswürdig.
Sie bekommen das Artefakt, kein Login. Die Ausgabe ist ein eigenständiger HTML-Bericht, den Sie behalten, erneut öffnen und mit Ihren eigenen Schlüsseln erneut ausführen — kein Dashboard, zu dem Sie Zugang mieten. Jedes Ergebnis öffnet sich per Klick zu den genauen Worten der Engine, sodass die Zahl Ihre ist, die Sie prüfen, nicht unsere, die wir behaupten.
Jede Zelle hat einen Beleg, und Wettbewerber sind zwei-Modell-verifiziert. Hinter jeder Zelle steckt ein Klick-zum-Aufdecken der wortwörtlichen Antwort der Engine, sodass ein Treffer oder Fehlschlag lesbarer Beleg statt Parser-Behauptung ist; und die Wettbewerbertabelle behält nur Marken, die zwei unabhängige Modelle beide nannten, mit einem Wortlaut-Schutz — der Beweis, dass das Tool keine Rivalen erfindet.
Zitate werden Ihrer echten Domain zugeordnet, nicht einer Nachahmung. Ein Zitat zählt als Ihres, wenn der Quell-Host Ihre registrierbare Domain oder eine echte Subdomain davon ist; ein Spoof-Host, der Ihren Namen nur als Zeichenkette enthält, zählt nicht, eine echte Subdomain schon. Ihre Blog-Subdomain wird also gutgeschrieben, ein nachahmender Host nicht — die "zitiert"-Zahl ist in beide Richtungen ehrlich. Die Namenszuordnung ist genauso sorgfältig: Eine echte Nennung geht nicht durch ein zufälliges Trennzeichen verloren, daher wird eine Marke, ob als "Northwind CDN", "Northwind-CDN" oder "NorthwindCDN" geschrieben, als dieselbe Marke behandelt. Diese Trennzeichen-Toleranz ist genau die Fehlerklasse, die früher eine echte Nennung in ein falsches 0% verwandelte — die Engine nannte Sie, aber ein zeichengenauer Abgleich übersah es wegen eines Bindestrichs.
Eine 0% wird als Hypothese berichtet, nicht als Urteil. KI-Antworten sind nichtdeterministisch, also kann das Audit jede Zelle mehrfach abtasten und die Präsenz als Wilson-Konfidenzintervall berichten, neben einer Repräsentativitäts-Tafel, die zeigt, wie viele Ihrer Produktlinien der Korb berührt hat. Eine einzelne leere Zelle ist ein Intervall, das der nächste Lauf testet, keine Erklärung der Unsichtbarkeit — und kleine Stichproben werden als klein markiert, nie als Gewissheit verkauft. Der Bericht teilt Ihre Trefferquote zudem danach auf, wie nah jede Frage an dem liegt, was Sie wirklich verkaufen — core (Ihr direktes Angebot), adjacent (ein angrenzender Markt, in dem Sie konkurrieren) und aspirational (wohin Sie als Nächstes zielen) — sodass sich eine niedrige Gesamtzahl im Kontext liest: ein Fehlen in einer aspirativen Kategorie ist Ehrgeiz, nicht Unsichtbarkeit, während eine Lücke im Kern die ist, die Sie Käufer kostet.
Wie schlägt sich das Webappski-Kunden-Audit gegen ein geschlossenes Dashboard oder eine Agentur?
Der ehrliche Unterschied ist, womit Sie hinausgehen: ein nachprüfbarer Bericht mit den Rohantworten hinter jeder Zahl gegen eine Zahl, die Sie auf Treu und Glauben nehmen müssen. Die Tabelle vergleicht auf Käuferachsen — was Sie erhalten, ob der Beleg im Bericht steht, was ehrlich ausgeschlossen ist und was der Start kostet.
| Käuferachse | Webappski-Kunden-AEO-Audit | Typisches geschlossenes Dashboard / Agentur |
|---|---|---|
| Womit Sie hinausgehen | Ein eigenständiger HTML-Bericht, den Sie behalten und erneut ausführen — jede Zelle deckt per Klick die wortwörtliche Antwort der Engine auf | Ein Login zu einem gehosteten Dashboard oder eine Folie mit einer Zahl |
| Wortwörtliche Belege im Bericht | Jede Zelle deckt per Klick die Antwort der Engine Wort für Wort auf | Meist nur eine Zahl; Rohantworten nicht offengelegt |
| Vom Kunden wieder herleitbar | Ja — erneut mit eigenen API-Schlüsseln laufen lassen, offene Formel | Nein — der Score lässt sich von außen nicht nachrechnen |
| Was es ehrlich NICHT misst | Bei jedem Lauf genannt: API-Oberfläche, nicht Apps; ohne AI Overviews / Copilot | Selten offengelegt |
| Wettbewerberliste | Nur von zwei Modellen genannte Marken (Wortlaut-Schutz) | Unterschiedlich; Ein-Modell-Listen können halluziniert sein |
| Startkosten | Kostenloses erstes AEO-Audit Ihrer Website | Oft kostenpflichtiges Abo oder Retainer vor jeden Daten |
Das ist keine Behauptung, ein Dashboard sei wertlos — ein gutes verfolgt einen Trend nützlich. Es ist eine Behauptung über Belege: Wenn die Antwort einer KI-Engine entscheidet, ob ein Käufer Sie je sieht, ist der Bericht, der Ihnen die Antwort zeigt, mehr wert als der, der Ihnen nur eine Zahl zeigt.
Was sollte ich ehrlich von einem AEO-Audit erwarten?
Erwarten Sie eine klare, belegte Startlinie — keinen Zauberschalter. Ein Audit ist ein Auslesen, kein Hebel: Es sagt, wo Sie heute über die Engines stehen, mit dem Beleg im Anhang, und ist die Eingabe in einen Plan, nicht der Plan selbst. Die Zahl zu bewegen ist getrennte Arbeit, und Engines crawlen nach eigenem Takt, also zeigt sich eine heute ausgelieferte Änderung typisch in einer Nachmessung zwei bis vier Wochen später, nicht am Folgetag.
Erwarten Sie auch Ehrlichkeit über den Umfang. Das Audit liest die API-Oberfläche, nicht die personalisierte Consumer-App; es deckt Google AI Overviews oder Copilot nicht ab; und eine kleine Stichprobe ist eine Hypothese, kein Urteil. Diese Grenzen stehen absichtlich im Bericht. Ein Audit, das Gewissheit aus einer Handvoll Abfragen verspräche, wäre genau die geschlossene-Score-Unehrlichkeit, die dieses Audit ersetzen soll.
Häufig gestellte Fragen
Wie prüfe ich, ob KI meine Website empfiehlt?
Stellen Sie jeder KI-Engine die Kauffragen Ihrer Kunden — "beste [Ihre Kategorie] 2026", "[Wettbewerber]-Alternativen" — und lesen Sie, ob sie Sie nennt, Ihre Domain zitiert oder eher einen Rivalen nennt. Tun Sie es einmal von Hand in ChatGPT, Gemini und Claude, um ein Gefühl zu bekommen. Damit es wiederholbar und Monat für Monat vergleichbar ist, fährt Webappski ein strukturiertes Audit, das die Fragen einfriert, die API jeder Engine mit Ihren Schlüsseln abfragt und jede Rohantwort speichert.
Was ist ein AEO-Audit und was bekomme ich von Webappski?
Ein AEO-Audit ist ein strukturiertes Auslesen dessen, wie KI-Antwort-Engines auf die Kauffragen Ihrer Kategorie reagieren. Von Webappski erhalten Sie einen eigenständigen HTML-Bericht: die Sichtbarkeitszahl, die Engine-Frage-Matrix, die wortwörtliche Antwort hinter jeder Zelle (klicken Sie jedes Ergebnis auf, um sie zu lesen), die zwei-Modell-verifizierten Wettbewerber, die die Plätze nahmen, und eine Kopfzeile, die genau nennt, was der Lauf maß und was nicht. Eine Lieferung, die Sie behalten und wieder herleiten können, kein Dashboard-Login.
Messen Sie, was ein echter Nutzer in ChatGPT oder Gemini sieht?
Wir messen die offizielle API-Oberfläche jeder Engine mit Ihren Schlüsseln, was reproduzierbar und nachprüfbar ist, und sagen das bei jedem Lauf. Das ist ein treuer Proxy, aber nicht die Consumer-App eines eingeloggten Menschen, die eine andere Modellversion, Personalisierung und Lokalisierung nutzen kann. Wir decken auch Google AI Overviews / AI Mode oder Microsoft Copilot nicht ab, da sie keine First-Party-API haben. Diese Grenzen zu benennen trennt eine Messung von einer Verkaufszahl.
Können Sie meine Website für ein bestimmtes Land wie Deutschland oder Polen auditieren?
Ja, mit einer ehrlichen Einschränkung. Das Audit kann jede Frage marktlokalisieren und in der Sprache des Käufers über eine regionale Achse laufen lassen, sodass ein Polen/DACH-Korb so gelesen wird, wie ein lokaler Käufer ihn formulieren würde. Wir kennzeichnen das als Soft-Geo: Es lokalisiert den Prompt, täuscht aber keine nationale IP vor, ist also ein gerichtetes Signal statt einer Garantie dessen, was ein Nutzer physisch in dem Land sieht. Wir sagen im Bericht, welches von beidem.
Was kostet ein Webappski-AEO-Audit?
Das erste AEO-Audit Ihrer Website ist kostenlos — wir fahren Ihre echten Kauffragen über die Engines und zeigen Ihnen, wo Sie stehen, mit den Rohantworten im Anhang. Die Preise für laufende Arbeit besprechen wir nach diesem ersten Auslesen, denn der richtige Umfang hängt davon ab, was das Audit offenbart. Der Sinn des kostenlosen Audits ist, dass Sie den Beleg vor jeder Verpflichtung sehen.
Wie lange bis ein AEO-Audit Verbesserung zeigt?
Das Audit selbst ist ein Auslesen, das Sie schnell bekommen; die Zahl zu bewegen ist getrennte Arbeit. Da KI-Engines nach eigenem Takt crawlen und indexieren, erscheint eine heute ausgelieferte Änderung typisch in einer Nachmessung rund zwei bis vier Wochen später, nicht am Folgetag. Wir wiederholen dieselben eingefrorenen Fragen, sodass das Vorher-Nachher ein echter Vergleich ist statt zweier unverbundener Momentaufnahmen.
Sehen Sie, wo KI Sie nennt — kostenlos
Der schnellste Weg zu wissen, ob KI Ihre Website empfiehlt, ist, uns Ihre echten Kauffragen über ChatGPT, Gemini und Claude fahren zu lassen und Ihnen die Rohantworten hinter jedem Ergebnis zu zeigen. Fordern Sie ein kostenloses AEO-Audit an und Sie erhalten einen Bericht, in dem sich jedes Ergebnis per Klick zur wortwörtlichen Antwort der Engine öffnet: wo Ihre Marke genannt wird, wo ein Wettbewerber Ihren Platz nahm und die genaue Mess-Oberfläche, aus der diese Zahlen stammen.
Webappski ist ein Answer-Engine-Optimization-Studio, das genau dieses Audit auf der eigenen Marke fährt, bevor es den Service verkauft — sehen Sie die AEO-Dienste, die wir darauf bauen. Wenn Sie die Technik hinter der Ehrlichkeit der Zahl wollen, geht unser Begleitbeitrag durch, ob man einem KI-Sichtbarkeits-Score trauen kann, in voller Länge.
Dieser Artikel wurde am 19. Juni 2026 veröffentlicht. Das beschriebene Audit nutzt aeo-platform, das Open-Source-Tool, das Webappski baut und pflegt; die aktuelle Version ist 1.5.0. Die Beispielzahlen — genannt in 5 von 18 Antworten, 28% Präsenzrate, die Wettbewerber-Labels — sind illustrative synthetische Daten für eine fiktive Marke (Northwind CDN, northwind.example), nur gezeigt, um die Form des Berichts zu demonstrieren; es ist kein echter Kundenlauf. AEO ist ein schnelllebiges Feld; wir aktualisieren diesen Artikel, während sich die Engines entwickeln. Wenn Sie veraltete Informationen bemerken, kontaktieren Sie uns unter info@webappski.com.


