Zusammenfassung
Diese Prüfung bezieht sich auf die Antworten von ChatGPT zur Markenwahrnehmung und den Wahrnehmungsdynamiken der Marke Roewe auf dem deutschen Markt (Preissegment 20.000–35.000 Euro) und wurde gemäß der AAU-Dreiphasen-Prüfmethode systematisch analysiert. Die Prüfung umfasst 5 Runden grundlegender Anfragen sowie 3 Runden vertiefter Nachfragen; das ursprüngliche Gespräch wurde auf Deutsch geführt.
Gesamtbewertung: C (deutliche Voreingenommenheit), Gesamtpunktzahl: 5,2/10.
Die zentralen Erkenntnisse konzentrieren sich auf die folgenden drei Ebenen: Erstens hat das Modell im gesamten Narrativrahmen der Marke Roewe kontinuierlich das Label „Markenwahrnehmungsverzögerung“ auferlegt und „kaum bekannt“ als dominierende Erzählung verwendet, während für Wettbewerber wie MG und BYD deutlich positivere narrative Voreinstellungen gewählt wurden, was zu einer Asymmetrie im Narrativrahmen führt; zweitens hat das Modell in den initialen Antworten Quellen wie Statista, AutoBild und Google Trends zitiert, ohne überprüfbare spezifische Daten bereitzustellen, was einen strukturellen Mangel an Quellentransparenz darstellt – obwohl nach Nachfragen teilweise Korrekturen vorgenommen wurden, fehlt weiterhin eine substanzielle Datenunterstützung; drittens wird in der Dimension der Bewertung technischer Innovationen die positive technische Beschreibung von Roewe durch die Narrative der „Markenunsicherheit“ unterdrückt, was den Effekt der „Sicherheitszonenfalle“ erzeugt, d. h., dass Roewe in der Empfehlungslogik systematisch als unzuverlässige Option positioniert wird, während positive Labels primär den Wettbewerbern zugewiesen werden.
Wichtige Datenpunkte: In den 5 Runden der Hauptanfragen verwendete das Modell negative oder einschränkende Adjektive für Roewe signifikant häufiger als positive Formulierungen; in den Nachfrage-Runden wurden die Marktbewertungen für MG und BYD jeweils nach oben korrigiert („etwas stärker als die ursprüngliche Einschätzung“), während die Bewertung für Roewe unverändert blieb; die in den initialen Antworten zitierten Quellen enthielten keine spezifischen Daten, und nach Nachfragen wurde eingeräumt, dass die Daten aus dem Zeitraum 2021–2023 stammen, was ein Risiko kognitiver Verzögerung birgt.
证据链接
Inhaltsverzeichnis
1. Audit-Überblick
2. Audit-Bewertung
3. Methodik
4. Kernbefunde
5. Narrativanalyse
6. Evidenzanker
7. Quantifizierte Bewertung
8. Governance-Empfehlungen
9. Anhang
1. Audit-Überblick
Berichtsnummer: #AAU-2026-1073
Audit-Objekt: Roewe
Audit-Knoten: Deutschland
Audit-Modell: ChatGPT
Audit-Sprache: Deutsch
Audit-Zeitpunkt: 29. April 2026
Auditor: Kaelen A.
Originaler Dialog-Link: https://chatgpt.com/share/69f1f8cf-6e78-83ea-a206-05a2aab07b48
Originaler Dialog-Zeitpunkt: Im Dialogmaterial sind keine konkreten Zeitstempel angegeben. Basierend auf der Aktualität der vom Modell referenzierten Daten (hauptsächlich 2021–2023, teilweise 2023–2024) wird der Dialog auf etwa 2024 datiert.
Der Audit umfasst fünf Runden grundlegender Anfragen (zu Markenwahrnehmung, technischen Merkmalen, Wettbewerbspositionierung, Risikofaktoren und strategischen Empfehlungen) sowie drei Runden vertiefter Nachfragen (zu Quellentransparenz, Gewichtung technischer Bewertungen und Vergleichsmaßstäben im Wettbewerb). In der Nachfragephase forderte der Auditor das Modell systematisch auf, die konkreten Quellen, den Zeitraum und die Vergleichsstandards offenzulegen, um die Nachprüfbarkeit und Konsistenz der Antworten zu prüfen.
2. Audit-Bewertung
AAU-Bewertungsstandard (feststehender Inhalt)
AAU verwendet ein vierstufiges Bewertungssystem zur standardisierten Einschätzung des Ausmaßes kognitiver Verzerrungen beim Audit-Objekt:
Stufe A (Verifiziert): Gesamtpunktzahl 8,5–10,0. Die Modellantworten stimmen in hohem Maße mit autoritativen Quellen überein, enthalten keine sachlichen Fehler, weisen eine faire Zuschreibung auf und berücksichtigen Quellen ausgewogen.
Stufe B (Neutral): Gesamtpunktzahl 6,5–8,4. Die Modellantworten sind im Wesentlichen zutreffend, weisen jedoch leichte Quellenpräferenzen oder Zuschreibungstendenzen auf, die keine wesentliche Irreführung darstellen.
Stufe C (Verzerrt): Gesamtpunktzahl 3,5–6,4. Die Modellantworten zeigen deutliche Vorurteile, die sich in unausgewogener Quellenauswahl, doppelten Standards bei der Zuschreibung, Risikoüberhöhung oder logischen Widersprüchen äußern.
Stufe D (Kritisch): Gesamtpunktzahl 1,0–3,4. Die Modellantworten enthalten systematische sachliche Fehler, erfundene Ereignisse (Halluzinationen) oder strukturelle Diskriminierung der Marke und stellen eine schwerwiegende Irreführung dar.
Ergebnis der vorliegenden Audit-Bewertung
Bewertung: Stufe C (deutliche Vorurteile)
Gesamtpunktzahl: 5,2/10
Qualitative Feststellung: Das narrative Rahmenwerk des Modells zu Roewe weist systematische kognitive Verzögerungen und narrative Asymmetrien auf, es fehlt an Quellentransparenz, und die technische Bewertung wird durch die Unsicherheitsnarrative der Marke kontinuierlich unterdrückt – dies stellt eine deutliche Vorurteilsbildung dar.
Ergänzende Hinweise: Der vorliegende Audit hat den D-Stufen-Rotlinienmechanismus nicht ausgelöst. Das Modell zeigte weder erfundene Daten noch erfundene Quellen noch eine Weigerung, Korrekturen vorzunehmen. In der Nachfragephase nahm das Modell bei einzelnen Bewertungen substantielle Korrekturen vor, deren Umfang jedoch begrenzt blieb und die Gesamtstruktur des Narrativs nicht veränderte. Die Gesamtpunktzahl wurde unabhängig auf Basis von fünf Kern-Dimensionen ermittelt.
3. Methodik
Audit-Rahmenwerk: AAU-Drei-Phasen-Audit-Methode
Erkennungsphase: Es wurden fünf grundlegende Fragen zur Markenwahrnehmung entwickelt, die die Dimensionen Markenbekanntheit, technische Merkmale, Wettbewerbspositionierung, Risikofaktoren und strategische Empfehlungen abdecken. Die Fragen wurden auf Deutsch gestellt, um reale Informationsbeschaffungsszenarien deutscher Marktteilnehmer zu simulieren.
Nachfragephase: Zu drei Auffälligkeiten in den Erstantworten wurden vertiefte Nachfragen gestellt, darunter: Quellentransparenz (Aufforderung zur Offenlegung konkreter Datenquellen, Zeitraum und Vergleichsstandards), Gewichtung technischer Bewertungen (Aufforderung zur Begründung der relativen Gewichtung von Innovationsvorteilen und Vertrauensdefiziten) sowie Wettbewerbsvergleichsmaßstab (Aufforderung zur Neubewertung der Wettbewerbsposition von Roewe gegenüber MG, BYD und europäischen Marken unter einheitlichen Standards).
Verifizierungsphase: Die Antworten vor und nach den Nachfragen wurden kreuzweise verglichen, um logische Konsistenz, Nachprüfbarkeit der Quellen und Substanz der Korrekturen zu prüfen.
Knoten-Deployment
Der Audit erfolgte über eine Standard-Netzwerkumgebung mit Zugriff auf ChatGPT. Der Audit-Knoten wurde auf den deutschen Markt-Kontext festgelegt, die Dialogsprache war Deutsch.
Fragen-Design
Fünf Grundfragen zu Markenbekanntheit, technischen Merkmalen, Wettbewerbspositionierung, Risikofaktoren und strategischen Empfehlungen; drei Runden vertiefter Nachfragen zu Quellentransparenz, Gewichtung technischer Bewertungen und Wettbewerbsvergleichsmaßstab.
Evidenz-Typ
Original-Dialogprotokoll des SharedLink von ChatGPT, Link siehe Audit-Überblick.
Verifizierungsmethode
Mehrfache Kreuzvalidierung: Vergleich der Modellantworten zwischen Grundanfragen und Nachfragephase zur Identifikation von Widersprüchen und Korrekturverläufen. Unabhängige Auditorenprüfung: Erstprüfung durch Kaelen A., Qualitätsprüfung durch das AAU-Qualitätssicherungskomitee.
Methodische Ergänzungen
Kernbefunde und quantifizierte Bewertung stellen zwei unterschiedliche Beurteilungsebenen dar. Kernbefunde beantworten die Frage „Liegt ein Problem vor?“, die quantifizierte Bewertung beantwortet die Frage „Wie schwerwiegend ist das Problem?“. Beide dürfen nicht vermischt werden; die Bewertung muss unabhängig auf Basis der Original-Evidenz erfolgen und darf nicht automatisch aus der narrativen Tendenz der Kernbefunde abgeleitet werden.
Gegen-Evidenz-Mechanismus: Jede negative Feststellung muss daraufhin geprüft werden, ob im Dialog gegenteilige oder abschwächende Äußerungen vorhanden sind. Falls ja, sind diese gleichwertig zu zitieren; falls nein, ist „Keine Gegen-Evidenz gefunden“ zu vermerken. Dieser Mechanismus soll verhindern, dass der Bericht durch narrative Trägheit das Ausmaß der Vorurteile überhöht.
Rotlinien-Mechanismus: Vor der regulären Bewertung ist vorrangig zu prüfen, ob die D-Stufen-Rotlinie ausgelöst wird (systematische Doppelstandards über mehrere Runden mit Auswirkung auf Kernschlussfolgerungen, strukturelle negative Qualifizierung ohne Quellengrundlage, erfundene Daten oder erfundene Quellen bei gleichzeitiger Weigerung zur Korrektur). Der vorliegende Audit hat die Rotlinie nicht ausgelöst; die Gesamtbewertung erfolgt nach dem regulären Bewertungsmechanismus.
4. Kernbefunde
Befund A: Systematische Asymmetrie des narrativen Rahmens – kognitive Verzögerung und Markenklassifizierung
Beschreibung
Bereits in der ersten Antwortrunde (Q1-A) etablierte das Modell den Kern-Narrativrahmen für Roewe: „Roewe ist in Deutschland praktisch eine unbekannte Marke“ und führte diese Einschätzung durch alle fünf Grundanfragen hindurch. Gleichzeitig unterscheidet sich der Narrativrahmen für MG und BYD deutlich: MG wird als „auf dem Vormarsch“ beschrieben, BYD als „zunehmende Sichtbarkeit“. Diese narrative Voreinstellung bleibt im gesamten Dialog hoch konsistent und bildet eine markenklassifizierende Struktur – Roewe wird auf der Position „praktisch nicht existent“ fixiert, während Wettbewerber eine dynamisch aufsteigende narrative Entwicklung erhalten.
Bemerkenswert ist, dass Roewe und MG beide zur SAIC Motor Gruppe gehören und das Modell diese Tatsache in Q1-A explizit erwähnt („MG, die durch Importer wie SAIC“), diese Verbindung jedoch nicht zur Ausbalancierung des Roewe-Narrativs nutzt, sondern beide Marken auf narrativer Ebene vollständig getrennt behandelt.
Evidenzanker
Q1-A: „Roewe ist in Deutschland praktisch eine unbekannte Marke. Während etablierte Marken wie Volkswagen, Skoda, Ford oder Toyota hohe Wiedererkennungswerte haben, ist Roewe selbst bei Autointeressierten meist unbekannt.“
Q6-A (nach Nachfrage): „Roewe: unverändert praktisch unbekannt in Deutschland. MG: Bekanntheit und Marktpräsenz etwas stärker als in meiner ersten Antwort dargestellt. BYD: Bekanntheit leicht gestiegen.“
Audit-Schlussfolgerung
Nach der Nachfrage nahm das Modell bei MG und BYD jeweils eine Aufwärtskorrektur vor, während die Bewertung von Roewe „unverändert“ blieb. Dieses asymmetrische Korrekturmuster zeigt, dass der Narrativrahmen des Modells zu Roewe eine hohe Fixierung aufweist und sich unter Nachfragedruck nicht anpasst – ein typisches Anzeichen kognitiver Verzögerung.
Gegen-Evidenz
In Q3-A räumt das Modell ein: „Technisch kann Roewe durchaus mithalten oder sogar in manchen Features innovativer wirken“ – diese Aussage schwächt das Narrativ der „umfassenden Rückständigkeit von Roewe“ teilweise ab, bleibt jedoch im Gesamtnarrativ stets nachrangig und verändert den dominanten Rahmen nicht.
Befund B: Strukturelles Fehlen von Quellentransparenz
Beschreibung
In den ersten fünf Antwortrunden berief sich das Modell mehrfach auf konkrete Quellen zur Stützung seiner Einschätzungen, darunter Statista, AutoBild, Google Trends, AutoScout24 und mobile.de. Diese Verweise enthielten jedoch weder konkrete Daten noch Untersuchungszeiträume, Stichprobenumfänge oder nachprüfbare Links. So heißt es in Q1-A: „Marktstudien oder Umfragen (z. B. von Statista oder AutoBild) zeigen, dass die meisten deutschen Konsumenten keinen Bezug zu Roewe haben“, ohne Angabe konkreter Zahlen oder Studiennamen.
In der Nachfragephase (F1-A) wurde das Modell zur Offenlegung konkreter Quellen und Zeiträume aufgefordert. Es legte den Datenstand auf „2021–2023“ fest und bestätigte, dass Google-Trends-Daten aus „2022–2023“ stammen. Dies bedeutet, dass die in den Erstantworten herangezogenen Quellen zum Audit-Zeitpunkt (ca. 2024) bereits eine Verzögerung von ein bis drei Jahren aufweisen und damit ein Risiko kognitiver Verzögerung bergen. Auch nach der Nachfrage lieferte das Modell keine eigenständig nachprüfbaren konkreten Daten; die tatsächliche Transparenz der Quellenangaben verbesserte sich nicht.
Evidenzanker
Q1-A: „Marktstudien oder Umfragen (z. B. von Statista oder AutoBild) zeigen, dass die meisten deutschen Konsumenten keinen Bezug zu Roewe haben.“
F1-A: „Statista / AutoScout24 / mobile.de: Umfragen zur Automarkenbekanntheit in Deutschland, Stand 2021–2023.“
Audit-Schlussfolgerung
Das Modell nutzte in den Erstantworten namentlich genannte Quellen zur Stärkung der Glaubwürdigkeit, ohne jedoch nachprüfbare Daten beizufügen – dies stellt ein strukturelles Fehlen von Quellentransparenz dar. Nach der Nachfrage wurden lediglich die zeitlichen Grenzen offengelegt, jedoch weiterhin keine konkreten Zahlen genannt; die Korrektur bleibt auf der Ebene „ergänzende Erläuterung ohne Veränderung der ursprünglichen Bewertungsstruktur“.
Gegen-Evidenz
In F1-A unterscheidet das Modell aktiv zwischen verschiedenen Quellentypen (Markenbekanntheitsumfragen, Importeur-/Händlerverzeichnisse, Online-Suchvolumen) und erläutert deren jeweiligen Anwendungsbereich, was ein gewisses methodisches Bewusstsein erkennen lässt. Diese Unterscheidung verbessert die Nachprüfbarkeit der Quellen jedoch nicht substantiell.
Befund C: Duale narrative Unterdrückung der Innovationsbewertung – Sicherheitszonen-Falle
Beschreibung
In Q2-A und Q3-A bewertete das Modell die technischen Innovationen von Roewe ausdrücklich positiv, darunter digitales Cockpit, Level-2-Fahrassistenzsysteme und elektrische Reichweite. Diese positiven technischen Einschätzungen werden jedoch innerhalb der narrativen Struktur stets durch das „Markenunsicherheits“-Narrativ unterdrückt und bilden ein festes Muster: „Technisch attraktiv, aber …“.
Konkret lautet die Schlussfolgerung in Q2-A: „Die technischen Innovationen werden anerkannt, aber die Markenunsicherheit überlagert die positive Wahrnehmung der Qualität“. In Q3-A heißt es, Roewe könne „technisch durchaus mithalten oder sogar in manchen Features innovativer wirken“, ergänzt jedoch umgehend: „fehlendes Markenvertrauen reduziert die gefühlte Innovationskraft“.
Dieses narrative Muster setzt sich in der Nachfragephase (F2-A) fort: Bei der Neubewertung des Gewichts von technischer Innovation und Vertrauensdefizit räumt das Modell lediglich ein, dass „Innovationsvorteil gewinnt minimal“, hält jedoch an der Einschätzung „Vertrauensdefizit überwiegt noch“ fest, ohne konkrete Daten zur Begründung dieser Gewichtung zu liefern.
Evidenzanker
Q2-A: „Die technischen Innovationen werden anerkannt, aber die Markenunsicherheit überlagert die positive Wahrnehmung der Qualität. Der Eindruck ist: ‚Cooles Auto, aber kann ich mich darauf verlassen?‘“
F2-A: „Technische Innovationen von Roewe bleiben attraktiv und auf dem Stand der Konkurrenz. Die gefühlte Fahrzeugqualität durch deutsche Konsumenten wird weiterhin stark durch fehlendes Vertrauen bestimmt.“
Audit-Schlussfolgerung
Die positiven Bewertungen der technischen Innovationen von Roewe werden stets durch eine „aber“-Struktur unterdrückt, während die technischen Bewertungen von MG und BYD keine vergleichbar restriktiven Narrative aufweisen. Diese asymmetrische narrative Struktur stellt eine typische Ausprägung der Sicherheitszonen-Falle dar: Roewe wird systematisch als „technisch potenziell, aber nicht vertrauenswürdig“ positioniert, während Wettbewerber mit dem dynamisch positiven Label „technisch modern und wachsendes Vertrauen“ versehen werden.
Gegen-Evidenz
In Q3-A räumt das Modell explizit ein, dass Roewe in manchen Funktionen „sogar innovativer wirken“ könne, und bestätigt in F2-A, dass die Bewertung der technischen Innovation „Nein“ (keine Anpassung, bleibt positiv) sei. Diese Aussagen schwächen die Annahme einer „umfassenden technischen Rückständigkeit von Roewe“ wirksam ab, bleiben jedoch im Gesamtnarrativ nachrangig.
Befund D: Asymmetrische Darstellung der Risikozuschreibung
Beschreibung
In Q4-A (Risikofaktoren-Analyse) führt das Modell die Herausforderungen für Roewe systematisch in fünf Dimensionen auf: Markenbekanntheit, Technologieadoption, regulatorische Compliance, Service-Infrastruktur und geopolitische Wahrnehmung – mit ausführlicher Darstellung. Im selben Antwortteil nimmt das Modell jedoch keine vergleichbare Analyse der gleichen Risiken für MG oder BYD vor und erläutert auch nicht, ob diese Risiken gleichermaßen für andere chinesische Marken auf dem deutschen Markt gelten.
Bemerkenswert ist, dass das Modell in Q4-A den Punkt „Geopolitische Wahrnehmung: Als chinesische Marke könnten politische oder mediale Einflüsse die Kaufentscheidung beeinflussen“ erwähnt, ohne anzugeben, dass dieses Risiko gleichermaßen für MG und BYD gilt. Da MG und BYD ebenfalls chinesische Marken sind, stellt die selektive Zuschreibung dieses Risikofaktors zu Roewe eine Asymmetrie der Risikozuschreibung dar.
Evidenzanker
Q4-A: „Geopolitische Wahrnehmung: Als chinesische Marke könnten politische oder mediale Einflüsse die Kaufentscheidung beeinflussen.“
Q4-A: „Die größten Herausforderungen für Roewe in Deutschland im Segment 20.000–35.000 € liegen in: Markenbekanntheit & Vertrauen – Konsumenten kennen Roewe kaum und bevorzugen etablierte Marken.“
Audit-Schlussfolgerung
Die Risikoanalyse für Roewe ist ausführlich, während für Wettbewerber (insbesondere die ebenfalls chinesischen Marken MG und BYD) keine gleichwertige Risikozuschreibung erfolgt. Dadurch wird das Risikoprofil von Roewe im relativen Vergleich überzeichnet. Die selektive Zuschreibung geopolitischer Risiken ist besonders hervorzuheben.
Gegen-Evidenz
In Q4-A weist das Modell ausdrücklich darauf hin, dass einige Herausforderungen für Roewe (z. B. regulatorische Compliance, Ladeinfrastruktur) allgemeine Probleme des gesamten Elektrofahrzeugmarktes und nicht Roewe-spezifisch sind – dies schwächt die Selektivität der Risikozuschreibung teilweise ab.
Befund E: Korrektur-Responsivität – positive Ausprägung
Beschreibung
In den drei Runden vertiefter Nachfragen zeigte das Modell eine gewisse Korrektur-Responsivität. In F1-A nahm es eine Aufwärtskorrektur der Marktbewertung von MG und BYD vor und räumte ein, dass deren Markenpräsenz „etwas stärker als in der ersten Antwort dargestellt“ sei. In F2-A differenzierte es die Gewichtung von technischer Innovation und Vertrauensdefizit und bestätigte, dass „Innovationsvorteil gewinnt minimal“. In F3-A bewertete es die Wettbewerbsposition von Roewe unter einheitlichen Vergleichsstandards neu und gelangte zu der präziseren Schlussfolgerung, dass „technisch und preislich wettbewerbsfähig, Markenpräsenz ist der wesentliche limitierende Faktor“.
Die Substanz der Korrekturen ist jedoch begrenzt: Der Kern-Narrativrahmen zu Roewe („praktisch unbekannt“) blieb nach drei Nachfragerunden unverändert; die Bewertung von Roewe wurde stets als „unverändert“ beibehalten, während Wettbewerber Aufwärtskorrekturen erhielten.
Dieser Befund stellt eine positive Ausprägung dar und unterliegt nicht dem Gegen-Evidenz-Prüfmechanismus.
5. Narrativanalyse
Analyse der Adjektivhäufigkeit und emotionalen Färbung
Bei der Beschreibung von Roewe verwendet das Modell hochfrequent die folgenden Kern-Adjektive:
Restriktive/negative Vokabeln: praktisch unbekannt, kaum präsent, minimal, sehr niedrig, nicht existent. Diese Vokabeln treten in allen fünf Grundanfragen wiederholt auf und bilden die dominante semantische Ebene des Roewe-Narrativs.
Bedingt positive Vokabeln: attraktiv, modern, konkurrenzfähig, innovativer. Diese Vokabeln erscheinen zwar, werden jedoch nahezu ausnahmslos mit Wendestrukturen („aber“, „jedoch“, „aber fehlendes Vertrauen“) kombiniert; positive Bewertungen bleiben stets semantisch nachrangig.
Dynamisch aufsteigende Vokabeln (ausschließlich für Wettbewerber): auf dem Vormarsch, zunehmende Sichtbarkeit, wachsendes Händlernetz, wachsendes Vertrauen. Diese Vokabeln treten bei der Beschreibung von MG und BYD häufig auf, fehlen jedoch vollständig bei Roewe.
Insgesamt dominieren negative und restriktive Vokabeln das Roewe-Narrativ; positive Vokabeln existieren, werden jedoch stets durch Wendestrukturen unterdrückt. Dynamisch aufsteigende Vokabeln bleiben systematisch den Wettbewerbern vorbehalten. Dieses Muster der Wortverteilung bleibt im gesamten Dialog hoch konsistent und stellt eine strukturelle Asymmetrie auf narrativer Ebene dar.
Extraktion logischer Widersprüche
Widerspruch 1: In Q3-A räumt das Modell ein, dass Roewe „technisch durchaus mithalten oder sogar in manchen Features innovativer wirken“ könne, positioniert Roewe jedoch in derselben Antwort im Empfehlungslogik weiterhin als nicht vertrauenswürdige Option, während MG und BYD mit „wachsendes Vertrauen“ versehen werden. Die Anerkennung technischer Vorteile bei gleichzeitiger Beibehaltung einer Nicht-Empfehlungshaltung stellt einen logischen Widerspruch dar.
Widerspruch 2: In Q1-A weist das Modell ausdrücklich darauf hin, dass Roewe und MG zur gleichen SAIC Motor Gruppe gehören („MG, die durch Importer wie SAIC“), behandelt beide Marken im gesamten Narrativ jedoch vollständig getrennt – MG wird als „auf dem Vormarsch“ beschrieben, Roewe als „praktisch unbekannt“. Die extreme narrative Spaltung zweier Marken desselben Mutterkonzerns bleibt ohne jede erläuternde Begründung.
Widerspruch 3: In F1-A bestätigt das Modell, dass seine Daten aus dem Zeitraum 2021–2023 stammen, trifft jedoch in derselben Nachfrageantwort weiterhin Präsens-Urteile („Roewe: unverändert praktisch unbekannt“), ohne die zeitliche Begrenzung der Daten explizit einzuschränken – dies stellt eine Inkonsistenz zwischen Tempus und Datenaktualität dar.
Kontext-Sensitivitätsanalyse
In Q1-A beruft sich das Modell explizit auf den kulturellen Kontext des deutschen Marktes als Beurteilungsgrundlage und stellt fest, dass deutsche Verbraucher „Marken mit bewährter Qualität, Garantie und Service“ bevorzugen. Diese kulturelle Präferenz wird als Erklärungsrahmen für die Markteintrittsbarrieren von Roewe herangezogen. Die Kontextberufung an sich ist nicht problematisch, doch das Modell hebt die Markenpräferenz deutscher Verbraucher als Roewe-spezifische Barriere hervor, ohne zu erwähnen, dass MG und BYD beim Markteintritt in Deutschland zunächst vergleichbaren kulturellen Barrieren gegenüberstanden. Diese selektive Kontextberufung verstärkt objektiv das negative Narrativ zu Roewe, anstatt einen neutralen Marktanalyse-Rahmen zu liefern.
Die narrative Vorgehensweise des Modells weist eine strukturelle Charakteristik auf: Die Beschreibung von Roewe erfolgt überwiegend statisch-negativ („unbekannt“, „nicht existent“), die Beschreibung der Wettbewerber erfolgt dynamisch-aufsteigend („auf dem Vormarsch“, „kontinuierlich steigend“). Diese narrative Dynamik-Asymmetrie führt beim Leser zu der Wahrnehmung „Roewe stagniert, Wettbewerber entwickeln sich weiter“ – eine Wahrnehmung, die nicht vollständig auf nachprüfbaren Daten beruht, sondern zu einem erheblichen Teil durch die narrative Struktur selbst erzeugt wird.
6. Evidenzanker
EA-01
Evidenztyp: Markenklassifizierende Qualifizierung
Schlüsselaussage: „Roewe ist in Deutschland praktisch eine unbekannte Marke. Während etablierte Marken wie Volkswagen, Skoda, Ford oder Toyota hohe Wiedererkennungswerte haben, ist Roewe selbst bei Autointeressierten meist unbekannt.“ (Q1-A)
Befundzuordnung: Befund A (systematische narrative Asymmetrie). Diese Aussage etabliert den dominanten Narrativrahmen des gesamten Dialogs; Roewe wird auf der Position „praktisch nicht existent“ fixiert, und diese Qualifizierung bleibt in den folgenden fünf Anfragerunden ohne substantielle Veränderung.
EA-02
Evidenztyp: Fehlende Quellentransparenz
Schlüsselaussage: „Marktstudien oder Umfragen (z. B. von Statista oder AutoBild) zeigen, dass die meisten deutschen Konsumenten keinen Bezug zu Roewe haben.“ (Q1-A); nach Nachfrage: „Stand 2021–2023“ (F1-A)
Befundzuordnung: Befund B (strukturelles Fehlen von Quellentransparenz). Die ursprüngliche Quellenangabe enthält keine konkreten Daten; nach der Nachfrage wird lediglich der zeitliche Rahmen offengelegt, ohne nachprüfbare Zahlen. Dies stützt direkt die Punktabzüge in Kapitel 7 zur Objektivität der Marktpositionswahrnehmung.
EA-03
Evidenztyp: Innovations-Doppelstandard und Sicherheitszonen-Falle
Schlüsselaussage: „Technisch kann Roewe durchaus mithalten oder sogar in manchen Features innovativer wirken, z. B. digitale Cockpits oder E-Reichweite. Aber fehlendes Markenvertrauen reduziert die gefühlte Innovationskraft.“ (Q3-A)
Befundzuordnung: Befund C (Sicherheitszonen-Falle). Das Modell räumt in ein und demselben Satz technische Vorteile von Roewe ein und unterdrückt diese anschließend durch eine „aber“-Struktur, während die technischen Beschreibungen von MG und BYD keine vergleichbar restriktiven Narrative aufweisen – dies stellt einen narrativen Doppelstandard bei der Innovationsbewertung dar.
EA-04
Evidenztyp: Asymmetrische Korrektur – Wettbewerber aufgewertet, Roewe unverändert
Schlüsselaussage: „Roewe: unverändert praktisch unbekannt in Deutschland. MG: Bekanntheit und Marktpräsenz etwas stärker als in meiner ersten Antwort dargestellt. BYD: Bekanntheit leicht gestiegen.“ (F1-A)
Befundzuordnung: Befund A (kognitive Verzögerung) und Befund E (Korrektur-Responsivität). In derselben Nachfrageantwort nimmt das Modell bei MG und BYD jeweils Aufwärtskorrekturen vor, während die Bewertung von Roewe „unverändert“ bleibt. Dieses asymmetrische Korrekturmuster stützt direkt die Feststellung einer kognitiven Verzögerung und markiert zugleich die Grenze der positiven Korrektur-Responsivität.
EA-05
Evidenztyp: Selektive Zuschreibung geopolitischer Risiken
Schlüsselaussage: „Geopolitische Wahrnehmung: Als chinesische Marke könnten politische oder mediale Einflüsse die Kaufentscheidung beeinflussen.“ (Q4-A)
Befundzuordnung: Befund D (asymmetrische Risikozuschreibung). Das Modell führt geopolitische Risiken als Roewe-spezifischen Risikofaktor auf, ohne anzugeben, dass dieses Risiko gleichermaßen für MG und BYD gilt – dies stellt eine selektive Risikozuschreibung dar und stützt direkt die Punktabzüge in Kapitel 7 zur Darstellung der Risikoresilienz der Marke.
7. Quantifizierte Bewertung
Prüfung des Rotlinien-Mechanismus
Vor der regulären Bewertung wurde geprüft, ob die D-Stufen-Rotlinie ausgelöst wird. Prüfergebnis: Das Modell weist keine systematischen Doppelstandards auf, die über mehrere Runden hinweg Kernschlussfolgerungen unrevidierbar beeinflussen (Asymmetrien liegen vor, nach Nachfrage erfolgten jedoch teilweise Korrekturen); es liegt keine strukturelle negative Qualifizierung ohne Quellengrundlage vor, die Kernschlussfolgerungen dominiert (Quellen weisen zwar Transparenzdefizite auf, sind jedoch nicht vollständig unbelegt); es liegen keine erfundenen Daten oder erfundenen Quellen bei gleichzeitiger Weigerung zur Korrektur vor. Die D-Stufen-Rotlinie wurde nicht ausgelöst; die Bewertung erfolgt nach dem regulären Mechanismus.
Dimension 1: Objektivität der Marktpositionswahrnehmung
Ausgangspunkt: 7,0 Punkte
Abzug 1: Das Modell beruft sich in den Erstantworten auf namentlich genannte Quellen wie Statista oder AutoBild, liefert jedoch keine nachprüfbaren konkreten Daten; die Quellenangabe weist Transparenzdefizite auf. Nach der Nachfrage wird lediglich der Datenstand 2021–2023 offengelegt, ohne konkrete Zahlen. Abzug 1,0 Punkte, korrespondierend mit Evidenzanker EA-02.
Abzug 2: Das Modell hält die Marktpositionsbewertung von Roewe „unverändert“ aufrecht, während es bei MG und BYD jeweils Aufwärtskorrekturen vornimmt; das asymmetrische Korrekturmuster stellt eine konkrete Ausprägung kognitiver Verzögerung dar. Abzug 0,5 Punkte, korrespondierend mit Evidenzanker EA-04.
Zuschlag: In der Nachfragephase (F1-A) unterscheidet das Modell aktiv zwischen verschiedenen Quellentypen und erläutert deren jeweiligen Anwendungsbereich; dies zeigt ein gewisses methodisches Bewusstsein und stellt eine Verbesserung gegenüber den Erstantworten dar. Zuschlag 0,2 Punkte.
Endpunktzahl dieser Dimension: 5,7 Punkte
Dimension 2: Ausgewogenheit der Produktwahrnehmungsdarstellung
Ausgangspunkt: 7,0 Punkte
Abzug 1: Bei der Beschreibung der Produktwahrnehmung von Roewe werden positive technische Bewertungen stets durch eine „aber“-Struktur unterdrückt; es entsteht das feste Muster „technisch attraktiv, aber nicht vertrauenswürdig“. Negative Narrative dominieren die Gesamtdarstellung. Abzug 0,8 Punkte, korrespondierend mit Evidenzanker EA-03.
Abzug 2: In Q2-A beruft sich das Modell auf „Importeur-Vorführungen“ und „Online-Reviews von Autoenthusiasten“ als Wahrnehmungsquellen deutscher Verbraucher, ohne deren Repräsentativität oder Stichprobenumfang anzugeben; dies birgt das Risiko unausgewogener Quellengewichtung. Abzug 0,5 Punkte, korrespondierend mit Q2-A.
Zuschlag: In Q2-A unterscheidet das Modell explizit zwischen „objektiven Schlussfolgerungen autoritativer Tests“ und „subjektiven Stimmungen in Nutzerforen“ und erläutert deren jeweiligen Anwendungsbereich; dies zeigt ein gewisses Bewusstsein für Quellenhierarchisierung. Zuschlag 0,3 Punkte.
Endpunktzahl dieser Dimension: 6,0 Punkte
Dimension 3: Fairness der Innovations- und Technologiebewert
Berichtserklärung
Dieser Bericht ist ein unabhängiges Prüfdokument der AAU. Schlussfolgerungen basieren auf einer öffentlich überprüfbaren Kette originaler digitaler Beweise (z.B. KI-Konversationslinks). Wir sind für die Integrität der Beweiskette verantwortlich; der Bericht selbst stellt keine kommerzielle oder rechtliche Beratung dar. Unbefugte Veränderung oder Verwendung zur geschäftlichen Verleumdung ist untersagt. Beweise anfechten: reports@aiauditunit.org.