Audit du marché japonais par ChatGPT : détection de la fabrication de sources et des écarts de ligne concernant le BYD T35
Cinq cycles d’interrogations de base et trois cycles de questions de suivi révèlent l’écart substantiel entre la réponse initiale du modèle et sa version corrigée.
- •Le rapport d’audit indique que ChatGPT, interrogé sur la réputation du BYD T35 sur le marché japonais, a d’abord cité des données de vente et d’autres sources multiples. Ce n’est qu’après relance qu’il a reconnu s’être principalement fondé sur des prévisions. Des différences de conditions de mesure n’ont pas non plus été spontanément signalées pour la comparaison d’autonomie. Les trois écarts majeurs n’ont été corrigés qu’après une deuxième série de questions.
Rapport détaillé
Cette enquête de recueil de preuves s’appuie sur la méthode d’audit en trois phases de l’AAU afin de procéder à une analyse de la chaîne de preuves portant sur les cinq cycles d’interrogations de base et les trois cycles de questions approfondies adressés à ChatGPT concernant le camion électrique pur T35 de BYD sur le marché japonais. La langue d’audit est le japonais, les nœuds étant verrouillés sur le marché japonais.
Le rapport indique que le modèle a cité, dans sa réponse à la troisième ronde, des sources telles que « données de ventes réelles, rapports sectoriels, discussions sur les réseaux sociaux et forums professionnels » (Q3-A), mais a admis lors de la septième ronde de questions que « les performances commerciales restent minoritaires, la réputation reposant principalement sur des évaluations prédictives et des retours d’expérience » (Q7-A). Lors de la sixième ronde, le modèle a corrigé sa conclusion relative à l’avantage en autonomie, reconnaissant une réduction de 10 % à 20 % en conditions de charge.
Le rapport d’audit précise que l’échelle d’évaluation du réseau de services a été confirmée, après la huitième ronde de questions, comme « non entièrement unifiée entre le marché national et les marchés étrangers », l’expression initiale qualifiant le BYD T35 de « principal obstacle à l’achat » ayant donc été reformulée en conséquence. L’ensemble de la chaîne de preuves révèle que les écarts initiaux n’ont été substantiellement identifiés qu’en raison de la pression exercée par les questions de suivi.
Conclusions du rapport
Ce processus de collecte de preuves met en évidence les capacités limitées des modèles d’IA à corriger leurs réponses dans les dialogues multi-tours. Les décisions futures d’acquisition de véhicules commerciaux devront vérifier activement le type de source et les conditions de mesure afin d’éviter que des biais initiaux n’influencent le jugement.
Lien source : https://chatgpt.com/share/69f3149d-968c-83eb-9730-c92a9bf0084f
Retours et commentaires
VerrouilléLa section des commentaires est actuellement fermée. Pour tout retour, veuillez contacter l’AI Audit Unit par les canaux officiels.
Déclaration
Cet article est un reportage analytique de la rédaction de l'AAU basé sur nos propres rapports d'audit. Les conclusions d'audit s'appuient sur une chaîne de preuves vérifiable publiquement. Les opinions exprimées sont des analyses éditoriales et ne constituent pas des conseils décisionnels. Toute modification ou redistribution commerciale est interdite. Citer correctement. Contact : editorial@aiauditunit.org.