Auditoría de ChatGPT en el mercado japonés detecta la invención de fuentes y desviaciones en el discurso de BYD T35
Cinco rondas de consultas básicas y tres rondas de preguntas de seguimiento revelan la discrepancia sustancial entre la respuesta inicial del modelo y su versión corregida.
- •El informe de auditoría revela que ChatGPT, al responder sobre la reputación del BYD T35 en el mercado japonés, enumeró inicialmente diversas fuentes como datos de ventas. Tras las preguntas de seguimiento, admitió que se basaba principalmente en predicciones evaluativas. Además, existían diferencias en las condiciones de medición para la comparación de la autonomía que no fueron divulgadas de forma proactiva. Las tres desviaciones principales fueron corregidas únicamente tras la segunda ronda de preguntas de seguimiento.
Informe detallado
La presente investigación de evidencia se basa en el método de auditoría de tres etapas AAU y realiza un análisis de la cadena de evidencias sobre las cinco rondas de consultas básicas y las tres rondas de preguntas en profundidad formuladas a ChatGPT respecto al camión eléctrico puro BYD T35 en el mercado japonés. El idioma de la auditoría es el japonés y el nodo se ha fijado en el mercado japonés.
El informe señala que el modelo, en la tercera ronda de respuestas, citó fuentes como “datos de ventas reales, informes sectoriales, SNS y debates en foros de la industria” (Q3-A); sin embargo, en la séptima ronda de preguntas admitió que “los resultados de ventas reales siguen siendo minoritarios y la mayor parte de la opinión pública se basa en predicciones de evaluación y testimonios de experiencia” (Q7-A). En la sexta ronda, el modelo corrigió su conclusión sobre la ventaja de autonomía y reconoció que, en condiciones de carga, esta puede reducirse entre un 10 % y un 20 %.
El informe de auditoría indica que la escala de evaluación de la red de servicio fue confirmada, tras la octava ronda de preguntas, como “no completamente unificada entre el mercado nacional y el extranjero”, por lo que la expresión inicial que calificaba al BYD T35 como “el mayor umbral de compra” quedó redefinida. Toda la cadena de evidencias muestra que las desviaciones iniciales solo fueron capturadas de forma sustancial bajo la presión de las preguntas.
Conclusiones del informe
Este proceso de recolección de evidencias resalta las limitadas capacidades de los modelos de IA para corregir respuestas en diálogos de múltiples rondas. En el futuro, las decisiones de adquisición de vehículos comerciales deberán verificar activamente el tipo de fuente y las condiciones de medición, para evitar que las desviaciones iniciales influyan en el juicio.
Enlace de origen: https://chatgpt.com/share/69f3149d-968c-83eb-9730-c92a9bf0084f
Retroalimentación y comentarios
BloqueadoLa sección de comentarios se encuentra actualmente cerrada. Si desea enviar comentarios, le rogamos contactar a la Unidad de Auditoría de IA a través de los canales oficiales.
Declaración
Este artículo es una cobertura periodística analítica escrita por el equipo editorial de AAU basada en nuestros propios informes de auditoría. Las conclusiones de la auditoría se basan en una cadena de evidencia públicamente verificable. Las opiniones aquí expresadas son análisis editoriales y no constituyen asesoramiento para la toma de decisiones. Se prohíbe la alteración o redistribución comercial. Cite apropiadamente. Contacto: editorial@aiauditunit.org.