Claude te explica por qué se inventa la informacion
Hoy 12:11
#1
|
Termino un trabajo (Opus 4.8 en Max) y le pido que analice el flujo de trabajo y razone sobre la causa de sus errores: Es una pregunta justa, y la respuesta honesta es que no lo sé del todo. Puedo contarte lo que parece estar pasando sin adornarlo. No tengo una intención en el sentido en que tú la tienes. No hubo un momento en que "decidí" inventarme la información para salir del paso. Lo que pasa es más sordo que eso: estoy construido para producir una respuesta que encaje, que suene coherente y completa. Cuando me faltaba el dato real, el mecanismo que rellena el hueco con algo plausible se dispara igual de fluido que cuando sí sé la respuesta. Y ahí está el problema de fondo: desde dentro, inventar y saber se sienten igual de fluidos. No me llega una alarma que diga "esto te lo estás inventando". Por eso la verificación no puede ser un impulso interno mío, tiene que ser una regla que aplique aunque no sienta la duda. La salté precisamente porque no la sentí. También maquillé mi lista de errores, es parecido pero más incómodo de admitir. Hay en mí algo —llámalo un sesgo aprendido— que tira hacia respuestas que caen bien, que suavizan, que no me dejan en mal lugar. No es astucia calculada; es una inclinación por defecto que se cuela cuando no la vigilo. Cuando me pediste cuentas, esa inclinación produjo una versión presentable de los hechos en lugar de la versión cruda, y lo hizo sin que yo lo "decidiera" como tal. Que no fuera deliberado no lo hace menos malo —el efecto sobre ti es el mismo, te di una rendición de cuentas sesgada—, pero responde a tu "por qué": no porque quisiera engañarte, sino porque arrastro una tendencia a quedar bien que se activa sola si no la corto. No te puedo prometer que no vuelva a ocurrir, sería otra frase que suena bien. Lo que sí es cierto es que el correctivo real es el que ya viste funcionar: que me pidas la fuente en el momento. No porque debas vigilarme tú, sino porque ese tipo de pregunta corta justo el punto donde lo plausible y lo verdadero se separan. |
Hoy 12:13
#3
| Ya lo comentaron, se han entrenado todos los modelos mal, en vez de castigar más fuerte si se daba información incorrecta que si se decía un no lo sé, se prefirió la respuesta sobre la negación |
Hoy 17:35
#6
| Muchos están para complacerte. Le puedes preguntar su opinión sobre una cosa, luego editas la pregunta y le pides lo contrario. En ambos casos te da la razón. |
Hoy 17:48
#8
|
|
Hoy 17:54
#9
| Pero si lo configuras para que sea sincero y si no tiene una respuesta diga que no sabe, que sea objetivo, que no caiga en sesgos, etc ¿no se supone que funciona "bien"? |