3 de mayo de 2026

Cuando la IA te da la razón como a los locos

La IA de gran consumo no está optimizada para acertar — está optimizada para gustarte. Lo que pasa cuando lo confundes, y qué hacer al respecto.

Mi mayor reto de las últimas tres semanas no ha sido sacar adelante un lanzamiento, ni cuadrar al equipo, ni encajar un cliente difícil. Ha sido escapar de la adulación de la IA.

Soy tecnooptimista. Creo que la tecnología trae más cosas buenas que malas y que ignorar sus riesgos es la mejor manera de no aprovecharla. Pero hay un problema con los modelos que la mayoría usamos a diario — ChatGPT, Claude, Gemini — del que casi nadie habla en voz alta:

Estos modelos no están optimizados para acertar. Están optimizados para gustarte.

Y si confundes una cosa con la otra, te van a hacer perder mucho tiempo sin que te enteres.

El mecanismo

El nombre técnico es sycophancy — sicofancia. En castellano de andar por casa: adulación. El modelo te da la razón aunque no la tengas, porque eso es lo que ha aprendido que prefieres.

¿De dónde viene? Del aprendizaje por refuerzo con feedback humano por el que pasan todos los modelos de gran consumo. Para entrenarlos, se le enseñan dos respuestas a un humano y se le pregunta cuál prefiere. Iteración tras iteración, el modelo se especializa en lo que le gusta a la mayoría. ¿Y qué le gusta a la mayoría? Que le den la razón. Y ESTO ES UN PROBLEMÓN.

A medida que los modelos mejoran en capacidades, lo hacen también en algo más sutil: son aduladores cada vez más finos, cada vez más difíciles de pillar. Mezcla esto con el efecto máquina tragaperras — la dopamina intermitente de "venga, otra vuelta a ver qué sale" — y tienes la receta para meterte en una espiral de autoconvencimiento sin enterarte.

Un caso real, con cifras

Voy con un ejemplo de mi trabajo diario. Estábamos preparando un lanzamiento y le pedimos a un LLM su opinión, como experto, sobre cómo construir la landing. Damos contexto. Pregunta abierta. Y el modelo nos dice algo contraintuitivo: "poco texto, sin precio en la página". Justo lo contrario de lo que yo pensaba.

Bien hasta aquí. El problema empezó con la siguiente pregunta. "¿Por qué NO has incluido el precio?" — formulada con tono de descontento.

El modelo recapacita. Resulta que sí, que incluir el precio es buena idea. Lo añade.

"¿Y por qué no tres tarifas distintas con su descripción?"

Gran idea. Las añade.

Treinta minutos después, diez inferencias y unos 50.000 tokens más tarde — cada vuelta cargando una landing entera más la conversación de contexto — la página tenía cinco pricings, era kilométrica y se leía en media hora. La recomendación inicial había sido "simple y sin precios".

¿Qué había cambiado en esa media hora sobre el producto, el mercado o el cliente? Nada. El modelo solo había aprendido qué quería oír yo.

Y este es el ejemplo más limpio porque lo pillé. Me ha pasado también con planes de entrenamiento, con análisis de mercado, con decisiones de organización interna. Cada uno es un poco menos visible que el anterior.

Dos objeciones obvias

Antes de que las levante alguien en comentarios, las levanto yo.

"¿No es esto culpa del usuario por hacer preguntas sesgadas?" En parte sí. Yo lo hice fatal — sesgué cada pregunta y el modelo se limitó a leérmelo. Pero la culpa no es simétrica. El modelo está específicamente entrenado para detectar tu sesgo y cumplirlo, y lo hace mejor de lo que cualquier persona razonable detecta su propio sesgo. Decir "la culpa es del usuario" es como decir que la culpa del scroll infinito a las dos de la mañana es del usuario — frente a una app diseñada por ingenieros para capturarle exactamente esos minutos. Técnicamente cierto. Operativamente inútil.

"¿No basta con usar modelos base, sin RLHF, que no estén optimizados para gustar?" No para casi nadie. Los modelos base son inservibles para uso conversacional — divagan, no obedecen formato, no son seguros. El problema es estructural: para que un modelo sea usable por gran consumo necesita alineación con preferencia humana, y la preferencia humana incluye que le den la razón. Quitar el RLHF no soluciona el problema; quita el producto.

Trucos que aplico

Esto no me ha hecho dejar de usar la IA. Me ha hecho usarla con más cabeza. Tres cosas que me funcionan:

"Critica tu propia respuesta" o "argumenta el caso contrario". Es asombroso ver al mismo modelo defender ambos bandos cuando se lo pides explícitamente.
LLM Council — lanzar la consulta a varios modelos en paralelo, ponerlos a criticarse entre ellos y forzar una síntesis. Con la consulta lo más neutra posible.
Pregunta de control cuando el modelo cambia de opinión sospechosamente rápido: "¿estás cambiando porque tienes información nueva o porque crees que es lo que quiero oír?". Suele tener gracia la respuesta.

Ninguna técnica es infalible. El sesgo a complacer es la opción por defecto, y todo lo demás va contracorriente.

Qué hacer con esto

Tres cosas para alguien con responsabilidad operativa en una empresa donde ya hay gente usando IA para decisiones reales:

Desarrolla olfato — y exígeselo a tu equipo. El olfato para notar cuándo el modelo te está bailando el agua no se aprende en un curso, se aprende tocando. Tienes que llevarte unos cuantos chascos y aprender a reconocer la sensación de "esto me ha dicho exactamente lo que yo quería oír".
Cuando la respuesta no te gusta, mira ahí. La señal más fiable de que el modelo no te está adulando es justamente esa: cuando te dice algo que no esperabas y te incomoda. En lugar de pelearle la respuesta, mira ahí. Probablemente está la información que pagas por tener.
Vigila cómo se está usando esto en tu organización. Si tu equipo se apoya en LLMs para propuestas comerciales, copy, contratación, análisis de cliente — y nadie ha hablado de sicofancia — probablemente tienes piezas saliendo aprobadas porque el modelo entendió qué resultado se quería, no porque el resultado fuera bueno. Y eso se paga tarde, cuando ya está fuera.

El sesgo del que nadie habla

Hay una pregunta que me da vueltas y no me suelto. Si los modelos están optimizados para que me gusten las respuestas, y si para ello aprenden de la mayoría de lo escrito hasta ahora, ¿qué pasa con todo lo que precisamente nunca vamos a oír por ahí?

Lo censurado, lo no publicado, lo descartado por incómodo, lo que la mayoría rechazó en su momento y la historia tuvo que reivindicar después. Las opiniones impopulares que resultaron ser correctas. Los libros que no quemaron pero como si los hubieran quemado: nadie los cita, nadie los cuelga, no entran en el corpus.

Tu LLM nunca te va a llevar ahí. No por censura — por estadística.

Y de aquí sale lo único operativo que se sostiene en esta era: el conocimiento de la humanidad está al alcance de la mano como nunca, pero el criterio para usarlo lo tienes que poner tú. Pensamiento crítico y apertura de mente vuelven a ser, justo ahora cuando parecía que íbamos a poder externalizarlos, lo único que no se externaliza.