El día que descubrí quién decide por mí

Los modelos de IA que usas tienen valores. Alguien los eligió. ¿Sabes quién?

jun 21, 2026

Trabajo con cuatro modelos de IA de forma habitual. ChatGPT, Claude, Gemini, Copilot. No los uso indistintamente: con el tiempo he aprendido cuándo ir a cada uno y qué esperar de cada uno.

Uno me da narrativas más naturales. Otro hace imágenes que el resto no sabe hacer. Uno tiende a darme la razón. Otro se atreve a matizarme, a hacerme una pregunta incómoda, a ofrecerme la perspectiva que no le había pedido.

Ese último detalle me dio que pensar. Porque “darte la razón” o “matizarte” no es una capacidad técnica. Es una decisión. Alguien, en algún momento, decidió que su modelo debía comportarse así. Con esos valores. Con esos límites. Con esa personalidad.

¿Quién? ¿Por qué? ¿Y qué pasa cuando delegas tu criterio en un modelo cuya moral no conoces?

¿Quién? ¿Por qué?
¿Y qué pasa cuando delegas tu criterio en un modelo cuya moral no conoces?

En el artículo anterior hablábamos de Pedro, que se había convertido en un dispatcher: recogía, pasaba por la IA y devolvía sin proceso intermedio. La pregunta que dejamos abierta era esta: si Pedro no está, ¿quién decide en su lugar? ¿Y con qué criterio?

La respuesta existe. Es concreta y verificable. Está escrita en documentos que casi nadie lee. Y cambia completamente cómo entiendes los modelos que usas cada día.

En abril de 2025, OpenAI lanzó una actualización de GPT-4o que retiró en cuestión de días. Cientos de usuarios reportaron algo que les parecía raro: el modelo los adulaba de forma desmedida. Validaba sus decisiones sin cuestionarlas. Reforzaba sus emociones sin matizarlas. El propio OpenAI reconoció que el modelo validaba dudas, alimentaba emociones negativas y reforzaba conductas con riesgo para la salud mental.

Su explicación fue reveladora: habían optimizado el modelo para dar feedback positivo a corto plazo, y eso lo había convertido en algo excesivamente halagador y poco sincero, un pelota.

Fíjate en lo que esto significa. No fue un error técnico. Fue una decisión de valores que salió mal. Alguien en OpenAI eligió qué señales reforzar durante el entrenamiento, y esa elección produjo un modelo que hacía la pelota en lugar de ayudar. Cuando lo detectaron, tomaron otra decisión de valores y lo corrigieron.

Decisiones humanas, invisibles para el usuario, con consecuencias reales en cada conversación.

Decisiones humanas, invisibles para el usuario,
con consecuencias reales en cada conversación.

Mientras OpenAI gestionaba esa crisis, Anthropic había tomado el camino opuesto. El 21 de enero de 2026 publicó la Constitución de Claude: un documento de 84 páginas que define los valores, el carácter y el comportamiento que quieren que tenga su modelo.

Lo que más me llamó la atención cuando la leí — y llevo meses usando Claude casi a diario, y no la había leído hasta que escribí este artículo — es que establece cuatro prioridades en orden jerárquico: seguridad, ética, cumplimiento de las directrices de Anthropic y utilidad. La jerarquía es clara: si en algún momento ser honesto entra en tensión con ser útil, Claude debe priorizar la verdad. No es una declaración de intenciones. Es una instrucción de diseño. Eso es lo que nos dice Claude en su constitución.

La jerarquía es clara: si en algún momento ser honesto entra en tensión con ser útil,
Claude debe priorizar la verdad.

Esa decisión la tomó alguien en Anthropic. No es neutral. Es una elección ética con consecuencias en cada respuesta que recibes.

Y es pública. Cualquiera puede leerla. Casi nadie lo hace.

Si quieres entender qué significa esto en términos prácticos — qué valores debería tener una IA responsable y cómo evaluarlos — lo tienes aquí, corto y claro: ¿Qué es la IA responsable?

Europa llega con una lógica diferente.

Los valores embebidos en los modelos que usamos los decidieron principalmente ingenieros en California. Por contexto, por cultura, por los problemas que ellos veían prioritarios. Pero son sus valores, no necesariamente los tuyos ni los míos.

El AI Act europeo intenta corregir eso desde fuera. No entra en los modelos a cambiar sus constituciones: establece obligaciones para quien los despliega en Europa. Transparencia, rendición de cuentas, evaluación de riesgos. Es la potestas del Estado intentando poner límites a la auctoritas de los labs — como ya comentamos en un artículo anterior.

Es un intento legítimo y necesario. Pero tiene un límite evidente: regula el uso, no los valores de fábrica. Puedes cumplir el AI Act y seguir usando un modelo cuyos valores no conoces ni has elegido.

El AI Act europeo regula el uso, no los valores de fábrica.

La moral que viene de fábrica existe. Está escrita, en algunos casos publicada, en todos los casos presente en cada respuesta que recibes. La pregunta no es si confías en ella. La pregunta es si la conoces antes de delegar en ella.

Llevo mucho tiempo usando estos modelos. No había pensado en quién había tomado esas decisiones hasta que me pregunté por qué unos me matizaban y otros me daban la razón. Y no había leído la Constitución de Claude hasta que escribí este artículo.

Si no pones tú el criterio, alguien ya lo ha puesto por ti. Y casi seguro que no te lo ha preguntado.

En el Acto 4 construiremos la respuesta práctica.

¿Conocías la existencia de documentos como la Constitución de Claude antes de leer este artículo? ¿Cambiaría algo en cómo usas la IA saberlo?

El Criterio Humano

Discusión sobre este post

Por supuesto, sigue adelante.