El día que dejé de explicarlo y empecé a demostrarlo

Una sesión con veintiocho profesionales, un canvas y una pared llena de preguntas que nadie esperaba.

jun 27, 2026

Entré al aula del máster de Ciencia de Datos de la EOI el jueves a las cinco de la tarde sin saber exactamente lo que iba a pasar.

Llevaba semanas preparando esta sesión. Cuatro artículos publicados. Un caso diseñado. Una mecánica de trabajo pensada hasta el detalle. Y aun así, en el pasillo antes de entrar, tuve un momento de duda real: ¿y si el canvas no funciona? ¿Y si los grupos llegan a las mismas conclusiones sin fricción y no hay nada que contar?

La duda es a veces más intensa cuanto más preparado te sientes.

Entré.

Había veintiocho personas sentadas. Ingenieros, economistas, gestores públicos, consultores, investigadores. Gente de Renfe, de Repsol, de Bosch, de ALIER, de Red.es, del Poder Judicial, del Banco Interamericano de Desarrollo. Una semana entera de máster a las espaldas. Era jueves por la tarde. Algunos llevaban días acumulando horas. Y se notaba.

Les hice una pregunta antes de abrir la presentación.

«¿Alguien tiene ya un criterio propio para decidir cuándo usar IA y cuándo no? No un marco teórico. Un criterio que aplique el lunes por la mañana al abrir el ordenador.»

Silencio. Alguna sonrisa incómoda. Nadie levantó la mano.

Ese es el problema. Y llevamos cuatro actos hablando de él.

Lo que propuse esa tarde no era una clase sobre IA responsable. Era construirla en tiempo real, con ellos, sobre un caso concreto.

La tesis que llevo defendiendo desde el Acto 1 es esta: la IA responsable debería estar en las tripas de los sistemas, no en los márgenes. En los valores que definen cómo se entrena un modelo. En las preguntas que se hacen antes de implantarlo. En las decisiones que se toman cuando algo falla. Todavía no lo está — en la mayoría de las organizaciones es un añadido, un apartado del informe de sostenibilidad, una diapositiva en la presentación del consejo.

La IA responsable debería estar en las tripas de los sistemas, no en los márgenes

Este es el momento de empujar para que esta situación cambie. Y eso no se demuestra con un framework. Se demuestra con veintiocho profesionales construyendo una herramienta real un jueves por la tarde.

Dividí la clase en dos grupos.

El Grupo A tenía que construir el canvas: una ficha con seis preguntas operativas — una por cada valor de IA responsable — más un criterio de puntuación para cada una. No solo la pregunta: también qué respuesta corresponde a cada color: verde, ámbar y rojo.

Antes de empezar comenté: hay más de doscientos marcos globales de IA responsable. La Comisión Europea tiene el suyo. Google tiene el suyo. La UNESCO tiene el suyo. No se ponen de acuerdo. No es como con los derechos humanos, que son universales. La IA responsable depende del contexto, de la cultura, del sector. Estos seis valores son una propuesta práctica, no una verdad universal. La tarea del Grupo A no era validarlos, era hacerlos operativos.

El Grupo B tenía que aplicar ese canvas a Printex Europa — una imprenta industrial ficticia con dos usos reales de IA: gestión de pedidos y optimización de stock — y tomar una decisión: ¿se implanta? ¿En qué condiciones?

*El caso Printex con los dos usos y la pregunta «¿se implanta?*

La mecánica seguía los principios del lean startup: los dos grupos trabajaban en paralelo, conectados por dos personas que comunicaban avances en tiempo real. El Grupo A no construía el canvas en abstracto — lo construía mientras el Grupo B lo usaba y le decía dónde fallaba.

El aula se reorganizó en minutos. Izquierda y derecha. Equipos con una tarea clara y un tiempo que empezaba a correr.

Lo que pasó a continuación fue lo que esperaba que pasara, y también lo que no esperaba.

El Grupo A se puso a trabajar de inmediato. Las preguntas de referencia estaban en su ficha, pero rápidamente las hicieron suyas. Para Transparencia dejaron de usar la pregunta modelo y concretaron algo más preciso: «¿En qué partes del proceso usáis la IA y para qué? ¿Están los afectados informados?» La diferencia parece pequeña. No lo es. La primera pregunta admite un sí o un no. La segunda obliga a pensar en cada paso del proceso.

Para Autonomía, pasó algo interesante: dos personas del Grupo A que habían trabajado por separado llegaron a la misma formulación de forma independiente. No en español. En inglés: «Human in the loop?»

No lo habían hablado entre ellos. Es la frase que circula en sus empresas, en sus reuniones, en sus proyectos reales. Ya estaba dentro. Y al escribirla en una ficha sobre un caso ficticio, la estaban aplicando mentalmente a su trabajo del lunes.

Para Responsabilidad, la pregunta que más les costó formular fue también la más honesta: ¿existe un responsable directo ante posibles problemas, con nombre y apellidos, con protocolo escrito? En verde: sí, y se actualiza. En ámbar: sí, pero no se actualiza. En rojo: no hay nadie.

Pocas empresas están en verde.

Y entonces llegó el momento que más me interesaba.

El Grupo B estaba aplicando a la empresa Printex el canvas que en ese mismo momento se estaba construyendo. Y dentro del propio grupo surgió el desacuerdo.

Para la gestión de pedidos, la evaluación fue relativamente ordenada. Criterios objetivos, GDPR cumplido, responsable identificado. Semáforo mayoritariamente verde con algún ámbar en Autonomía. Implantable con condiciones.

Para la optimización de stock, el resultado fue más incómodo. Transparencia: rojo — los gestores lo saben, pero los proveedores y los clientes no. Privacidad: rojo — sin consentimiento y sin protección de datos.

Pero uno de los momentos más interesantes de la tarde vino al hablar de Equidad. Uno de los grupos reconoció que en una primera fase de su modelo real los pequeños proveedores estaban infrarrepresentados en los datos. Lo detectaron. Lo corrigieron. Volvieron a evaluar hasta que el sesgo desapareció.

Eso no es rellenar una ficha. Es una empresa pensando en voz alta sobre algo que le pasó de verdad.

Y para Responsabilidad, en lugar de nombrar un responsable, escribieron algo que no estaba en ninguna pregunta del canvas: «Redactar la responsabilidad al gestor.»

No una evaluación. Una tarea. Para el lunes.

Ese momento no estaba previsto. Ocurrió porque la herramienta funcionó.

Y para Responsabilidad, en lugar de nombrar un responsable,
escribieron algo que no estaba en ninguna pregunta del canvas:
«Redactar la responsabilidad al gestor.»

Al final de la sesión pedí a cada persona que escribiera en un post-it la pregunta del canvas que le gustaría lanzar el lunes por la mañana en su empresa para valorar si una de sus aplicaciones de IA es responsable.

Los pegaron en la pared, debajo del valor que correspondía.

Me acerqué a mirarla antes de fotografiarla.

Autonomía y Responsabilidad concentraban la mayoría. Transparencia y Equidad, casi vacíos.

Ese dato no lo esperaba. Este grupo de profesionales con experiencia real no teme la transparencia. La da casi por resuelta. Lo que les quita el sueño es quién decide cuando la IA falla, y quién responde cuando algo sale mal.

Eso invierte la intuición habitual sobre IA responsable. La mayoría de los marcos empiezan por transparencia. Este grupo de veintiocho profesionales, aplicando una herramienta a un caso real, llegó a otra conclusión: el problema no es si la gente sabe que hay IA. El problema es si hay alguien que se haga cargo cuando la IA se equivoca.

El problema no es si la gente sabe que hay IA.
El problema es si hay alguien que se haga cargo cuando la IA se equivoca.

ALIER S.A. en Autonomía. Robert Bosch en Responsabilidad. Renfe en Transparencia. Empresas reales, preguntas reales, pegadas en una pared de un aula de la EOI un jueves por la tarde.

Eran las 18:59:55 cuando hice la foto.

Cuatro actos. Cuatro semanas. Una tesis que empezó como una frase — «ningún marco te dice qué hacer el lunes por la mañana» — y que ahora tiene forma de herramienta, de fichas rellenadas a mano, de post-its con nombres de empresa, de una pared que dice más sobre IA responsable que cualquier informe que haya leído este año.

El canvas existe. Las seis preguntas son públicas — las tienes en los artículos anteriores de esta serie. Cualquier equipo puede empezar a usarlas esta semana, sobre cualquier proyecto de IA, sin necesitar a nadie que se las explique.

La IA responsable no es un principio. Es una pregunta. Y cuando la pregunta es buena — concreta, operativa, dirigida a una situación real — la gente sabe responderla.

Lo que no saben todavía, en la mayoría de las organizaciones, es quién se hace cargo cuando la respuesta es roja.

Eso es lo que nos queda por resolver. Y eso, aunque todavía no tiene nombre, es lo que viene después.

Una función en cuatro actos, y lo que queda

Esta serie empezó con una pregunta que no tenía respuesta fácil: ¿qué es exactamente la IA responsable, y por qué nadie te dice qué hacer con ella el lunes por la mañana?

El primer artículo intentó definirla. El segundo la aterrizó en un caso concreto — Printex Europa, una imprenta industrial que quería implantar IA sin dar pasos en falso. Los tres actos que siguieron fueron algo distinto: la historia de cómo el criterio se puede delegar sin darte cuenta, de cómo los modelos que usas cada día tienen valores incorporados que no elegiste, y de lo que pasa cuando dejas de explicar todo esto y lo construyes con otros en tiempo real.

Cuatro actos. Seis artículos. Una tesis que no ha cambiado desde el principio.

El criterio no se delega. Pero tampoco se adquiere leyendo frameworks. Se adquiere aplicándolo — sobre casos reales, con preguntas concretas, con la incomodidad de llegar a respuestas que no esperabas.

Si quieres releer la serie desde el principio, empieza por aquí.

Lo que viene después tiene otro nombre. Pero eso es para la próxima función.

Una función sobre IA responsable:

Qué es la IA responsable
Un caso real: Printex Europa
Acto 1. El criterio no se delega
Acto 2. El día que delegué el juicio sin darme cuenta
Acto 3. El día que descubrí quien decide por mí
Acto 4. El día que dejé de explicarlo y empecé a demostrarlo

El Criterio Humano

Discusión sobre este post

Por supuesto, sigue adelante.