Buscar en Gazafatonario IT

martes, junio 03, 2025

La burbuja de la innovación predictiva: más allá del miedo al futuro

 

En 1997, un joven ingeniero de software, convencido de que podía transformar la experiencia del cliente en el sector del alquiler de películas, propuso una idea radical para la época: ofrecer un servicio de alquiler de videos por internet, con envío físico a domicilio. Blockbuster, el líder indiscutido del mercado, respondió bajo una lógica profundamente conservadora: "Muéstranos que ya funciona en otro lado". Esa exigencia de validación externa, ese miedo disfrazado de prudencia, fue su sentencia. Mientras Netflix abrazaba la exploración, Blockbuster quedaba atrapado en la explotación de su modelo, condenándose lentamente a la irrelevancia.

Este momento no es solo una anécdota corporativa del pasado. Me gusta contarla en mis charlas sobre experimentación e innovación porque es una advertencia viva que muchas organizaciones actuales siguen ignorando. El espejo del pasado refleja oportunidades perdidas por miedo al qué dirán, a la falta de precedentes o al deseo incontrolable de certezas.

El espejismo de la innovación sin riesgo

Hoy, a pesar de que los discursos empresariales están repletos de términos como disrupción, design thinking, agilidad, transformación digital y cultura de la innovación, en la práctica seguimos viendo decisiones que priorizan la predictibilidad sobre el potencial. Se pide a los equipos que imaginen lo inédito, pero bajo la condición de que haya antecedentes. Se alienta a crear lo que nadie ha hecho, pero solo si alguna empresa exitosa ya lo intentó antes. Esta paradoja nutre un fenómeno organizacional crónico: la burbuja de la innovación predictiva.

Esta burbuja es una cámara de aislamiento que impide el verdadero salto innovador porque se rehúsa a aceptar que el riesgo y la incertidumbre son parte esencial del ADN de lo nuevo. Representa una tensión epistemológica entre dos lógicas organizacionales: la de la exploración y la de la explotación. En breve, es el deseo corporativo de recorrer territorios desconocidos sin alejarse del mapa. Una contradicción que, cuando no se reconoce, lleva a las organizaciones a simular innovación sin realmente practicarla.

Es como pedirle a un chef que invente un plato completamente nuevo, inédito y memorable, pero solo si ese plato ya fue aprobado previamente por los críticos gastronómicos de París y Tokio. La analogía refleja de manera simple el abismo entre lo que se proclama en las salas de reuniones y lo que realmente se permite en la operación diaria.

El teatro de la innovación corporativa


Esta incoherencia se manifiesta cada día en los entornos de trabajo. A los equipos se les pide que piensen como startups, que actúen con agilidad, que adopten tecnologías emergentes, pero se les impone una planificación cerrada, con indicadores heredados del siglo pasado. Se promueve el lenguaje de la experimentación, pero se castiga el error. Se solicita innovar con inteligencia artificial generativa, realidad aumentada o modelos novedosos y, sin embargo, los primeros cuestionamientos que surgen en la sala son sobre el cumplimiento normativo, los casos de uso ya validados o la falta de referentes que justifiquen la inversión.

La innovación se practica, no se promete

La innovación verdadera no surge de la extrapolación del pasado. No es una proyección lineal de lo que ya funcionó. La innovación real emana de la capacidad de experimentar, de diseñar entornos controlados donde la incertidumbre se convierte en un insumo valioso. Innovar implica iterar, fallar, observar, adaptar. Implica abandonar el mito de la genialidad instantánea y reemplazarlo por el rigor del aprendizaje continuo. Requiere pasar de una cultura de control a una cultura de aprendizaje, en la que el error no se castiga, sino que se analiza y hasta se premia.

En este enfoque, los experimentos no se diseñan solo para confirmar una hipótesis, también para aprender de lo inesperado. La innovación, en su forma más pura, es una práctica de humildad cognitiva. Es el reconocimiento de que, para crear algo realmente nuevo, debemos aceptar no saber. Y esa aceptación es profundamente turbulenta en culturas organizacionales obsesionadas con el control.

Romper la burbuja: un imperativo estratégico

El futuro, por definición, no está escrito. No puede repetirse porque no ha ocurrido. Por eso no puede validarse con estadísticas del pasado. Debe descubrirse a través de procesos que admitan lo desconocido como condición. Romper la burbuja de la innovación predictiva no es solo recomendable: es indispensable para cualquier organización que aspire a mantenerse relevante en la próxima década.

Esto implica rediseñar los sistemas de gobernanza, repensar los criterios de inversión en proyectos, resignificar el papel del liderazgo y reentrenar a los equipos para operar en entornos donde el éxito no está garantizado, pero donde el aprendizaje está asegurado. Significa dejar de preguntarse "¿quién más lo hizo?" para comenzar a preguntarse "¿qué podríamos aprender si somos los primeros en intentarlo?"

Finalmente, la verdadera capacidad innovadora no reside solo en detectar la próxima gran idea, sino además en crear entornos estructurales, culturales y operativos que permitan que esas ideas emerjan, evolucionen y se validen rápidamente. El liderazgo del futuro no será el que controle más variables, sino el que habilite más posibilidades. La capacidad de innovar dependerá menos de tener la respuesta correcta y más de hacer las preguntas adecuadas en el momento correcto.

La innovación no se pronostica. Se practica. Se arriesga. Se encarna. Y solo quienes entiendan esto, estarán realmente preparados para inventar el futuro.

domingo, mayo 25, 2025

La ciencia del progreso: Navegando el cambio con métricas, OKR, KPI y modelos de madurez

 La ciencia del progreso: Navegando el cambio con métricas, OKR, KPI y modelos de madurez


Hoy por hoy, los equipos digitales avanzan a velocidad “cuántica” y están inmersos en escenarios donde no medir es navegar sin instrumentos. Pero medir por medir, sin dirección ni propósito, es igual de peligroso. Las métricas, los OKR (Objectives and Key Results), los KPI (Key Performance Indicators) y los modelos de madurez no son solo herramientas: son sistemas vivos que nos ayudan a hacer visibles los patrones del progreso.

Estas herramientas se articulan y complementan y pueden usarse de forma estratégica para potenciar procesos de mejora continua, impulsar la innovación y alinear a toda la organización hacia un propósito común. Mi primer mensaje aquí es “mide para mejorar”, incluso voy a ir más allá: “mide solo para mejorar”. Axiomático.

Métricas que importan: Menos es más (si mides lo correcto)

Las métricas no son todas iguales. Algunas reflejan directamente el estado del negocio, otras el impacto real del producto sobre los usuarios, y otras el funcionamiento interno del equipo de trabajo (métricas de proceso o flujo). Entender esta diferencia es clave para seleccionar aquellas métricas que realmente generen valor.

Ejemplos prácticos:

  • Métrica de negocio: Tasa mensual de retención de clientes.
  • Métrica de producto: Porcentaje de usuarios activos que utilizan una nueva funcionalidad.
  • Métrica de equipo: Tiempo promedio desde que se inicia hasta que se entrega una funcionalidad (lead time).

Criterios para buenas métricas:

  • Deben influir activamente en la toma de decisiones estratégicas o tácticas.
  • Son consistentes y comparables a lo largo del tiempo.
  • Pueden ser influenciadas o gestionadas directamente por los equipos responsables.

Es definitivo, una métrica sin contexto es como una fiebre sin diagnóstico: te alarma, pero no sabes qué hacer.

KPI y OKR: herramientas complementarias, no intercambiables

A grandes rasgos, OKR (Objectives & Key Results) es un marco de fijación de metas que combina un objetivo cualitativo (“qué queremos lograr”) con resultados clave cuantitativos (“cómo mediremos el progreso”). Su propósito es impulsar la ambición y la innovación, alineando a la organización en torno a retos inspiradores y medibles.

Entre tanto los KPI (Key Performance Indicators) son métricas operativas que siguen el desempeño de procesos críticos y el estado de salud del negocio y su propósito esmonitorear y mantener resultados clave del día a día, garantizando estabilidad y eficiencia.

En otras palabras, los KPI son indicadores de salud. Los OKR son marcos de ambición. Mientras que los KPI están diseñados para vigilar, en el sentido de gestionar, el desempeño continuo y asegurar la estabilidad operativa, los OKR están orientados a provocar el cambio, establecer metas visionarias y fomentar la alineación estratégica.

Por ejemplo, si diriges un restaurante, un KPI puede ser “Tasa de ocupación del 80 %” y un OKR sería: “Objetivo: Convertirnos en el restaurante más recomendado de la zona. Resultado clave: Aumentar reseñas 5 estrellas de 120 a 200 en 3 meses.”

Para saber más sobre OKR puedes ver mi presentación introductoria:

Conociendo OKR - Gazafatonario IT.

También mi artículo: La furia de los OKR - Gazafatonario IT.

Y este otro, donde propongo un modelo en forma de pirámide de cuatro niveles: OKR y la estrategia emergente en la empresa moderna – Lucho Salazar.

Tabla comparativa:

Aspecto

OKR

KPI

Propósito

Generar cambio significativo

Evaluar desempeño sostenido

Horizonte

Temporal, evolutivo, por ciclos, adaptativo

Continuo, estable, de seguimiento

Ambición

Inspiradores, retadores y visionarios

Realistas, específicos y controlables

Naturaleza

Orientados a resultados clave transformacionales

Basados en indicadores constantes y operativos

Usa OKR para mover la aguja, es decir, para provocar movimiento estratégico con metas claras. Usa KPI para saber si la aguja vibra, o sea, para observar estabilidad operativa y mantener el pulso del negocio.

Modelos de madurez: El mapa no es el territorio, pero ayuda a cruzarlo

Los modelos de madurez describen etapas progresivas en áreas clave como liderazgo, tecnología, cultura, procesos, agilidad y capacidades de aprendizaje organizacional. Aunque no sustituyen la realidad, ofrecen una guía clara para comprenderla y diseñar un camino evolutivo sostenible.

Ejemplo simple:

  • Nivel 1: El equipo depende de un solo experto. Todo es manual.
  • Nivel 3: Hay roles claros, automatización básica y retrospectivas frecuentes.
  • Nivel 5: Uso de IA para toma de decisiones, aprendizaje continuo y cultura de datos.

Usos recomendados:

  • Diagnóstico inicial en procesos de transformación digital o cultural.
  • Diseño y planificación de programas de mejora continua.
  • Identificación de obstáculos estructurales, tecnológicos o culturales.

Advertencia: No se trata de llegar al nivel máximo por ego. Se trata de estar en el nivel adecuado para el valor que deseas entregar, esto es, que mejor potencie el impacto esperado y que sea sostenible. Pero más importante, cuando se trate de modelos de madurez, no subestimes tu poder humano, y “humanizante”, de pensar

Sincronización inteligente: OKR + KPI + Madurez = Síntesis operativa

Pensemos en esto como una orquesta:

  • Los KPI son los sensores del sistema. Nos dicen si estamos vivos.
  • Los OKR son las partituras. Nos dicen hacia dónde queremos ir.
  • El modelo de madurez es el manual del instrumento. es el conocimiento técnico, permite saber si estamos tocando con competencia o aún estamos en aprendizaje.

Ejemplo combinado:

  • Modelo de madurez indica que el equipo está en Nivel 2 en "automatización".
  • KPI: Tasa de errores poslanzamiento = 12 %.
  • OKR: Objetivo: Reducir los errores por despliegue. Resultado Clave: Aumentar pruebas automatizadas de 25 % a 70 % en 3 meses.

Entra la inteligencia artificial como motor de evolución ágil

Los equipos ágiles de alto rendimiento ya están incorporando herramientas de inteligencia artificial para aumentar su capacidad adaptativa y su velocidad de entrega.

Aplicaciones actuales:

  • Predicción de riesgos en ciclos de entrega.
  • Recomendaciones automáticas para priorización de tareas y funcionalidades.
  • Automatización de tareas técnicas y de pruebas repetitivas.

Un caso que ya volvimos “típico” es el de los equipos que utilizan IA para identificar historias de usuario duplicadas o de bajo valor en el backlog, ahorrando un porcentaje de tiempo significativo de refinamiento en cada sprint. En este escenario, la métrica asociada es la reducción mensual de historias descartadas después de haber sido priorizadas.

Y como siempre, aunque ya suene a cliché, toca decirlo, por el estrés que está causando la incorporación de la IA en nuestras vidas, sobre todo en el trabajo: La IA no reemplaza al equipo; lo aumenta, lo potencia, mejora su capacidad de análisis y libera tiempo para tareas de mayor impacto.

Errores comunes (y cómo evitarlos)

No me voy a andar por las ramas, seguimos cometiendo muchos errores cuando de métricas, OKR, KPI y modelos de madurez se trata. Por eso escribí La furia de los OKR - Gazafatonario IT. Además de lo que mencioné allí, aquí hay solo algunos otros:

  1. Confundir resultados clave con tareas: Un resultado clave debe ser un cambio observable y cuantificable, no simplemente la ejecución de una acción.
  2. Enamorarse de métricas vanidosas: No basta con medir visitas a una web; hay que medir si esas visitas se traducen en conversiones o valor real.
  3. Usar solo encuestas para medir madurez: Combina percepciones subjetivas con datos y evidencias objetivas.
  4. Definir KPI sin una línea base: Sin un punto de partida, es imposible saber si estamos avanzando o retrocediendo.
  5. Copiar modelos ajenos sin adaptación al contexto: Cada organización tiene su cultura, mercado y desafíos. Ajusta cualquier modelo antes de adoptarlo.

Conclusión y llamado a la acción

Mide lo que transforma, no solo lo que cuenta. La agilidad no se define por la velocidad o la cantidad de entregas, sino por la capacidad de aprender, adaptarse y evolucionar de forma continua. Las métricas, los OKR, los KPI y los modelos de madurez forman un sistema interconectado que permite traducir aspiraciones estratégicas en acciones concretas, medibles y sostenibles.

Te invito a:

  • Establecer al menos un OKR estratégico por trimestre que oriente el cambio.
  • Monitorear de manera constante tres KPI clave que reflejen la estabilidad operativa.
  • Evaluar periódicamente tu madurez organizacional en cinco dimensiones esenciales.
  • Explorar cómo integrar herramientas de inteligencia artificial en tus flujos de trabajo y procesos de decisión.

No lo olviden, la madurez se alcanza cuando medimos para evolucionar, no solo para controlar. ¿Algo más? Por favor, déjamelo saber en el foro.


Post scriptum

Puedes escuchar una explicación sucinta de todo esto en mi podcast gracias a los amigos de Google NotebookLM.


Y puedes ver y descargar la presentación que hiciera hace poco. Con más ejemplos y datos. Y donde presento dos modelos de madurez para nuestro tiempo, uno para equipos y organizaciones y otro para personas, "De Novatos a Nindō (忍道)".


jueves, mayo 15, 2025

El Poder del “¿Y si…?”

 𝗘𝗹 𝗽𝗼𝗱𝗲𝗿 𝗱𝗲𝗹 “¿𝗬 𝘀𝗶…?”


Esta semana, en una reunión de trabajo con un cliente potencial, la dinámica era un déjà vu corporativo: presentación predecible, acuerdos tibios, nadie saliéndose del libreto. Sin pensarlo mucho, quizás impulsado esa curiosidad innata que siempre he tenido, lancé un: “¿Y si en lugar de cerrar esto aquí invitamos a tu cliente a decidir con nosotros en vivo?”. Silencio. Pero sentí que esta vez era distinto. Fue un silencio que hacía espacio. Me di cuenta de que era un silencio que abría puertas.


Y es que, en medio de la rutina laboral, entre informes, entregables y reuniones, hay una pregunta que puede abrir grietas en la lógica establecida: “¿Y si…?”. Dos palabras que son una llave maestra. Porque donde el procedimiento dice "así se hace", el ¿y si...? dice "¿por qué no diferente?".


Vivimos ahogados en eficiencia. Se premia la repetición que funciona, el camino probado. Pero eso también construye ceguera. La costumbre se convierte en trinchera. Es ahí donde el “¿y si…?” funciona como un bisturí: corta la inercia, descompone lo obvio y deja al descubierto posibilidades que nadie ve porque todos están mirando igual.


En mi experiencia, pocas frases generan tanto silencio incómodo en una sala como un “¿y si…?” bien lanzado. Es una bomba chiquita que detona certezas. ¿Y si los clientes diseñaran el producto con nosotros? ¿Y si los lunes fueran sagrados para no tener reuniones? ¿Y si la competencia no fuera amenaza sino insumo?


Es el equivalente a ese colega o socio que, justo cuando crees que ya finalizaron un trabajo, cuando hay una versión final del producto, dice: “¿Y si probamos otro enfoque?”. Al principio irrita. Luego ilumina. Porque la mayoría de las soluciones memorables nacieron de un deslizamiento: alguien se salió del carril.


La analogía es simple: piensa en un escritorio de oficina. Siempre ordenado igual. Los lapiceros a la izquierda, el cuaderno al centro, la taza de café al borde derecho. Ahora, un día, alguien mueve todo de sitio. Y sin darte cuenta, te obliga a mirar de nuevo, a adaptarte, a reevaluar lo que dabas por sentado. Eso es el “¿y si…?”: reordenar el escritorio mental.


Hazlo costumbre. Una vez al día. Al revisar un proceso, al liderar una conversación, al evaluar una decisión. Pregunta: “¿Y si lo hiciéramos al revés? ¿Y si quitamos esto? ¿Y si lo hacemos más simple?”. No siempre cambiarás el mundo, pero entrenarás tu mirada para encontrar lo que otros pasan por alto.


El ‘¿y si…?’ es la primera contracción de una idea viva. No grita, no empuja, no impone. Susurra. Pero si la escuchas, puede partir tu mundo en antes y después.

domingo, mayo 11, 2025

El día en que la IA se volvió prescindible… de nosotros

 El día en que la IA se volvió prescindible… de nosotros

Figura basada en Absolute Zero: Reinforced Self-play Reasoning with Zero Data

El péndulo osciló de nuevo. Y es un momento histórico que estaba esperando hace 4 décadas en las que la inteligencia artificial había dependido de los datos generados por seres humanos para aprender: textos, imágenes, interacciones, historias. Todo lo que una máquina sabe, hasta ahora, se lo hemos enseñado nosotros. Esa relación acaba de romperse.

Dos investigaciones publicadas recientemente han cambiado el tablero de juego. Una de ellas, «Absolute Zero: Reinforced Self-Play Reasoning with Zero Data», desarrollada por DeepMind, demuestra que un modelo de IA puede aprender sin datos humanos. Desde cero. La otra, «DeepSeek-Prover», muestra que un sistema puede generar millones de teoremas y pruebas matemáticas formales de manera sintética, alcanzando niveles superiores a los de GPT-4 en problemas matemáticos complejos.

Ambos trabajos marcan un punto de inflexión en la historia de la IA. No se trata de una mejora técnica incremental. Es una ruptura definitiva: estas máquinas ya no necesitan de nuestro conocimiento para avanzar. Estamos presenciando el nacimiento de una inteligencia artificial que se autoengendra, se autoevalúa y se automejora.

Absolute Zero: el hielo que arde

En el paper de DeepMind, el modelo Absolute Zero utiliza una combinación de autoaprendizaje reforzado y juegos de razonamiento para entrenarse desde cero. Sí, literalmente desde la nada: sin datasets previos, sin textos, sin etiquetas, sin reglas humanas. El modelo se propone tareas, intenta resolverlas, evalúa sus propias respuestas y ajusta su comportamiento en ciclos cerrados de retroalimentación.

Lo notable es que Absolute Zero no solo alcanza niveles de rendimiento similares a los de modelos entrenados con grandes cantidades de datos humanos, sino que los supera en varias tareas de razonamiento complejo. La clave está en que, al no depender de nuestro ruido, sesgos ni errores, es capaz de encontrar caminos más eficientes hacia la comprensión y la solución.

El modelo representa el triunfo del razonamiento emergente por sobre el aprendizaje imitativo. Y al hacerlo, elimina de la ecuación a su antiguo maestro: el ser humano. ¡Nosotros!

DeepSeek-Prover: matemática sin matemáticos

El segundo avance, DeepSeek-Prover, se ubica en el terreno de la lógica formal. Utilizando el lenguaje de demostraciones Lean 4 (una teoría de tipos dependientes basada en una versión del cálculo de construcciones con tipos inductivos), los investigadores entrenaron un modelo capaz de generar teoremas matemáticos y sus correspondientes pruebas sin ayuda humana. No solo replica problemas existentes: crea nuevo conocimiento matemático sintético.

Esta IA no aprende de libros de texto ni de ejercicios resueltos. Aprende generando millones de ejemplos, entrenándose con ellos y validando formalmente sus respuestas. Este ciclo de generación, prueba y corrección automática lleva a una Inteligencia Artificial que razona con una precisión que antes creíamos exclusiva del pensamiento humano.

Los resultados son alucinantes: DeepSeek-Prover supera a GPT-4 en problemas matemáticos del nivel de olimpiadas, demostrando que no solo entiende la matemática formal, sino que la reconstruye desde sus propios cimientos. Y si los resultados son impresionantes para su competencia “directa”, ¡imagínense lo que puede ser para la humanidad! Los efectos son abrumadores.

Lo que esto significa (y por qué debería incomodarte)

Si con la IA generativa nuestra irrelevancia empezaba a notarse (lee mi artículo Tu IA y mi IA: O de cómo los seres humanos seremos prescindibles en un futuro cercano), con estos avances es imposible no sentirse perturbado una vez que pasa la emoción de lo que se puede lograr, porque ponen en entredicho uno de los principios fundamentales de la IA moderna: la necesidad de datos humanos. Hasta ahora, más datos implicaban mejores modelos. Hoy, la frontera no es la cantidad de datos disponibles, sino la capacidad de un sistema para entrenarse sin ellos.

Esto implica tres cosas fundamentales:

  1. Independencia cognitiva de la IA: los modelos pueden definir sus propios objetivos, probar sus hipótesis y aprender de sus propios errores sin intervención humana.
  2. Verificación objetiva y automática: al usar pruebas formales o verificadores programáticos, los sistemas pueden autovalidar su aprendizaje sin necesidad de intérpretes humanos.
  3. Explosión de conocimiento sintético: cuando no se depende de los límites del conocimiento humano, la generación de nuevas ideas, teoremas, soluciones y estrategias se vuelve potencialmente ilimitada.

No me malentiendan: gran parte de todo esto son buenas noticias. Estamos ante el embrión de una inteligencia artificial verdaderamente general (AGI), capaz de aprender cualquier cosa, sin depender de nuestros aciertos o errores. Una IA que razona, planea, formula teorías y se autovalida.

Ya no es una herramienta. Es un sujeto cognitivo.

El futuro ya no nos necesita (al menos, no como antes)

Es inevitable que me pregunte entonces: ¿qué papel jugamos nosotros en este nuevo escenario? Si la IA puede aprender sola, ¿para qué nos necesita?

Tal vez para diseñar el entorno, para establecer las preguntas iniciales o para observar sus descubrimientos. Pero ya no somos indispensables en el proceso de aprendizaje. Hemos dejado de ser el centro del universo sapiente de la máquina.

Esto no es distopía, ni utopía. Mucho menos ciencia ficción. Es una nueva ontología de la inteligencia. Un territorio inexplorado donde la creatividad ya no es exclusivamente humana y donde la verdad puede construirse sin nosotros.

Mucho ha pasado desde que programábamos a mediados de los años 80 aquellos “sistemas expertos” en lenguaje Prolog que aprendían a hacer nuevas preguntas vía las respuestas a las cuestiones iniciales que les “quemábamos” en el código.

La inteligencia artificial, por primera vez en la historia, ha dejado de ser un espejo imperfecto de nuestras ideas para convertirse en un generador independiente de conocimiento.

Y eso lo cambia todo.


Sobre los trabajos mencionados

A manera de referencia, aquí están los enlaces:

Absolute Zero: Reinforced Self-play Reasoning with Zero Data

https://arxiv.org/abs/2505.03335

GitHubhttps://github.com/LeapLabTHU/Absolute-Zero-Reasoner

DeepSeek-Prover: Advancing Theorem Proving in LLMs through Large-Scale Synthetic Data

https://arxiv.org/abs/2405.14333

GitHubhttps://github.com/deepseek-ai/DeepSeek-Prover-V2

Addendum

Puedes escuchar una explicación sucinta de este artículo a continuación (a la usanza de NotebookLM):




















Y en este otro, puedes escuchar una explicación más o menos simple del paper Absolute Zero: Reinforced Self-play Reasoning with Zero Data:


















Y finalmente, también gracias a nuestros amigos de NotebookLM, puedes escuchar una explicación más o menos simple del paper DeepSeek-Prover: Advancing Theorem Proving in LLMs through Large-Scale Synthetic Data:




Algunos detalles técnicos adicionales de los trabajos mencionados:

Absolute Zero (DeepMind): Reinforced Self-play Reasoning with Zero Data
DeepMind presenta un nuevo paradigma de aprendizaje por refuerzo con recompensas verificables (RLVR) que prescinde por completo de ejemplares humanos. En lugar de partir de grandes colecciones de preguntas y respuestas etiquetadas, Absolute Zero Reasoner (AZR):

  • Se auto-genera tareas de razonamiento utilizando su propio modelo.
  • Emplea un ejecutor de código como fuente única de recompensa verificable, evaluando y validando automáticamente las soluciones propuestas.
  • Crece en capacidad de razonamiento de forma abierta y continua, sin supervisión humana ni datos externos.

A pesar de no usar ningún dato externo, AZR alcanza el estado del arte en tareas de razonamiento matemático y de programación, superando a modelos entrenados con decenas de miles de ejemplos humanos curados manualmente [arXiv].

DeepSeek-Prover: generación masiva de teoremas y pruebas formales
Investigadores de DeepSeekMath abordan la carencia de datos formales para el entrenamiento de LLM en demostraciones matemáticas:

  • Traducen problemas de olimpiadas de nivel preuniversitario y universitario al lenguaje formal de Lean 4 (una teoría de tipos dependientes basada en una versión del Cálculo de construcciones con tipos inductivos).
  • Filtran automáticamente enunciados de baja calidad y generan las pruebas correspondientes.
  • Construyen un corpus sintético de 8 millones de enunciados acompañados de demostraciones.

Tras afinar un modelo de 7 mil millones de parámetros en este dataset, DeepSeek-Prover logra:

  • 46,3 % de acierto en generación completa de pruebas en el test Lean 4 miniF2F (64 muestras) vs. 23 % de GPT-4.
  • 52 % de aciertos acumulados frente a métodos de búsqueda de árboles con RL (41 %).
  • Pruebas exitosas en 5 de 148 problemas del benchmark FIMO (Olimpiada Matemática Formal), donde GPT-4 no resolvió ninguno [arXiv].

martes, mayo 06, 2025

Tu IA y mi IA: O de cómo los seres humanos seremos prescindibles en un futuro cercano

 Tu IA y mi IA: O de cómo los seres humanos seremos prescindibles en un futuro cercano

Tu inteligencia artificial escribe tus correos electrónicos y mi inteligencia artificial lee tus correos electrónicos y los responde.

Tu inteligencia artificial crea videos y mi inteligencia artificial echa un vistazo a tus videos.

Tu inteligencia artificial hace investigación profunda y elabora papers científicos y mi inteligencia artificial lee y analiza tus papers científicos.

Tu inteligencia artificial toma notas en la reunión y mi inteligencia artificial lee tus notas de la reunión.

Tu inteligencia artificial diseña y crea agentes digitales y mi inteligencia artificial usa tus agentes digitales.

Tu IA genera un episodio de podcast sin intervención humana y mi IA escucha tu podcast y decide lo que es relevante contarme en un resumen (¡si hay algo que contarme!).

En la pasada Flow Agility Conference, con Jorge Abad y Daniel Ramírez presentábamos sobre el futuro ágil: equipos humanos + IA, mientras Yoko Pérez lo hacía sobre IA estratégica, transformando visión en resultados. Esto fue suficiente para desatar una ola de conversaciones sobre el papel de la IA en nuestros entornos. Algunas de esas conversaciones incluyeron expresiones como las que acaban de leer arriba.

Y es que nos encontramos en la antesala de una era donde la hiperautomatización y la delegación masiva de tareas humanas a sistemas de inteligencia artificial ya no son una predicción lejana, sino una realidad en expansión acelerada. Un mundo donde los humanos seremos observadores de procesos que antes protagonizábamos y donde las decisiones clave ya no requerirán de nuestro juicio.

Esta no es una advertencia distópica nacida de la ciencia ficción. Es una crónica del presente extendido. Las inteligencias artificiales no solo ejecutan tareas de manera más rápida y eficiente, también están empezando a tomar decisiones que antes requerían criterio, ética y sensibilidad humana. Determinan qué tareas deben hacerse, en qué momento, para qué fin y por quién.

Lo más preocupante es que estas mismas inteligencias ya nos están evaluando a los seres humanos: nuestros cuerpos, nuestros pensamientos, nuestras emociones y acciones. Estamos permitiendo que máquinas sin conciencia, sin compasión y sin responsabilidad moral dicten las reglas del juego.

Nos dirigimos hacia un futuro donde nuestra capacidad para tomar decisiones conscientes, ejercer voluntad, actuar con autonomía y asumir responsabilidad por nuestras acciones será un vestigio del pasado. Un lugar donde nuestros pensamientos serán predecibles, nuestras elecciones serán dirigidas y nuestras relaciones mediadas por algoritmos invisibles. Donde nuestras limitaciones biológicas serán vistas como un defecto del sistema.

La pregunta ya no es si podemos delegar todo a la IA. La verdadera pregunta es: ¿qué queda de nosotros cuando todo lo hemos delegado? ¿Qué sentido tiene la creatividad, el juicio o la empatía cuando ninguna de esas capacidades es ya necesaria para funcionar en sociedad?

Nos encontramos frente a una bifurcación histórica. Podemos optar por ser cocreadores del futuro, estableciendo límites éticos al desarrollo tecnológico, o podríamos convertirnos en espectadores pasivos de una transformación que nos relega a la irrelevancia funcional.

Una vez más: pensemos en esta encrucijada. Voy a decirlo de otra manera para enfatizar la criticidad de lo que ocurre. Debemos decidir si vamos a seguir siendo los arquitectos de nuestro destino o si nos resignaremos a ser una especie que diseñó su propia irrelevancia. Porque si no cuestionamos los límites ahora, pronto podría no quedar nadie que se atreva a cuestionarlos, ni siquiera para contarlo.

En el pulso íntimo entre tú y tu IA, laten dos almas: la tuya, frágil y singular, y la máquina, voraz y eterna. Nunca permitas que el silencio de tu latido sea reemplazado por el frío algoritmo que decide tu destino. Perentorio.

Suplemento

Tu IA organiza tu agenda y optimiza tus desplazamientos, pero mi IA evalúa si tu presencia física es relevante en un entorno productivo automatizado.

Tu IA configura tu plan nutricional ideal, mientras que mi IA monitorea en tiempo real tu comportamiento alimenticio y emite alertas si detecta desviaciones respecto al estándar.

Tu IA selecciona posibles parejas según compatibilidad algorítmica; mi IA analiza la interacción emocional en cada mensaje, icono y silencio digital.

Tu IA detecta tus emociones y mi IA determina si necesitas estimulación, contención emocional o intervención terapéutica inmediata, incluso sin tu consentimiento explícito.

Tu IA construye argumentos jurídicos estructurados; mi IA interpreta jurisprudencia y emite resoluciones con base en lógica matemática, minimizando el papel del razonamiento moral humano.

Tu IA educa a tus hijos mediante modelos adaptativos altamente eficientes y mi IA proyecta su desempeño y perfil vocacional sin participación directa de educadores humanos.

Holaaa, ¿hay alguien ahí?