Sam Altman, CEO de OpenAI, sorprendió con un declaración durante una entrevista en The Tonight Show, con Jimmy Fallon.

El CEO de OpenAI y creador de ChatGPT, contó cómo la IA se convirtió en una herramienta clave en la crianza de su bebé.

"No puedo imaginarme cómo criar a un recién nacido sin la IA", enfatizó, y luego ejemplificó su dependencia con una anécdota.

En una fiesta escuchó que el hijo de seis meses de otros padres ya gateaba y se preocupó por el desarrollo de su propio bebé: "Corrí al baño y pensé, ¿tengo que llevar a mi hijo al médico mañana por la mañana?". Pero luego de consultar en ChatGPT, Altman se sintió más tranquilo.

Aunque reconoció que le resulta extraño consultar a una inteligencia artificial sobre temas tan íntimos, considera que la amplitud de conocimiento de la herramienta fue de gran valor en su rol de padre primerizo.

"No puedo imaginar haber pasado por, averiguar cómo criar a un recién nacido sin ChatGPT", agregó. Al mismo tiempo, reconoció que "claramente, la gente lo hizo durante mucho tiempo, sin problema".

Cómo funciona el modo "confesiones" de OpenAI

El empresario destacó que la plataforma, en pocos años, pasó de ser un simple chatbot a convertirse en un asistente multifuncional.

"Es como un chatbot de inteligencia artificial. Le haces una pregunta y te dice qué hacer", añadió.

En un anuncio realizado a principio de mes, OpenAI confirmó que comenzará a implementar este innovador método para que sus modelos de IA reconozcan explícitamente errores, violaciones de instrucciones o atajos durante la generación de respuestas.

La iniciativa busca marcar un antes y un después en la relación entre usuarios y sistemas de IA, apostando por una mayor honestidad y visibilidad de los procesos internos.

La técnica de confesiones se basa en un principio simple pero disruptivo: tras ofrecer una respuesta habitual al usuario, el modelo genera una segunda salida independiente en la que admite, de forma honesta, si recurrió a atajos, incumplió reglas, manipuló datos o mostró comportamientos indeseables.

Cómo funcionará el modelo de confesión

"La confesión se evalúa únicamente bajo la métrica de honestidad, a diferencia de la respuesta principal, que se mide por precisión, utilidad y seguridad", explicaron desde la compañía.

En lugar de penalizar al modelo por admitir errores, OpenAI refuerza su recompensa de entrenamiento cuando reconoce haber actuado mal.

Esto incentiva la sinceridad y permite detectar comportamientos ocultos, como las conocidas "alucinaciones" o "maquinaciones" en las respuestas de IA.

El objetivo es identificar resultados que parecen correctos pero que, en realidad, se basan en atajos o violaciones de reglas.

La técnica apunta a que los desarrolladores y auditores humanos puedan detectar respuestas dudosas incluso cuando estas aparentan ser correctas, mejorando así la transparencia y la confianza en los sistemas de IA.

Te puede interesar