El modelo obtuvo una puntuación de 35 sobre 42, superando el umbral para la medalla de oro, alcanzado solo por el 10% de los participantes humanos
25.07.2025 • 18:00hs • Inteligencia Artificial
Inteligencia Artificial
OpenAI consigue la medalla de oro en el examen de matemáticas más difícil del mundo
Un modelo experimental de OpenAI, la empresa desarrolladora de ChatGPT, logró resolver cinco de los seis problemas del examen de la Olimpiada Internacional de Matemática (IMO) de 2025.
De esta forma, alcanzó el puntaje suficiente para obtener la codiciada medalla de oro en la competencia considerada como el examen de matemáticas más difícil del mundo.
Este logro, comparable con el rendimiento de los mejores "mathletes" adolescentes del planeta, marca un avance extraordinario en la capacidad de razonamiento lógico y creativo de la IA, equivalente a la de los medallistas humanos más destacados.
OpenAI logra medalla de oro en el examen de matemáticas más difícil del mundo
La IMO, celebrada este año en la Sunshine Coast de Australia, reunió a más de 600 participantes de más de 100 países, todos menores de veinte años. Durante dos jornadas intensas, los concursantes enfrentaron exámenes de cuatro horas y media cada uno, con problemas que exigen creatividad, intuición y una argumentación matemática rigurosa, atributos tradicionalmente considerados patrimonio exclusivo del intelecto humano.
Sin embargo, en esta edición, tanto OpenAI como Google DeepMind evaluaron sus modelos —en el caso de DeepMind, con validación oficial del comité de la IMO, y en OpenAI, replicando las condiciones exactas de los equipos humanos— y ambos obtuvieron una puntuación de 35 sobre 42, superando el umbral para la medalla de oro, alcanzado solo por el 10% de los participantes humanos.
Este avance no se trata de simples cálculos automáticos ni de resolución por fuerza bruta. Los problemas olímpicos requieren razonamiento original y la construcción de "pruebas" matemáticas detalladas, habilidades que los grandes modelos de lenguaje históricos, como ChatGPT, no habían podido demostrar en este nivel de exigencia.
OpenAI obtiene la medalla de oro en el exámen de matemáticas más dificil del mundo
El modelo de OpenAI, por ejemplo, leyó los enunciados oficiales y escribió soluciones en lenguaje natural, que luego fueron evaluadas y puntuadas por exmedallistas de la IMO, replicando todo el proceso humano y demostrando un salto a una visión de inteligencia artificial general capaz de sostener múltiples cadenas argumentativas complejas sin intervención externa.
Esta hazaña generó amplio debate en la comunidad académica internacional. Algunos celebran el hecho como un paso decisivo hacia la IA general y una nueva era de colaboración entre la tecnología y matemáticos humanos, mientras que otros más cautelosos señalan que, aunque la IA alcanzó el nivel oro, sigue existiendo una distancia respecto a los "superdotados" que logran puntajes perfectos y resuelven todos los problemas del examen.
El consenso es que el suceso representa una señal ineludible del avance acelerado de la IA en tareas complejas, con posibles repercusiones inmediatas en la investigación científica, la educación matemática y el desarrollo de sistemas capaces de abordar problemas hasta ahora reservados al ingenio humano.
Sam Altman, CEO de OpenAI, reconoció que hace apenas unos años este escenario parecía un sueño irrealizable, y subrayó que aún pasarán varios meses hasta que tales modelos estén disponibles al público general.
Polémica por presuntos mensajes ocultos en ChatGPT
La distinción se dio en medio de una polémica que involucra a ChatGPT y otros programas de inteligencia artificial. Distintos medios revelaron mensajes ocultos en textos científicos y otros documentos que están dirigidos a los usuarios.
Por ejemplo, la revista Nature reportó que en 18 artículos científicos alojados en repositorios de prepublicaciones, los autores insertaron textos invisibles para el ojo humano (escritos en color blanco) que funcionan como instrucciones ocultas destinadas a que ChatGPT genere revisiones positivas a sus trabajos, inflando así artificialmente la evaluación de dichos artículos.
Estos mensajes ocultos buscan aprovechar el uso creciente de IA por parte de revisores de artículos científicos, a quienes se les detectó utilizar estos programas, aunque muchas editoriales lo prohíben. Más allá de la ciencia, algunos reportes también hablan de "funciones ocultas" no tan evidentes dentro del modelo de IA que permiten acceder a capacidades avanzadas o personalizar la experiencia.
Sin embargo, estas no necesariamente son mensajes ocultos en el sentido de manipulaciones maliciosas, sino más bien comandos o atajos para mejorar la productividad al interactuar con la inteligencia artificial.