Un hito en IA: modelos de lenguaje alcanzan la cumbre de la matemática juvenil.

El modelo experimental de OpenAI logra medalla de oro en la Olimpiada Internacional de Matemáticas 2025

IA
photo_camera IA
OpenAI ha anunciado que su modelo de lenguaje con capacidades de razonamiento avanzadas obtuvo un rendimiento equivalente al nivel de medalla de oro en la Olimpiada Internacional de Matemáticas (IMO) 2025, resolviendo cinco de los seis problemas bajo las mismas condiciones que los concursantes humanos.

El sábado 19 de julio de 2025, Alexander Wei, investigador de OpenAI, comunicó a través de X que su modelo de razonamiento alcanzó niveles de oro en la IMO 2025, uno de los concursos matemáticos más exigentes del mundo. El modelo resolvió cinco de los seis problemas en las dos sesiones de 4,5 horas, sin acceso a herramientas externas, ni internet.

Evaluación y verificación
Cada prueba fue evaluada de forma independiente por tres antiguos ganadores de medalla IMO. El modelo acumuló 35 puntos de 42 posibles, los cuales corresponden al estándar dorado.

El salto en inteligencia general
Noam Brown, otro investigador de OpenAI, destacó la capacidad del modelo para pensar durante largas sesiones, demostrando sustento creativo prolongado —algo crítico en problemas de IMO— más allá de pruebas rápidas. Sam Altman, CEO de OpenAI, destacó que este avance representa un enfoque de inteligencia general, no meramente matemática estrecha.

Reacciones de la comunidad
Aunque algunos críticos como Gary Marcus consideraron el logro “impresionante”, también recalcaron la necesidad de conocer detalles del entrenamiento y validación, incluyendo independencia de datos de prueba y revisión por terceros. La propia IMO aún no ha avalado oficialmente estos resultados.

Comparativa con sistemas anteriores
A diferencia de DeepMind con AlphaGeometry, que se especializa en geometría ℹ️ un sistema híbrido (statístico + simbólico) que resolvió problemas de IMO con un nivel cercano a oro, el modelo de OpenAI aborda la IMO desde una perspectiva de propósito general, sin fine‑tuning específico en matemáticas

Más en CURIOSIDADES
Comentarios