GPT-5.2 Pro bate récord en FrontierMath y lidera la IA matemática

Detalles: By Chris Borden; Categoría: Modelos; 5 m; 24 Enero 2026; 156

Hay un nuevo mejor modelo matemático. GPT-5.2 Pro de OpenAI establece un nuevo récord en FrontierMath

GPT-5.2 Pro de OpenAI ha logrado un nuevo récord en el exigente benchmark FrontierMath, según las pruebas realizadas por Epoch AI. El modelo alcanzó un 31% en el nivel más difícil, Tier 4, lo que representa un salto significativo frente al anterior mejor resultado del 19% obtenido por Gemini 3 Pro. Debido a problemas con la API, Epoch AI evaluó el modelo manualmente a través de la interfaz web de ChatGPT.

El rendimiento de GPT-5.2 Pro superó claramente a sus competidores más cercanos: Gemini 3 Pro (19%) y GPT-5.2 xhigh (17%). Fuente: Epoch AI

De un total de 48 tareas, GPT-5.2 Pro resolvió con éxito 15, incluidas cuatro que ningún modelo anterior había logrado solucionar. Varios matemáticos profesionales evaluaron las respuestas, elogiando en general su calidad, aunque señalaron en algunos casos una falta ocasional de precisión en los razonamientos.

Los resultados refuerzan los informes positivos recientes sobre los modelos avanzados de IA — en particular GPT-5 Thinking y GPT-5 Pro — como herramientas potentes para la resolución de problemas matemáticos complejos. Según algunos testimonios, GPT-5 incluso ha resuelto de forma autónoma problemas de Erdős, mientras que en otros casos ha actuado como un asistente matemático avanzado.

Conclusión

El nuevo récord de GPT-5.2 Pro confirma que los modelos de razonamiento avanzado están entrando en una fase cualitativamente distinta, donde la IA comienza a competir con expertos humanos en matemáticas de alto nivel. Si esta tendencia se mantiene, los próximos años podrían redefinir por completo la investigación científica, la educación y el desarrollo tecnológico impulsado por inteligencia artificial.

About The Hosts

Chris Borden

AI Analyst & Technology Researcher

AI researcher and industry analyst covering decentralized infrastructure, AI systems, and emerging technology markets. Focused on data-driven analysis, long-term trends, and real-world adoption of artificial intelligence.