En pruebas de referencia, el modelo superó a GPT-5.2 de OpenAI y a Claude Opus 4.6 de Anthropic, incluidos resultados destacados en ARC-AGI-2 (rompecabezas de razonamiento visual), MMMU-Pro para evaluación multimodal, una puntuación Elo de 3.455 y Humanity’s Last Exam.
«Actualizamos Gemini 3 Deep Think en estrecha colaboración con científicos e investigadores para abordar desafíos científicos complejos, donde los problemas a menudo no tienen límites claros ni una única respuesta correcta, y los datos son incompletos», señaló Google en una entrada de su blog.
Gemini 3 Deep Think ofrece resultados de vanguardia en matemáticas y programación y se desempeña de forma “excepcional” en las ciencias naturales, incluidas la química y la física. El modo actualizado resuelve problemas al nivel de medallistas de oro en olimpíadas internacionales.
En el CMT Benchmark, el modelo obtuvo un 50,5%, demostrando un profundo conocimiento en física teórica.
«Más allá del rendimiento en benchmarks, Deep Think está diseñado para el uso en el mundo real: ayuda a los investigadores a interpretar datos complejos y permite a los ingenieros modelar sistemas físicos mediante código», señaló Google.
La versión actualizada de Deep Think está disponible en la aplicación Gemini para suscriptores de Google AI Ultra y a través de la API de Gemini para desarrolladores seleccionados.
El matemático de IA de DeepMind
Google DeepMind también presentó Aletheia, un agente de IA que estableció un nuevo récord en IMO-ProofBench Advanced, resolviendo el 91,9% de los problemas. Este benchmark es considerado uno de los más exigentes en matemáticas.
Construido sobre Gemini Deep Think, Aletheia incorpora un módulo de verificación que detecta errores en borradores de soluciones y los refina de forma iterativa. Una característica clave del agente es su capacidad para reconocer cuándo un problema no tiene solución, lo que ahorra un tiempo significativo a los investigadores.
Aletheia utiliza Google Search para navegar por literatura científica compleja, reduciendo el riesgo de referencias falsas y errores de cálculo.
Entre los logros del sistema se incluyen:
-
la generación completa de un artículo científico con el cálculo de constantes estructurales en geometría aritmética;
-
la colaboración humano-IA en demostraciones sobre sistemas de partículas en interacción (conjuntos independientes);
-
la resolución autónoma de cuatro problemas de la lista de problemas de Erdős, incluido uno que anteriormente se consideraba abierto.
DeepMind subrayó que el éxito de Aletheia refuerza las leyes de escalado: en matemáticas formales, la calidad de las soluciones sigue mejorando gracias a enfoques basados en agentes.
Avance en el descubrimiento de fármacos
La filial de DeepMind, Isomorphic Labs, presentó IsoDDE, un nuevo motor para el descubrimiento de medicamentos. En evaluaciones complejas, IsoDDE alcanzó el doble de precisión predictiva que AlphaFold 3.
Mientras que AlphaFold 3 supuso un gran avance al predecir estructuras tridimensionales de proteínas y sus interacciones moleculares, IsoDDE va un paso más allá:
-
predice la afinidad de unión con mayor precisión que los métodos tradicionales;
-
puede identificar “bolsillos” ocultos en proteínas donde pueden unirse fármacos;
-
admite una amplia gama de moléculas complejas, incluidos anticuerpos y grandes estructuras biológicas.
«IsoDDE ofrece una base escalable para el diseño de fármacos impulsado por IA, proporcionando el nivel de precisión predictiva necesario para trabajar con nuevos sistemas biológicos con una fiabilidad sin precedentes», afirmó la compañía.
ES
EN