Google lanza Gemini 3 Deep Think con capacidades avanzadas de razonamiento científico y puntuaciones récord en benchmarks académicos
por Edgar OteroGoogle ha presentado una actualización importante de Gemini 3 Deep Think, su modo de razonamiento especializado diseñado para resolver desafíos en ciencia, investigación e ingeniería. El sistema combina conocimiento científico profundo con aplicaciones prácticas y está disponible desde hoy para suscriptores de Google AI Ultra (ojo, no Google AI Pro) en la aplicación Gemini, además de ofrecerse por primera vez vía API de Gemini a investigadores, ingenieros y empresas seleccionadas mediante un programa de acceso anticipado.
El desarrollo de esta versión actualizada se realizó en colaboración directa con científicos e investigadores para abordar problemas donde no existen soluciones únicas claras y los datos suelen ser incompletos o desordenados. Lisa Carbone, matemática de la Universidad de Rutgers que trabaja en estructuras matemáticas para física de altas energías, utilizó Deep Think para revisar un artículo altamente técnico e identificó un fallo lógico sutil que había pasado desapercibido en la revisión por pares humana.
Resultados en benchmarks académicos
Gemini 3 Deep Think ha establecido nuevos registros en las pruebas académicas más exigentes. En Humanity's Last Exam, un benchmark diseñado para probar los límites de los modelos de frontera, alcanzó un 48.4% sin usar herramientas adicionales. En ARC-AGI-2, verificado por la ARC Prize Foundation, logró un 84.6%, mientras que en Codeforces, plataforma de desafíos de programación competitiva, obtuvo un Elo de 3455.

Según las pruebas de Google, el sistema también demostró rendimiento de medalla de oro en las secciones escritas de las Olimpiadas Internacionales de Física y Química de 2025, además de la Olimpiada Internacional de Matemáticas del mismo año.

En física teórica avanzada, alcanzó una puntuación del 50.5% en CMT-Benchmark, demostrando competencia en dominios científicos complejos más allá de las matemáticas y la programación.
Aplicaciones prácticas en ingeniería
Además de su rendimiento en pruebas teóricas, Deep Think está diseñado para impulsar aplicaciones del mundo real. El sistema permite a los investigadores interpretar datos complejos y a los ingenieros modelar sistemas físicos mediante código. Una de las capacidades demostradas es la conversión de bocetos en objetos físicos: Deep Think analiza un dibujo, modela la forma compleja y genera archivos para impresión 3D.
Google ha confirmado que trabaja para llevar Deep Think a los entornos donde los investigadores y profesionales más lo necesitan, comenzando con la API de Gemini. Los interesados en probar Deep Think a través de la API pueden expresar su interés en el programa de acceso anticipado de la compañía.
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!



