
NVIDIA ha presentado OpenReasoning-Nemotron, 4 modelos de razonamiento basados en DeepSeek de 671B
por Juan Antonio SotoNVIDIA presume de núcleos Tensor en sus tarjetas gráficas para juegos, con una configuración más potente cuando el modelo es de gama más alta. Para poder aprovechar estos núcleos dedicados a dar respuesta a las tareas de IA, NVIDIA ha presentado OpenReasoning-Nemotron. OpenReasoing-Nemotron son 4 modelos de razonamiento usando como referencia el 671B DeepSeek R1 0528 que ofrecen parámetros 1.5B, 7B, 14B y 32B basados en Qwen-2.5, para hacerlo más accesible incluso con las plataformas de juego que podemos encontrar en casa.
Con esta solución podemos prescindir de las soluciones basadas en la nube o incluso tener que contar con GPUs más caras. NVIDIA ha generado 5 millones de soluciones basadas en matemáticas, ciencias y código que luego ha ajustado minuciosamente mediante aprendizaje supervisado. Con esto ha conseguido muy buenas cifras en el modelo 32B, que ha alcanzado 89,2 en AIME24 y 73,8 en el concurso HMMT del pasado febrero, incluso la variante más ligera de 1,5B ha obtenido 55,5 y 31,5 respectivamente.
Estos 4 modelos estarán disponibles para descargar en Hugging Face, donde podrás obtener un recurso que permitirá personalizar los modelos para tus necesidades. También contarás con una base que te permitirá realizar tareas de razonamiento ajustadas con aprendizaje por refuerzo. Una de las opciones que ofrece el modelo 32B es usar GenSelect, capaz de realizar varias pasadas a cada pregunta y obtener respuestas paralelas, para determinar la mejor a tu pregunta. De esta forma tenemos un rival incluso para modelos como el o3 de OpenAI, capaces de superarlo en algunos puntos concretos.
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!