Introducción al modelo DeepSeek-R1
En un movimiento que podría cambiar el panorama de la inteligencia artificial, el laboratorio chino DeepSeek ha lanzado una versión abierta de su modelo de razonamiento, conocido como DeepSeek-R1. Este modelo, que se encuentra disponible en la plataforma de desarrollo de IA Hugging Face bajo una licencia MIT, promete competir con el reconocido modelo de OpenAI, o1, en varios benchmarks de inteligencia artificial.
Rendimiento y características del modelo
DeepSeek afirma que su modelo R1 supera a o1 en benchmarks específicos como AIME, MATH-500 y SWE-bench Verified. AIME utiliza otros modelos para evaluar el rendimiento, mientras que MATH-500 se centra en problemas de palabras y SWE-bench Verified en tareas de programación. Una de las características más destacadas de R1 es su capacidad de auto-verificación, lo que le permite evitar errores comunes que suelen afectar a otros modelos de IA. Aunque los modelos de razonamiento como R1 pueden tardar más en llegar a soluciones, su fiabilidad en campos como la física, la ciencia y las matemáticas es notable.
Especificaciones técnicas y accesibilidad
Con un impresionante total de 671 mil millones de parámetros, R1 se posiciona como uno de los modelos más avanzados en el mercado. Los parámetros son un indicador clave de las habilidades de resolución de problemas de un modelo, y en general, los modelos con más parámetros tienden a ofrecer un mejor rendimiento. DeepSeek también ha lanzado versiones “destiladas” de R1, que varían en tamaño desde 1.5 mil millones hasta 70 mil millones de parámetros, lo que permite que incluso los dispositivos más modestos puedan ejecutar el modelo más pequeño. Sin embargo, el modelo completo requiere hardware más potente y está disponible a través de la API de DeepSeek a precios significativamente más bajos que los de OpenAI.
Desafíos y limitaciones del modelo
A pesar de sus impresionantes capacidades, R1 enfrenta desafíos únicos debido a su origen chino. El modelo está sujeto a regulaciones por parte del regulador de internet de China, lo que significa que no puede responder a preguntas sobre temas sensibles como la Plaza de Tiananmen o la autonomía de Taiwán. Esta limitación es común entre muchos sistemas de IA en China, que evitan abordar temas que podrían provocar la ira de los reguladores. Este contexto se vuelve aún más relevante en el marco de las recientes propuestas del gobierno de EE. UU. para endurecer las reglas de exportación y restricciones sobre tecnologías de IA para empresas chinas.
El futuro de la inteligencia artificial en China y EE. UU.
La llegada de R1 se produce en un momento crítico, ya que la administración saliente de Biden ha propuesto nuevas restricciones que podrían afectar la capacidad de las empresas chinas para acceder a tecnologías avanzadas de IA. OpenAI ha instado al gobierno de EE. UU. a apoyar el desarrollo de la inteligencia artificial nacional para evitar que los modelos chinos igualen o superen a los estadounidenses en capacidad. Con al menos tres laboratorios chinos, incluyendo DeepSeek, Alibaba y Kimi, desarrollando modelos que afirman rivalizar con o1, la competencia en el ámbito de la IA se intensifica.