Deepseek ha implementado R1-0528, una importante actualización al modelo de razonamiento R1 de la nueva empresa china, que se lanzó en enero. La actualización llegó solo un mes después de que el QWEN3 de Alibaba Group Holding venció al Deepseek R1 original en LiveBench, un punto de referencia en línea para modelos de inteligencia artificial de código abierto.
El modelo R1-0528 actualizado de Deepseek ahora se encuentra junto a los principales modelos de IA de OpenAI y Google en rendimiento. El regreso muestra qué tan rápido las grandes empresas de tecnología de China y las nuevas empresas tecnológicas están presionando para mejorar sus herramientas de IA.
En su declaración, Deepseek dijo que R1-0528 muestra un mejor razonamiento y habilidades de escritura creativa. La actualización también trae la capacidad de codificación StronGER. Lo más importante, la compañía afirma que el modelo ahora produce un 50% menos de "alucinaciones".
Deepseek explicó que las actualizaciones provenían de la potencia informática adicional invertida durante la fase posterior a la capacitación, cuando los ingenieros ajustan un modelo después del proceso de entrenamiento principal. Durante la fase posterior a la capacitación, los ingenieros tienen como objetivo aumentar la eficiencia del modelo y mejorar su precisión y seguridad.
En LivecodeBench, que mide el rendimiento del modelo AI, R1-0528 ahora se ubica justo detrás de los modelos O4-Mini y O3 de OpenAI.
"La última actualización de Deepseek es más nítida en el razonamiento, StronGer en Matemáticas y Código, y se acerca a modelos de primer nivel como Gemini y O3", dijo Adina Yakefu, investigadora de IA en Hugging Face.
Agregó que la nueva versión muestra "mejoras importantes en la inferencia y la reducción de la alucinación" y demuestra que la puesta en marcha no simplemente se está poniendo al día, sino que competir activamente.
El rápido progreso se produjo después de que Washington había restringido los chips avanzados y otras exportaciones de tecnología a China. Sin embargo, las empresas chinas continúan refinando sus sistemas. A principios de este mes, Baidu y Tencent describieron formas en que están haciendo que sus modelos funcionen de manera más eficiente a pesar del acceso limitado a semiconductores de vanguardia.
El presidente ejecutivo de NVIDIA, Jensen Huang, criticó los controles de exportación el miércoles. "Estados Unidos ha basado su política en el supuesto de que China no puede hacer chips de IA", dijo. "Esa suposición siempre fue cuestionable, y ahora está claramente incorrecta. La pregunta no es si China tendrá IA. Ya lo hace".
Deepseek también dijo que destiló los pasos de razonamiento utilizados en R1-0528 en QWEN3 8B de Alibaba. Ese proceso creó un modelo nuevo y más pequeño que superó el rendimiento de Qwen3 en más del 10%, según la compañía. Al mismo tiempo, el modelo era 30 veces más pequeño.
"Creemos que la cadena de pensamiento de Deepseek-R1-0528 tendrá una importancia significativa para la investigación académica sobre modelos de razonamiento y trabajos industriales en modelos pequeños", declaró la empresa.
Según Reuters, un representante de Deepseek le dijo a un grupo de WeChat que el cambio fue una "actualización menor de prueba" que ya estaba abierta para las pruebas públicas. En respuesta a la competencia de Fiercer, Google ha descartado algunos niveles de acceso Gemini, mientras que OpenAI introdujo el modelo O3 Mini de menor costo.
Academia Cryptopolitan: ¿Cansado de columpios del mercado? Aprenda cómo DeFi puede ayudarlo a generar ingresos pasivos constantes. Registrarse ahora