R1-0528 de Deepseek ahora se ubica justo detrás del O4-Mini de OpenAi

Fuente Cryptopolitan

Deepseek ha implementado R1-0528, una importante actualización al modelo de razonamiento R1 de la nueva empresa china, que se lanzó en enero. La actualización llegó solo un mes después de que el QWEN3 de Alibaba Group Holding venció al Deepseek R1 original en LiveBench, un punto de referencia en línea para modelos de inteligencia artificial de código abierto.

El modelo R1-0528 actualizado de Deepseek ahora se encuentra junto a los principales modelos de IA de OpenAI y Google en rendimiento. El regreso muestra qué tan rápido las grandes empresas de tecnología de China y las nuevas empresas tecnológicas están presionando para mejorar sus herramientas de IA.

En su declaración, Deepseek dijo que R1-0528 muestra un mejor razonamiento y habilidades de escritura creativa. La actualización también trae la capacidad de codificación StronGER. Lo más importante, la compañía afirma que el modelo ahora produce un 50% menos de "alucinaciones".

Deepseek explicó que las actualizaciones provenían de la potencia informática adicional invertida durante la fase posterior a la capacitación, cuando los ingenieros ajustan un modelo después del proceso de entrenamiento principal. Durante la fase posterior a la capacitación, los ingenieros tienen como objetivo aumentar la eficiencia del modelo y mejorar su precisión y seguridad.

R1-0528 ahora se ubica justo detrás del O3 y O4-Mini de OpenAi

En LivecodeBench, que mide el rendimiento del modelo AI, R1-0528 ahora se ubica justo detrás de los modelos O4-Mini y O3 de OpenAI.

"La última actualización de Deepseek es más nítida en el razonamiento, StronGer en Matemáticas y Código, y se acerca a modelos de primer nivel como Gemini y O3", dijo Adina Yakefu, investigadora de IA en Hugging Face.

Agregó que la nueva versión muestra "mejoras importantes en la inferencia y la reducción de la alucinación" y demuestra que la puesta en marcha no simplemente se está poniendo al día, sino que competir activamente.

El rápido progreso se produjo después de que Washington había restringido los chips avanzados y otras exportaciones de tecnología a China. Sin embargo, las empresas chinas continúan refinando sus sistemas. A principios de este mes, Baidu y Tencent describieron formas en que están haciendo que sus modelos funcionen de manera más eficiente a pesar del acceso limitado a semiconductores de vanguardia.

El presidente ejecutivo de NVIDIA, Jensen Huang, criticó los controles de exportación el miércoles. "Estados Unidos ha basado su política en el supuesto de que China no puede hacer chips de IA", dijo. "Esa suposición siempre fue cuestionable, y ahora está claramente incorrecta. La pregunta no es si China tendrá IA. Ya lo hace".

Deepseek aumentó el rendimiento del modelo QWEN3 8B de Alibaba en un 10%

Deepseek también dijo que destiló los pasos de razonamiento utilizados en R1-0528 en QWEN3 8B de Alibaba. Ese proceso creó un modelo nuevo y más pequeño que superó el rendimiento de Qwen3 en más del 10%, según la compañía. Al mismo tiempo, el modelo era 30 veces más pequeño.

"Creemos que la cadena de pensamiento de Deepseek-R1-0528 tendrá una importancia significativa para la investigación académica sobre modelos de razonamiento y trabajos industriales en modelos pequeños", declaró la empresa.

Según Reuters, un representante de Deepseek le dijo a un grupo de WeChat que el cambio fue una "actualización menor de prueba" que ya estaba abierta para las pruebas públicas. En respuesta a la competencia de Fiercer, Google ha descartado algunos niveles de acceso Gemini, mientras que OpenAI introdujo el modelo O3 Mini de menor costo.

Academia Cryptopolitan: ¿Cansado de columpios del mercado? Aprenda cómo DeFi puede ayudarlo a generar ingresos pasivos constantes. Registrarse ahora

Descargo de responsabilidad: Sólo con fines informativos. Rentabilidades pasadas no son indicativas de resultados futuros.
placeholder
El Índice del Dólar repunta modestamente mientras la corte de apelaciones de EE. UU. pone en pausa la prohibición de arancelesEl Dólar estadounidense (USD) se recupera el viernes tras una fuerte venta el día anterior, con los inversores permaneciendo inciertos sobre la existencia de la mayoría de los aranceles impuestos por el presidente de Estados Unidos (EE.UU.), Donald Trump, a todos sus socios comerciales desde su regreso a la Casa Blanca este año.
Autor  FXStreet
El dia de ayer 09: 16
El Dólar estadounidense (USD) se recupera el viernes tras una fuerte venta el día anterior, con los inversores permaneciendo inciertos sobre la existencia de la mayoría de los aranceles impuestos por el presidente de Estados Unidos (EE.UU.), Donald Trump, a todos sus socios comerciales desde su regreso a la Casa Blanca este año.
placeholder
GBP/USD Pronóstico del Precio: Comercio por debajo de 1.3500; permanece el sesgo alcista antes de los datos PCE de EE.UU.El par GBP/USD atrae a nuevos vendedores tras el buen rebote del día anterior desde la zona de 1.3415, o el mínimo semanal, en medio de un modesto repunte del Dólar estadounidense (USD)
Autor  FXStreet
El dia de ayer 06: 07
El par GBP/USD atrae a nuevos vendedores tras el buen rebote del día anterior desde la zona de 1.3415, o el mínimo semanal, en medio de un modesto repunte del Dólar estadounidense (USD)
placeholder
La SEC acepta desestimar la demanda contra Binance sin cargos adicionalesLa Comisión de Valores Bursátiles de EE.UU. (SEC) presentó una estipulación conjunta con el intercambio de criptomonedas Binance el jueves para desestimar su demanda contra la compañía, su ex CEO Changpeng Zhao (CZ) y su subsidiaria, Binance US.
Autor  FXStreet
El dia de ayer 02: 09
La Comisión de Valores Bursátiles de EE.UU. (SEC) presentó una estipulación conjunta con el intercambio de criptomonedas Binance el jueves para desestimar su demanda contra la compañía, su ex CEO Changpeng Zhao (CZ) y su subsidiaria, Binance US.
placeholder
XRP se mantiene estable a pesar de la oferta de 300 millones de dólares de Webus para lanzar la reserva de XRPEl XRP de Ripple vio una ligera disminución del 0.5% el jueves después de que Webus International (WETO) anunciara planes para lanzar una reserva de XRP a través de financiamiento no accionario por un valor de hasta 300 millones $.
Autor  FXStreet
El dia de ayer 01: 50
El XRP de Ripple vio una ligera disminución del 0.5% el jueves después de que Webus International (WETO) anunciara planes para lanzar una reserva de XRP a través de financiamiento no accionario por un valor de hasta 300 millones $.
placeholder
WTI se recupera aún más, acercándose a 63.00$ impulsado por una prohibición de arancelesLos precios del petróleo WTI aceleraron su recuperación el jueves, ya que un fallo de un tribunal estadounidense en contra de los aranceles de Trump aumentó las esperanzas de una normalización en el comercio global, lo que apoyará la demanda de crudo. El Tribunal de Comercio Internacional de EE.UU. dictaminó el miércoles que los aranceles comerciales unilaterales de Trump exceden la autoridad del Congreso de EE.UU.
Autor  FXStreet
5 Mes 29 Día Jue
Los precios del petróleo WTI aceleraron su recuperación el jueves, ya que un fallo de un tribunal estadounidense en contra de los aranceles de Trump aumentó las esperanzas de una normalización en el comercio global, lo que apoyará la demanda de crudo. El Tribunal de Comercio Internacional de EE.UU. dictaminó el miércoles que los aranceles comerciales unilaterales de Trump exceden la autoridad del Congreso de EE.UU.
goTop
quote