El agente operador de OpenAI recibe un impulso con el nuevo modelo de IA

Fuente Cryptopolitan

OpenAI actualizó el operador de alimentación del modelo AI de la versión personalizada anterior de GPT-4O a un modelo basado en O3, uno de los últimos en la serie O de OpenAI de modelos de "razonamiento". El operador O3 fue ajustado con datos de seguridad adicionales para el uso de la computadora e incluía conjuntos de datos de seguridad diseñados para enseñar los límites de decisión del modelo.

Operai actualizó el operador en ChatGPT con un nuevo modelo de agente de uso de computadora (CUA) basado en una versión de OpenAI O3. Con el nuevo modelo, el operador se volvió más persistente y más preciso al interactuar con el navegador, mejorando la tasa general de éxito de la tarea. También ofrece respuestas mejor estructuradas que son más claras y exhaustivas.

Según Openai , el nuevo modelo CUA mostró el rendimiento de S tron Ger en relación con la industria, logrando SOTA en Osworld y Webarena. También mostró el rendimiento relativo de S tron a la versión anterior, tanto en puntos de referencia establecidos como en evaluaciones de preferencias humanas.

Operai reemplaza el modelo basado en GPT-4O con una versión basada en O3

Openai reemplazó el modelo existente basado en GPT-4O para el operador con una versión basada en OpenAI O3, aunque la versión API permanecerá basada en 4O. La firma AI también afirmó que el operador O3 utiliza el mismo enfoque de seguridad de múltiples capas utilizado para la versión 4O.

Sin embargo, en comparación con otros modelos de la familia O3, el operador O3 se ajustó con datos de seguridad adicionales para el uso de la computadora, incluidos los conjuntos de datos de seguridad diseñados para enseñar los límites de decisión del modelo en confirmaciones y rechazos.

Openai publicó un informe técnico que muestra el rendimiento del operador O3 en evaluaciones de seguridad específicas. En comparación con el modelo de operador GPT-4O, el operador O3 tenía menos probabilidades de negarse a realizar actividades "ilícitas" y buscar datos personales confidenciales y menos susceptible a una forma de ataque de IA conocido como "inyección inmediata".

"El operador O3 utiliza el mismo enfoque de seguridad múltiple que utilizamos para la versión 4O del operador ... aunque el operador O3 hereda las capacidades de codificación de O3, no tiene acceso nativo a un entorno de codificación o terminal".

IA abierta

La firma de IA también reveló que el nuevo modelo basado en O3 pasó por evaluaciones de seguridad estándar, y el operador continuó estando disponible como una vista previa de investigación para los usuarios de ChatGPT Pro a nivel mundial. Sin embargo, este modelo actualizado solo estaba disponible en el operador en ChatGPT.

Knoop sospecha que ejecuta el modelo O3 de OpenAI podría ser más costoso de lo esperado

La semana pasada, la Fundación del Premio ARC, que mantiene y administra ARC-AGI, actualizó sus costos de computación aproximados para O3. La organización originalmente estimó que la configuración de mejor rendimiento de O3 que probó, O3 alta, costó alrededor de $ 3K para resolver un solo problema de ARC-AGI. Sin embargo, la Fundación ahora cree que el costo podría ser 10 veces mayor de lo estimado previamente, posiblemente alrededor de $ 30k por tarea.

Además, aunque OpenAi aún no tiene que fijar el precio de O3 o liberarlo por completo, uno de los cofundadores de la Fundación del Premio ARC, Mike Knoop, cree que el precio del modelo O1-Pro es un proxy razonable y una comparación más cercana del verdadero costo de O3. Él, sin embargo, agregó que O3 continuaría siendo etiquetado como una vista previa en la tabla de clasificación para reflejar la incertidumbre hasta que se anunciara el precio oficial.

Según la Fundación del Premio ARC, un alto precio para O3 High no estaría fuera de la cuestión, dada la cantidad de recursos informáticos, según los informes, el modelo utiliza. O3 High usó 172x más de computación que O3 Low, la configuración de baja computadora de O3, para abordar ARC-AGI.

Los rumores han estado volando desde principios de marzo sobre los costosos planes que Operai estaba considerando presentar a los clientes empresariales. La información informó que la compañía puede cobrar hasta $ 20k por mes por "agentes" especializados de IA, como los agentes de desarrolladores de software.

Sin embargo, mientras que algunos argumentaron que incluso los modelos más caros de OpenAi costarían bien bajo lo que un típicotrachumano o empleado ordenaría, el investigador de IA Toby Ord señaló que los modelos pueden no ser tan eficientes. Por ejemplo, O3 High necesitaba 1.024 intentos en cada tarea en ARC-AGI para lograr su mejor puntaje.

Cable de diferencia de clave : la herramienta secreta que los proyectos de cifrado utilizan para obtener cobertura de medios garantizada

Descargo de responsabilidad: Sólo con fines informativos. Rentabilidades pasadas no son indicativas de resultados futuros.
placeholder
El Salvador será sede de la primera conferencia mundial Bitcoin respaldada por el gobiernoEl Salvador será sede de la primera conferencia Bitcoin del mundo respaldada por el gobierno en noviembre de 2025.
Autor  Cryptopolitan
9 Mes 02 Día Mar
El Salvador será sede de la primera conferencia Bitcoin del mundo respaldada por el gobierno en noviembre de 2025.
placeholder
Oro retrocede desde máximos históricos a medida que los alcistas se muestran cautelosos en medio de una nueva recuperación del USDEl Oro (XAU/USD) prolonga su tendencia alcista observada durante las últimas dos semanas y avanza a un nuevo máximo histórico, alrededor de la región de 3.546-3.547$ durante la sesión asiática del miércoles.
Autor  FXStreet
El dia de ayer 05: 46
El Oro (XAU/USD) prolonga su tendencia alcista observada durante las últimas dos semanas y avanza a un nuevo máximo histórico, alrededor de la región de 3.546-3.547$ durante la sesión asiática del miércoles.
placeholder
EE.UU. elimina la exención de TSMC para enviar libremente suministros de chips a ChinaEE.UU. elimina la exención de TSMC para enviar libremente suministros de chips a China.
Autor  Cryptopolitan
23 hace una horas
EE.UU. elimina la exención de TSMC para enviar libremente suministros de chips a China.
placeholder
El oro prolonga su racha de récords apoyándose en la demanda de activos refugioLos precios del oro extendían su racha récord el miércoles, mientras la persistente incertidumbre del mercado y la creciente confianza de los inversores en que la Reserva Federal de Estados Unidos recortará los tipos de interés este mes elevaron la demanda del metal refugio.
Autor  Reuters
23 hace una horas
Los precios del oro extendían su racha récord el miércoles, mientras la persistente incertidumbre del mercado y la creciente confianza de los inversores en que la Reserva Federal de Estados Unidos recortará los tipos de interés este mes elevaron la demanda del metal refugio.
placeholder
El rendimiento de los bonos a largo plazo sube y el oro bate récordLa caída mundial de los bonos a largo plazo se extendía a Asia el miércoles, y el rendimiento de los bonos japoneses alcanzaba un máximo histórico, mientras que el oro marcó un nuevo máximo ante la creciente preocupación de los inversores por la deuda pública y el crecimiento económico.
Autor  Reuters
23 hace una horas
La caída mundial de los bonos a largo plazo se extendía a Asia el miércoles, y el rendimiento de los bonos japoneses alcanzaba un máximo histórico, mientras que el oro marcó un nuevo máximo ante la creciente preocupación de los inversores por la deuda pública y el crecimiento económico.
goTop
quote