El agente operador de OpenAI recibe un impulso con el nuevo modelo de IA

Fuente Cryptopolitan

OpenAI actualizó el operador de alimentación del modelo AI de la versión personalizada anterior de GPT-4O a un modelo basado en O3, uno de los últimos en la serie O de OpenAI de modelos de "razonamiento". El operador O3 fue ajustado con datos de seguridad adicionales para el uso de la computadora e incluía conjuntos de datos de seguridad diseñados para enseñar los límites de decisión del modelo.

Operai actualizó el operador en ChatGPT con un nuevo modelo de agente de uso de computadora (CUA) basado en una versión de OpenAI O3. Con el nuevo modelo, el operador se volvió más persistente y más preciso al interactuar con el navegador, mejorando la tasa general de éxito de la tarea. También ofrece respuestas mejor estructuradas que son más claras y exhaustivas.

Según Openai , el nuevo modelo CUA mostró el rendimiento de S tron Ger en relación con la industria, logrando SOTA en Osworld y Webarena. También mostró el rendimiento relativo de S tron a la versión anterior, tanto en puntos de referencia establecidos como en evaluaciones de preferencias humanas.

Operai reemplaza el modelo basado en GPT-4O con una versión basada en O3

Openai reemplazó el modelo existente basado en GPT-4O para el operador con una versión basada en OpenAI O3, aunque la versión API permanecerá basada en 4O. La firma AI también afirmó que el operador O3 utiliza el mismo enfoque de seguridad de múltiples capas utilizado para la versión 4O.

Sin embargo, en comparación con otros modelos de la familia O3, el operador O3 se ajustó con datos de seguridad adicionales para el uso de la computadora, incluidos los conjuntos de datos de seguridad diseñados para enseñar los límites de decisión del modelo en confirmaciones y rechazos.

Openai publicó un informe técnico que muestra el rendimiento del operador O3 en evaluaciones de seguridad específicas. En comparación con el modelo de operador GPT-4O, el operador O3 tenía menos probabilidades de negarse a realizar actividades "ilícitas" y buscar datos personales confidenciales y menos susceptible a una forma de ataque de IA conocido como "inyección inmediata".

"El operador O3 utiliza el mismo enfoque de seguridad múltiple que utilizamos para la versión 4O del operador ... aunque el operador O3 hereda las capacidades de codificación de O3, no tiene acceso nativo a un entorno de codificación o terminal".

IA abierta

La firma de IA también reveló que el nuevo modelo basado en O3 pasó por evaluaciones de seguridad estándar, y el operador continuó estando disponible como una vista previa de investigación para los usuarios de ChatGPT Pro a nivel mundial. Sin embargo, este modelo actualizado solo estaba disponible en el operador en ChatGPT.

Knoop sospecha que ejecuta el modelo O3 de OpenAI podría ser más costoso de lo esperado

La semana pasada, la Fundación del Premio ARC, que mantiene y administra ARC-AGI, actualizó sus costos de computación aproximados para O3. La organización originalmente estimó que la configuración de mejor rendimiento de O3 que probó, O3 alta, costó alrededor de $ 3K para resolver un solo problema de ARC-AGI. Sin embargo, la Fundación ahora cree que el costo podría ser 10 veces mayor de lo estimado previamente, posiblemente alrededor de $ 30k por tarea.

Además, aunque OpenAi aún no tiene que fijar el precio de O3 o liberarlo por completo, uno de los cofundadores de la Fundación del Premio ARC, Mike Knoop, cree que el precio del modelo O1-Pro es un proxy razonable y una comparación más cercana del verdadero costo de O3. Él, sin embargo, agregó que O3 continuaría siendo etiquetado como una vista previa en la tabla de clasificación para reflejar la incertidumbre hasta que se anunciara el precio oficial.

Según la Fundación del Premio ARC, un alto precio para O3 High no estaría fuera de la cuestión, dada la cantidad de recursos informáticos, según los informes, el modelo utiliza. O3 High usó 172x más de computación que O3 Low, la configuración de baja computadora de O3, para abordar ARC-AGI.

Los rumores han estado volando desde principios de marzo sobre los costosos planes que Operai estaba considerando presentar a los clientes empresariales. La información informó que la compañía puede cobrar hasta $ 20k por mes por "agentes" especializados de IA, como los agentes de desarrolladores de software.

Sin embargo, mientras que algunos argumentaron que incluso los modelos más caros de OpenAi costarían bien bajo lo que un típicotrachumano o empleado ordenaría, el investigador de IA Toby Ord señaló que los modelos pueden no ser tan eficientes. Por ejemplo, O3 High necesitaba 1.024 intentos en cada tarea en ARC-AGI para lograr su mejor puntaje.

Cable de diferencia de clave : la herramienta secreta que los proyectos de cifrado utilizan para obtener cobertura de medios garantizada

Descargo de responsabilidad: Sólo con fines informativos. Rentabilidades pasadas no son indicativas de resultados futuros.
placeholder
El Oro extiende la corrección en medio del optimismo comercial y la fortaleza del DólarEl precio del oro (XAU/USD) extiende la corrección, deslizándose por debajo de la marca de 3.300$ en el momento de escribir el martes en medio de un mejor apetito por el riesgo y un Dólar estadounidense (USD) más fuerte.
Autor  FXStreet
7 hace una horas
El precio del oro (XAU/USD) extiende la corrección, deslizándose por debajo de la marca de 3.300$ en el momento de escribir el martes en medio de un mejor apetito por el riesgo y un Dólar estadounidense (USD) más fuerte.
placeholder
Pronóstico del Precio de Ethereum: Los inversores de ETH regresan a la compra neta, pero la dominancia corta frena el crecimiento del precioEthereum (ETH) ha subido un 1% el lunes tras señales mixtas en sus datos en cadena, donde los compradores lideran en los intercambios al contado, pero los cortos dominan en el mercado de derivados.
Autor  FXStreet
15 hace una horas
Ethereum (ETH) ha subido un 1% el lunes tras señales mixtas en sus datos en cadena, donde los compradores lideran en los intercambios al contado, pero los cortos dominan en el mercado de derivados.
placeholder
El S&P 500 reacciona al alza tras la pausa arancelaria de Trump a la Unión Europea​El S&P 500 marcó un mínimo del día en 5.846, atrayendo compradores que impulsaron el índice a un máximo no visto desde el 21 de mayo en 5.879.
Autor  FXStreet
15 hace una horas
​El S&P 500 marcó un mínimo del día en 5.846, atrayendo compradores que impulsaron el índice a un máximo no visto desde el 21 de mayo en 5.879.
placeholder
Índice del Dólar DXY alcanza un nuevo mínimo de un mes por debajo de 99.00 mientras mejora el apetito por el riesgoEl Índice del Dólar estadounidense (DXY) ha comenzado la semana con el mismo tono débil visto durante la última.
Autor  FXStreet
El dia de ayer 07: 35
El Índice del Dólar estadounidense (DXY) ha comenzado la semana con el mismo tono débil visto durante la última.
placeholder
Los mercados de criptomonedas avanzan ligeramente mientras el presidente Trump retrasa el arancel del 50% sobre los productos de la UE hasta el 9 de julioEl mercado de criptomonedas se está recuperando modestamente durante las horas asiáticas del lunes, apoyado por la disminución de las tensiones geopolíticas después de que el presidente de EE.UU., Donald Trump, anunciara un retraso en el arancel del 50% planeado sobre los bienes de la Unión Europea.
Autor  FXStreet
El dia de ayer 07: 11
El mercado de criptomonedas se está recuperando modestamente durante las horas asiáticas del lunes, apoyado por la disminución de las tensiones geopolíticas después de que el presidente de EE.UU., Donald Trump, anunciara un retraso en el arancel del 50% planeado sobre los bienes de la Unión Europea.
goTop
quote