OpenAI actualizó el operador de alimentación del modelo AI de la versión personalizada anterior de GPT-4O a un modelo basado en O3, uno de los últimos en la serie O de OpenAI de modelos de "razonamiento". El operador O3 fue ajustado con datos de seguridad adicionales para el uso de la computadora e incluía conjuntos de datos de seguridad diseñados para enseñar los límites de decisión del modelo.
Operai actualizó el operador en ChatGPT con un nuevo modelo de agente de uso de computadora (CUA) basado en una versión de OpenAI O3. Con el nuevo modelo, el operador se volvió más persistente y más preciso al interactuar con el navegador, mejorando la tasa general de éxito de la tarea. También ofrece respuestas mejor estructuradas que son más claras y exhaustivas.
Según Openai , el nuevo modelo CUA mostró el rendimiento de S tron Ger en relación con la industria, logrando SOTA en Osworld y Webarena. También mostró el rendimiento relativo de S tron a la versión anterior, tanto en puntos de referencia establecidos como en evaluaciones de preferencias humanas.
Operai sugiere una gran actualización para el agente del operador de chatgpt pic.twitter.com/igpqp9butd
- Sabatage (@Sabatage) 22 de mayo de 2025
Openai reemplazó el modelo existente basado en GPT-4O para el operador con una versión basada en OpenAI O3, aunque la versión API permanecerá basada en 4O. La firma AI también afirmó que el operador O3 utiliza el mismo enfoque de seguridad de múltiples capas utilizado para la versión 4O.
Sin embargo, en comparación con otros modelos de la familia O3, el operador O3 se ajustó con datos de seguridad adicionales para el uso de la computadora, incluidos los conjuntos de datos de seguridad diseñados para enseñar los límites de decisión del modelo en confirmaciones y rechazos.
Openai publicó un informe técnico que muestra el rendimiento del operador O3 en evaluaciones de seguridad específicas. En comparación con el modelo de operador GPT-4O, el operador O3 tenía menos probabilidades de negarse a realizar actividades "ilícitas" y buscar datos personales confidenciales y menos susceptible a una forma de ataque de IA conocido como "inyección inmediata".
"El operador O3 utiliza el mismo enfoque de seguridad múltiple que utilizamos para la versión 4O del operador ... aunque el operador O3 hereda las capacidades de codificación de O3, no tiene acceso nativo a un entorno de codificación o terminal".
–IA abierta
La firma de IA también reveló que el nuevo modelo basado en O3 pasó por evaluaciones de seguridad estándar, y el operador continuó estando disponible como una vista previa de investigación para los usuarios de ChatGPT Pro a nivel mundial. Sin embargo, este modelo actualizado solo estaba disponible en el operador en ChatGPT.
La semana pasada, la Fundación del Premio ARC, que mantiene y administra ARC-AGI, actualizó sus costos de computación aproximados para O3. La organización originalmente estimó que la configuración de mejor rendimiento de O3 que probó, O3 alta, costó alrededor de $ 3K para resolver un solo problema de ARC-AGI. Sin embargo, la Fundación ahora cree que el costo podría ser 10 veces mayor de lo estimado previamente, posiblemente alrededor de $ 30k por tarea.
Además, aunque OpenAi aún no tiene que fijar el precio de O3 o liberarlo por completo, uno de los cofundadores de la Fundación del Premio ARC, Mike Knoop, cree que el precio del modelo O1-Pro es un proxy razonable y una comparación más cercana del verdadero costo de O3. Él, sin embargo, agregó que O3 continuaría siendo etiquetado como una vista previa en la tabla de clasificación para reflejar la incertidumbre hasta que se anunciara el precio oficial.
Según la Fundación del Premio ARC, un alto precio para O3 High no estaría fuera de la cuestión, dada la cantidad de recursos informáticos, según los informes, el modelo utiliza. O3 High usó 172x más de computación que O3 Low, la configuración de baja computadora de O3, para abordar ARC-AGI.
Los rumores han estado volando desde principios de marzo sobre los costosos planes que Operai estaba considerando presentar a los clientes empresariales. La información informó que la compañía puede cobrar hasta $ 20k por mes por "agentes" especializados de IA, como los agentes de desarrolladores de software.
Sin embargo, mientras que algunos argumentaron que incluso los modelos más caros de OpenAi costarían bien bajo lo que un típicotrachumano o empleado ordenaría, el investigador de IA Toby Ord señaló que los modelos pueden no ser tan eficientes. Por ejemplo, O3 High necesitaba 1.024 intentos en cada tarea en ARC-AGI para lograr su mejor puntaje.
Cable de diferencia de clave : la herramienta secreta que los proyectos de cifrado utilizan para obtener cobertura de medios garantizada