
Llega ChatGPT Agent, un agente autónomo capaz de ejecutar tareas complejas en la web
por Edgar OteroLos principales laboratorios siguen empeñados en lanzar lo que se conoce como agentes de IA. Perplexity propone algo así con Comet, su primer navegador con IA plenamente integrada. Ahora, OpenAI ha lanzado una nueva función para ChatGPT que permite delegar tareas complejas a un agente autónomo con capacidad para navegar por la web, ejecutar código, interactuar con formularios y generar archivos editables.
Este agente de ChatGPT combina dos tecnologías previas. Por un lado, Operator, que permitía interactuar con sitios web a través de un navegador remoto. Y, por el otro lado, la herramienta de investigación avanzada, diseñada para sintetizar información desde múltiples fuentes. Al fusionarlas, el sistema puede ahora pasar de una simple conversación a ejecutar tareas autónomas sin necesidad de cambiar de entorno ni de herramientas.
Interacción en tiempo real y control del usuario
Uno de los aspectos clave del nuevo agente es su diseño colaborativo. Los usuarios pueden interrumpir, ajustar o pausar las tareas en cualquier momento, sin que se pierda el progreso. El agente también solicita confirmación antes de realizar acciones sensibles, como enviar formularios o iniciar sesión, lo que garantiza que el usuario mantiene el control en todo momento.
ChatGPT evalúa continuamente los pasos a seguir y puede utilizar distintas vías de acceso a la información, desde navegadores visuales hasta API especializadas, para optimizar el rendimiento en función del tipo de tarea. Esto permite automatizar procesos como preparar informes financieros, crear modelos de datos o elaborar presentaciones a partir de datos sin procesar.
Rendimiento validado en tareas reales
Según evaluaciones internas de la propia OpenAI, el agente ha superado a modelos anteriores y a humanos en tareas de análisis, modelado y edición de hojas de cálculo. En benchmarks como DSBench y SpreadsheetBench, ha logrado récords de precisión que muestran su capacidad para manejar flujos de trabajo técnicos y administrativos de alto nivel.
En pruebas específicas, como la simulación de tareas de analistas financieros de primer año, el agente ha superado con claridad a versiones anteriores como o3 y al sistema de investigación profunda, al demostrar mayor precisión en el uso de fórmulas y en el formato de los entregables. También ha sacado buenas notas en WebArena y BrowseComp, dos entornos de evaluación diseñados para medir la efectividad de los agentes al navegar e interactuar con sitios web reales.
Seguridad y disponibilidad gradual
El despliegue del agente ha puesto especial énfasis en la seguridad. ChatGPT pide confirmación explícita antes de realizar acciones con impacto en el mundo real y rechaza tareas de alto riesgo, como transacciones financieras. Además, se han implementado controles de privacidad reforzados: el navegador remoto no almacena datos introducidos por el usuario y permite borrar toda la actividad con un solo clic.
El agente comienza a estar disponible para usuarios de los planes Pro, Plus y Team, con despliegue previsto para empresas y centros educativos durante el mes de julio. Se puede activar desde el menú de herramientas del editor, seleccionando el "modo agente" al iniciar la conversación.
Aunque todavía está en fase beta, el objetivo de OpenAI es seguir ampliando las capacidades del agente, incluyendo mejoras en la generación de presentaciones, más conectores personalizados y mayor autonomía en flujos de trabajo complejos. Ahora queda por ver qué tal se maneja en entornos reales y cuál es su fiabilidad a la hora de ejecutar ciertas tareas. De hecho, no todo el mundo tiene tan claro que 2025 vaya a ser el año de los agentes de IA.
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!