El nuevo agente de ChatGPT promete navegar webs, ejecutar código, usar APIs y gestionar aplicaciones. Un paso más hacia la delegación digital masiva… con riesgos explosivos.
El salto de OpenAI: de asistente a operador autónomo
OpenAI ha dado el paso más osado desde la creación de ChatGPT: lanzar un agente de propósito general capaz de realizar tareas complejas por cuenta del usuario, incluyendo navegación web, análisis de competidores, compras, ejecución de código e integración con herramientas como Gmail o GitHub.
Esta nueva funcionalidad, bautizada simplemente como agente de ChatGPT, estará disponible para suscriptores de los planes Pro, Plus y Team, y se activa desde el nuevo “modo agente” del menú.
ChatGPT ya no solo responde: actúa
A diferencia de versiones anteriores, este agente no se limita a generar texto. Según OpenAI, puede crear presentaciones editables, gestionar calendarios, buscar datos en la red y sintetizar informes con información en tiempo real. Incluso puede interactuar con terminales y usar APIs externas, lo que lo convierte en un operador digital autónomo.
Casos de uso citados: organizar una lista de compras para un desayuno japonés, analizar a tres competidores y generar una presentación estratégica. Todo desde lenguaje natural.
Los riesgos no son ficción: seguridad y uso malicioso
Pero el poder tiene precio. OpenAI ha calificado su agente como un modelo de “alta capacidad” para el ámbito de armas biológicas y químicas, según su propio Marco de Preparación en Seguridad. Aunque no existe evidencia directa, se han activado monitores en tiempo real que rastrean si el agente procesa contenido relacionado con biología o amenazas potenciales.
Además, la función de memoria ha sido desactivada preventivamente, ante el riesgo de que actores maliciosos puedan realizar ataques de exfiltración de datos a través de “inyecciones rápidas” de prompts diseñados.
¿Una revolución útil o una herramienta con doble filo?
Los benchmarks son impresionantes:
- 41,6 % en el exigente “Último Examen de la Humanidad” (el doble que modelos anteriores).
- 27,4 % en FrontierMath, superando ampliamente el 6,3 % de o4-mini.
Pero la gran pregunta sigue sin respuesta: ¿funcionará este agente en el mundo real con fiabilidad, o estamos ante una promesa aún frágil? Silicon Valley lleva años anunciando agentes inteligentes, pero pocos han demostrado ser productivos fuera de entornos controlados.
Hacia una delegación digital total: ¿quién vigila al agente?
Con este paso, OpenAI avanza hacia una visión donde el usuario cede decisiones y tareas directamente a una inteligencia artificial. La línea entre herramienta y operador empieza a desdibujarse. En manos equivocadas, el agente ChatGPT podría ser más que útil: potencialmente peligroso.
¿Estamos asistiendo a la revolución de la productividad digital o al inicio del control automatizado disfrazado de asistente virtual?



