OpenAI presenta Operator, su IA capaz de interactuar con cualquier sitio web en tu nombre
OpenAI anunció hoy la disponibilidad de Operator, una nueva herramienta dentro de la plataforma de servicios que cae bajo el paraguas de la inteligencia artificial generativa ChatGPT. ...
OpenAI anunció hoy la disponibilidad de Operator, una nueva herramienta dentro de la plataforma de servicios que cae bajo el paraguas de la inteligencia artificial generativa ChatGPT. Operator es un navegador web inteligente: puede entrar a cualquier sitio y realizar tareas allí por nosotros, porque entiende qué es lo que se despliega en pantalla, qué es un botón, una caja de texto, un link en una imagen, etcétera.
Según explica la compañía, Operator es “un agente que puede ir a la web para realizar tareas por vos. Usando su propio navegador, puede mirar una página web e interactuar con ella escribiendo, haciendo clic y desplazándose.” Al tiempo que aclara que es experimental, OpenAI advierte que Operator “es uno de nuestros primeros agentes, que son IA capaces de hacer el trabajo por usted de forma independiente: vos le asignás una tarea y él la ejecutará.”
Operator puede analizar lo que se ve en pantalla e interactuar con el sitio web simulando el mouse y el teclado a través de un navegador, lo que evitar tener que usar una API especializadas
Entre los ejemplos de tareas repetitivas que OpenAI propone para usar Operator en la web está:
completar formularioscomprar pasajes de aviónordenar alimentos en una tienda online crear memesSegún OpenAI, “la capacidad de utilizar las mismas interfaces y herramientas con las que interactúan los humanos a diario amplía la utilidad de la IA, ayudando a las personas a ahorrar tiempo en las tareas cotidianas y al mismo tiempo abre nuevas oportunidades de participación para las empresas.”
La compañía dice que ya está trabajando con DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber y otros para asegurarse de que la IA “entiende” esos sitios, para así optimizar su funcionamiento.
Operator ya tiene competenciaOperator no es la primera IA generativa capaz de interactuar con un sitio web externo: la IA Claude 3.5 Sonnet de Anthropic tiene una función similar (también experimental) que anunció en octubre último; Google también trabaja en algo así, una herramienta conocida internamente como Project Jarvis y que permite que Gemini gestione Chrome y la interacción con una página web.
De hecho, la posibilidad de interpretar un sitio web convencional como una persona era una de las promesas (fallidas) del Rabbit R1, el dispositivo presentado hace un año y que fue uno de los pioneros en llevar la IA a un dispositivo portátil.
Aun así, Operator tendrá la innegable ventaja de debutar en la plataforma de IA generativa más popular, aunque no estará disponible para todos inicialmente: por ahora estará limitada a los usuarios Pro (que pagan US$ 200 al mes) en Estados Unidos entrando al sitio oficial. La intención de OpenAI es probar primero con estos usuarios y luego hacerlo disponible para los miembros de los planes Plus, Team y Enterprise.