IA. OpenAI lance un agent IA autonome qui exécute des tâches en ligne
OpenAI, le créateur de ChatGPT, a lancé jeudi Operator, un agent IA (intelligence artificielle) capable d'effectuer des tâches en ligne pour l'utilisateur. Operator peut notamment planifier des vacances, réserver un restaurant ou faire des courses.
Partager
ATS et AFP
Aujourd’hui à 03:43, mis à jour à 03:48
L'agent IA "utilise son propre navigateur", a indiqué l'entreprise californienne dans un communiqué. Il peut "regarder une page Internet, la faire défiler, cliquer sur les boutons" et "remplir les champs de texte comme les gens le font au quotidien".
La nouvelle fonction n'est pour l'instant disponible que pour les abonnés professionnels de ChatGPT, afin de l'améliorer grâce aux retours. "Operator est l'un de nos premiers agents, c'est-à-dire des IA capables d'effectuer des tâches pour vous de manière autonome: vous lui confiez une tâche et il l'exécute", résume OpenAI.
L'explosion de l'IA générative avec le succès de ChatGPT depuis la fin 2022 a lancé une course effrénée aux assistants IA entre les géants des technologies, qui déploient rapidement des outils capables de rédiger des messages, de répondre à des questions, de générer des images.
Computer Use, Gemini 2.0
Le Graal de la Silicon Valley, ce sont les agents IA, quand la machine devient une sorte de secrétaire omniscient, disponible à toute heure et capable d'exécuter de nombreuses tâches, des messages à envoyer aux courses sur Internet. Sur ce terrain, OpenAI n'est pas le plus rapide, au moins en termes de déploiement.
Operator ressemble à "Computer Use", une fonctionnalité lancée en octobre par Anthropic, une start-up rivale.
Computer Use permet en effet à Claude, l'interface d'IA générative d'Anthropic, d'utiliser les ordinateurs comme un humain, de la sélection des boutons à la saisie de texte et au maniement de différents logiciels.
Google, qui a présenté en décembre Gemini 2.0, sa nouvelle famille de modèles d'IA générative, avance aussi sur des interactions plus complexes avec la technologie, pour que les agents IA naviguent sur Internet de façon autonome, cherchent des informations complémentaires en ligne ou dans un document.