Amazon frappe fort avec Nova Act : l’agent IA autonome qui redéfinit l’interaction web

20 avril 2025

Amazon vient de franchir un cap majeur dans la course à l’intelligence artificielle en dévoilant Nova Act, un agent IA autonome capable d’effectuer des actions complexes dans un navigateur web. Cette innovation pourrait bien transformer notre manière d’interagir avec le numérique, en automatisant des tâches jusqu’ici réservées aux humains, comme faire des achats, remplir des formulaires ou naviguer sur des interfaces complexes. Derrière ce projet ambitieux, un objectif clair : rendre les agents intelligents plus fiables, plus efficaces, et surtout… réellement utiles au quotidien.

Dans cet article, nous allons découvrir en détail ce qu’est Nova Act, comment il fonctionne, quelles sont ses applications concrètes et pourquoi il représente un tournant stratégique pour Amazon dans le domaine de l’intelligence artificielle.


Qu’est-ce que Nova Act ?

Nova Act est un agent intelligent développé par le laboratoire AGI (Artificial General Intelligence) d’Amazon, basé à San Francisco. Cet agent se distingue par sa capacité à agir de manière autonome dans un navigateur web, comme le ferait un humain. Contrairement aux simples assistants vocaux ou aux chatbots conversationnels, Nova Act peut lire une page, cliquer sur des boutons, remplir des champs, analyser les informations affichées à l’écran, puis décider de l’action suivante à entreprendre.

Cette forme d’autonomie marque une étape importante dans le développement de l’intelligence artificielle dite “générale”. Elle rapproche les agents numériques de véritables assistants personnels capables d’intervenir dans des situations complexes sans supervision constante.


Une IA conçue pour agir, pas seulement pour répondre

Jusqu’à présent, la plupart des modèles d’IA, même les plus avancés comme ChatGPT ou Claude, ont été conçus pour répondre à des questions, produire du texte ou générer des images. Nova Act, lui, a été conçu pour agir dans le monde numérique.

L’agent utilise une combinaison de vision par ordinateur, d’apprentissage par renforcement et d’analyse contextuelle pour comprendre ce qui se passe sur un écran et prendre des décisions. Par exemple, on peut lui demander d’acheter un produit sur un site e-commerce en évitant les options d’assurance superflues : il est capable de suivre cette instruction, de localiser les bons boutons, et de finaliser l’achat de manière autonome.

Ce niveau d’interaction requiert une compréhension bien plus fine de l’environnement, mais aussi une fiabilité extrême, car les erreurs peuvent avoir des conséquences concrètes (paiements, réservations, publications, etc.).


Un projet porté par l’ancien VP d’OpenAI

Le développement de Nova Act a été supervisé par David Luan, ancien vice-président de l’ingénierie chez OpenAI. Recruté par Amazon pour diriger le laboratoire AGI, il incarne l’ambition d’Amazon de rattraper — voire dépasser — ses concurrents dans la course à l’IA.

Luan insiste sur l’importance de créer des agents fiables et robustes, capables de fonctionner dans des environnements réels, plutôt que de viser uniquement des démonstrations impressionnantes mais peu reproductibles. Nova Act est donc le fruit d’un travail en profondeur sur la précision des actions, la gestion des erreurs et la reproductibilité des comportements.


Quelles sont les capacités concrètes de Nova Act ?

Nova Act a été conçu pour exécuter des tâches web complexes de manière totalement autonome. Voici quelques exemples de ce qu’il est capable de faire :

  • Faire du shopping en ligne : trouver un produit, le comparer, ajouter au panier, éviter les options inutiles, valider un paiement.
  • Remplir des formulaires : saisir des informations personnelles, cocher les bonnes cases, soumettre des données.
  • Réserver des services : acheter un billet d’avion, planifier un rendez-vous, organiser une livraison.
  • Naviguer dans des interfaces complexes : tableaux de bord, portails clients, back-offices professionnels.
  • Suivre des instructions précises : ignorer certains éléments, prioriser d’autres, gérer des conditions spéciales.

Cette polyvalence est rendue possible par l’intégration avec Playwright, un outil de test automatisé pour les navigateurs. Nova Act peut donc non seulement analyser l’interface utilisateur mais aussi y interagir comme le ferait un testeur humain.


Un SDK pour les développeurs

Amazon ne se contente pas de proposer Nova Act comme un produit fini. L’entreprise a également mis à disposition un SDK (Software Development Kit), permettant aux développeurs de créer leurs propres agents personnalisés basés sur Nova Act.

Ce SDK facilite :

  • La décomposition de workflows complexes en actions simples et fiables.
  • L’ajout de logiques conditionnelles et de paramètres dynamiques.
  • La combinaison entre actions par navigateur et appels API.
  • Le test et le débogage des agents dans des environnements simulés.

Cette ouverture aux développeurs vise à encourager un écosystème d’agents IA pour des usages très variés, allant du service client à l’automatisation administrative.


Une intégration stratégique avec Alexa

Nova Act n’est pas un produit isolé. Il s’inscrit dans une stratégie plus large d’Amazon visant à renforcer les capacités de son assistant vocal Alexa. L’objectif est de combler les limites actuelles des assistants vocaux qui ne peuvent agir que dans des environnements prédéfinis, avec des API disponibles.

Avec Nova Act, Alexa pourrait prochainement accomplir des actions sur le web même en l’absence d’API, comme réserver une table sur un site qui ne propose pas d’interface dédiée ou effectuer un achat complexe nécessitant plusieurs clics.


Des performances qui dépassent les leaders actuels

Amazon affirme que Nova Act dépasse les agents d’OpenAI et d’Anthropic sur plusieurs benchmarks, notamment ceux mesurant la capacité à interagir avec du texte à l’écran ou à exécuter des actions avec précision.

Sur le benchmark ScreenSpot Web Text, Nova Act aurait obtenu 94 % de réussite, contre 88 % pour l’agent Customizable UI Agent d’OpenAI, et 90 % pour Claude 3.7 Sonnet d’Anthropic. Ces résultats, bien qu’annoncés par Amazon lui-même, témoignent d’un niveau de maturité technique impressionnant.


Pourquoi cette annonce est stratégique pour Amazon

Amazon ne peut plus se permettre de rester en retrait dans la course à l’IA. Face aux annonces fréquentes d’OpenAI, Google et Meta, l’entreprise avait besoin d’un signal fort. Nova Act est ce signal.

Derrière cette innovation se cache une vision d’avenir : celle d’un assistant numérique réellement autonome, capable de prendre le relais sur les tâches numériques chronophages. Que ce soit pour des particuliers, des professionnels ou des entreprises, un tel outil pourrait faire gagner un temps précieux, tout en améliorant la qualité d’exécution.

Avec Nova Act, Amazon ne se contente pas de suivre la tendance. Elle pose les bases d’une nouvelle génération d’agents IA, plus pratiques, plus fiables, et plus proches de l’intelligence humaine dans leurs capacités d’action.


Ce qu’il faut retenir

  • Nova Act est un agent IA autonome capable d’agir dans un navigateur web.
  • Il a été développé par le laboratoire AGI d’Amazon, sous la direction d’un ancien d’OpenAI.
  • Il peut effectuer des tâches complexes de navigation, de saisie et d’interaction.
  • Il est accompagné d’un SDK pour permettre aux développeurs de créer leurs propres agents.
  • Il est intégré à l’écosystème Alexa et vise à automatiser de nombreuses tâches en ligne.
  • Il affiche des performances supérieures aux agents concurrents sur plusieurs benchmarks.
  • Il représente une avancée majeure dans la course à l’AGI et à l’automatisation intelligente.

Sources

Create your account