IA

ReAct

ReAct (Reasoning + Acting) : pattern d'IA qui alterne raisonnement et action en boucle, fondement du fonctionnement des agents IA.

ReAct (Reasoning + Acting) est le pattern fondamental qui fait fonctionner les agents IA. Formalisé par Yao et al. en 2022, il décrit une boucle itérative dans laquelle un modèle de langage alterne entre raisonnement et action — jusqu'à atteindre un objectif ou reconnaître qu'il ne peut pas avancer.

Définition technique

Le principe : penser puis agir, en boucle

Avant ReAct, les modèles de langage fonctionnaient en mode question-réponse : un prompt en entrée, une réponse en sortie, fin de l'interaction. ReAct casse ce schéma en introduisant une boucle : le modèle raisonne sur la situation, décide d'une action (appeler une API, lancer une recherche, exécuter du code), observe le résultat, puis raisonne à nouveau à partir de cette nouvelle information.

C'est cette boucle qui transforme un simple LLM en agent capable d'accomplir des missions complexes de façon autonome.

Les quatre temps du cycle

  1. Percevoir — L'agent observe l'état actuel : données d'entrée, historique des actions passées, résultats des étapes précédentes.
  2. Raisonner — Le LLM analyse la situation et produit un plan : quelle sous-tâche prioriser, quel outil appeler, comment formuler la requête.
  3. Agir — L'agent exécute l'action choisie via un outil : appel API, recherche web, lecture de fichier, exécution de code.
  4. Observer — L'agent analyse le résultat et décide : continuer (nouvelle itération), corriger (changer de stratégie) ou terminer (objectif atteint).

Enjeux actuels

Le socle de l'IA agentique

ReAct est devenu le standard de facto pour la construction d'agents IA. Tous les frameworks majeurs — LangGraph, CrewAI, Claude Agent SDK, OpenAI Agents SDK — implémentent ce pattern sous une forme ou une autre. Quand on parle d'IA agentique, on parle fondamentalement de systèmes construits sur le cycle ReAct.

Les limites à connaître

Le cycle ReAct peut tourner indéfiniment si l'agent ne trouve pas de solution — c'est le risque de la boucle infinie. Sans garde-fous (plafond de tokens, timeout, nombre maximum d'itérations), un agent ReAct peut consommer des ressources considérables sans progresser. C'est pourquoi le human in the loop et les mécanismes de circuit breaker sont essentiels en production.

Questions fréquentes

Quelle est la différence entre ReAct et le Chain-of-Thought (CoT) ?

Le Chain-of-Thought (chaîne de pensée) fait uniquement raisonner le modèle étape par étape, sans agir sur le monde extérieur. ReAct ajoute une dimension d'action : le modèle peut appeler des outils (recherche web, exécution de code, API) entre chaque étape de raisonnement. Le résultat observé alimente le raisonnement suivant, créant une boucle qui s'auto-corrige.

Comment fonctionne le cycle ReAct dans un agent IA ?

Le cycle se déroule en quatre temps : percevoir (l'agent observe l'état actuel), raisonner (le LLM analyse et planifie), agir (exécuter une action via un outil) et observer (évaluer le résultat). Si l'objectif n'est pas atteint, le cycle recommence. Un agent peut enchaîner 10 à 50 itérations pour une mission complexe.

Quels frameworks utilisent le pattern ReAct ?

La plupart des frameworks d'agents IA implémentent ReAct : LangGraph (LangChain), CrewAI, Claude Agent SDK (Anthropic) et OpenAI Agents SDK. Même les agents no-code créés dans Mistral Le Chat ou ChatGPT reposent sur ce cycle, bien que de façon transparente pour l'utilisateur.

Ressources et documentation