Construire un agent IA opérationnel avec n8n et Claude · Nareh® · Agence ERP × CMS · Odoo × Shopify × n8n

La promesse des agents IA est simple : déléguer du travail réel à un LLM bien outillé. La réalité est plus rugueuse, la plupart des “agents” que je vois en production ne font que répondre poliment, sans rien exécuter.

Voici comment je construis un agent opérationnel sur n8n + Claude.

Le piège du chatbot déguisé

90 % des “agents IA” que je rencontre sont en fait des chatbots avec un nom plus ambitieux. L’utilisateur pose une question, le LLM répond, fin de l’histoire. Aucune action déclenchée, aucun système modifié, aucun ROI mesurable.

Un vrai agent doit : comprendre une intention → choisir des outils → exécuter → vérifier → reporter.

L’architecture qui tient

J’utilise systématiquement la même structure n8n :

Trigger (webhook / cron / form)
  → Préparation contexte (récup données + RAG)
    → Appel Claude (avec tool definitions)
      → Routing tool calls (n8n Switch)
        → Exécution outils (HTTP, DB, Odoo, Shopify…)
          → Boucle de validation (retry ou escalade humaine)
            → Reporting (Slack / mail / dashboard)

Le point critique : les outils ne sont pas appelés par Claude directement, mais par n8n après que Claude ait demandé quel outil utiliser. n8n fait office de garde-fou, il valide les paramètres, applique les règles métier, et peut refuser d’exécuter.

Le RAG production, sans drama

Pour la base de connaissances, j’évite les solutions “magiques”. Mon stack :

PostgreSQL + pgvector pour le stockage (pas Pinecone, pas Weaviate, pgvector tient la charge en dessous de 5M chunks et c’est gratuit)
OpenAI embeddings (text-embedding-3-small) pour le calcul vectoriel, moins cher et plus rapide que Voyage ou Cohere pour la plupart des usages
Re-ranking systématique avec un second appel Claude (ça double le coût mais multiplie la pertinence)

n8n se charge de l’indexation incrémentale (cron quotidien sur les sources qui changent) et de la requête au moment de l’exécution.

Ce que je donne à Claude

Trois éléments dans chaque appel :

Le contexte métier statique (procédure, contraintes, périmètre)
Le RAG dynamique (top 5-10 chunks pertinents)
Les outils disponibles avec leurs parameters Zod-validated

Et surtout : un system prompt qui dit explicitement “Si tu n’as pas assez d’information pour agir, demande. Ne jamais inventer un appel d’outil.”

La validation humaine intégrée

Aucun de mes agents production ne fait d’écriture irréversible sans validation. La règle :

Lecture / consultation : autonome
Écriture réversible (créer un brouillon, ajouter un tag) : autonome avec log
Écriture irréversible (envoyer un mail client, valider une commande, débiter) : escalade humaine systématique

n8n route ces actions vers Slack ou un dashboard interne, où un humain valide en un clic.

Ce que ça donne en prod

Sur un agent de tri du service client e-commerce que j’ai déployé récemment :

80 % des tickets routés sans intervention humaine
15 % brouillon de réponse pré-rédigé, validé par l’équipe
5 % escalade directe (litige, remboursement, complaint)

Le ROI se mesure en heures économisées par semaine, pas en “wow ça parle bien”. Si votre agent IA ne sauve pas du temps réel à quelqu’un, c’est qu’il est déguisé en chatbot.