Construire un agent IA opérationnel avec n8n et Claude
Du workflow simple au RAG production : comment connecter une base de connaissances à Claude via n8n, et faire qu'il agisse vraiment au lieu de répondre poliment.
La promesse des agents IA est simple : déléguer du travail réel à un LLM bien outillé. La réalité est plus rugueuse, la plupart des “agents” que je vois en production ne font que répondre poliment, sans rien exécuter.
Voici comment je construis un agent opérationnel sur n8n + Claude.
Le piège du chatbot déguisé
90 % des “agents IA” que je rencontre sont en fait des chatbots avec un nom plus ambitieux. L’utilisateur pose une question, le LLM répond, fin de l’histoire. Aucune action déclenchée, aucun système modifié, aucun ROI mesurable.
Un vrai agent doit : comprendre une intention → choisir des outils → exécuter → vérifier → reporter.
L’architecture qui tient
J’utilise systématiquement la même structure n8n :
Trigger (webhook / cron / form)
→ Préparation contexte (récup données + RAG)
→ Appel Claude (avec tool definitions)
→ Routing tool calls (n8n Switch)
→ Exécution outils (HTTP, DB, Odoo, Shopify…)
→ Boucle de validation (retry ou escalade humaine)
→ Reporting (Slack / mail / dashboard)Le point critique : les outils ne sont pas appelés par Claude directement, mais par n8n après que Claude ait demandé quel outil utiliser. n8n fait office de garde-fou, il valide les paramètres, applique les règles métier, et peut refuser d’exécuter.
Le RAG production, sans drama
Pour la base de connaissances, j’évite les solutions “magiques”. Mon stack :
- PostgreSQL + pgvector pour le stockage (pas Pinecone, pas Weaviate, pgvector tient la charge en dessous de 5M chunks et c’est gratuit)
- OpenAI embeddings (
text-embedding-3-small) pour le calcul vectoriel, moins cher et plus rapide que Voyage ou Cohere pour la plupart des usages - Re-ranking systématique avec un second appel Claude (ça double le coût mais multiplie la pertinence)
n8n se charge de l’indexation incrémentale (cron quotidien sur les sources qui changent) et de la requête au moment de l’exécution.
Ce que je donne à Claude
Trois éléments dans chaque appel :
- Le contexte métier statique (procédure, contraintes, périmètre)
- Le RAG dynamique (top 5-10 chunks pertinents)
- Les outils disponibles avec leurs
parametersZod-validated
Et surtout : un system prompt qui dit explicitement “Si tu n’as pas assez d’information pour agir, demande. Ne jamais inventer un appel d’outil.”
La validation humaine intégrée
Aucun de mes agents production ne fait d’écriture irréversible sans validation. La règle :
- Lecture / consultation : autonome
- Écriture réversible (créer un brouillon, ajouter un tag) : autonome avec log
- Écriture irréversible (envoyer un mail client, valider une commande, débiter) : escalade humaine systématique
n8n route ces actions vers Slack ou un dashboard interne, où un humain valide en un clic.
Ce que ça donne en prod
Sur un agent de tri du service client e-commerce que j’ai déployé récemment :
- 80 % des tickets routés sans intervention humaine
- 15 % brouillon de réponse pré-rédigé, validé par l’équipe
- 5 % escalade directe (litige, remboursement, complaint)
Le ROI se mesure en heures économisées par semaine, pas en “wow ça parle bien”. Si votre agent IA ne sauve pas du temps réel à quelqu’un, c’est qu’il est déguisé en chatbot.
Bâtissons votre architecture ensemble.
Audit gratuit sous 24 h ouvrées. Devis chiffré sous 72 h. Aucun engagement derrière.
Réserver un audit