Systèmes agentiques & automatisation.
Des workflows multi-étapes où un LLM gère le raisonnement, vos outils gèrent les actions, et un humain valide la sortie. Nous construisons, documentons, et formons votre équipe à en prendre la maîtrise.
À PARTIR DE 5 000 € · 3 À 8 SEMAINES · RUNBOOK INCLUS
Ce que c'est (et ce que ce n'est pas).
C'est : un système qui prend un input (ticket, lead, document, ligne de données), le passe dans un LLM avec vos prompts et vos outils, produit un brouillon, et le met en file pour validation humaine.
Ce n'est pas : un chatbot en pleine autonomie qui répond seul sans relecture. Nous n'en livrons pas - le taux d'erreur n'est pas acceptable pour la plupart des cas PME aujourd'hui.
Scope.
- Un workflow, du début à la fin.
- Bibliothèque de prompts (versionnée, testable).
- Intégrations aux outils existants (CRM, helpdesk, docs, e-mail, Slack, Airtable).
- Interface de revue humaine - dashboard ou file dans votre outil existant.
- Logging et évaluation - voir ce que l'agent a fait, pourquoi, et si c'était juste.
- Runbook + formation pour 2 à 3 personnes de votre équipe.
Méthode (comment se déroule un build).
- Semaine 1 - Cartographie du workflow. Nous nous asseyons avec les humains qui font le travail aujourd'hui. Cartographie de chaque branche et cas limite.
- Semaine 2 - Conception prompts + outils. Premiers prompts rédigés, outils câblés, dix inputs testés.
- Semaines 3-4 - Build. Intégrations, UI de revue, logging. Démos quotidiennes.
- Semaines 5-6 - Shadow run. L'agent tourne en parallèle de l'humain. Comparaison des sorties. Tuning.
- Semaine 7 - Bascule. L'agent d'abord, l'humain valide. Vous en êtes propriétaires.
- Semaine 8 (optionnelle) - Formation + remise du runbook.
Prix.
- Agent simple - 5 000 €-8 000 €. 3 à 4 semaines.
- Agent moyen - 8 000 €-15 000 €. 4 à 6 semaines.
- Complexe / multi-agents - 15 000 €+. 6 à 8 semaines. Chiffré après cadrage.
Le tuning continu se prête mieux à un retainer Growth (1 990 €/mois) ou Scale (3 990 €/mois).
Humain dans la boucle, par défaut.
Les taux d'erreur LLM actuels sur de vraies données métier vont de 3 à 15 % selon la tâche. Pour une PME de 10 personnes, 5 % d'erreur sur 200 réponses hebdomadaires, c'est 10 mauvaises réponses par semaine. C'est un incendie.
Chaque agent que nous construisons passe par un humain avant d'agir. Nous concevons l'UI de revue pour que la validation prenne quelques secondes, pas quelques minutes. Au fil du temps, à mesure que la précision mesurée monte, vous pouvez choisir d'auto-approuver certaines branches. À vous de décider, avec les données.
Build de référence : l'AISO Orchestrator.
L'AISO Orchestrator dispatche 17 types d'agents sur la recherche, le copywriting, le développement, la QA et les opérations. Stack : Next.js + MongoDB replica set, Server-Sent Events, Agent Messaging MCP, write-back vers Claude Memory, revue humaine sur chaque décision non triviale. Lire le build log →