La construction d'agents d'IA puissants n'est pas la finalité du jeu. Si vous lisez ces lignes, vous avez probablement créé des agents capables de raisonner, d'agir et même d'utiliser des outils par eux-mêmes. Peut-être font-ils déjà un travail impressionnant. Mais si vous souhaitez faire confiance à ces agents en production, une nouvelle série de défis se présente et va au-delà de la simple vérification que l'agent "fonctionne" en laboratoire.
Que se passe-t-il lorsque vos agents ont besoin de l'approbation d'un humain avant de prendre une décision risquée ? Vos agents peuvent-ils survivre à de longues périodes d'exécution, à des pannes ou à des redémarrages sans perdre leur place ? Et que faut-il pour prendre en charge des agents qui ne sont pas de simples scripts sur un bureau, mais des systèmes complexes fonctionnant sur des plates-formes cloud et des environnements distribués ?
C'est ce genre de questions qui nous a poussés, chez SnapLogic, à repenser la gestion de l'état des agents. La réponse : Agent Continuations, un nouveau mécanisme conçu pour rendre les les workflows agents réellement résumables, fiables et collaboratifs.
Quelle est la place de l'homme ?
L'automatisation des agents présente d'énormes avantages, mais la plupart des entreprises ont besoin de garde-fous. Les gens veulent une supervision pour les tâches qui comportent des risques : pensez aux transferts d'argent, à la suppression de comptes ou aux changements majeurs apportés aux systèmes critiques. C'est ce que nous appelons la prise de décision la prise de décision.
Vous ne voulez pas qu'un agent franchisse une étape à haut risque sans le feu vert d'un humain. Dans le même temps, vous ne voulez pas interrompre l'ensemble du flux de travail de l'agent simplement pour attendre cette approbation, en particulier si vous coordonnez des équipes ou des fuseaux horaires différents.
Les agents à long terme et le problème de l'échec
Plus vos agents sont sophistiqués, plus ils sont susceptibles de fonctionner pendant des heures (voire des jours), en prenant de nombreuses décisions en cours de route. Mais les processus de longue durée sont des aimants à défaillances, et les problèmes de réseau, de matériel, les limites de l'API ou les interruptions des services cloud peuvent mettre fin aux progrès si vous n'y prenez pas garde.
La plupart des frameworks actuels partent du principe que la boucle principale de l'agent continuera à tourner jusqu'à ce qu'elle soit terminée. Mais dans le monde réel, il n'est pas toujours possible de le garantir. Si le système tombe en panne, votre agent doit-il repartir de zéro ? Ou peut-il reprendre là où il s'est arrêté ?
Le nouveau monde : des agents distribués à plusieurs niveaux
Les architectures d'agents évoluent. Au lieu d'un grand agent, vous avez souvent des orchestrateurs qui délèguent le travail à des sous-agents, chacun ayant ses propres tâches et boîtes à outils. Ces sous-agents peuvent fonctionner sur différents serveurs, sur des plateformes cloud , ou même interagir par le biais d'API comme Slack ou des applications web.
Cette complexité multiplie le risque d'interruption et rend encore plus important le fait de disposer d'un moyen fiable de mettre en pause, de persister et de reprendre l'exécution de l'agent, en particulier lorsque des humains doivent intervenir ou lorsque des dépendances externes sont impliquées.
Saisir les continuités de l'agent
Pour relever ces défis, nous nous sommes inspirés de la théorie des langages de programmation, et plus particulièrement du concept des continuations. En programmation, une continuation contient tout ce qu'il faut savoir pour interrompre et reprendre un calcul à partir d'un point donné.
Les Continuations d'agents font de même pour les les workflows l'IA :
- À n'importe quelle étape du processus d'un agent, vous pouvez prendre un instantané de son état complet, y compris les outils qu'il était sur le point d'appeler, ses actions en cours et même l'état imbriqué des sous-agents.
- Cet instantané peut être stocké, déplacé ou même transmis à un autre système.
- Lorsque vous êtes prêt, par exemple après qu'un humain a approuvé une demande, vous pouvez renvoyer la suite et l'agent reprend exactement là où il s'est arrêté, sans rien perdre entre-temps.

Comment cela fonctionne-t-il dans la pratique ?
Chaque interaction avec un agent, chaque appel LLM, chaque exécution d'outil est enregistré dans un "tableau de messages" structuré. Ce tableau agit comme un journal d'événements, fournissant l'historique complet des conversations et des décisions jusqu'au moment présent. Lorsqu'une pause est nécessaire (peut-être pour une approbation humaine, ou parce qu'un agent a atteint une limite de ressources), un objet de continuation est créé.
Cet objet de continuation tient :
- Le tableau des messages (la mémoire de l'agent sur ce qui s'est passé)
- Métadonnées sur ce qui doit être repris (par exemple, quel appel d'outil est en attente d'approbation)
- Des drapeaux pour suivre les étapes qui ont été approuvées ou traitées
Si les agents sont imbriqués, les continuations supportent des niveaux arbitraires de récursivité, capturant non seulement l'état de l'agent principal, mais aussi les états des sous-agents.
Une fois que l'action requise est prise (par exemple, un responsable approuve un appel d'outil sensible), la suite mise à jour est renvoyée à l'agent, qui reconstruit l'ensemble du flux de travail et continue d'avancer.
Prêt à le voir en action ? Consultez notre démo GitHub.
Exemple concret : L'intégration des RH avec Agent Continuations
Supposons que vous automatisiez un flux de travail d'intégration des ressources humaines. L'agent principal des RH doit :
- Créer un nouveau compte utilisateur
- Définir les privilèges du compte
- Envoyer un courriel de bienvenue
Mais l'autorisation des privilèges d'un compte est risquée et nécessite donc l'approbation explicite d'une personne.
Avec les Continuations d'agent, le workflow s'arrête à l'étape d'autorisation, regroupe l'état complet de l'agent et le renvoie pour examen. Une fois approuvé, le workflow reprend, envoie l'email de bienvenue et s'achève - pas de perte de progression, pas de redémarrage manuel et pas de risque de passer à côté d'une supervision humaine.

Pourquoi c'est important
Les Continuations d'agents apportent fiabilité et flexibilité aux les workflows l'IA avancée.
- Les agents peuvent fonctionner aussi longtemps que nécessaire, avec une résilience intégrée en cas de défaillance ou de redémarrage.
- Les approbations humaines en boucle deviennent des citoyens de première classe, et non des solutions de contournement gênantes.
- Les systèmes d'agents complexes et distribués peuvent s'interrompre et reprendre dans tous les environnements, que ce soit sur votre bureau, dans le cloud ou au sein de plusieurs équipes.
D'autres frameworks proposent une gestion des états, mais la plupart d'entre eux ne disposent pas d'une approbation humaine transparente ou ne peuvent pas gérer des architectures d'agents profondément imbriquées. Notre approche, issue de l'équipe de recherche SnapLogic AgentCreator , combine les deux.
Où nous allons
Nous avons réalisé des prototypes d'agents continus à partir de l'API Python d'OpenAI (que vous trouverez ici sur GitHub) et de laplateforme AgentCreator de SnapLogic. Nous travaillons activement à l'extension de ces idées à des scénarios plus larges :
- Suspension des agents pour des raisons indépendantes de l'approbation humaine (comme l'attente d'événements asynchrones)
- Intégration avec d'autres cadres et normes
Si vous souhaitez créer des agents d'intelligence artificielle robustes et réutilisables, je vous invite à essayer Agent Continuations ou, si vous voulez voir la conception visuelle d'un agent en action, à jeter un coup d'œil à SnapLogic AgentCreator.
Dernières réflexions
La mise en production des agents ne se limite pas à ce qu'ils peuvent faire, mais aussi à la façon dont ils récupèrent, s'adaptent et collaborent. Avec Agent Continuations, nous construisons les fondations de systèmes d'IA capables de survivre dans le monde réel - en s'arrêtant pour les gens quand c'est important, et en reprenant toujours là où ils se sont arrêtés.
- Vous voulez voir l'intégralité de l'intervention ? Regarder sur YouTube
- Code et documentation : github.com/SnapLogic/agent-continuations
- Conception visuelle de l'agent : agentcreator.com