Validé sur PC Windows (DESKTOP-58D5CAC, 2560x1600) : - 8 clics résolus visuellement (1 anchor_template, 1 som_text_match, 6 som_vlm) - Score moyen 0.75, temps moyen 1.6s - Texte tapé correctement (bonjour, test word, date, email) - 0 retries, 2 actions non vérifiées (OK) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
7.7 KiB
Spécification des Exigences - Améliorations Agent V0
Introduction
L'Agent V0 est un outil de capture cross-platform qui enregistre les interactions utilisateur pour créer des workflows automatisés. Bien que fonctionnel, plusieurs limitations ont été identifiées qui impactent l'expérience utilisateur et l'efficacité du système. Cette spécification vise à améliorer les workflows de l'Agent V0 pour une meilleure utilisabilité et une intégration optimisée avec RPA Vision V3.
Glossaire
- Agent_V0: Agent de capture cross-platform qui enregistre les sessions utilisateur
- Workflow: Séquence d'actions automatisées générée à partir d'une session capturée
- RawSession: Format de données brutes capturées par l'agent
- Pipeline_Traitement: Pipeline serveur qui traite les sessions uploadées
- Nommage_Intelligent: Système de génération automatique de noms descriptifs
- Capture_Étendue: Système de capture d'événements amélioré
- Monitoring_Pipeline: Système de suivi du traitement des sessions
Exigences
Exigence 1: Nommage intelligent des workflows
User Story: En tant qu'utilisateur de l'Agent V0, je veux que mes workflows aient des noms descriptifs et uniques, afin de pouvoir les identifier facilement dans la liste des workflows disponibles.
Critères d'Acceptation
- WHEN une session est capturée, THE System SHALL générer automatiquement un nom descriptif basé sur les actions détectées
- THE Nommage_Intelligent SHALL analyser les éléments UI interagis pour créer un nom pertinent
- WHEN plusieurs workflows similaires existent, THE System SHALL ajouter un suffixe numérique ou temporel
- THE System SHALL permettre à l'utilisateur de modifier le nom généré avant la finalisation
- WHEN le nom est vide ou générique, THE System SHALL proposer des suggestions basées sur le contexte
Exigence 2: Capture d'événements complète
User Story: En tant qu'utilisateur de l'Agent V0, je veux que toutes mes interactions soient capturées fidèlement, afin que les workflows générés soient complets et précis.
Critères d'Acceptation
- THE Capture_Étendue SHALL enregistrer toutes les saisies clavier avec leur contexte
- WHEN l'utilisateur tape du texte, THE System SHALL capturer le contenu et l'élément cible
- THE System SHALL capturer les raccourcis clavier (Ctrl+C, Ctrl+V, etc.) avec leur signification
- WHEN l'utilisateur utilise des touches spéciales (Tab, Enter, Escape), THE System SHALL les enregistrer avec leur contexte
- THE System SHALL associer chaque saisie clavier à l'élément UI correspondant
Exigence 3: Captures d'écran ciblées
User Story: En tant qu'utilisateur de l'Agent V0, je veux des captures d'écran optimisées et ciblées, afin d'améliorer la précision de la détection UI et réduire la taille des fichiers.
Critères d'Acceptation
- THE System SHALL capturer des zones ciblées autour des éléments interagis
- WHEN un élément UI est cliqué, THE System SHALL capturer une zone étendue autour de cet élément
- THE System SHALL maintenir des captures plein écran pour le contexte global
- WHEN la zone ciblée est trop petite, THE System SHALL l'agrandir automatiquement
- THE System SHALL optimiser la qualité et la taille des captures selon leur importance
Exigence 4: Visibilité du traitement
User Story: En tant qu'utilisateur de l'Agent V0, je veux voir le progrès du traitement de mes sessions, afin de savoir quand mes workflows seront disponibles.
Critères d'Acceptation
- THE Monitoring_Pipeline SHALL afficher le statut de traitement en temps réel
- WHEN une session est uploadée, THE System SHALL montrer les étapes de traitement
- THE System SHALL indiquer le temps estimé de traitement restant
- WHEN le traitement échoue, THE System SHALL afficher l'erreur et les actions possibles
- THE System SHALL notifier l'utilisateur quand le workflow est prêt à utiliser
Exigence 5: Découvrabilité des workflows
User Story: En tant qu'utilisateur de l'Agent V0, je veux pouvoir retrouver facilement mes workflows créés, afin de les utiliser, modifier ou partager.
Critères d'Acceptation
- THE System SHALL fournir une interface de recherche et navigation des workflows
- WHEN l'utilisateur recherche un workflow, THE System SHALL proposer des filtres par date, nom, et type
- THE System SHALL afficher des aperçus visuels des workflows (première capture, description)
- WHEN un workflow est sélectionné, THE System SHALL montrer ses détails et statistiques d'usage
- THE System SHALL permettre l'organisation des workflows en catégories ou dossiers
Exigence 6: Métadonnées enrichies
User Story: En tant qu'utilisateur de l'Agent V0, je veux que mes sessions contiennent des métadonnées riches, afin d'améliorer la qualité des workflows générés.
Critères d'Acceptation
- THE System SHALL capturer les informations contextuelles de chaque action
- WHEN une action est effectuée, THE System SHALL enregistrer l'état de l'application cible
- THE System SHALL détecter et enregistrer les changements d'état de l'interface
- WHEN des éléments UI changent, THE System SHALL capturer les transitions
- THE System SHALL enrichir les métadonnées avec des informations sémantiques
Exigence 7: Validation et feedback
User Story: En tant qu'utilisateur de l'Agent V0, je veux recevoir des retours sur la qualité de mes captures, afin d'améliorer mes prochaines sessions.
Critères d'Acceptation
- THE System SHALL analyser la qualité de la session capturée
- WHEN la session est incomplète ou ambiguë, THE System SHALL alerter l'utilisateur
- THE System SHALL suggérer des améliorations pour les prochaines captures
- WHEN des actions critiques sont manquées, THE System SHALL proposer de les ajouter
- THE System SHALL fournir un score de qualité avec des recommandations d'amélioration
Exigence 8: Intégration workflow builder
User Story: En tant qu'utilisateur de l'Agent V0, je veux pouvoir éditer mes workflows capturés, afin de les personnaliser et optimiser avant utilisation.
Critères d'Acceptation
- THE System SHALL permettre l'ouverture directe des workflows dans le Visual Workflow Builder
- WHEN un workflow est généré, THE System SHALL proposer l'édition immédiate
- THE System SHALL synchroniser les modifications entre l'agent et le builder
- WHEN des améliorations sont apportées, THE System SHALL les sauvegarder automatiquement
- THE System SHALL permettre le test du workflow modifié depuis l'agent
Contraintes Techniques
Contrainte 1: Compatibilité
- Les améliorations DOIVENT maintenir la compatibilité avec le format RawSession existant
- Les nouvelles fonctionnalités DOIVENT fonctionner sur Linux, macOS et Windows
- L'interface utilisateur DOIT rester simple et intuitive
Contrainte 2: Performance
- Les captures ciblées NE DOIVENT PAS ralentir significativement l'enregistrement
- Le nommage intelligent DOIT s'exécuter en moins de 2 secondes
- Le monitoring pipeline NE DOIT PAS impacter les performances du serveur
Contrainte 3: Sécurité
- Toutes les données capturées DOIVENT rester chiffrées
- Les métadonnées enrichies NE DOIVENT PAS exposer d'informations sensibles
- L'intégration workflow builder DOIT respecter les permissions utilisateur
Critères de Succès
- Amélioration UX: 90% des utilisateurs trouvent leurs workflows facilement
- Qualité des captures: Réduction de 50% des sessions incomplètes
- Efficacité: Temps de création de workflow réduit de 30%
- Adoption: 80% des utilisateurs utilisent les nouvelles fonctionnalités
- Satisfaction: Score de satisfaction utilisateur > 4.5/5