rpa_vision_v3

Author	SHA1	Message	Date
Dom	4e217e30dd	feat: capture Windows auto-détection OS, chat Léa agrandi, UX améliorée - Capture auto : détecte OS navigateur → capture Windows ou Linux - Timer capture utilise aussi la smart capture - Heartbeat background permanent (même sans session) - Tri screenshots par date (plus de vieilles captures) - Chat Léa : 450x650, polices 11pt, redimensionnable, meilleur contraste - Bouton Exécuter : "Linux" + "Windows" avec feedback visuel - Délai 5s avant replay Windows (temps de réduire le navigateur) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-17 23:03:53 +01:00
Dom	371db69543	feat: replay visuel Windows opérationnel — template matching + VWB complet - Bouton "Windows" dans VWB pour exécuter sur le PC distant - Template matching OpenCV multi-scale pour localiser les ancres visuelles - Proxy VWB→streaming server avec chargement ancre (thumb, pas full) - Fix executor Windows : mss lazy, result reporting, debug prints - Fix poll replay permanent (sans session active) - Mapping types VWB→executor (click_anchor→click, type_text→type) - CORS streaming server, capture Windows dans VWB - Dédup heartbeats côté client (hash perceptuel) - Mode cloud VLM configurable via RPA_VLM_MODEL - Fix resolve_target : pas de ScreenAnalyzer fallback (trop lent) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-17 18:56:44 +01:00
Dom	dd149c1cbb	feat: VWB panneau droit réorganisé en 3 onglets + galerie bibliothèque - 3 onglets : Propriétés / Capture / Données - Panneau extensible 320px → 480px au clic - Galerie bibliothèque plein écran - Fix port détection UI : 5001 → 5002 - Boutons aide (?) et supprimer (×) toujours visibles sur les nœuds Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-17 09:47:03 +01:00
Dom	1e18194e31	feat: VWB — aide outil (?), croix suppression, plein écran, zones détection - Bouton ? sur chaque nœud : tooltip avec description + paramètres typés - Croix rouge visible (fix overflow React Flow) - Sélection plein écran avec détection auto des éléments UI - Zones détectées affichées sur l'aperçu de capture - 32 actions documentées en français avec paramètres typés - Pruning candidats VLM : max 80 avant classification (3x plus rapide) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-17 08:13:46 +01:00
Dom	928b9e1065	feat: import Excel via chat Léa, suppression nœuds VWB, fix temperature 0.1 - Chat Léa : "importe patients.xlsx" → preview → confirmation → table SQLite Bouton 📎 pour upload fichier, "montre les tables", "info table X" - VWB : suppression nœuds via touche Suppr/Backspace + bouton croix rouge - Fix : toutes les températures VLM à 0.1 (qwen3-vl bloque à 0.0) - Fix : capture VWB avec DISPLAY=:1 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-17 07:18:51 +01:00
Dom	97cb2957d5	feat: upload Excel via explorateur de fichier dans le VWB - Bouton "Parcourir..." ouvre l'explorateur natif du navigateur - Upload vers /api/v3/upload-excel, sauvegarde dans data/uploads/ - Nom de table auto-suggéré depuis le nom du fichier Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-16 23:17:05 +01:00
Dom	9da804bb6e	feat: import Excel → SQLite + boucle données → UI dans le VWB - ExcelImporter : import .xlsx → SQLite auto (détection types, batch insert) - DBIterator : lecture ligne par ligne avec filtre/tri/limite - VWB actions : "Importer Excel" + "Pour chaque ligne" dans la palette - DAG executor : pré-exécution import, boucle foreach avec injection ${current_row.colonne} dans les étapes dépendantes - 36 tests unitaires Excel/DB (tous passent) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-16 23:10:51 +01:00
Dom	5e3865d328	feat: DAG executor async + intégration IA/LLM dans le VWB - DAGExecutor : exécution workflow par graphe de dépendances, étapes LLM parallèles, UI séquentielles, injection ${step.result} - LLMActionHandler : analyze_text, translate, extract_data, generate_text via Ollama /api/chat (qwen3-vl:8b, temperature 0.1) - VWB palette : catégorie "IA / LLM" avec 4 actions draggables - VWB propriétés : éditeurs pour chaque action LLM (modèle, prompt, langue) - VWB endpoint : POST /api/v3/workflow/<id>/execute-dag - 37 tests unitaires DAG executor (tous passent) - Fix log spam cache workflows (info → debug) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-16 22:58:44 +01:00
Dom	ad15237fe0	feat: smart systray Léa (plyer), preflight GPU, fix tests, support qwen3-vl - Smart systray (pystray+plyer) remplace PyQt5 : notifications toast, menu dynamique avec workflows, chat "Que dois-je faire ?", icône colorée - Preflight GPU : check_machine_ready() + @pytest.mark.gpu dans conftest - Correction 63 tests cassés → 0 failed (1200 passed) - Tests VWB obsolètes déplacés vers _a_trier/ - Support qwen3-vl:8b sur GPU (remplace qwen2.5vl:3b) - fix images < 32x32 (Ollama panic) - fix force_json=False (qwen3-vl incompatible) - fix temperature 0.1 (0.0 bloque avec images) - Fix captor Windows : Key.esc, _get_key_name() - Fix LeaServerClient : check_connection, list_workflows format - deploy_windows.py : packaging propre client Windows - VWB : edges visibles (#607d8b) + fitView automatique Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-16 22:25:12 +01:00
Dom	cf495dd82f	feat: chat unifié, GestureCatalog, Copilot, Léa UI, extraction données, vérification replay Refonte majeure du système Agent Chat et ajout de nombreux modules : - Chat unifié : suppression du dual Workflows/Agent Libre, tout passe par /api/chat avec résolution en 3 niveaux (workflow → geste → "montre-moi") - GestureCatalog : 38 raccourcis clavier universels Windows avec matching sémantique, substitution automatique dans les replays, et endpoint /api/gestures - Mode Copilot : exécution pas-à-pas des workflows avec validation humaine via WebSocket (approve/skip/abort) avant chaque action - Léa UI (agent_v0/lea_ui/) : interface PyQt5 pour Windows avec overlay transparent pour feedback visuel pendant le replay - Data Extraction (core/extraction/) : moteur d'extraction visuelle de données (OCR + VLM → SQLite), avec schémas YAML et export CSV/Excel - ReplayVerifier (agent_v0/server_v1/) : vérification post-action par comparaison de screenshots, avec logique de retry (max 3) - IntentParser durci : meilleur fallback regex, type GREETING, patterns améliorés - Dashboard : nouvelles pages gestures, streaming, extractions - Tests : 63 tests GestureCatalog, 47 tests extraction, corrections tests existants - Dépréciation : /api/agent/plan et /api/agent/execute retournent HTTP 410, suppression du code hardcodé _plan_to_replay_actions Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-15 10:02:09 +01:00
Dom	75260e3254	feat(vwb-frontend): Sélecteur modèle IA, validation workflow et variables Nouveaux composants: - AIModelSelector: sélection du modèle Ollama avec détection auto - WorkflowValidation: validation des étapes avant exécution - ollamaService: service de communication avec Ollama (liste modèles) Améliorations: - PropertiesPanel: intégration sélecteur IA, champs prompt/température - VariableManager: support variables runtime et substitution {{var}} - ConfidenceDashboard: refactoring et simplification - App.tsx: routing et intégration des nouveaux composants - api.ts: endpoints validate et export-training - types.ts: types pour modèles IA et validation - styles.css: styles pour les nouveaux composants Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-17 10:56:40 +01:00
Dom	a27b74cf22	v1.0 - Version stable: multi-PC, détection UI-DETR-1, 3 modes exécution - Frontend v4 accessible sur réseau local (192.168.1.40) - Ports ouverts: 3002 (frontend), 5001 (backend), 5004 (dashboard) - Ollama GPU fonctionnel - Self-healing interactif - Dashboard confiance Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-29 11:23:51 +01:00
Dom	21bfa3b337	feat(vwb): Ajouter SeeClick, Self-Healing interactif et Dashboard confiance ## Nouvelles fonctionnalités ### 1. SeeClick Adapter (visual grounding fallback) - Nouvel adapter pour le modèle SeeClick (HuggingFace) - Intégré dans la chaîne de fallback: CLIP → Template → SeeClick → Static - Localise les éléments GUI à partir de descriptions textuelles ### 2. Self-Healing Interactif - Dialogue qui propose des alternatives quand l'ancre n'est pas trouvée - L'utilisateur peut choisir: candidat alternatif, coords statiques, ou sauter - Nouveaux endpoints: /healing/status, /healing/choose, /healing/candidates - État "waiting_for_choice" pour mettre l'exécution en pause ### 3. Dashboard Confiance (temps réel) - Affiche les scores de confiance pendant l'exécution - Montre: méthode utilisée, distance, taux de succès - Interface pliable en bas à droite - Visible uniquement en mode intelligent/debug ## Fichiers ajoutés - core/detection/seeclick_adapter.py - frontend_v4/src/components/SelfHealingDialog.tsx - frontend_v4/src/components/ConfidenceDashboard.tsx ## Fichiers modifiés - core/detection/__init__.py - backend/services/intelligent_executor.py - backend/api_v3/execute.py - frontend_v4/src/App.tsx - frontend_v4/src/services/api.ts - docs/VISION_RPA_INTELLIGENT.md Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-24 02:34:01 +01:00
Dom	f04f156144	fix(vision): Corriger les seuils CLIP/Template pour éviter les clics erronés Problème résolu: - Le workflow cliquait au mauvais endroit (200-500px de distance) - Les seuils de matching étaient trop permissifs Corrections apportées: - CLIP: MAX_DISTANCE=120px, MIN_SCORE=0.55, MIN_COMBINED=0.5 - Template zonée: MAX_DISTANCE=150px - Template global: MAX_DISTANCE=150px (était 500px) - Ajout de logs détaillés pour debug des candidats rejetés - Désactivation de l'overlay debug (polling intensif inutile) Fichiers modifiés: - intelligent_executor.py: Seuils stricts + logs - execute.py: Logique d'exécution modes basic/intelligent/debug - ui_detection_service.py: Backend UI-DETR-1 - App.tsx: Overlay désactivé - ExecutionOverlay.tsx: URLs API corrigées Documentation: - docs/REFERENCE_VISION_RPA.md: Guide complet de référence Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-24 02:15:04 +01:00
Dom	d8d086dac5	feat(vwb): Intégration UI-DETR-1 + Toggle mode Basique/Intelligent/Debug - Toggle 3 modes dans le header: Basique (coords fixes), Intelligent (vision IA), Debug (overlay) - Service UI-DETR-1 pour détection d'éléments UI (510MB model, ~800ms/image) - API endpoints: /api/ui-detection/detect, /preload, /status, /find-element - Overlay des bboxes détectées en mode Debug (miniature + plein écran) - Clic sur élément détecté pour le sélectionner comme ancre - Document de vision produit: docs/VISION_RPA_INTELLIGENT.md - Configuration CORS étendue pour ports locaux Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-23 14:13:32 +01:00
Dom	483653a0b4	feat(vwb-v4): Frontend React Flow avec palette d'outils complète - Interface style n8n avec React Flow pour le canvas - 22 actions organisées en 7 catégories (souris, clavier, attente, données, logique, IA, validation) - 4 points d'accroche par nœud (haut, bas, droite, gauche) pour workflows complexes - Panel de propriétés complet avec tous les paramètres pour chaque type d'action - Capture d'écran plein écran avec sélection d'ancre - Thème sombre professionnel Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-23 12:54:08 +01:00

16 Commits