rpa_vision_v3

Author	SHA1	Message	Date
Dom	f340eab628	feat: conformité AI Act — divulgation IA, consentement, rétention, arrêt urgence - Léa se présente comme "assistante basée sur l'intelligence artificielle" - Dialog consentement avant enregistrement (capture écran/clavier) - Rétention logs 180 jours (Article 12 + 26(6)) - Bouton ARRÊT D'URGENCE toujours visible (Article 14) - Transparence mode autonome explicite (Article 50) - Rapport conformité AI Act en français (docs/CONFORMITE_AI_ACT.md) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-18 16:57:43 +01:00
Dom	353c2a347e	feat: floutage auto champs sensibles + fix routing actions fichiers Floutage (conformité AI Act) : - Détection OpenCV des champs de saisie (rectangles clairs avec texte) - Flou gaussien avant stockage/envoi - Activé par défaut (RPA_BLUR_SENSITIVE=true) - <200ms par screenshot, 12 tests Fix actions fichiers VWB : - Pas de wait 5s pour les actions fichiers (inutile) - Routing direct vers agent port 5006 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-18 16:24:01 +01:00
Dom	40e5fba86c	feat: outils gestion fichiers dans le VWB (📁 Fichiers) - 5 actions : lister, créer dossier, déplacer, copier, classer par extension - Exécution sur Windows via agent port 5006 - Sécurité chemins (bloque C:\Windows, /etc, etc.) - Propriétés panel + preview canvas pour chaque action Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-18 16:05:36 +01:00
Dom	97d708c6f5	fix: replay visuel — fallback coordonnées bbox si template matching échoue - Le proxy injecte x_pct/y_pct depuis le centre du bbox de l'ancre - Si le visual resolve timeout → clic aux coordonnées bbox (pas à 0,0) - Lookup replay_states par machine_id (premier replay fonctionne) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-18 12:42:30 +01:00
Dom	58e8bbafff	fix: replay routing — lookup machine_id dans replay_states + auto-inject machine_id - /replay/next cherche dans replay_states par machine_id (pas seulement machine_replay_target) - execute-windows auto-détecte la machine Windows connectée - resolve_target utilise ThreadPool par défaut (pas le GPU executor saturé) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-18 12:05:42 +01:00
Dom	81d2d016ff	fix: replay Windows réparé — machine_replay_target restauré Le fix sécurité avait supprimé _machine_replay_target qui est nécessaire pour router les actions vers la bonne session agent. Session_id vide dans le frontend = auto-détection serveur. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-18 11:30:04 +01:00
Dom	d4871249ea	feat: capture Windows temps réel via mini serveur HTTP (port 5006) - CaptureServer : serveur HTTP daemon sur l'agent Windows - Capture fraîche mss en ~94ms à chaque requête - Plus de lecture de vieux heartbeats sur disque - Fallback capture locale si agent indisponible - Firewall Windows port 5006 configuré Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-18 11:20:57 +01:00
Dom	ae65be2555	chore: ajouter agent_v0/ au tracking git (était un repo embarqué) Suppression du .git embarqué dans agent_v0/ — le code est maintenant tracké normalement dans le repo principal. Inclut : agent_v1 (client), server_v1 (streaming), lea_ui (chat client) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-18 11:12:23 +01:00
Dom	af83552923	fix: corrections critiques sécurité et robustesse Sécurité : - CORS restreint aux origines connues (plus de *) - Clés Flask sécurisées (secrets.token_hex) - .env.local vérifié non commité Robustesse : - Queues replay bornées (max 500 actions, cleanup TTL 1h) - Vol cross-session supprimé dans /replay/next - Backoff exponentiel polling agent (1s → 30s max) - Nettoyage sessions mémoire TTL 24h - Fix fuite file descriptors upload images - Fix exceptions silencieuses compression images Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-18 10:59:00 +01:00
Dom	5a07e0dee5	feat: Léa répond via LLM — réponses naturelles au lieu de templates - _generate_lea_response() appelle Ollama qwen3:8b avec persona Léa - Fallback templates si LLM indisponible - Intent parser conservé pour la détection d'actions - think=false pour éviter les réponses vides qwen3 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-18 00:55:06 +01:00
Dom	5d7ef46c93	fix: small talk élargi — coca, bière, fatigue, météo ne lancent plus de tâches - Pattern élargi : boissons, nourriture, météo, fatigue, émotions - Catégorie "mood" avec réponses empathiques - "un coca" → humor au lieu de lancer un workflow - "il fait chaud" → mood au lieu d'execute Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-18 00:39:25 +01:00
Dom	8d6b49277f	feat: Léa personnalité humaine + fichiers + fix doublon menu - Small talk : café, merci, ça va, qui es-tu → réponses chaleureuses - Bouton 📎 dans le chat pour envoyer des fichiers - Polices 13-15pt, fenêtre 600x800 - Fix doublon "Discuter avec Léa" dans le systray - IntentType.SMALL_TALK avec 7 catégories Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-18 00:01:04 +01:00
Dom	32c6808afb	feat: Léa humanisée — plus de jargon technique, ton chaleureux - "Workflow" → "tâche" partout - Vouvoiement, ton de collègue bienveillante - Noms de tâches lisibles (Bloc-notes — Écriture et sauvegarde) - Notifications féminisées (Connectée, prête) - Boutons : Apprenez-moi, Lancer, Données, Arrêter, Aide - Intent parser enrichi (langage naturel humain) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-17 23:36:28 +01:00
Dom	4e217e30dd	feat: capture Windows auto-détection OS, chat Léa agrandi, UX améliorée - Capture auto : détecte OS navigateur → capture Windows ou Linux - Timer capture utilise aussi la smart capture - Heartbeat background permanent (même sans session) - Tri screenshots par date (plus de vieilles captures) - Chat Léa : 450x650, polices 11pt, redimensionnable, meilleur contraste - Bouton Exécuter : "Linux" + "Windows" avec feedback visuel - Délai 5s avant replay Windows (temps de réduire le navigateur) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-17 23:03:53 +01:00
Dom	8175b39eba	feat: multi-machine + chat Léa Edge mode app Multi-machine : - machine_id auto (hostname_os), configurable via RPA_MACHINE_ID - Sessions/workflows isolés par machine (dossiers séparés) - Replay ciblé par machine (pas de fuite cross-machine) - Endpoint GET /machines pour lister les machines connectées - Léa affiche la machine source des workflows Chat Léa systray : - Edge en mode app (--app=URL) — fenêtre native sans barre d'adresse - Toggle via menu systray "Discuter avec Léa" - Fallback navigateur si Edge absent Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-17 20:02:45 +01:00
Dom	371db69543	feat: replay visuel Windows opérationnel — template matching + VWB complet - Bouton "Windows" dans VWB pour exécuter sur le PC distant - Template matching OpenCV multi-scale pour localiser les ancres visuelles - Proxy VWB→streaming server avec chargement ancre (thumb, pas full) - Fix executor Windows : mss lazy, result reporting, debug prints - Fix poll replay permanent (sans session active) - Mapping types VWB→executor (click_anchor→click, type_text→type) - CORS streaming server, capture Windows dans VWB - Dédup heartbeats côté client (hash perceptuel) - Mode cloud VLM configurable via RPA_VLM_MODEL - Fix resolve_target : pas de ScreenAnalyzer fallback (trop lent) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-17 18:56:44 +01:00
Dom	dd149c1cbb	feat: VWB panneau droit réorganisé en 3 onglets + galerie bibliothèque - 3 onglets : Propriétés / Capture / Données - Panneau extensible 320px → 480px au clic - Galerie bibliothèque plein écran - Fix port détection UI : 5001 → 5002 - Boutons aide (?) et supprimer (×) toujours visibles sur les nœuds Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-17 09:47:03 +01:00
Dom	3bd23d6135	fix: ajouter RawSession.from_dict() pour le StreamProcessor Le GraphBuilder ne pouvait pas construire le graphe car from_dict n'existait pas (seulement from_json). Alias avec valeurs par défaut pour les sessions streaming. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-17 09:06:42 +01:00
Dom	1e18194e31	feat: VWB — aide outil (?), croix suppression, plein écran, zones détection - Bouton ? sur chaque nœud : tooltip avec description + paramètres typés - Croix rouge visible (fix overflow React Flow) - Sélection plein écran avec détection auto des éléments UI - Zones détectées affichées sur l'aperçu de capture - 32 actions documentées en français avec paramètres typés - Pruning candidats VLM : max 80 avant classification (3x plus rapide) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-17 08:13:46 +01:00
Dom	fb648e730f	chore: consolider venvs — .venv unique avec requirements.txt complet - Tous les paquets (Flask, torch, docTR, CLIP, openpyxl, etc.) dans .venv - requirements.txt généré (168 paquets) - venv_v3 obsolète (les services se relanceront sur .venv via svc.sh) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-17 07:52:25 +01:00
Dom	edd1c2efdb	fix: classification VLM robuste — skip petits crops, retry, extraction JSON - Skip crops < 40px (deviner type par forme, confidence 0.3) - Retry 1 fois si réponse VLM vide - Extraction JSON robuste : cherche {…} dans le texte, fixe single quotes - Élimine ~70% des appels VLM inutiles sur les petits éléments Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-17 07:25:00 +01:00
Dom	928b9e1065	feat: import Excel via chat Léa, suppression nœuds VWB, fix temperature 0.1 - Chat Léa : "importe patients.xlsx" → preview → confirmation → table SQLite Bouton 📎 pour upload fichier, "montre les tables", "info table X" - VWB : suppression nœuds via touche Suppr/Backspace + bouton croix rouge - Fix : toutes les températures VLM à 0.1 (qwen3-vl bloque à 0.0) - Fix : capture VWB avec DISPLAY=:1 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-17 07:18:51 +01:00
Dom	97cb2957d5	feat: upload Excel via explorateur de fichier dans le VWB - Bouton "Parcourir..." ouvre l'explorateur natif du navigateur - Upload vers /api/v3/upload-excel, sauvegarde dans data/uploads/ - Nom de table auto-suggéré depuis le nom du fichier Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-16 23:17:05 +01:00
Dom	9da804bb6e	feat: import Excel → SQLite + boucle données → UI dans le VWB - ExcelImporter : import .xlsx → SQLite auto (détection types, batch insert) - DBIterator : lecture ligne par ligne avec filtre/tri/limite - VWB actions : "Importer Excel" + "Pour chaque ligne" dans la palette - DAG executor : pré-exécution import, boucle foreach avec injection ${current_row.colonne} dans les étapes dépendantes - 36 tests unitaires Excel/DB (tous passent) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-16 23:10:51 +01:00
Dom	5e3865d328	feat: DAG executor async + intégration IA/LLM dans le VWB - DAGExecutor : exécution workflow par graphe de dépendances, étapes LLM parallèles, UI séquentielles, injection ${step.result} - LLMActionHandler : analyze_text, translate, extract_data, generate_text via Ollama /api/chat (qwen3-vl:8b, temperature 0.1) - VWB palette : catégorie "IA / LLM" avec 4 actions draggables - VWB propriétés : éditeurs pour chaque action LLM (modèle, prompt, langue) - VWB endpoint : POST /api/v3/workflow/<id>/execute-dag - 37 tests unitaires DAG executor (tous passent) - Fix log spam cache workflows (info → debug) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-16 22:58:44 +01:00
Dom	ad15237fe0	feat: smart systray Léa (plyer), preflight GPU, fix tests, support qwen3-vl - Smart systray (pystray+plyer) remplace PyQt5 : notifications toast, menu dynamique avec workflows, chat "Que dois-je faire ?", icône colorée - Preflight GPU : check_machine_ready() + @pytest.mark.gpu dans conftest - Correction 63 tests cassés → 0 failed (1200 passed) - Tests VWB obsolètes déplacés vers _a_trier/ - Support qwen3-vl:8b sur GPU (remplace qwen2.5vl:3b) - fix images < 32x32 (Ollama panic) - fix force_json=False (qwen3-vl incompatible) - fix temperature 0.1 (0.0 bloque avec images) - Fix captor Windows : Key.esc, _get_key_name() - Fix LeaServerClient : check_connection, list_workflows format - deploy_windows.py : packaging propre client Windows - VWB : edges visibles (#607d8b) + fitView automatique Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-16 22:25:12 +01:00
Dom	cf495dd82f	feat: chat unifié, GestureCatalog, Copilot, Léa UI, extraction données, vérification replay Refonte majeure du système Agent Chat et ajout de nombreux modules : - Chat unifié : suppression du dual Workflows/Agent Libre, tout passe par /api/chat avec résolution en 3 niveaux (workflow → geste → "montre-moi") - GestureCatalog : 38 raccourcis clavier universels Windows avec matching sémantique, substitution automatique dans les replays, et endpoint /api/gestures - Mode Copilot : exécution pas-à-pas des workflows avec validation humaine via WebSocket (approve/skip/abort) avant chaque action - Léa UI (agent_v0/lea_ui/) : interface PyQt5 pour Windows avec overlay transparent pour feedback visuel pendant le replay - Data Extraction (core/extraction/) : moteur d'extraction visuelle de données (OCR + VLM → SQLite), avec schémas YAML et export CSV/Excel - ReplayVerifier (agent_v0/server_v1/) : vérification post-action par comparaison de screenshots, avec logique de retry (max 3) - IntentParser durci : meilleur fallback regex, type GREETING, patterns améliorés - Dashboard : nouvelles pages gestures, streaming, extractions - Tests : 63 tests GestureCatalog, 47 tests extraction, corrections tests existants - Dépréciation : /api/agent/plan et /api/agent/execute retournent HTTP 410, suppression du code hardcodé _plan_to_replay_actions Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-15 10:02:09 +01:00
Dom	74a1cb4e03	feat(agent-libre): exécuter les plans LLM sur le PC cible via streaming server Le mode "Agent Libre" envoyait les actions localement (Linux) au lieu du PC Windows. Maintenant les plans LLM sont convertis en actions normalisées et envoyés au streaming server via POST /replay/raw. L'Agent V1 les exécute sur la bonne machine. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-15 08:41:53 +01:00
Dom	463f1dd95e	fix(dashboard): corriger les routes mortes, parsing API et liens cassés Audit et corrections du Web Dashboard (port 5001) : - Désactiver le bouton "Restaurer" (rollback) car la route /api/version/rollback n'est pas implémentée côté serveur - Corriger le parsing de /api/version : les données sont dans version.version (dict), pas directement dans version (string) - Corriger le parsing de /api/version/system-info : données imbriquées dans system_info.system, pas directement à la racine - Corriger le parsing de /api/backup/stats : utiliser stats..file_count au lieu de categories..count qui n'existe pas - Corriger le fallback correction packs pour utiliser le bon format de stats - Corriger le parsing de faiss.total_vectors dans l'onglet Apprentissage - Remplacer les données simulées dans loadActionTypeStats() par un placeholder honnête - Corriger le HTML invalide (double attribut style sur configTestResults) - Rendre switchTab() plus robuste avec event.target.closest('.tab') - Réduire le polling services de 5s à 15s pour limiter la charge - Mettre à jour SERVICES_CONFIG (ports corrects, .venv/ au lieu de venv_v3/) - Ajouter le proxy streaming et 4 services manquants dans la config - Ajouter 19 tests unitaires pour les routes du dashboard Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-14 22:05:11 +01:00
Dom	8f31ba95d3	feat: extraction expressions math + workflow calculatrice paramétrable - IntentParser: ajout pattern "expression" pour capturer 5+2, 100*3, etc. - demo_calculator.json: text "${expression}=" avec default "2+2" → l'utilisateur peut dire "calcule 5+2" et le paramètre est injecté Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-14 18:39:56 +01:00
Dom	7df01f2642	fix(agent-chat): ne plus fallback local quand streaming server refuse - Distinguer serveur injoignable (fallback local OK) vs serveur UP mais refus (pas de session Agent V1, workflow inconnu) → message d'erreur explicite au lieu d'ouvrir un navigateur sur Linux - _try_streaming_server_replay retourne {"error": ...} au lieu de None quand le serveur répond avec un code d'erreur HTTP Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-14 18:20:07 +01:00
Dom	599dd02399	fix(agent-chat): suivi replay distant + timeout 15s - Session ID vide pour auto-détection de la session Agent V1 active - Timeout augmenté de 5s à 15s pour la requête replay - Ajout _poll_replay_progress : suit la progression réelle du replay (polling /replay/{id} toutes les 2s, max 120s) au lieu de marquer faussement "terminé avec succès" immédiatement Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-14 17:43:49 +01:00
Dom	766c57e126	fix(agent-chat): execution_status.running manquant en mode local Le fallback d'exécution locale ne mettait pas execution_status["running"] à True, ce qui causait l'arrêt immédiat de la boucle d'exécution avec "Exécution annulée par l'utilisateur" dès la première étape. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-14 17:31:36 +01:00
Dom	79c19c5e9d	fix(agent-chat): ajouter handler QUERY pour les infos workflow Le chat listait les workflows mais répondait "Je n'ai pas d'information" quand l'utilisateur demandait des détails. Le handler QUERY utilise maintenant SemanticMatcher.find_workflow() + get_workflow_help() pour retourner description, tags et paramètres supportés. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-14 16:37:24 +01:00
Dom	148321dffd	feat: WorkflowRunner, matching sémantique et replay distant (P0-4, P0-6, P0-7) P0-4: WorkflowRunner — orchestrateur de replay intelligent - Boucle capture → match FAISS → résolution sémantique → exécution - Mode dry_run, substitution de variables, anti-boucle (max 200 steps) - Découplé de pyautogui via executor_callback P0-6: Unification des répertoires workflows - SemanticMatcher scanne data/workflows/ + data/training/workflows/ - Auto-reload sur changement de répertoire (60s) P0-7: Matching sémantique via Ollama - Pré-filtrage Jaccard + re-ranking LLM (qwen2.5:7b) - Score final : 40% Jaccard + 60% LLM, fallback si Ollama indisponible Agent Chat: exécution distante via streaming server - POST http://localhost:5005/api/v1/traces/stream/replay - Fallback sur exécution locale si serveur indisponible Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-14 11:23:33 +01:00
Dom	de779af5a1	chore: nettoyage des fichiers legacy via .gitignore Suppression de 472 fichiers temporaires, scripts de test one-shot, fichiers de status/progress, et documentation auto-générée qui n'auraient jamais dû être commités. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-14 11:22:10 +01:00
Dom	c2feca29c4	chore: add .gitignore	2026-03-05 00:37:31 +01:00
Dom	773ee78949	feat(vwb): Remplacer EasyOCR par docTR (Mindee) pour l'OCR docTR est plus performant et mieux maintenu. Crée un service OCR partagé (singleton paresseux) utilisé par verify_text_content et extraire_tableau, avec les mêmes signatures et fallbacks. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-18 22:19:44 +01:00
Dom	786e640de9	Merge dev/ia-tools-improvement: audit phases 1-4 + outils IA - refactor(audit): suppression code mort, config centralisée, thread-safety, logging - feat(vwb): outils IA améliorés, validation workflow, suppression fallback statique - feat(vwb-frontend): sélecteur modèle IA, validation, variables - fix(vwb): suppression debug /tmp, correction import UIElement v1.1	2026-02-17 11:05:23 +01:00
Dom	2cb53901a1	fix(vwb): Supprimer debug /tmp et corriger import UIElement - Supprimer le bloc debug qui écrivait dans /tmp/vwb_debug.log - Corriger l'import UIElement (core.models.ui_element au lieu de screen_state) — supprime le warning au démarrage Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-17 10:58:14 +01:00
Dom	75260e3254	feat(vwb-frontend): Sélecteur modèle IA, validation workflow et variables Nouveaux composants: - AIModelSelector: sélection du modèle Ollama avec détection auto - WorkflowValidation: validation des étapes avant exécution - ollamaService: service de communication avec Ollama (liste modèles) Améliorations: - PropertiesPanel: intégration sélecteur IA, champs prompt/température - VariableManager: support variables runtime et substitution {{var}} - ConfidenceDashboard: refactoring et simplification - App.tsx: routing et intégration des nouveaux composants - api.ts: endpoints validate et export-training - types.ts: types pour modèles IA et validation - styles.css: styles pour les nouveaux composants Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-17 10:56:40 +01:00
Dom	4c9a6d293f	feat(vwb): Améliorer outils IA et supprimer fallback statique Backend: - analyser_avec_ia.py: centraliser URL Ollama via os.environ.get() - action_contracts.py: assouplir le contrat ai_analyze_text (mode texte sans ancre visuelle, accepter prompt ou analysis_prompt) - intelligent_executor.py: supprimer le fallback coordonnées statiques quand la vision échoue — renvoyer not_found pour self-healing - workflow.py: ajouter endpoints validate et export-training run.sh: - Corriger les ports (3000 → 3002) et le venv (venv_v3 → .venv) - Lancer run_v4.sh au lieu de l'ancien run.sh Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-17 10:56:17 +01:00
Dom	3ff36e3c79	refactor(audit): Nettoyage dette technique phases 1-4 Phase 1 — Code mort et duplication : - Supprimer catalog_routes.py (-1832 lignes, doublon de v2_vlm) - Mettre à jour app.py et app_lightweight.py vers catalog_routes_v2_vlm - Nettoyer 9 imports inutilisés dans catalog_routes_v2_vlm.py - Supprimer get_required_params inutilisé dans execute.py Phase 2 — Centraliser la configuration : - Ollama URL via os.environ.get() dans verify_text_content.py et extraire_tableau.py - MODEL_PATH relatif au projet + var env UI_DETR_MODEL_PATH dans ui_detection_service.py Phase 3 — Thread-safety de l'exécution : - Ajouter _execution_lock (RLock) pour protéger _execution_state - Remplacer le polling self-healing par threading.Event - Initialiser 'variables' dans le dict initial (plus de création dynamique) - Corriger bare except → except Exception as db_err avec message Phase 4 — Logging minimal : - Ajouter logger dans execute.py, remplacer print() critiques par logger - Configurer RotatingFileHandler (5MB, 3 backups) dans app.py Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-02-17 08:11:45 +01:00
Dom	a27b74cf22	v1.0 - Version stable: multi-PC, détection UI-DETR-1, 3 modes exécution - Frontend v4 accessible sur réseau local (192.168.1.40) - Ports ouverts: 3002 (frontend), 5001 (backend), 5004 (dashboard) - Ollama GPU fonctionnel - Self-healing interactif - Dashboard confiance Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com> v1.0-stable	2026-01-29 11:23:51 +01:00
Dom	21bfa3b337	feat(vwb): Ajouter SeeClick, Self-Healing interactif et Dashboard confiance ## Nouvelles fonctionnalités ### 1. SeeClick Adapter (visual grounding fallback) - Nouvel adapter pour le modèle SeeClick (HuggingFace) - Intégré dans la chaîne de fallback: CLIP → Template → SeeClick → Static - Localise les éléments GUI à partir de descriptions textuelles ### 2. Self-Healing Interactif - Dialogue qui propose des alternatives quand l'ancre n'est pas trouvée - L'utilisateur peut choisir: candidat alternatif, coords statiques, ou sauter - Nouveaux endpoints: /healing/status, /healing/choose, /healing/candidates - État "waiting_for_choice" pour mettre l'exécution en pause ### 3. Dashboard Confiance (temps réel) - Affiche les scores de confiance pendant l'exécution - Montre: méthode utilisée, distance, taux de succès - Interface pliable en bas à droite - Visible uniquement en mode intelligent/debug ## Fichiers ajoutés - core/detection/seeclick_adapter.py - frontend_v4/src/components/SelfHealingDialog.tsx - frontend_v4/src/components/ConfidenceDashboard.tsx ## Fichiers modifiés - core/detection/__init__.py - backend/services/intelligent_executor.py - backend/api_v3/execute.py - frontend_v4/src/App.tsx - frontend_v4/src/services/api.ts - docs/VISION_RPA_INTELLIGENT.md Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-24 02:34:01 +01:00
Dom	f04f156144	fix(vision): Corriger les seuils CLIP/Template pour éviter les clics erronés Problème résolu: - Le workflow cliquait au mauvais endroit (200-500px de distance) - Les seuils de matching étaient trop permissifs Corrections apportées: - CLIP: MAX_DISTANCE=120px, MIN_SCORE=0.55, MIN_COMBINED=0.5 - Template zonée: MAX_DISTANCE=150px - Template global: MAX_DISTANCE=150px (était 500px) - Ajout de logs détaillés pour debug des candidats rejetés - Désactivation de l'overlay debug (polling intensif inutile) Fichiers modifiés: - intelligent_executor.py: Seuils stricts + logs - execute.py: Logique d'exécution modes basic/intelligent/debug - ui_detection_service.py: Backend UI-DETR-1 - App.tsx: Overlay désactivé - ExecutionOverlay.tsx: URLs API corrigées Documentation: - docs/REFERENCE_VISION_RPA.md: Guide complet de référence Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-24 02:15:04 +01:00
Dom	d8d086dac5	feat(vwb): Intégration UI-DETR-1 + Toggle mode Basique/Intelligent/Debug - Toggle 3 modes dans le header: Basique (coords fixes), Intelligent (vision IA), Debug (overlay) - Service UI-DETR-1 pour détection d'éléments UI (510MB model, ~800ms/image) - API endpoints: /api/ui-detection/detect, /preload, /status, /find-element - Overlay des bboxes détectées en mode Debug (miniature + plein écran) - Clic sur élément détecté pour le sélectionner comme ancre - Document de vision produit: docs/VISION_RPA_INTELLIGENT.md - Configuration CORS étendue pour ports locaux Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-23 14:13:32 +01:00
Dom	483653a0b4	feat(vwb-v4): Frontend React Flow avec palette d'outils complète - Interface style n8n avec React Flow pour le canvas - 22 actions organisées en 7 catégories (souris, clavier, attente, données, logique, IA, validation) - 4 points d'accroche par nœud (haut, bas, droite, gauche) pour workflows complexes - Panel de propriétés complet avec tous les paramètres pour chaque type d'action - Capture d'écran plein écran avec sélection d'ancre - Thème sombre professionnel Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-23 12:54:08 +01:00
Dom	858e6007f9	feat(vwb-v3): Architecture Thin Client fonctionnelle API = Source de vérité unique (SQLite + Flask) - Backend: API v3 avec session, workflow, capture, execute - Frontend: Vanilla TypeScript, pas de state local - Contrats stricts pour les actions RPA - Drag & drop pour réorganiser les étapes - Insertion d'étapes entre deux existantes - Bibliothèque de captures (sessionStorage) - Exécution avec coordonnées statiques (pyautogui) Fonctionne mais fragile (coordonnées fixes, pas de détection visuelle) Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-23 12:07:13 +01:00
Dom	a9a53991bc	fix(vwb): Corriger auto-save et coordonnées miniature - Ajouter méthode updateWorkflow (PUT) dans apiClient pour les workflows existants - Utiliser PUT au lieu de POST pour l'auto-sauvegarde des workflows - Ajouter tracking du scale dans VisualSelector pour convertir les coordonnées du canvas vers l'image originale - Corriger le bounding_box pour correspondre aux dimensions réelles de l'image capturée Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>	2026-01-20 21:38:47 +01:00

1 2 3 4 5

239 Commits