Pipeline replay visuel : - VLM-first : l'agent appelle Ollama directement pour trouver les éléments - Template matching en fallback (seuil strict 0.90) - Stop immédiat si élément non trouvé (pas de clic blind) - Replay depuis session brute (/replay-session) sans attendre le VLM - Vérification post-action (screenshot hash avant/après) - Gestion des popups (Enter/Escape/Tab+Enter) Worker VLM séparé : - run_worker.py : process distinct du serveur HTTP - Communication par fichiers (_worker_queue.txt + _replay_active.lock) - Le serveur HTTP ne fait plus jamais de VLM → toujours réactif - Service systemd rpa-worker.service Capture clavier : - raw_keys (vk + press/release) pour replay exact indépendant du layout - Fix AZERTY : ToUnicodeEx + AltGr detection - Enter capturé comme \n, Tab comme \t - Filtrage modificateurs seuls (Ctrl/Alt/Shift parasites) - Fusion text_input consécutifs, dédup key_combo Sécurité & Internet : - HTTPS Let's Encrypt (lea.labs + vwb.labs.laurinebazin.design) - Token API fixe dans .env.local - HTTP Basic Auth sur VWB - Security headers (HSTS, CSP, nosniff) - CORS domaines publics, plus de wildcard Infrastructure : - DPI awareness (SetProcessDpiAwareness) Python + Rust - Métadonnées système (dpi_scale, window_bounds, monitors, os_theme) - Template matching multi-scale [0.5, 2.0] - Résolution dynamique (plus de hardcode 1920x1080) - VLM prefill fix (47x speedup, 3.5s au lieu de 180s) Modules : - core/auth/ : credential vault (Fernet AES), TOTP (RFC 6238), auth handler - core/federation/ : LearningPack export/import anonymisé, FAISS global - deploy/ : package Léa (config.txt, Lea.bat, install.bat, LISEZMOI.txt) UX : - Filtrage OS (VWB + Chat montrent que les workflows de l'OS courant) - Bibliothèque persistante (cache local + SQLite) - Clustering hybride (titre fenêtre + DBSCAN) - EdgeConstraints + PostConditions peuplés - GraphBuilder compound actions (toutes les frappes) Agent Rust : - Token Bearer auth (network.rs) - sysinfo.rs (DPI, résolution, window bounds via Win32 API) - config.txt lu automatiquement - Support Chrome/Brave/Firefox (pas que Edge) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
23 lines
920 B
Plaintext
23 lines
920 B
Plaintext
# RPA Vision V3 - Configuration des services
|
|
# Format: NOM|PORT|COMMANDE|TYPE
|
|
# TYPE: required | optional | dev-only
|
|
#
|
|
# Carte des ports définitive:
|
|
# 8000 - API Server (core upload/processing)
|
|
# 5001 - Web Dashboard (monitoring)
|
|
# 5002 - VWB Backend (Visual Workflow Builder Flask)
|
|
# 5003 - Monitoring (métriques système)
|
|
# 5004 - Agent Chat (interface conversationnelle)
|
|
# 5005 - Streaming Server (Agent V1 → core pipeline)
|
|
# 3002 - VWB Frontend (Vite/React)
|
|
#
|
|
|
|
api|8000|server/api_upload.py|required
|
|
dashboard|5001|web_dashboard/app.py|required
|
|
vwb-backend|5002|visual_workflow_builder/backend/app.py|required
|
|
monitoring|5003|monitoring_server.py|optional
|
|
agent-chat|5004|agent_chat/app.py|optional
|
|
streaming|5005|agent_v0/server_v1/api_stream.py|optional
|
|
worker|5099|agent_v0/server_v1/run_worker.py|optional
|
|
vwb-frontend|3002|cd visual_workflow_builder/frontend_v4 && npm run dev|required
|