# Quick Start - RPA Vision V3 (RÉEL) ## Installation et Setup ```bash cd rpa_vision_v3 ./run.sh ``` Le script `run.sh` va : - ✅ Créer le venv - ✅ Installer les dépendances - ✅ Vérifier FAISS - ✅ Vérifier Ollama et Qwen3-VL - ✅ Vérifier que les modèles sont intégrés ## Tests Rapides ### 1. Test CLIP (Embeddings) ```bash source venv/bin/activate python3 examples/test_clip_simple.py ``` **Résultat attendu:** ``` ✓ Embedding généré: shape=(512,), norme=1.0000 ``` ### 2. Test Pipeline Complet (CLIP + FAISS) ```bash python3 examples/test_complete_pipeline.py ``` **Résultat attendu:** ``` ✅ PIPELINE COMPLET FONCTIONNEL ``` ### 3. Test OWL-v2 (Détection UI) ```bash python3 examples/test_owl_simple.py ``` ## Architecture Vérifiée ✅ **OpenCLIP** : Intégré dans `StateEmbeddingBuilder` ✅ **FAISS** : Indexation et recherche fonctionnelles ✅ **OWL-v2** : Intégré dans `UIDetector` ✅ **Qwen3-VL** : Disponible via Ollama ## Prochaines Étapes 1. Tester la détection UI sur une vraie capture d'écran 2. Créer un workflow complet de bout en bout 3. Persister l'index FAISS sur disque 4. Intégrer avec le système de capture ## Troubleshooting ### FAISS non trouvé ```bash source venv/bin/activate pip install faiss-cpu ``` ### Ollama non installé ```bash curl -fsSL https://ollama.com/install.sh | sh ollama pull qwen3-vl:8b ``` ### Modèles non chargés ```bash python3 verify_models.py ```