rpa_vision_v3/docs/guides/QUICKSTART_REAL.md

# Quick Start - RPA Vision V3 (RÉEL)

## Installation et Setup

```bash
cd rpa_vision_v3
./run.sh
```

Le script `run.sh` va :
- ✅ Créer le venv
- ✅ Installer les dépendances
- ✅ Vérifier FAISS
- ✅ Vérifier Ollama et Qwen3-VL
- ✅ Vérifier que les modèles sont intégrés

## Tests Rapides

### 1. Test CLIP (Embeddings)
```bash
source venv/bin/activate
python3 examples/test_clip_simple.py
```

**Résultat attendu:**
```
✓ Embedding généré: shape=(512,), norme=1.0000
```

### 2. Test Pipeline Complet (CLIP + FAISS)
```bash
python3 examples/test_complete_pipeline.py
```

**Résultat attendu:**
```
✅ PIPELINE COMPLET FONCTIONNEL
```

### 3. Test OWL-v2 (Détection UI)
```bash
python3 examples/test_owl_simple.py
```

## Architecture Vérifiée

✅ **OpenCLIP** : Intégré dans `StateEmbeddingBuilder`
✅ **FAISS** : Indexation et recherche fonctionnelles
✅ **OWL-v2** : Intégré dans `UIDetector`
✅ **Qwen3-VL** : Disponible via Ollama

## Prochaines Étapes

1. Tester la détection UI sur une vraie capture d'écran
2. Créer un workflow complet de bout en bout
3. Persister l'index FAISS sur disque
4. Intégrer avec le système de capture

## Troubleshooting

### FAISS non trouvé
```bash
source venv/bin/activate
pip install faiss-cpu
```

### Ollama non installé
```bash
curl -fsSL https://ollama.com/install.sh | sh
ollama pull qwen3-vl:8b
```

### Modèles non chargés
```bash
python3 verify_models.py
```