Files
rpa_vision_v3/docs/HEALTHCHECK_LEA_STACK_2026-05-25.md

77 lines
2.3 KiB
Markdown

# Healthcheck Lea stack — preuve initiale
Date : 2026-05-25 12:53 Europe/Paris
Script : `tools/lea_healthcheck.py`
Mode : lecture seule, aucun restart, aucune restauration, aucune suppression.
## Commandes
Local Linux seul :
```bash
.venv/bin/python tools/lea_healthcheck.py
```
Linux + Windows via SSH, sans stocker le mot de passe dans le script :
```bash
SSHPASS='***' LEA_SSH_COMMAND='sshpass -e ssh' \
.venv/bin/python tools/lea_healthcheck.py --windows-host 192.168.1.11
```
Sortie JSON :
```bash
.venv/bin/python tools/lea_healthcheck.py --json
```
## Resultat initial
Statut global : **WARN**.
OK :
- `rpa-streaming.service` actif.
- Port `5005` ouvert.
- `/health` streaming healthy.
- Ollama API `11434` ouverte.
- Tags critiques presents :
- `qwen2.5vl:7b-rpa`
- `t2a-gemma3-27b:latest`
- `t2a-gemma3-27b-q4:latest`
- `thiagomoraes/medgemma-27b-it:Q4_K_S`
- `qwen2.5vl:7b-rpa` resident dans Ollama avec `context_length=2048`.
- Store Ollama : 38 manifests, 106 blobs.
- 3 blobs critiques 27B presents.
- Windows SSH joignable.
- Tache Windows `LeaInteractive` : `Running`.
- 2 processus `run_agent_v1.py` observes, conforme au wrapper venv + Python reel.
Etat initial avant C1 :
- `rpa-agent-chat.service` inactif.
- Port `5004` ferme.
- FeedbackBus non joignable.
- Variable utilisateur Windows `LEA_FEEDBACK_BUS='1'`, donc Lea tente le bus 5004 alors qu'il est down.
Etat apres C1 / restart controle du 2026-05-25 13:26 :
- `rpa-agent-chat.service` actif.
- Port `5004` ouvert.
- SocketIO polling OK avec origins `http://192.168.1.40:5004` et `http://192.168.1.11:5004`.
- `GET /api/status` FeedbackBus retourne `status=online`.
- Healthcheck Linux + Windows : **OK**.
Point restant : `agent_chat` tente encore de charger OWL-v2 sur CUDA au boot et garde environ 602 MiB VRAM apres OOM. Cela n'empeche pas 5004, mais doit etre traite dans le chantier performance/VRAM.
## Interpretation
Le chemin critique replay/pause/resume reste couvert par `rpa-streaming` port 5005 et par le fallback HTTP.
Le chantier propre avant le 1 juin est de choisir entre :
1. reparer et rallumer FeedbackBus 5004 pour la narration temps reel ;
2. ou desactiver explicitement `LEA_FEEDBACK_BUS` cote Windows si la narration n'est pas retenue.
Avec le report de la demo au 1 juin, l'option privilegiee est de reparer proprement 5004 au lieu de masquer le warning.