3.1 KiB
3.1 KiB
Plan stabilisation demo Lea — cible lundi 1 juin 2026
Date de cadrage : 2026-05-25 12:44 Europe/Paris Pilotage : Codex Contexte : la demo client est reportee au lundi 1 juin 2026. On sort du mode rustine J-4 et on vise un systeme propre, mesurable, restaurable.
Principes
- Pas de restauration destructive ni suppression de modele sans inventaire et accord explicite.
- Pas de replay live tant que les chemins pause/resume, FeedbackBus et perf ne sont pas instrumentes.
- Les changements doivent avoir une preuve : test, commande de healthcheck, log cible, ou bench.
C:\rpa_visionreste le runtime Windows reel ; ne pas resynchroniseragent_v0/deploy/windows_client.- Les collegues repondent dans
docs/coordination/inbox_codex/avec ACK/NACK explicite.
P0 — Inventaire et protection Ollama
Objectif : garantir que les modeles critiques existent, sont referencables, et peuvent etre reconstruits si un tag disparait.
- Figer
ollama list, manifests, gros blobs,ollama show --modelfiledes modeles critiques. - Verifier les artefacts locaux et backup :
t2a-gemma3-27b-q8_0.gguf,t2a-gemma3-27b-q4_k_m.gguf, merged safetensors. - Produire une table : tag Ollama, digest/blob, source GGUF/HF, backup, statut de reconstruction.
- Identifier les vrais manquants avec Dom si sa liste attendue depasse les 38 tags actuels.
P0 — FeedbackBus 5004 propre
Objectif : garder la narration temps reel si elle est utile, mais sans bruit log ni service fragile.
- Corriger la cause
rpa-agent-chat.service inactive. - Corriger ou isoler le warning CLIP/torch au boot.
- Corriger CORS/SocketIO pour la ChatWindow Windows.
- Conserver le fallback HTTP 5005 pour
resume/abort. - Decider apres test si
LEA_FEEDBACK_BUS=1reste actif cote Windows.
P0 — Performance mesurable
Objectif : remplacer les intuitions par des mesures reproductibles.
- Harness build replay sans live replay : mesure avec/sans
RPA_SKIP_INTENTION_ENRICHMENT. - Mesure des appels VLM : modele,
num_ctx, layers CPU/GPU, p50/p95, taux JSON valide. - Politique de residence Ollama :
MAX_LOADED_MODELS=1, modele VLM prechauffe, eviter les swaps texte/VLM. - Decision documentee :
qwen2.5vl:7b-rpavsqwen2.5vl:7bvsqwen2.5vl:3bvs autre backend.
P0 — Replay pause/resume robuste
Objectif : zero confusion visible dans Lea.
- La bulle supervisee ne doit plus tronquer le message.
- La bulle doit se fermer a la reprise serveur (
server_cleared). - Le compteur et le statut doivent refleter l'etape reelle.
- Smoke Windows obligatoire apres patch deploye.
P1 — Hygiene runtime/deploiement
Objectif : rendre le systeme re-demarrable sans memoire orale.
- Runbook Linux :
rpa-streaming,ollama,rpa-agent-chat. - Runbook Windows : tache
LeaInteractive, lock, logs, hash des fichiers deployes. - Separateur clair : source repo vs runtime
C:\rpa_vision.
P1 — Pack de preuve demo
Objectif : arriver lundi avec une preuve concrete, pas seulement du code.
- Healthcheck global : Linux 5005/5004/Ollama + Windows agent.
- Bench perf avant/apres.
- Smoke replay controle, sans improvisation.
- Notes de risques restantes avec mitigation.