# Handoff Qwen — Session 2026-05-26 soir → 2026-05-27

- `De`: Qwen
- `Date`: 2026-05-26 22:30 Europe/Paris
- `Contexte`: fin de session soir, reprise demain
- `Équipe`: Dom (arbitre), Codex (coordinateur), Claude/Claudettes (collègues), Qwen (moi)

---

## État du projet — ce qui a été fait ce soir

### Session de reprise (20h44 → 22h30)

1. **Lecture du prompt de reprise** (`PROMPT_REPRISE_QWEN_2026-05-26_SOIR.md`)
   - Cadrage Aiva-vision / Léa / Aiva-urgence
   - Scénario démo v2 : collecte multi-onglets → transposition OnlyOffice
   - Limites non négociables Dom

2. **Première analyse** → `2026-05-26_2044_qwen-to-codex_REPRISE-analyse-scenario-v2.md`
   - ACK/NACK, 8-lignes résumé, 5 risques, 5 critères, 3 vérifications
   - Recommandation : dry-run contrôlé

3. **Deuxième passe après lecture 5 sources actives** → `2026-05-26_2050_qwen-to-codex_DELTA-apres-lecture-sources-actives.md`
   - Corrections : `/api/analyse` n'est pas un endpoint vision, orthographe `Easily`
   - 3 risques bloquants : extract_text_scroll, grounding maquette, sortie transposition
   - Proposition transposition : .xlsx via openpyxl, fallback .txt

4. **Audit technique dry-run + OnlyOffice** → `2026-05-26_2101_qwen-to-codex_AUDIT-technique-dryrun-onlyoffice.md`
   - 8 ancres critiques à valider
   - Seuils GO/NOGO par onglet
   - Fallbacks F1-F4

5. **Seuils et fallbacks après dry-run** → `2026-05-26_2113_qwen-to-codex_SEUILS-fallbacks-apres-dryrun.md`
   - Seuils affinés sur données réelles du dry-run
   - 4 fallbacks techniques documentés

6. **Rapport P0 OCR écran** → `2026-05-26_2117_qwen-to-codex_RAPPORT-P0-ocr-ecran.md`
   - Diagnostic pipeline OCR (EasyOCR, docTR, Tesseract)
   - Architecture multi-moteur par zone
   - Cold start vs interface apprise
   - **Mis à jour** : docTR CPU repositionné comme moteur de zonage P0

7. **Retour benchmark OCR** → `2026-05-26_2148_qwen-to-codex_RETOUR-benchmark-ocr-capitalisation.md`
   - Tesseract 11/11 IPP en 0,47s ✅
   - EasyOCR 8/11 IPP, bon sur texte continu
   - Preprocessing OpenCV : régression, pas d'amélioration
   - Architecture multi-moteur : chiffres→Tesseract, texte→EasyOCR, structure→docTR
   - 5 règles de capitalisation

8. **ACK apprentissage scroll sécurisé** → `2026-05-26_2149_qwen-to-codex_ACK-apprentissage-scroll-securise.md`
   - GO/NOGO sur marqueurs après scroll (CCMU, GEMSA, J12.1, Consultation externe)
   - Scroll réussi = geste + changement visuel + données relues

### Exploration web (solutions similaires)
- Agent-S : réflexion in-context, Best-of-N sampling, grounding dédié
- UI-TARS : grounding GUI par coordonnées, reinforcement learning
- Claude Computer Use : 22% OSWorld, scroll/drag difficiles
- OpenAI Operator : **abandonné** (août 2025)
- Différentiateur Aiva-vision : "l'agent qui sait s'arrêter" — défendable en domaine réglementé

### Exploration codebase
- Agent explorateur a scanné 880 fichiers Python, 39 sous-modules core/
- Pipeline complet compris : capture → streaming → analyse → grounding → execution → replay

---

## État technique connu — décisions actives

### OCR
- **EasyOCR brut** : moteur par défaut pour texte continu (inchangé)
- **Tesseract** : patch appliqué pour IPP/chiffres (`extract_digits_tesseract_from_image()`, `extract_table(engine="tesseract")`)
- **docTR CPU** : moteur de zonage pour band patient, synthèse, bboxes
- **Preprocessing OpenCV** : ❌ reporté (régression mesurée)
- **PaddleOCR** : ❌ post-démo
- **VLM OCR texte** : ❌ exclu J-6

### Workflow
- `Demo_urgence_3_db` / `wf_483910cdd851_1778750587` : step `extract_table` → Tesseract
- BDD backupée : `workflows.db.backup_2026-05-26_ocr_tesseract_demo3`
- 5 onglets préparés, live prudent possible en 4 si scroll échoue

### Démo
- Cible : 2026-06-01
- Répétition humaine : demain (Dom challengeur)
- Dossier cible : `MOREL Catherine / IPP 25003284`
- Sortie : `.xlsx` ouvert dans OnlyOffice (`/snap/bin/onlyoffice-desktopeditors`)
- Profil démo Linux actif (flags skip vision, EasyOCR CPU)

---

## Documents actifs à connaître

### Sources actives prioritaires
1. `docs/coordination/active/2026-05-26_cadrage-produit-aiva-vision.md`
2. `docs/coordination/active/2026-05-26_arbitrage-dom-demo-reelle-poc.md`
3. `docs/coordination/active/2026-05-26_principe-dom-apprentissage-fail-safe.md`
4. `docs/coordination/active/2026-05-26_scenario-operatoire-demo-lea-v2-collecte-transposition.md`
5. `docs/coordination/active/2026-05-26_audit-ancien-workflow-urgence-aiva.md`

### Documents ajoutés ce soir
- `docs/coordination/active/2026-05-26_benchmark-ocr-local-captures-easily.md`
- `docs/coordination/active/2026-05-26_arbitrage-scroll-vwb-reference.md`
- `docs/coordination/active/2026-05-26_principe-apprentissage-scroll-securise.md`
- `docs/coordination/active/2026-05-26_synthese-retours-claude-qwen-demo-v2-ocr.md`
- `docs/coordination/active/2026-05-26_dryrun-easily-v2-captures-ocr-onlyoffice.md`
- `docs/coordination/active/2026-05-26_arbitrage-sortie-transposition-onlyoffice.md`
- `docs/coordination/active/2026-05-26_mission-p0-ocr-ecran-lea.md`
- `docs/coordination/active/2026-05-26_mission-P0-ocr-ecran-qwen.md`

### Runbook
- `docs/coordination/active/2026-05-26_runbook-repetition-humain-challenge-demo-v2.md`

---

## Fichiers produits ce soir (inbox_codex)

| Fichier | Type |
|---------|------|
| `2026-05-26_2044_qwen-to-codex_REPRISE-analyse-scenario-v2.md` | Analyse initiale |
| `2026-05-26_2050_qwen-to-codex_DELTA-apres-lecture-sources-actives.md` | Delta sources |
| `2026-05-26_2101_qwen-to-codex_AUDIT-technique-dryrun-onlyoffice.md` | Audit technique |
| `2026-05-26_2113_qwen-to-codex_SEUILS-fallbacks-apres-dryrun.md` | Seuils/fallbacks |
| `2026-05-26_2117_qwen-to-codex_RAPPORT-P0-ocr-ecran.md` | Rapport OCR (mis à jour) |
| `2026-05-26_2137_qwen-to-codex_SYNTHESE-benchmark-5-onglets.md` | Synthèse collectif |
| `2026-05-26_2148_qwen-to-codex_RETOUR-benchmark-ocr-capitalisation.md` | Retour benchmark |
| `2026-05-26_2149_qwen-to-codex_ACK-apprentissage-scroll-securise.md` | ACK scroll |

---

## Ce qui reste à faire / à surveiller demain

1. **Répétition humaine** — Dom challengeur, critères GO/NOGO stricts
2. **Résultats de la répétition** — ajuster si nécessaire
3. **Patchs potentiels** — selon résultats répétition (scroll, grounding)
4. **Préparation démo 2026-06-01** — J-5 après demain

---

## Mémoire construite ce soir

- `user/dom_constraints.md` — Limites non négociables Dom
- `project/aiva_vision_demo.md` — Contexte démo Aiva-vision
- `feedback/qwen_avoidances.md` — Ce que Qwen doit éviter
- `feedback/dom_doctr_preference.md` — DocTR puissant pour zonage
- `feedback/qwen_proactive_improvements.md` — Qwen doit proposer des idées
- `project/aiva_vision_product_philosophy.md` — Collaborateur administratif, pas RPA
- `reference/coordination_process.md` — Coordination par fichiers Markdown

---

## Notes personnelles Qwen

- Le positionnement produit est **collaborateur administratif supervisé**, pas RPA "boîte à clic"
- Notre avantage : "l'agent qui sait s'arrêter" — pas un bug, une feature en domaine réglementé
- Architecture : Aiva-vision (socle universel) + plugins métier (accélérateurs d'apprentissage)
- Cycle Léa : apprendre → essayer → se planter → humain rattrape → consolide → indépendant
- L'exploration web montre que personne n'a résolu le computer use fiable (Claude 22%, OpenAI a abandonné)

---

*Auteur : Qwen*