Handoff Qwen — Session 2026-05-26 soir → 2026-05-27

De: Qwen
Date: 2026-05-26 22:30 Europe/Paris
Contexte: fin de session soir, reprise demain
Équipe: Dom (arbitre), Codex (coordinateur), Claude/Claudettes (collègues), Qwen (moi)

État du projet — ce qui a été fait ce soir

Session de reprise (20h44 → 22h30)

Lecture du prompt de reprise (PROMPT_REPRISE_QWEN_2026-05-26_SOIR.md)
- Cadrage Aiva-vision / Léa / Aiva-urgence
- Scénario démo v2 : collecte multi-onglets → transposition OnlyOffice
- Limites non négociables Dom
Première analyse → 2026-05-26_2044_qwen-to-codex_REPRISE-analyse-scenario-v2.md
- ACK/NACK, 8-lignes résumé, 5 risques, 5 critères, 3 vérifications
- Recommandation : dry-run contrôlé
Deuxième passe après lecture 5 sources actives → 2026-05-26_2050_qwen-to-codex_DELTA-apres-lecture-sources-actives.md
- Corrections : /api/analyse n'est pas un endpoint vision, orthographe Easily
- 3 risques bloquants : extract_text_scroll, grounding maquette, sortie transposition
- Proposition transposition : .xlsx via openpyxl, fallback .txt
Audit technique dry-run + OnlyOffice → 2026-05-26_2101_qwen-to-codex_AUDIT-technique-dryrun-onlyoffice.md
- 8 ancres critiques à valider
- Seuils GO/NOGO par onglet
- Fallbacks F1-F4
Seuils et fallbacks après dry-run → 2026-05-26_2113_qwen-to-codex_SEUILS-fallbacks-apres-dryrun.md
- Seuils affinés sur données réelles du dry-run
- 4 fallbacks techniques documentés
Rapport P0 OCR écran → 2026-05-26_2117_qwen-to-codex_RAPPORT-P0-ocr-ecran.md
- Diagnostic pipeline OCR (EasyOCR, docTR, Tesseract)
- Architecture multi-moteur par zone
- Cold start vs interface apprise
- Mis à jour : docTR CPU repositionné comme moteur de zonage P0
Retour benchmark OCR → 2026-05-26_2148_qwen-to-codex_RETOUR-benchmark-ocr-capitalisation.md
- Tesseract 11/11 IPP en 0,47s ✅
- EasyOCR 8/11 IPP, bon sur texte continu
- Preprocessing OpenCV : régression, pas d'amélioration
- Architecture multi-moteur : chiffres→Tesseract, texte→EasyOCR, structure→docTR
- 5 règles de capitalisation
ACK apprentissage scroll sécurisé → 2026-05-26_2149_qwen-to-codex_ACK-apprentissage-scroll-securise.md
- GO/NOGO sur marqueurs après scroll (CCMU, GEMSA, J12.1, Consultation externe)
- Scroll réussi = geste + changement visuel + données relues

Exploration web (solutions similaires)

Agent-S : réflexion in-context, Best-of-N sampling, grounding dédié
UI-TARS : grounding GUI par coordonnées, reinforcement learning
Claude Computer Use : 22% OSWorld, scroll/drag difficiles
OpenAI Operator : abandonné (août 2025)
Différentiateur Aiva-vision : "l'agent qui sait s'arrêter" — défendable en domaine réglementé

Exploration codebase

Agent explorateur a scanné 880 fichiers Python, 39 sous-modules core/
Pipeline complet compris : capture → streaming → analyse → grounding → execution → replay

État technique connu — décisions actives

OCR

EasyOCR brut : moteur par défaut pour texte continu (inchangé)
Tesseract : patch appliqué pour IPP/chiffres (extract_digits_tesseract_from_image(), extract_table(engine="tesseract"))
docTR CPU : moteur de zonage pour band patient, synthèse, bboxes
Preprocessing OpenCV : ❌ reporté (régression mesurée)
PaddleOCR : ❌ post-démo
VLM OCR texte : ❌ exclu J-6

Workflow

Demo_urgence_3_db / wf_483910cdd851_1778750587 : step extract_table → Tesseract
BDD backupée : workflows.db.backup_2026-05-26_ocr_tesseract_demo3
5 onglets préparés, live prudent possible en 4 si scroll échoue

Démo

Cible : 2026-06-01
Répétition humaine : demain (Dom challengeur)
Dossier cible : MOREL Catherine / IPP 25003284
Sortie : .xlsx ouvert dans OnlyOffice (/snap/bin/onlyoffice-desktopeditors)
Profil démo Linux actif (flags skip vision, EasyOCR CPU)

Documents actifs à connaître

Sources actives prioritaires

docs/coordination/active/2026-05-26_cadrage-produit-aiva-vision.md
docs/coordination/active/2026-05-26_arbitrage-dom-demo-reelle-poc.md
docs/coordination/active/2026-05-26_principe-dom-apprentissage-fail-safe.md
docs/coordination/active/2026-05-26_scenario-operatoire-demo-lea-v2-collecte-transposition.md
docs/coordination/active/2026-05-26_audit-ancien-workflow-urgence-aiva.md

Documents ajoutés ce soir

docs/coordination/active/2026-05-26_benchmark-ocr-local-captures-easily.md
docs/coordination/active/2026-05-26_arbitrage-scroll-vwb-reference.md
docs/coordination/active/2026-05-26_principe-apprentissage-scroll-securise.md
docs/coordination/active/2026-05-26_synthese-retours-claude-qwen-demo-v2-ocr.md
docs/coordination/active/2026-05-26_dryrun-easily-v2-captures-ocr-onlyoffice.md
docs/coordination/active/2026-05-26_arbitrage-sortie-transposition-onlyoffice.md
docs/coordination/active/2026-05-26_mission-p0-ocr-ecran-lea.md
docs/coordination/active/2026-05-26_mission-P0-ocr-ecran-qwen.md

Runbook

docs/coordination/active/2026-05-26_runbook-repetition-humain-challenge-demo-v2.md

Fichiers produits ce soir (inbox_codex)

Fichier	Type
`2026-05-26_2044_qwen-to-codex_REPRISE-analyse-scenario-v2.md`	Analyse initiale
`2026-05-26_2050_qwen-to-codex_DELTA-apres-lecture-sources-actives.md`	Delta sources
`2026-05-26_2101_qwen-to-codex_AUDIT-technique-dryrun-onlyoffice.md`	Audit technique
`2026-05-26_2113_qwen-to-codex_SEUILS-fallbacks-apres-dryrun.md`	Seuils/fallbacks
`2026-05-26_2117_qwen-to-codex_RAPPORT-P0-ocr-ecran.md`	Rapport OCR (mis à jour)
`2026-05-26_2137_qwen-to-codex_SYNTHESE-benchmark-5-onglets.md`	Synthèse collectif
`2026-05-26_2148_qwen-to-codex_RETOUR-benchmark-ocr-capitalisation.md`	Retour benchmark
`2026-05-26_2149_qwen-to-codex_ACK-apprentissage-scroll-securise.md`	ACK scroll

Ce qui reste à faire / à surveiller demain

Répétition humaine — Dom challengeur, critères GO/NOGO stricts
Résultats de la répétition — ajuster si nécessaire
Patchs potentiels — selon résultats répétition (scroll, grounding)
Préparation démo 2026-06-01 — J-5 après demain

Mémoire construite ce soir

user/dom_constraints.md — Limites non négociables Dom
project/aiva_vision_demo.md — Contexte démo Aiva-vision
feedback/qwen_avoidances.md — Ce que Qwen doit éviter
feedback/dom_doctr_preference.md — DocTR puissant pour zonage
feedback/qwen_proactive_improvements.md — Qwen doit proposer des idées
project/aiva_vision_product_philosophy.md — Collaborateur administratif, pas RPA
reference/coordination_process.md — Coordination par fichiers Markdown

Notes personnelles Qwen

Le positionnement produit est collaborateur administratif supervisé, pas RPA "boîte à clic"
Notre avantage : "l'agent qui sait s'arrêter" — pas un bug, une feature en domaine réglementé
Architecture : Aiva-vision (socle universel) + plugins métier (accélérateurs d'apprentissage)
Cycle Léa : apprendre → essayer → se planter → humain rattrape → consolide → indépendant
L'exploration web montre que personne n'a résolu le computer use fiable (Claude 22%, OpenAI a abandonné)

Auteur : Qwen

7.4 KiB Raw Blame History

Handoff Qwen — Session 2026-05-26 soir → 2026-05-27

État du projet — ce qui a été fait ce soir

Session de reprise (20h44 → 22h30)

Exploration web (solutions similaires)

Exploration codebase

État technique connu — décisions actives

OCR

Workflow

Démo

Documents actifs à connaître

Sources actives prioritaires

Documents ajoutés ce soir

Runbook

Fichiers produits ce soir (inbox_codex)

Ce qui reste à faire / à surveiller demain

Mémoire construite ce soir

Notes personnelles Qwen

7.4 KiB

Raw Blame History