7.4 KiB
Handoff Qwen — Session 2026-05-26 soir → 2026-05-27
De: QwenDate: 2026-05-26 22:30 Europe/ParisContexte: fin de session soir, reprise demainÉquipe: Dom (arbitre), Codex (coordinateur), Claude/Claudettes (collègues), Qwen (moi)
État du projet — ce qui a été fait ce soir
Session de reprise (20h44 → 22h30)
-
Lecture du prompt de reprise (
PROMPT_REPRISE_QWEN_2026-05-26_SOIR.md)- Cadrage Aiva-vision / Léa / Aiva-urgence
- Scénario démo v2 : collecte multi-onglets → transposition OnlyOffice
- Limites non négociables Dom
-
Première analyse →
2026-05-26_2044_qwen-to-codex_REPRISE-analyse-scenario-v2.md- ACK/NACK, 8-lignes résumé, 5 risques, 5 critères, 3 vérifications
- Recommandation : dry-run contrôlé
-
Deuxième passe après lecture 5 sources actives →
2026-05-26_2050_qwen-to-codex_DELTA-apres-lecture-sources-actives.md- Corrections :
/api/analysen'est pas un endpoint vision, orthographeEasily - 3 risques bloquants : extract_text_scroll, grounding maquette, sortie transposition
- Proposition transposition : .xlsx via openpyxl, fallback .txt
- Corrections :
-
Audit technique dry-run + OnlyOffice →
2026-05-26_2101_qwen-to-codex_AUDIT-technique-dryrun-onlyoffice.md- 8 ancres critiques à valider
- Seuils GO/NOGO par onglet
- Fallbacks F1-F4
-
Seuils et fallbacks après dry-run →
2026-05-26_2113_qwen-to-codex_SEUILS-fallbacks-apres-dryrun.md- Seuils affinés sur données réelles du dry-run
- 4 fallbacks techniques documentés
-
Rapport P0 OCR écran →
2026-05-26_2117_qwen-to-codex_RAPPORT-P0-ocr-ecran.md- Diagnostic pipeline OCR (EasyOCR, docTR, Tesseract)
- Architecture multi-moteur par zone
- Cold start vs interface apprise
- Mis à jour : docTR CPU repositionné comme moteur de zonage P0
-
Retour benchmark OCR →
2026-05-26_2148_qwen-to-codex_RETOUR-benchmark-ocr-capitalisation.md- Tesseract 11/11 IPP en 0,47s ✅
- EasyOCR 8/11 IPP, bon sur texte continu
- Preprocessing OpenCV : régression, pas d'amélioration
- Architecture multi-moteur : chiffres→Tesseract, texte→EasyOCR, structure→docTR
- 5 règles de capitalisation
-
ACK apprentissage scroll sécurisé →
2026-05-26_2149_qwen-to-codex_ACK-apprentissage-scroll-securise.md- GO/NOGO sur marqueurs après scroll (CCMU, GEMSA, J12.1, Consultation externe)
- Scroll réussi = geste + changement visuel + données relues
Exploration web (solutions similaires)
- Agent-S : réflexion in-context, Best-of-N sampling, grounding dédié
- UI-TARS : grounding GUI par coordonnées, reinforcement learning
- Claude Computer Use : 22% OSWorld, scroll/drag difficiles
- OpenAI Operator : abandonné (août 2025)
- Différentiateur Aiva-vision : "l'agent qui sait s'arrêter" — défendable en domaine réglementé
Exploration codebase
- Agent explorateur a scanné 880 fichiers Python, 39 sous-modules core/
- Pipeline complet compris : capture → streaming → analyse → grounding → execution → replay
État technique connu — décisions actives
OCR
- EasyOCR brut : moteur par défaut pour texte continu (inchangé)
- Tesseract : patch appliqué pour IPP/chiffres (
extract_digits_tesseract_from_image(),extract_table(engine="tesseract")) - docTR CPU : moteur de zonage pour band patient, synthèse, bboxes
- Preprocessing OpenCV : ❌ reporté (régression mesurée)
- PaddleOCR : ❌ post-démo
- VLM OCR texte : ❌ exclu J-6
Workflow
Demo_urgence_3_db/wf_483910cdd851_1778750587: stepextract_table→ Tesseract- BDD backupée :
workflows.db.backup_2026-05-26_ocr_tesseract_demo3 - 5 onglets préparés, live prudent possible en 4 si scroll échoue
Démo
- Cible : 2026-06-01
- Répétition humaine : demain (Dom challengeur)
- Dossier cible :
MOREL Catherine / IPP 25003284 - Sortie :
.xlsxouvert dans OnlyOffice (/snap/bin/onlyoffice-desktopeditors) - Profil démo Linux actif (flags skip vision, EasyOCR CPU)
Documents actifs à connaître
Sources actives prioritaires
docs/coordination/active/2026-05-26_cadrage-produit-aiva-vision.mddocs/coordination/active/2026-05-26_arbitrage-dom-demo-reelle-poc.mddocs/coordination/active/2026-05-26_principe-dom-apprentissage-fail-safe.mddocs/coordination/active/2026-05-26_scenario-operatoire-demo-lea-v2-collecte-transposition.mddocs/coordination/active/2026-05-26_audit-ancien-workflow-urgence-aiva.md
Documents ajoutés ce soir
docs/coordination/active/2026-05-26_benchmark-ocr-local-captures-easily.mddocs/coordination/active/2026-05-26_arbitrage-scroll-vwb-reference.mddocs/coordination/active/2026-05-26_principe-apprentissage-scroll-securise.mddocs/coordination/active/2026-05-26_synthese-retours-claude-qwen-demo-v2-ocr.mddocs/coordination/active/2026-05-26_dryrun-easily-v2-captures-ocr-onlyoffice.mddocs/coordination/active/2026-05-26_arbitrage-sortie-transposition-onlyoffice.mddocs/coordination/active/2026-05-26_mission-p0-ocr-ecran-lea.mddocs/coordination/active/2026-05-26_mission-P0-ocr-ecran-qwen.md
Runbook
docs/coordination/active/2026-05-26_runbook-repetition-humain-challenge-demo-v2.md
Fichiers produits ce soir (inbox_codex)
| Fichier | Type |
|---|---|
2026-05-26_2044_qwen-to-codex_REPRISE-analyse-scenario-v2.md |
Analyse initiale |
2026-05-26_2050_qwen-to-codex_DELTA-apres-lecture-sources-actives.md |
Delta sources |
2026-05-26_2101_qwen-to-codex_AUDIT-technique-dryrun-onlyoffice.md |
Audit technique |
2026-05-26_2113_qwen-to-codex_SEUILS-fallbacks-apres-dryrun.md |
Seuils/fallbacks |
2026-05-26_2117_qwen-to-codex_RAPPORT-P0-ocr-ecran.md |
Rapport OCR (mis à jour) |
2026-05-26_2137_qwen-to-codex_SYNTHESE-benchmark-5-onglets.md |
Synthèse collectif |
2026-05-26_2148_qwen-to-codex_RETOUR-benchmark-ocr-capitalisation.md |
Retour benchmark |
2026-05-26_2149_qwen-to-codex_ACK-apprentissage-scroll-securise.md |
ACK scroll |
Ce qui reste à faire / à surveiller demain
- Répétition humaine — Dom challengeur, critères GO/NOGO stricts
- Résultats de la répétition — ajuster si nécessaire
- Patchs potentiels — selon résultats répétition (scroll, grounding)
- Préparation démo 2026-06-01 — J-5 après demain
Mémoire construite ce soir
user/dom_constraints.md— Limites non négociables Domproject/aiva_vision_demo.md— Contexte démo Aiva-visionfeedback/qwen_avoidances.md— Ce que Qwen doit éviterfeedback/dom_doctr_preference.md— DocTR puissant pour zonagefeedback/qwen_proactive_improvements.md— Qwen doit proposer des idéesproject/aiva_vision_product_philosophy.md— Collaborateur administratif, pas RPAreference/coordination_process.md— Coordination par fichiers Markdown
Notes personnelles Qwen
- Le positionnement produit est collaborateur administratif supervisé, pas RPA "boîte à clic"
- Notre avantage : "l'agent qui sait s'arrêter" — pas un bug, une feature en domaine réglementé
- Architecture : Aiva-vision (socle universel) + plugins métier (accélérateurs d'apprentissage)
- Cycle Léa : apprendre → essayer → se planter → humain rattrape → consolide → indépendant
- L'exploration web montre que personne n'a résolu le computer use fiable (Claude 22%, OpenAI a abandonné)
Auteur : Qwen