rpa_vision_v3

Author	SHA1	Message	Date
Dom	882e4e1f3a	docs(design+audit): navigate coords consumption gaps + dead code C-MORT audit Some checks failed tests / Lint (ruff + black) (push) Failing after 1m51s Details tests / Tests unitaires (sans GPU) (push) Has been cancelled Details tests / Tests sécurité (critique) (push) Has been cancelled Details DESIGN_NAVIGATE_COORDS_CONSUMPTION_2026-07-02.md: 3 structural gaps with code evidence (Gap A/B/C), 2 resolution options with comparative table, test rouge proposal. AUDIT_CODE_MORT_2026-07-02.md: 8 C-MORT, 5 B-ORPHELIN, 4 duplicats, 3 QG-gated suppression lots (~1900 lines).	2026-07-02 13:02:04 +02:00
Dom	61664c9a36	feat(update): scaffold MAJ silencieuse + canary par machine (DETTE-022, gated OFF, swap encore stub) Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-07-01 12:36:48 +02:00
Dom	de73cbd404	docs(dette): DETTE-021 (logs client Léa non effectifs) + DETTE-022 (MAJ auto Léa) DETTE-021: LOG_FILE défini mais jamais branché (basicConfig->stderr perdu sous pythonw, dossier logs vide) -> diagnostic terrain aveugle + non-conformité Règlement IA Art.12 (180j). Pendant client du DETTE-020. DETTE-022: modif client = redéploiement manuel poste par poste -> dérange les TIM, ne scale pas. Besoin MAJ auto/tâche de fond. Décision Dom 2026-06-25. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-25 14:32:32 +02:00
Dom	1b491326be	docs(dette): DETTE-020 (P1) — incidents silencieux, pas d'alerte composant critique HS Grounder vLLM (rpa-vllm-grounder) trouvé en crash-loop (×3960) → bascule silencieuse sur fallback Qwen2.5-VL, sans remontée dashboard/log/alerte. Découvert par vérif manuelle runtime (DGX clinique, 2026-06-25). Dette = absence de supervision/alerte des composants critiques (vLLM/Ollama/services rpa-*) ; la cause SSL/offline du crash se corrige à part. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-25 11:37:18 +02:00
Dom	c0e4c382be	docs(dette): acte DETTE-018/019 (garde-seuil grounding) + inscrit DETTE-015..017 Some checks failed tests / Lint (ruff + black) (push) Failing after 1m45s Details tests / Tests unitaires (sans GPU) (push) Failing after 1m51s Details tests / Tests sécurité (critique) (push) Has been skipped Details DETTE-018: method="grounding_vlm" legacy non gardé par _RESOLUTION_MIN_SCORES (seul prefixe memory_ traité ; reste = match exact) → Check-1 seuil jamais appliqué au chemin legacy. Mode qwen3vl ("grounding", seuil 0.60) correctement gardé. DETTE-019: confiance figée 0.85 en dur dans _resolve_by_grounding (return) pour les deux modes → garde-seuil (0.60) reçoit toujours 0.85, filtre inopérant. Découvertes au câblage qwen3vl (`5c5ce747b`) + validation E2E 2026-06-13 (15/15, 0 dangereux). Inscrit aussi DETTE-015/016/017 restées non commitées. refs DETTE-018 DETTE-019 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-13 09:33:58 +02:00
Dom	6d34b3cb68	chore(dgx): snapshot consolidation WIP pour transfert poc DGX Some checks failed tests / Lint (ruff + black) (push) Failing after 1m44s Details tests / Tests unitaires (sans GPU) (push) Failing after 1m49s Details tests / Tests sécurité (critique) (push) Has been skipped Details Regroupe le WIP non committé requis pour le clone/runtime DGX (Option A) : - api_stream.py : préflight replay + smoke santé modèles + handler 403 WP-B - de-hardcode VLM : vlm_config, gpu/*, vram_orchestrator, ollama_manager - stream_processor, semantic_matcher, agent_chat (app/planner/intent) - workflows.db (acquis ; le transfert artifacts le mettra à jour + rewrite chemins) - docs : plans DGX, benchmarks VLM/grounders, recherche SOTA, coordination 8 juin Snapshot destiné à la branche poc-dgx poussée sur Gitea pour cloner le DGX. Scan anti-secret : clean. graphify (repo embarqué) exclu. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-08 16:33:58 +02:00
Dom	4dc7d840d6	feat(p1x): de-hardcode VLM models/endpoints to vlm_config (DGX-ready) Migre les call-sites VLM serveur vers la configuration centrale pour fonctionner sur DGX (tunnel Ollama 11434), où gemma4:* est absent et le port Docker 11435 est mort. - task_planner, replay_verifier, domain_context, ir_builder, resolve_engine (popup): modele -> vlm_config.get_vlm_model(), defaut 11435 -> 11434 (override GEMMA4_PORT legacy conserve) - resolve_engine (grounding bbox x2): nouvel helper vlm_config.get_bbox_grounding_model() (var dediee RPA_BBOX_GROUNDING_MODEL, fallback RPA_GROUNDING_MODEL puis qwen2.5vl:7b-rpa) -> desambiguise le conflit D5-v3b, bbox_2d + num_ctx 4096 preserves - safety_checks_provider: defaut -> get_vlm_model(), override RPA_SAFETY_CHECKS_LLM_MODEL preserve - ui_detector: default_factory + resolution lazy (corrige aussi un gel a l'import), pas d'appel reseau a l'import - field_extractor: property lazy via vlm_config TDD strict (RED->GREEN), 305 tests verts, tests mockes HTTP (zero dependance DGX reel), aucun alias Ollama. Hors perimetre (arbitrage Dom): client Lea agent_v1/executor.py (gele), chemin V4 observe_reason_act (RPA_REASONING_MODEL), core/config.py defaults. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>	2026-06-03 14:06:03 +02:00
Dom	4e7c2a7628	docs(coordination): dispatch dgx vlm model cleanup	2026-06-02 18:16:55 +02:00
Dom	3697e3ba0e	docs(coordination): record p11 option a decision	2026-06-02 17:46:22 +02:00
Dom	9b8bdfdbbe	docs(coordination): sync agent inboxes and active decisions	2026-06-02 16:30:14 +02:00
Dom	f2e9aac6b7	docs: add POC specs, handoffs, and research notes	2026-06-02 16:28:34 +02:00
Dom	2dd306724c	docs(coordination): report no-cli competence test patch	2026-06-01 12:10:01 +02:00
Dom	1a58a0d1f1	docs(coordination): sync dgx no-cli phase1 gaps	2026-06-01 11:59:27 +02:00
Dom	eb2df539f1	docs(poc): revise dgx spark dsi prerequisites docx	2026-06-01 11:04:16 +02:00
Dom	c9f848273b	docs(poc): add minimal dgx spark dsi prerequisites	2026-06-01 10:45:46 +02:00
Dom	45ec5fe969	docs(coordination): answer c gamma clarifications	2026-06-01 10:40:53 +02:00
Dom	8b6c397531	docs(poc): share dgx spark readiness context	2026-06-01 10:37:00 +02:00
Dom	6a300a4298	docs(coordination): add dgx spark multi-poste poc focus	2026-06-01 10:14:27 +02:00
Dom	0587036c17	docs(coordination): dispatch dgx spark poc readiness	2026-06-01 10:05:12 +02:00
Dom	f2a9e40502	docs(coordination): report c gamma dashboard promotion	2026-05-29 21:49:36 +02:00
Dom	bd3aaf7d64	docs(coordination): dispatch c gamma dashboard work	2026-05-29 19:04:58 +02:00
Dom	05a30f2d1d	docs(coordination): propose c gamma writeback decisions	2026-05-29 18:58:12 +02:00
Dom	d515b22d1b	docs(coordination): report c beta supervision	2026-05-29 18:40:03 +02:00
Dom	7ad260d02f	docs(coordination): report c alpha preview	2026-05-29 18:15:30 +02:00
Dom	8332b2cd37	docs(coordination): delegate yaml vwb supervision patch	2026-05-29 17:54:10 +02:00
Dom	9a45e61e2a	docs(coordination): report wait for state runtime	2026-05-29 17:26:35 +02:00
Dom	488d14240a	docs(coordination): report vwb catalog patch	2026-05-29 17:11:02 +02:00
Dom	02211fddf2	docs(coordination): answer lea vwb mapping questions	2026-05-29 16:30:11 +02:00
Dom	ed36bc2b37	docs(coordination): share reflex vwb supervision findings	2026-05-29 14:33:57 +02:00
Dom	9677738f32	docs(coordination): request global review after vwb feedback	2026-05-29 14:05:40 +02:00
Dom	d422aa119c	docs(coordination): require claude qwen vision guardrails	2026-05-29 13:59:39 +02:00
Dom	7b943926db	docs(coordination): clarify vwb learning bridge	2026-05-29 13:46:22 +02:00
Dom	6b8114eb97	docs(coordination): recadre lea direct competence flow	2026-05-29 13:41:18 +02:00
Dom	8ea4ed0ad2	docs(coordination): record supervised competence replay plan	2026-05-29 11:38:51 +02:00
Dom	762e75a077	docs(coordination): record competence catalog integration	2026-05-29 11:29:18 +02:00
Dom	e8a0fb0e42	feat(competences): extract batch candidates	2026-05-29 11:25:00 +02:00
Dom	5ea4960e65	backup: snapshot post-démo GHT 2026-05-19 Some checks failed tests / Lint (ruff + black) (push) Successful in 1m50s Details tests / Tests unitaires (sans GPU) (push) Failing after 1m50s Details tests / Tests sécurité (critique) (push) Has been skipped Details Backup état complet après enregistrement vidéo démo de bout en bout. À utiliser comme point de référence pour la consolidation post-démo. Changements majeurs de la session 18-19 mai : - AIVA-URGENCE : page autonome avec preset URL + auto-focus chain - Workflow Demo_urgence_3_db : merge linux_db + steps AIVA + pause humaine NoMachine - Bypass LLM (static_result / static_text) dans replay_engine pour démos déterministes sans appel Ollama - Fix api_stream:3013 — replay_paused au premier polling /next - dag_execute : lift duration_ms vers top-level pour wait runtime - NPM bypass auth /aiva-urgence/ via location ^~ (proxy_host/10.conf hors git) - scripts/cancel-replays.sh — workaround Stop VWB qui ne purge pas la queue Anchors visuels (468) forcés dans le commit pour garantir restorabilité. DB workflows actuelle + ~12 .bak DB de la journée incluses. Sujets identifiés pour consolidation post-démo (TODO) : 1. Bug VWB recapture anchor ne régénère pas le PNG 2. Léa client accumule état mémoire (restart périodique requis) 3. Stop VWB ne purge pas la queue serveur (lien manquant vers /replay/cancel) 4. Bug coord client mss tronqué 2560x60 → mapping Y cassé 5. delay_before/delay_after ignorés au runtime (fix partiel duration_ms) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-19 14:55:06 +02:00
Dom	2eeaa806bb	docs(handoff): clôture session 2026-05-09 Session de 6h consacrée au fix DETTE-006 (bug d'échelle pixel grounding). Bilan : 2/5 commits fix faits (smart_resize + refactor parser bbox_2d), 3/5 bloqués par découverte DETTE-010 (divergence factor 28 vs 32 sur checkpoint Qwen3-VL-8B-Instruct, à instruire demain matin). Effets de bord positifs : registre dette technique créé (14 entrées P1/P2/P3), investigation mémoire visuelle orpheline documentée, infra clarifiée (vLLM absent, Transformers direct retenu, checkpoint Qwen3-VL-8B fp16 téléchargé 17 GB). Voir docs/handoffs/2026-05-09_session_audit.md pour détail. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-09 15:53:26 +02:00
Dom	df5ad59330	docs(dette): MAJ DETTE-010 (config trouvé, divergences) + création DETTE-014 (smart_resize calé sur mauvaise référence) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-09 15:46:46 +02:00
Dom	ecc5a233a7	docs(dette): création DETTE-013 env tests dev local Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-09 14:49:57 +02:00
Dom	293e54b4e6	docs(dette): création DETTE-012 (vLLM hors scope) + maj DETTE-010 (cible Transformers + AWQ) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-09 13:47:21 +02:00
Dom	4df1ba5779	docs(dette): création DETTE-011 bug cv2 Python 3.12 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-09 12:42:36 +02:00
Dom	e9702b4df9	docs(dette): création DETTE-010 vérif preprocessor_config Qwen3-VL Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-09 12:08:08 +02:00
Dom	e0b47e4518	docs(refs): commit groupé docs de référence session 2026-05-08 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-09 11:32:52 +02:00
Dom	5dc20cc85b	docs(dette): rectif mapping DETTE-005 + DETTE-008/009 + investigation mémoire visuelle orpheline Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-09 11:23:45 +02:00
Dom	88ed103de5	docs(dette): création registre dette technique + 7 entrées rétroactives Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-09 10:43:27 +02:00
Dom	194853cebb	docs(handoff): clôture session 2026-05-08 3 commits du jour : pré-check OCR réactivé + instrumenté + bug spatial documenté. Plan demain : fix smart_resize vLLM ciblé selon MIGRATION_VLM_PLAN_2026-05-09.md. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-08 22:33:35 +02:00
Dom	626823d327	docs(bug): pré-check OCR spatialement aveugle - dette identifiée Bug découvert pendant test live du 2026-05-08. _text_match_fuzzy valide la présence du texte dans le crop (560×560 px) sans vérifier sa position au point cliqué. Sur onglets serrés (3 px), valide à tort les clics adjacents. À fixer post-démo Kerella - Option B préférée (bboxes EasyOCR + distance). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-08 22:31:56 +02:00
Dom	8648e375fe	docs(handoff): session audit 2026-05-08 - controles debranches	2026-05-08 11:37:40 +02:00
Dom	56e869c467	fix(replay): bug TypeError log + flag pré-check OCR off par défaut (démo GHT) Some checks failed tests / Lint (ruff + black) (push) Successful in 14s Details tests / Tests unitaires (sans GPU) (push) Failing after 13s Details tests / Tests sécurité (critique) (push) Has been skipped Details Diagnostic post-bench E2E (rapport docs/E2E_TEST_RUN_2026-05-08.md) : 1. BUG SILENCIEUX MAJEUR (api_stream.py:4549) — quand le pré-check OCR rejette, mon code de rejet hier soir met x_pct=None / y_pct=None. Le log structuré faisait result.get('x_pct', 0):.4f → None:.4f → TypeError → réponse "analysis_error" qui MASQUE le vrai motif "rejected_text_mismatch". Conséquence : pendant toute la session du 7 mai soir, les rejets pré-check ont été silencieusement transformés en erreurs analyse → cascade locale Léa V1 → clic au pif. Fix : `(result.get('x_pct') or 0):.4f` traite None \| None \| 0 uniformément. 2. FLAG ENV pré-check OFF par défaut — le pré-check _validate_text_at_position introduit hier soir a 2 défauts identifiés par le bench E2E sur 8 click_anchor : * radius_px=200 trop petit pour les tabs à 2 tokens (Examens cliniques, Synthèse Urgences) — OCR voit un crop tronqué "Maquette POC ler en cours Codage Statistiques" qui n'inclut pas "Examens" → fuzzy match 1/2 = 50% < seuil 0.60 → REJET. À radius 300/400 le mot est inclus → match passe. * min_token_ratio=0.60 trop strict pour cibles 2 tokens. Solution démo : flag env RPA_ENABLE_TEXT_PRECHECK (défaut "false"). Le pré-check est désactivé par défaut → retour au comportement stable d'avant-hier (hybrid_text_direct ≥ 0.80 utilisé direct, exemption drift préservée). Code et fonction _validate_text_at_position conservés en place pour reprise post-démo après calibrage radius adaptatif (≈ 0.17 × min(screen_w, screen_h)) et token_ratio descendu à 0.50. Pour ré-activer en dev/test : `RPA_ENABLE_TEXT_PRECHECK=true` dans .env.local ou env du service rpa-streaming. Inclus aussi : - docs/E2E_TEST_RUN_2026-05-08.md (rapport agent test E2E ~1700 mots) - tests/e2e/urgence_aiva_demo_expected.yaml (tolérances re-écrites) - tests/e2e/fixtures/urgence_aiva_demo/live/*.png (8 fixtures recapturées headless 1920x1080 pour itérer demain) - _ocr_inventory.json + _run_resolve_results.json (raw runs) 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-08 10:09:23 +02:00

1 2

76 Commits