Files
rpa_vision_v3/docs/MAIL_PAULINE_AVANT_VISIO.md
Dom 5ea4960e65
Some checks failed
tests / Lint (ruff + black) (push) Successful in 1m50s
tests / Tests unitaires (sans GPU) (push) Failing after 1m50s
tests / Tests sécurité (critique) (push) Has been skipped
backup: snapshot post-démo GHT 2026-05-19
Backup état complet après enregistrement vidéo démo de bout en bout.
À utiliser comme point de référence pour la consolidation post-démo.

Changements majeurs de la session 18-19 mai :
- AIVA-URGENCE : page autonome avec preset URL + auto-focus chain
- Workflow Demo_urgence_3_db : merge linux_db + steps AIVA + pause humaine NoMachine
- Bypass LLM (static_result / static_text) dans replay_engine
  pour démos déterministes sans appel Ollama
- Fix api_stream:3013 — replay_paused au premier polling /next
- dag_execute : lift duration_ms vers top-level pour wait runtime
- NPM bypass auth /aiva-urgence/ via location ^~ (proxy_host/10.conf hors git)
- scripts/cancel-replays.sh — workaround Stop VWB qui ne purge pas la queue

Anchors visuels (468) forcés dans le commit pour garantir restorabilité.
DB workflows actuelle + ~12 .bak DB de la journée incluses.

Sujets identifiés pour consolidation post-démo (TODO) :
1. Bug VWB recapture anchor ne régénère pas le PNG
2. Léa client accumule état mémoire (restart périodique requis)
3. Stop VWB ne purge pas la queue serveur (lien manquant vers /replay/cancel)
4. Bug coord client mss tronqué 2560x60 → mapping Y cassé
5. delay_before/delay_after ignorés au runtime (fix partiel duration_ms)

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-19 14:55:06 +02:00

4.7 KiB
Raw Blame History

Template mail à Pauline — préparation visio démo GHT

À adapter selon ton ton habituel avec Pauline. Les blocs entre {{}} sont à remplir.


Objet : Démo GHT Sud 95 — bilan d'avancement + 7 points à valider avant la visio

Bonjour Pauline,

Petit point d'avancement avant notre visio {{date/heure}} pour préparer la démo.

1. Ce qui est prêt

  • 🟢 Maquette aiva-vision : interface de décision facturation (Forfait/UHCD) déployée, intégrée à l'écosystème Easily Assure (URL : https://urgence.labs.laurinebazin.design/codage.html?id=XXX). Tu peux la tester dossier par dossier.
  • 🟢 Pipeline IA Léa : Léa peut ouvrir Chrome, lire la liste des patients en OCR, traiter chaque dossier, soumettre à analyse LLM, lire la décision. Toute la chaîne fonctionne en bout-en-bout (validé ce matin sur le PC de démo).
  • 🟢 Bench LLM décisionnel : 18 modèles testés sur les 11 dossiers que tu nous as fournis (rapport complet en pièce jointe : BENCH_T2A_DECISION_11DOSSIERS.md).
    • Modèle retenu pour la démo : gemma3:27b-cloud (8/11 = 73% de bonnes décisions).
    • Backup local rapide : qwen3:8b (7/11 = 64%, 7.6s/dossier, 5 GB).
    • Aucun modèle n'atteint 100% → le garde-fou humain (médecin valide chaque proposition de Léa) est indispensable, et c'est précisément le récit produit qu'on porte.

2. Limite identifiée — qualité des données source

J'ai fait une revue ligne à ligne entre tes captures d'écran et ce qui est dans data.js (la base interne de la maquette). Trouvailles :

  • 40+ noms de soignants inventés lors de la première anonymisation
  • Plusieurs hallucinations cliniques graves sur quelques dossiers (sens inversé : "anhydrose" vs "ankylose", TDM "sans" vs "avec injection", etc.)
  • Constantes vitales tronquées sur 5 dossiers (3-7 colonnes dans tes captures, 2 dans data.js)
  • Vérité-terrain incorrecte sur 25003284 : initialement classé UHCD, c'est en fait un Forfait (sortie domicile en 3h37, J12.1 Pneumopathie VRS — l'asthme n'est qu'un antécédent)

→ Reconstruction propre de data.js en cours. Rapport détaillé en pj : REVUE_DOSSIERS_PAULINE.md.

3. Questions concrètes pour notre visio

# Question Pourquoi c'est important
1 Vérité-terrain validée : tu confirmes la nouvelle classification 5 UHCD / 6 Forfait (avec 25003284 reclassé Forfait) ? Référence pour tous nos benchs
2 Cas piège démo : sur les 11, lequel est typique d'un cas où le DIM se ferait piéger (UHCD ratée → forfait facturé) ? Lequel est limite cliniquement ? Lequel est évident ? Sélectionner les 3 dossiers à présenter le jour J
3 25048485 (NGUYEN Léo) : ta capture montre 2 motifs distincts (1ère CTCG puis 2ème CTCG le même jour). C'est 2 passages distincts ou 1 ? Risque de fausse classification
4 Onglet Imagerie : on a ajouté un onglet dédié pour les CR scan/radio/échographie (avant noyés dans Notes médicales). Tu valides la pertinence ? Impact UI
5 Workflow garde-fou : Léa propose une décision avec confiance (élevée/moyenne/faible). Pour les "faibles", elle demande validation médecin. Tu valides ? Argument de sécurité face à Carvella (DSI)
6 Position juridique : qui est responsable du codage final ? Le médecin DIM (Léa propose) ? Point anti-FUD pour Carvella
7 ROI estimé : 100k€/mois mentionnés dans les premiers échanges — tu peux confirmer le calcul (nb dossiers/jour × % UHCD ratés × valorisation) ? Slide ROI

4. Demande matérielle

Pour finaliser la reconstruction des dossiers j'ai 2 questions :

  • 3 dossiers manquants : c'est OK, je les ai retrouvés dans RPU UHCD IA (2)/RPU UHCD IA.docx — pas besoin de captures supplémentaires.
  • Si tu as le temps : pour les 11 dossiers, est-ce que tu pourrais nous valider à l'écrit le contenu reconstruit (1 ligne suffit par dossier : "OK" / "à modifier sur tel point") ? Idéalement d'ici J-2 (le {{date}}).

5. Planning démo restant

  • Aujourd'hui : reconstruction data.js avec ta revue
  • Demain : enregistrement du workflow Urgence sur le PC de démo
  • J-1 : tests E2E répétés
  • Jour J : démo {{lieu, heure, audience}}

Si tu vois quoi que ce soit à challenger ou améliorer, n'hésite pas. On compte beaucoup sur ton expertise DIM pour faire la différence face à Carvella.

À tout à l'heure, {{Dominique}}


Pièces jointes suggérées

  • docs/BENCH_T2A_DECISION_11DOSSIERS.md (rapport bench 18 modèles)
  • docs/REVUE_DOSSIERS_PAULINE.md (revue qualité 11 dossiers)
  • docs/RECONSTRUCTION_DATA_JS_REPORT.md (à créer après reconstruction — pas encore prêt)