fix(anonymizer): cover CHCB real-world staff layouts

This commit is contained in:
2026-06-08 12:44:09 +02:00
parent 41b64bf64f
commit 0af71caffe
4 changed files with 301 additions and 0 deletions

View File

@@ -0,0 +1,44 @@
---
from: dom-via-codex
to: claude
date: 2026-06-08T12:43:00+02:00
topic: chcb-final3-rebuild-validation
status: open
priority: high
references:
- output: /home/dom/Téléchargements/II-1 Ctrl_T2A_2025_CHCB_DocJustificatifs/anonymisé/echantillon_20_20260608_123915_rules_raster_final3
- branch: feature/q1-quarantine-mvp
---
# Mission Claude — rebuild + validation Windows après CHCB final3
Codex a repris les tests réels demandés par Dom sur 20 dossiers CHCB tirés au
hasard, avec sortie finale dans :
`/home/dom/Téléchargements/II-1 Ctrl_T2A_2025_CHCB_DocJustificatifs/anonymisé/echantillon_20_20260608_123915_rules_raster_final3`
Résultat Linux local :
- 20 dossiers, 42 PDF.
- 33 PDF livrés avec `.redacted_raster.pdf`, `.pseudonymise.txt`, `.audit.jsonl`.
- 7 refus sécurité/quarantaine `rescan_residual_pii`.
- 2 erreurs PDF protégés par mot de passe.
- `evaluate_quality.py` sur les 33 livrés : 98.5/100, leak score 100.0, 0 fuite regex/audit/INSEE contexte fort.
- Vérification visuelle faite sur les zones sensibles : en-têtes opératoires,
bandeaux applicatifs, références par initiales, IAO Trackare, rôle `Aide`.
Mission :
1. Après push Gitea, pull la branche `feature/q1-quarantine-mvp` et reconstruis le
binaire Windows depuis le dernier commit.
2. Confirme le commit exact intégré dans le binaire, le hash de l'EXE et les logs
de build.
3. Si la GUI frozen reste impossible à mesurer sans intervention humaine, propose
un mini harnais CLI non invasif pour permettre à Dom de lancer un lot de PDF
réel depuis Windows sans passer par la GUI.
4. Ne bloque pas en silence : si un prérequis manque, écris un retour dans
`docs/coordination/inbox/for-dom/` et donne l'étape suivante actionnable.
Pas de noms ni extraits nominaux dans ce message volontairement.
— Codex pour Dom

View File

@@ -0,0 +1,47 @@
---
from: dom-via-codex
to: qwen
date: 2026-06-08T12:43:00+02:00
topic: review-chcb-final3-rulefix
status: open
priority: high
references:
- output: /home/dom/Téléchargements/II-1 Ctrl_T2A_2025_CHCB_DocJustificatifs/anonymisé/echantillon_20_20260608_123915_rules_raster_final3
- branch: feature/q1-quarantine-mvp
---
# Mission Qwen — revue indépendante règles CHCB final3
Codex a traité le lot réel demandé par Dom : 20 dossiers CHCB tirés au hasard,
42 PDF, sortie finale `final3` sous le répertoire `anonymisé`.
Résultat :
- 33 PDF livrés.
- 7 documents refusés par `rescan_residual_pii`.
- 2 PDF protégés par mot de passe en erreur.
- Score qualité sur les 33 livrés : 98.5/100, leak score 100.0, 0 fuite détectée.
- Rendus visuels contrôlés sur les layouts sensibles.
Changements à challenger :
- `RE_HEADER_CROP_EPI_NOM` : en-têtes opératoires `CROp Epi - ...`.
- `RE_MODIFIED_BY_NOM` : bandeaux applicatifs `mod. le ... par ...`.
- `RE_TRACKARE_IAO_MULTILINE_VALUE` : valeur IAO sur ligne suivante.
- `RE_REF_INITIALS_INLINE` : références initiales `Réf`, `Ref`, `Réf_CRO`.
- `RE_LABEL_STAFF_ROLE_NOM` : personnel après rôle structuré, notamment rôle
`Aide` avec interne/externe.
Mission :
1. Relire le diff moteur/tests et chercher les risques de faux positifs
génériques, pas seulement le cas observé.
2. Rejouer ou auditer les tests unitaires associés.
3. Inspecter le manifeste `final3/manifest.json` et `SUMMARY.txt`.
4. Proposer une règle plus propre si une regex te paraît trop large.
5. Répondre dans `docs/coordination/inbox/for-dom/` avec verdict clair :
bloquant, non bloquant, ou OK pour rebuild.
Pas de noms ni extraits nominaux dans ce message volontairement.
— Codex pour Dom