tests: alias DLBCL + garde-fou Trackare + e2e PDFs réels + gold CRH + benchmark enrichi

- 11 tests unitaires : TestAliasAndConclusionBonus (7) + TestTrackareSymptomGuard (4)
- Tests e2e sur PDFs réels (skip si absent) : méningite A87.0 + DLBCL C83.3 top1
- Gold CRH enrichi : 5 cas (2 réels ajoutés : 115_23066188, 132_23080179)
- Benchmark synthese : récupération conclusion depuis source_excerpt des DAS/traitements
- .gitignore : protection anti-PHI (real_crh_pdfs/, data/crh_samples/*.pdf)
- docs/PHI_POLICY.md : 7 règles de sécurité PHI
- Rapports debug : case 132 REVIEW (garde-fou actif), top errors, DIM pack

1043 tests passent, 0 régression.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
dom
2026-02-24 14:35:57 +01:00
parent 06a1be5425
commit cad0dd22b1
16 changed files with 1513 additions and 11 deletions

9
docs/PHI_POLICY.md Normal file
View File

@@ -0,0 +1,9 @@
# Politique PHI — Données de santé identifiantes
1. Les PDF de CRH réels ne sont JAMAIS committés dans le repo.
2. Le dossier `real_crh_pdfs/` est exclu par `.gitignore`.
3. Seuls des extraits texte courts (<=240 chars), pseudonymisés, peuvent figurer dans les tests.
4. Les entrées gold (JSONL/CSV) ne contiennent que des codes CIM-10 et des extraits anonymisés.
5. Les tests e2e sur PDFs réels sont skippés automatiquement si les fichiers sont absents.
6. Avant tout partage du repo : vérifier `git status` — aucun `.pdf` ne doit apparaître.
7. En cas de doute, exécuter : `git diff --cached --name-only | grep -i '\.pdf$'`