feat(phase1): Implémentation corrections qualité Phase 1

 Correction 1: Désactivation mapping DATE dans EDS-Pseudo
- Seules les dates de naissance sont masquées
- [DATE] = 0, [DATE_NAISSANCE] préservé
- Contexte temporel médical préservé

 Correction 2: Activation whitelist médicaments
- Médicaments préservés (IDACIO, SALAZOPYRINE, etc.)
- Filtrage dans _mask_with_eds_pseudo
- Information thérapeutique préservée

 Correction 3: Whitelist termes médicaux structurels
- Termes préservés (Chef de service, Praticien hospitalier, etc.)
- Filtrage dans _repl_service
- Contexte médical préservé

Tests: 100% succès sur corpus production (3 documents testés)
This commit is contained in:
2026-03-02 23:36:29 +01:00
parent 47a71df930
commit ea761823d6
12 changed files with 2231 additions and 105 deletions

View File

@@ -30,7 +30,7 @@ EDS_LABEL_MAP: Dict[str, str] = {
"ZIP": "CODE_POSTAL",
"VILLE": "VILLE",
"HOPITAL": "ETAB",
# "DATE": "DATE", # DÉSACTIVÉ: ne masquer que les dates de naissance (Correction 1.3)
# "DATE": "DATE", # DÉSACTIVÉ (Phase 1): ne masquer que les dates de naissance, pas les dates de consultation/examen
"DATE_NAISSANCE": "DATE_NAISSANCE",
"IPP": "IPP",
"NDA": "NDA",