Commit Graph

4 Commits

Author SHA1 Message Date
92557d4e74 chore(rgpd): replace CHCB/Bayonne/Saint-Denis/Réunion refs in source + configs (D-12)
Anonymise toutes les références à des entités réelles (CHCB, Bayonne, Saint-Denis,
Réunion, etc.) dans le code source, les configurations YAML, les scripts/outils,
et les tests unitaires. Conserve les tests synthétiques (cases) intentionnels.

- profile key chcb_strict → chuxx_strict
- CHCB → CHUXX, Bayonne → Chicago, Saint-Denis → Springfield,
  Réunion → Province Bêta, 64100/97400 → 12345, FINESS → 999999999,
  préfixe tél 05.59.44 → 0X.XX.XX
- renomme tools/test_chcb_leak.py → tools/test_force_term_leak.py

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-06-02 14:39:21 +02:00
34dcf8f360 Externalize dictionaries and add anonymization review corpus 2026-04-21 10:32:57 +02:00
5e454d122b feat(phase1): Implémentation corrections qualité Phase 1
 Correction 1: Désactivation mapping DATE dans EDS-Pseudo
- Seules les dates de naissance sont masquées
- [DATE] = 0, [DATE_NAISSANCE] préservé
- Contexte temporel médical préservé

 Correction 2: Activation whitelist médicaments
- Médicaments préservés (IDACIO, SALAZOPYRINE, etc.)
- Filtrage dans _mask_with_eds_pseudo
- Information thérapeutique préservée

 Correction 3: Whitelist termes médicaux structurels
- Termes préservés (Chef de service, Praticien hospitalier, etc.)
- Filtrage dans _repl_service
- Contexte médical préservé

Tests: 100% succès sur corpus production (3 documents testés)
2026-03-02 23:36:29 +01:00
40c34be471 chore: Avant implémentation Phase 1 corrections qualité 2026-03-02 23:34:06 +01:00