Files
anonymisation/config/hospital_stopwords.yml
Domi31tls 92557d4e74 chore(rgpd): replace CHCB/Bayonne/Saint-Denis/Réunion refs in source + configs (D-12)
Anonymise toutes les références à des entités réelles (CHCB, Bayonne, Saint-Denis,
Réunion, etc.) dans le code source, les configurations YAML, les scripts/outils,
et les tests unitaires. Conserve les tests synthétiques (cases) intentionnels.

- profile key chcb_strict → chuxx_strict
- CHCB → CHUXX, Bayonne → Chicago, Saint-Denis → Springfield,
  Réunion → Province Bêta, 64100/97400 → 12345, FINESS → 999999999,
  préfixe tél 05.59.44 → 0X.XX.XX
- renomme tools/test_chcb_leak.py → tools/test_force_term_leak.py

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-06-02 14:39:21 +02:00

75 lines
1.9 KiB
YAML

# Liste des informations hospitalières à ne PAS anonymiser
# Ces informations sont publiques et ne constituent pas des données personnelles
# Adresses d'hôpitaux et établissements de santé
hospital_addresses:
- "13, Avenue de l'Interne J"
- "13 Avenue de l'Interne J"
- "13 Av. de l'Interne Jacques Loeb"
- "13 avenue de l'"
- "LOEB BP 8"
- "4, AVENUE DE TRÉVILLE"
- "4 AVENUE DE TRÉVILLE"
# Codes postaux d'établissements (avec CEDEX)
hospital_postal_codes:
- "12345 CHICAGO CEDEX"
- "12345 CHICAGO Cedex"
- "33076 BORDEAUX CEDEX"
# Villes avec CEDEX (indique un établissement)
hospital_cities:
- "CHICAGO CEDEX"
- "BORDEAUX CEDEX"
# Téléphones d'hôpitaux (préfixes 0X XX XX = CHUXX générique)
hospital_phones:
- "0X XX XX 35 35"
- "0X XX XX 35 88"
- "0X.XX.XX.37.33"
- "0X.XX.XX.37.32"
- "0X.XX.XX.37.42"
- "0X.XX.XX.38.62"
- "0X.XX.XX.37.74"
- "0X.XX.XX.81.89"
- "0X.XX.XX.35.49"
- "0X.XX.XX.37.25"
- "0X.XX.XX.37.22"
- "0X.XX.XX.37.29"
- "0X.XX.XX.37.23"
- "0X.XX.XX.38.44"
- "0X.XX.XX.35.69"
- "0X.XX.XX.35.30"
- "0X.XX.XX.35.06"
- "0X.XX.XX.39.24"
- "0X.XX.XX.37.07"
- "0X.XX.XX.31.39"
- "0X.XX.XX.37.35"
- "0X.XX.XX.37.46"
- "0X.XX.XX.37.39"
- "0X.XX.XX.35.05"
- "0XXXXXXX74"
# Patterns de téléphones hospitaliers (regex)
hospital_phone_patterns:
- "^0X\\.?XX\\.?XX\\.?" # CHUXX générique
- "^0X\\.?XX\\.?XX\\.?" # Autre établissement
# Termes médicaux/anatomiques souvent confondus avec des villes
anatomical_terms:
- "DROIT"
- "GAUCHE"
- "SUPERIEUR"
- "INFERIEUR"
- "ANTERIEUR"
- "POSTERIEUR"
- "LATERAL"
- "MEDIAL"
- "PROXIMAL"
- "DISTAL"
# Patterns d'épisodes à ignorer (numéros dans les noms de fichiers)
# Ces numéros apparaissent dans les métadonnées mais pas dans le contenu patient
episode_filename_patterns:
- "trackare-\\d+-\\d+" # Format: trackare-IPP-EPISODE