chore(rgpd): replace CHCB/Bayonne/Saint-Denis/Réunion refs in source + configs (D-12)

Anonymise toutes les références à des entités réelles (CHCB, Bayonne, Saint-Denis,
Réunion, etc.) dans le code source, les configurations YAML, les scripts/outils,
et les tests unitaires. Conserve les tests synthétiques (cases) intentionnels.

- profile key chcb_strict → chuxx_strict
- CHCB → CHUXX, Bayonne → Chicago, Saint-Denis → Springfield,
  Réunion → Province Bêta, 64100/97400 → 12345, FINESS → 999999999,
  préfixe tél 05.59.44 → 0X.XX.XX
- renomme tools/test_chcb_leak.py → tools/test_force_term_leak.py

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
2026-06-02 14:39:21 +02:00
parent a1ef2225d5
commit 1c44a26eb3
37 changed files with 819 additions and 128 deletions

View File

@@ -74,7 +74,7 @@ def normalize(s: str) -> str:
def extract_distinctive_name(full_name: str) -> str:
"""Extrait la partie distinctive d'un nom d'établissement.
Ex: 'CENTRE HOSPITALIER DE BAYONNE''bayonne'
Ex: 'CENTRE HOSPITALIER DE CHICAGO''chicago'
'PHARMACIE DES GASCONS''gascons'
'LES GIRANDIERES''les girandieres'
"""
@@ -112,7 +112,7 @@ def main():
# Numéros FINESS : col 1 = finess_et (structure), col 2 = entjur (entité juridique).
# Les deux sont des identifiants 9 chiffres réels du référentiel FINESS et doivent
# être masqués. Avant ce fix, seul finess_et était extrait (~102k), et les ~48k
# entjur étaient manqués — provoquant des fuites (ex: 640780417 entjur CHCB).
# entjur étaient manqués — provoquant des fuites (ex: 999999999 entjur CHUXX).
for col_idx in (1, 2):
finess = row[col_idx].strip() if col_idx < len(row) else ""
if re.match(r"^\d{9}$", finess):