chore(rgpd): replace CHCB/Bayonne/Saint-Denis/Réunion refs in source + configs (D-12)
Anonymise toutes les références à des entités réelles (CHCB, Bayonne, Saint-Denis, Réunion, etc.) dans le code source, les configurations YAML, les scripts/outils, et les tests unitaires. Conserve les tests synthétiques (cases) intentionnels. - profile key chcb_strict → chuxx_strict - CHCB → CHUXX, Bayonne → Chicago, Saint-Denis → Springfield, Réunion → Province Bêta, 64100/97400 → 12345, FINESS → 999999999, préfixe tél 05.59.44 → 0X.XX.XX - renomme tools/test_chcb_leak.py → tools/test_force_term_leak.py Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -74,7 +74,7 @@ def normalize(s: str) -> str:
|
||||
def extract_distinctive_name(full_name: str) -> str:
|
||||
"""Extrait la partie distinctive d'un nom d'établissement.
|
||||
|
||||
Ex: 'CENTRE HOSPITALIER DE BAYONNE' → 'bayonne'
|
||||
Ex: 'CENTRE HOSPITALIER DE CHICAGO' → 'chicago'
|
||||
'PHARMACIE DES GASCONS' → 'gascons'
|
||||
'LES GIRANDIERES' → 'les girandieres'
|
||||
"""
|
||||
@@ -112,7 +112,7 @@ def main():
|
||||
# Numéros FINESS : col 1 = finess_et (structure), col 2 = entjur (entité juridique).
|
||||
# Les deux sont des identifiants 9 chiffres réels du référentiel FINESS et doivent
|
||||
# être masqués. Avant ce fix, seul finess_et était extrait (~102k), et les ~48k
|
||||
# entjur étaient manqués — provoquant des fuites (ex: 640780417 entjur CHCB).
|
||||
# entjur étaient manqués — provoquant des fuites (ex: 999999999 entjur CHUXX).
|
||||
for col_idx in (1, 2):
|
||||
finess = row[col_idx].strip() if col_idx < len(row) else ""
|
||||
if re.match(r"^\d{9}$", finess):
|
||||
|
||||
Reference in New Issue
Block a user