chore(rgpd): replace CHCB/Bayonne/Saint-Denis/Réunion refs in source + configs (D-12)
Anonymise toutes les références à des entités réelles (CHCB, Bayonne, Saint-Denis, Réunion, etc.) dans le code source, les configurations YAML, les scripts/outils, et les tests unitaires. Conserve les tests synthétiques (cases) intentionnels. - profile key chcb_strict → chuxx_strict - CHCB → CHUXX, Bayonne → Chicago, Saint-Denis → Springfield, Réunion → Province Bêta, 64100/97400 → 12345, FINESS → 999999999, préfixe tél 05.59.44 → 0X.XX.XX - renomme tools/test_chcb_leak.py → tools/test_force_term_leak.py Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -12,15 +12,15 @@ defaults:
|
||||
- structured
|
||||
- table
|
||||
rules:
|
||||
- id: rule_chcb_exact_mask
|
||||
label: Masquer le sigle CHCB
|
||||
- id: rule_chuxx_exact_mask
|
||||
label: Masquer le sigle CHUXX
|
||||
description: Sigle local a masquer dans tous les contextes documentaires.
|
||||
type: exact_term
|
||||
action: mask
|
||||
placeholder: "[MASK]"
|
||||
status: active
|
||||
match:
|
||||
exact_value: CHCB
|
||||
exact_value: CHUXX
|
||||
normalization:
|
||||
case_insensitive: true
|
||||
whole_word: true
|
||||
|
||||
@@ -22,7 +22,7 @@ blacklist:
|
||||
# nationaux (FINESS / INSEE / BDPM). Évitez d'ajouter ici des noms d'hôpitaux,
|
||||
# villes, codes postaux ou numéros FINESS — ils sont déjà détectés automatiquement.
|
||||
force_mask_terms:
|
||||
- CHCB
|
||||
- CHUXX
|
||||
- 'Dates du séjour :'
|
||||
- CONCERTATION
|
||||
- LABORATOIRE de BIOLOGIE MEDICALE
|
||||
|
||||
@@ -13,47 +13,47 @@ hospital_addresses:
|
||||
|
||||
# Codes postaux d'établissements (avec CEDEX)
|
||||
hospital_postal_codes:
|
||||
- "64109 BAYONNE CEDEX"
|
||||
- "64109 BAYONNE Cedex"
|
||||
- "12345 CHICAGO CEDEX"
|
||||
- "12345 CHICAGO Cedex"
|
||||
- "33076 BORDEAUX CEDEX"
|
||||
|
||||
# Villes avec CEDEX (indique un établissement)
|
||||
hospital_cities:
|
||||
- "BAYONNE CEDEX"
|
||||
- "CHICAGO CEDEX"
|
||||
- "BORDEAUX CEDEX"
|
||||
|
||||
# Téléphones d'hôpitaux (préfixes 05 59 44 = CH Côte Basque)
|
||||
# Téléphones d'hôpitaux (préfixes 0X XX XX = CHUXX générique)
|
||||
hospital_phones:
|
||||
- "05 59 44 35 35"
|
||||
- "05 59 63 35 88"
|
||||
- "05.59.44.37.33"
|
||||
- "05.59.44.37.32"
|
||||
- "05.59.44.37.42"
|
||||
- "05.59.44.38.62"
|
||||
- "05.59.44.37.74"
|
||||
- "05.33.78.81.89"
|
||||
- "05.59.44.35.49"
|
||||
- "05.59.44.37.25"
|
||||
- "05.59.44.37.22"
|
||||
- "05.59.44.37.29"
|
||||
- "05.59.44.37.23"
|
||||
- "05.59.44.38.44"
|
||||
- "05.59.44.35.69"
|
||||
- "05.59.44.35.30"
|
||||
- "05.59.44.35.06"
|
||||
- "05.59.44.39.24"
|
||||
- "05.59.44.37.07"
|
||||
- "05.59.44.31.39"
|
||||
- "05.59.44.37.35"
|
||||
- "05.59.44.37.46"
|
||||
- "05.59.44.37.39"
|
||||
- "05.59.44.35.05"
|
||||
- "0559443674"
|
||||
- "0X XX XX 35 35"
|
||||
- "0X XX XX 35 88"
|
||||
- "0X.XX.XX.37.33"
|
||||
- "0X.XX.XX.37.32"
|
||||
- "0X.XX.XX.37.42"
|
||||
- "0X.XX.XX.38.62"
|
||||
- "0X.XX.XX.37.74"
|
||||
- "0X.XX.XX.81.89"
|
||||
- "0X.XX.XX.35.49"
|
||||
- "0X.XX.XX.37.25"
|
||||
- "0X.XX.XX.37.22"
|
||||
- "0X.XX.XX.37.29"
|
||||
- "0X.XX.XX.37.23"
|
||||
- "0X.XX.XX.38.44"
|
||||
- "0X.XX.XX.35.69"
|
||||
- "0X.XX.XX.35.30"
|
||||
- "0X.XX.XX.35.06"
|
||||
- "0X.XX.XX.39.24"
|
||||
- "0X.XX.XX.37.07"
|
||||
- "0X.XX.XX.31.39"
|
||||
- "0X.XX.XX.37.35"
|
||||
- "0X.XX.XX.37.46"
|
||||
- "0X.XX.XX.37.39"
|
||||
- "0X.XX.XX.35.05"
|
||||
- "0XXXXXXX74"
|
||||
|
||||
# Patterns de téléphones hospitaliers (regex)
|
||||
hospital_phone_patterns:
|
||||
- "^05\\.?59\\.?44\\.?" # CH Côte Basque
|
||||
- "^05\\.?33\\.?78\\.?" # Autre établissement
|
||||
- "^0X\\.?XX\\.?XX\\.?" # CHUXX générique
|
||||
- "^0X\\.?XX\\.?XX\\.?" # Autre établissement
|
||||
|
||||
# Termes médicaux/anatomiques souvent confondus avec des villes
|
||||
anatomical_terms:
|
||||
|
||||
48
config/profiles.default.yml
Normal file
48
config/profiles.default.yml
Normal file
@@ -0,0 +1,48 @@
|
||||
version: 1
|
||||
default_profile: standard_local
|
||||
|
||||
profiles:
|
||||
standard_local:
|
||||
label: Standard local
|
||||
description: Profil par défaut pour les traitements internes sur poste bureautique.
|
||||
require_manual_mask: false
|
||||
force_disable_vlm: false
|
||||
dictionaries_overlay: {}
|
||||
|
||||
chuxx_strict:
|
||||
label: CHUXX strict
|
||||
description: Profil conservateur pour les échanges prudents du CHUXX.
|
||||
require_manual_mask: false
|
||||
force_disable_vlm: true
|
||||
dictionaries_overlay:
|
||||
blacklist:
|
||||
force_mask_terms:
|
||||
- CHUXX
|
||||
- Centre Hospitalier Universitaire XX
|
||||
- CENTRE HOSPITALIER UNIVERSITAIRE XX
|
||||
|
||||
partage_recherche:
|
||||
label: Partage recherche
|
||||
description: Profil externe strict. Le masque manuel est recommandé pour les documents formatés.
|
||||
require_manual_mask: true
|
||||
force_disable_vlm: true
|
||||
dictionaries_overlay:
|
||||
blacklist:
|
||||
force_mask_terms:
|
||||
- CHUXX
|
||||
- Centre Hospitalier Universitaire XX
|
||||
- CENTRE HOSPITALIER UNIVERSITAIRE XX
|
||||
|
||||
dossier_audit:
|
||||
label: Dossier audit
|
||||
description: Profil orienté traçabilité et reproductibilité des traitements.
|
||||
require_manual_mask: false
|
||||
force_disable_vlm: true
|
||||
dictionaries_overlay: {}
|
||||
|
||||
demo:
|
||||
label: Démo
|
||||
description: Profil léger pour démonstration interne sur machine de bureau.
|
||||
require_manual_mask: false
|
||||
force_disable_vlm: true
|
||||
dictionaries_overlay: {}
|
||||
77
config/profiles.yml
Normal file
77
config/profiles.yml
Normal file
@@ -0,0 +1,77 @@
|
||||
# Surcharge locale des profils métier.
|
||||
# Source de vérité : config/profiles.default.yml
|
||||
# Les profils créés depuis la GUI sont enregistrés ici.
|
||||
|
||||
profiles:
|
||||
standard_local_copie:
|
||||
label: Standard local copie
|
||||
description: Profil par défaut pour les traitements internes sur poste bureautique.
|
||||
require_manual_mask: false
|
||||
force_disable_vlm: false
|
||||
dictionaries_overlay: {}
|
||||
param_lists:
|
||||
whitelist_phrases:
|
||||
- classification internationale
|
||||
- prise en charge
|
||||
- bas de contention
|
||||
- date de naissance
|
||||
- lieu de naissance
|
||||
- ville de résidence
|
||||
- date de sortie
|
||||
- date d'admission
|
||||
- code postal
|
||||
blacklist_force_mask_terms:
|
||||
- CHUXX
|
||||
- 'Dates du séjour :'
|
||||
- CONCERTATION
|
||||
- LABORATOIRE de BIOLOGIE MEDICALE
|
||||
additional_stopwords: []
|
||||
preferred_manual_mask_template: ''
|
||||
standard_local_copie_copie:
|
||||
label: Standard local copie copie
|
||||
description: Profil par défaut pour les traitements internes sur poste bureautique.
|
||||
require_manual_mask: false
|
||||
force_disable_vlm: false
|
||||
dictionaries_overlay: {}
|
||||
param_lists:
|
||||
whitelist_phrases:
|
||||
- classification internationale
|
||||
- prise en charge
|
||||
- bas de contention
|
||||
- date de naissance
|
||||
- lieu de naissance
|
||||
- ville de résidence
|
||||
- date de sortie
|
||||
- date d'admission
|
||||
- code postal
|
||||
blacklist_force_mask_terms:
|
||||
- CHUXX
|
||||
- 'Dates du séjour :'
|
||||
- CONCERTATION
|
||||
- LABORATOIRE de BIOLOGIE MEDICALE
|
||||
additional_stopwords: []
|
||||
preferred_manual_mask_template: ''
|
||||
standard_local_copie_2:
|
||||
label: Standard local copie
|
||||
description: Profil par défaut pour les traitements internes sur poste bureautique.
|
||||
require_manual_mask: false
|
||||
force_disable_vlm: false
|
||||
dictionaries_overlay: {}
|
||||
param_lists:
|
||||
whitelist_phrases:
|
||||
- classification internationale
|
||||
- prise en charge
|
||||
- bas de contention
|
||||
- date de naissance
|
||||
- lieu de naissance
|
||||
- ville de résidence
|
||||
- date de sortie
|
||||
- date d'admission
|
||||
- code postal
|
||||
blacklist_force_mask_terms:
|
||||
- CHUXX
|
||||
- 'Dates du séjour :'
|
||||
- CONCERTATION
|
||||
- LABORATOIRE de BIOLOGIE MEDICALE
|
||||
additional_stopwords: []
|
||||
preferred_manual_mask_template: ''
|
||||
Reference in New Issue
Block a user