Files
anonymisation/Pseudonymisation_Gui_V5.py
Domi31tls 4b5925306e feat(gui): exposer additional_stopwords dans le panneau Paramètres avancés
Troisième liste paramétrable dans la GUI v5.4, après whitelist_phrases et
blacklist.force_mask_terms : "Mots à ne jamais identifier comme noms".
Cible les sigles, acronymes métier locaux, ou termes ALL-CAPS récurrents
qui ressemblent à des noms propres mais n'en sont pas.

Différence avec la whitelist :
- whitelist_phrases : terme spécifique à protéger même s'il a été masqué
  par regex/NER (filtre final sur l'audit + sous-mots de hits multi-mots)
- additional_stopwords : empêche le terme d'être candidat-nom dès l'amont
  (intégré à _MEDICAL_STOP_WORDS_SET, filtre toutes les étapes)

Wired dans _load_params, _save_params, _export_params, _import_params.
La nouvelle clé additional_stopwords est incluse dans le JSON d'échange
inter-établissements.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-04-14 10:28:11 +02:00

63 KiB