f188116bc1c5320da5eca8c08252026803e2a56c
Problème: - 36 CRO avec fuites dates de naissance (Né(e) le DD/MM/YYYY) - Dates détectées page 0 mais pas propagées pages suivantes - Désactivation propagation globale avait éliminé 951 FP mais créé fuites Solution: - Propagation SÉLECTIVE: uniquement PII critiques (DATE_NAISSANCE, NIR, IPP, EMAIL, force_term) - PII non-critiques (TEL, ADRESSE, etc.) NON propagés (évite 951 FP) - Remplacement amélioré: gère variations format dates (/, ., -, espaces) - Gère contexte 'Né(e) le' avec case-insensitive Impact attendu: - Rappel: 100% (plus de fuites) - Précision: 85-87% (légère baisse vs 88.27%, mais acceptable) - FP réintroduits: ~10-20 (vs 951 avant) Fichiers: - anonymizer_core_refactored_onnx.py: propagation sélective + remplacement amélioré - tools/test_date_propagation.py: script test sur CRO - LEAK_FIX.md: documentation complète de la correction
placer tout les fichiers dans un répertoire. faire un chmod 777 install.sh pour lui donner les droits d'execution lancer ./install.sh pour lancer l'installation complete
L'installation peut prendre du temps, elle charge deux modele IA nlp. Elle crée un environement virtuel python.
Description
Languages
Python
98.2%
Batchfile
1%
PowerShell
0.5%
Shell
0.3%