- Régression identifiée: +183.6% PII/doc (13.4 → 38.0) - 6 causes racines confirmées: 1. Sur-masquage termes médicaux (RE_SERVICE trop large) 2. Sur-détection noms (répétitions + termes médicaux) 3. Masquage médicaments (whitelist non utilisée) 4. Sur-masquage dates (51 vs 2, +2450%) 5. Répétitions en-têtes/pieds (RPPS 36 vs 2) 6. Artefacts OCR (paramètres non optimaux) - Plan de correction en 3 phases (1-10 jours) - Impact attendu: PII/doc -66%, Precision +35 points Fichiers: - ROOT_CAUSE_ANALYSIS.md: Analyse détaillée - EXECUTIVE_SUMMARY.md: Résumé exécutif - tools/root_cause_analysis.py: Script d'analyse - tools/deep_quality_regression_analysis.py: Analyse approfondie
9.7 KiB
9.7 KiB