Domi31tls 93617bab55 analysis: Analyse complète des causes racines de la régression de qualité
- Régression identifiée: +183.6% PII/doc (13.4 → 38.0)
- 6 causes racines confirmées:
  1. Sur-masquage termes médicaux (RE_SERVICE trop large)
  2. Sur-détection noms (répétitions + termes médicaux)
  3. Masquage médicaments (whitelist non utilisée)
  4. Sur-masquage dates (51 vs 2, +2450%)
  5. Répétitions en-têtes/pieds (RPPS 36 vs 2)
  6. Artefacts OCR (paramètres non optimaux)

- Plan de correction en 3 phases (1-10 jours)
- Impact attendu: PII/doc -66%, Precision +35 points

Fichiers:
- ROOT_CAUSE_ANALYSIS.md: Analyse détaillée
- EXECUTIVE_SUMMARY.md: Résumé exécutif
- tools/root_cause_analysis.py: Script d'analyse
- tools/deep_quality_regression_analysis.py: Analyse approfondie
2026-03-02 23:13:30 +01:00

placer tout les fichiers dans un répertoire. faire un chmod 777 install.sh pour lui donner les droits d'execution lancer ./install.sh pour lancer l'installation complete

L'installation peut prendre du temps, elle charge deux modele IA nlp. Elle crée un environement virtuel python.

Description
No description provided
Readme 247 MiB
Languages
Python 98.2%
Batchfile 1%
PowerShell 0.5%
Shell 0.3%