feat: Analyse propagation globale - 100% des *_GLOBAL et NOM_EXTRACTED sont des FP

This commit is contained in:
2026-03-02 11:01:14 +01:00
parent 4eba826ca5
commit dfa45041d7
6 changed files with 876 additions and 3 deletions

View File

@@ -26,9 +26,9 @@
- [x] 1.1.3.4 Valider les annotations (double vérification)
- [x] 1.1.3.5 Calculer les statistiques du dataset (PII par type, difficulté)
- [ ] 1.1.4 Enrichir la liste des stopwords médicaux
- [ ] 1.1.4.1 Extraire les termes médicaux des 30 documents annotés
- [ ] 1.1.4.2 Identifier les faux positifs actuels (termes masqués à tort)
- [-] 1.1.4 Enrichir la liste des stopwords médicaux
- [x] 1.1.4.1 Extraire les termes médicaux des 30 documents annotés
- [x] 1.1.4.2 Identifier les faux positifs actuels (termes masqués à tort)
- [ ] 1.1.4.3 Ajouter les nouveaux termes à `_MEDICAL_STOP_WORDS_SET`
- [ ] 1.1.4.4 Documenter les sources des stopwords