|
|
dfa45041d7
|
feat: Analyse propagation globale - 100% des *_GLOBAL et NOM_EXTRACTED sont des FP
|
2026-03-02 11:01:14 +01:00 |
|
|
|
4eba826ca5
|
feat: Analyse baseline - 77.7% FP dus à NOM_EXTRACTED, 19.2% à propagation globale
|
2026-03-02 10:59:10 +01:00 |
|
|
|
0ba5424eb0
|
feat: Annotation automatique et évaluation qualité baseline - Rappel 100%, Précision 18.97%
|
2026-03-02 10:51:38 +01:00 |
|
|
|
30a6ebcc19
|
feat: Benchmark de performance baseline - 2.62s/doc moyen, 92% dans objectif
|
2026-03-02 10:42:15 +01:00 |
|
|
|
340348b820
|
feat: Phase 1 - Système d'évaluation de la qualité
- Sélection et copie de 27 documents représentatifs (10 simples, 12 moyens, 5 complexes)
- Outil d'annotation CLI complet (tools/annotation_tool.py)
- Guide d'annotation détaillé (docs/annotation_guide.md)
- Évaluateur de qualité (evaluation/quality_evaluator.py)
* Calcul Précision, Rappel, F1-Score
* Identification faux positifs/négatifs
* Métriques par type de PII
* Export JSON et rapports texte
- Scanner de fuite (evaluation/leak_scanner.py)
* Détection PII résiduels (CRITIQUE)
* Détection nouveaux PII (HAUTE)
* Scan métadonnées PDF (MOYENNE)
- Benchmark de performance (evaluation/benchmark.py)
* Mesure temps de traitement
* Mesure CPU/RAM
* Export JSON/CSV
- Tests unitaires complets pour tous les composants
- Documentation complète du module d'évaluation
Tâches complétées:
- 1.1.1 Sélection de 27 documents (au lieu de 30)
- 1.1.2 Outil d'annotation CLI
- 1.2.1 Évaluateur de qualité
- 1.2.2 Scanner de fuite
- 1.2.3 Benchmark de performance
Prochaines étapes:
- 1.1.3 Annotation des 27 documents (manuel)
- 1.1.4 Enrichissement stopwords médicaux
- 1.3 Mesure de la baseline
|
2026-03-02 10:07:41 +01:00 |
|
|
|
0067738df6
|
spec: Architecture complète avec VLM (5 couches détection)
- Ajout documentation VLM (Ollama qwen2.5vl:7b)
- Pipeline complet: Regex → VLM → EDS-Pseudo → CamemBERT → Contextuel
- Nouvelles exigences REQ-013/REQ-014 pour optimisation VLM
- Tâches Phase 2.5: amélioration prompt, validation croisée, perf
- Document ARCHITECTURE_REELLE.md avec détails complets
- Matériel: AMD Ryzen 9 9950X, 128GB RAM, RTX 5070 12GB
- Objectifs: Rappel ≥99.5%, Précision ≥97%, F1 ≥0.98
|
2026-03-02 09:52:49 +01:00 |
|