Commit Graph

4 Commits

Author SHA1 Message Date
ea761823d6 feat(phase1): Implémentation corrections qualité Phase 1
 Correction 1: Désactivation mapping DATE dans EDS-Pseudo
- Seules les dates de naissance sont masquées
- [DATE] = 0, [DATE_NAISSANCE] préservé
- Contexte temporel médical préservé

 Correction 2: Activation whitelist médicaments
- Médicaments préservés (IDACIO, SALAZOPYRINE, etc.)
- Filtrage dans _mask_with_eds_pseudo
- Information thérapeutique préservée

 Correction 3: Whitelist termes médicaux structurels
- Termes préservés (Chef de service, Praticien hospitalier, etc.)
- Filtrage dans _repl_service
- Contexte médical préservé

Tests: 100% succès sur corpus production (3 documents testés)
2026-03-02 23:36:29 +01:00
47a71df930 chore: Avant implémentation Phase 1 corrections qualité 2026-03-02 23:34:06 +01:00
86274b3b2a Sécurité VLM : format JSON forcé, modèle local uniquement, fix logging critique
- vlm_manager: ajout format:json dans payload Ollama (élimine hallucinations JSON)
- vlm_manager: retour modèle local qwen2.5vl:7b (sécurité données médicales)
- anonymizer_core: ajout import logging (fix NameError silencieux qui tuait le VLM)
- anonymizer_core: masquage direct pages manuscrites (suppression rotation inutile)
- GUI: intégration checkbox VLM + auto-load EDS-Pseudo prioritaire

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-02-27 02:38:30 +01:00
8339069c83 Initial commit — Pseudonymisation de PDF v5
- GUI v5 : vue unique épurée (tkinter), 2 étapes visuelles
- Core ONNX : anonymisation regex + NER optionnel
- Extraction globale des noms depuis champs structurés
  (Patient, Rédigé par, MME/Madame, DR)
- Génération simultanée PDF Image + PDF Anonymisé (structure préservée)
- Build Windows via Nuitka (script batch + GitHub Actions CI)
- install.sh pour setup/run Linux

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-02-16 15:03:37 +01:00