Commit Graph

  • 012445755a fix(splash): étapes de chargement dans le splash NATIF (pas le tkinter) main Domi31tls 2026-04-15 23:34:40 +02:00
  • 4b825976bd feat(splash): afficher les étapes de chargement dans le splash Domi31tls 2026-04-15 22:23:57 +02:00
  • ab5a24fa68 feat(ui): refonte UI — logo aivanonym + palette magenta/pêche + onglets + v5.5 Domi31tls 2026-04-15 22:04:41 +02:00
  • 6586b89b8f feat(gui): afficher version + build date + commit dans titre et status bar Domi31tls 2026-04-15 18:40:58 +02:00
  • 234137ec50 fix(frozen): ajouter optimum aux hiddenimports PyInstaller Domi31tls 2026-04-15 18:37:20 +02:00
  • 003be68ca8 chore(rebuild): script PowerShell robuste — rename + verif timestamp Domi31tls 2026-04-15 17:48:19 +02:00
  • 8e43d8d1ae fix(detect): accepter prénoms 3 chars après Dr/Mme (Ute, Eva, Léo…) Domi31tls 2026-04-15 17:21:54 +02:00
  • f17438c2ec ui(splash): retirer ligne statique qui chevauche le texte dynamique Domi31tls 2026-04-15 16:15:02 +02:00
  • 0a377bc001 feat(splash): splash natif PyInstaller — couvre la décompression onefile Domi31tls 2026-04-15 15:28:45 +02:00
  • e2e2a7c8e3 fix(redact): masquer tokens collés à ponctuation ("Douar,nécessitant") Domi31tls 2026-04-15 14:10:34 +02:00
  • ea214db170 chore(yaml): nettoyer force_mask_terms — déléguer aux gazetteers nationaux Domi31tls 2026-04-15 13:08:41 +02:00
  • aa3db69a9b fix(regex): RE_HOPITAL_VILLE accepte les ALL-CAPS (CENTRE HOSPITALIER) Domi31tls 2026-04-15 09:40:08 +02:00
  • 83769f6e63 feat(ville): énumérations + CP nu + suffixe CEDEX dans règle contextuelle Domi31tls 2026-04-15 09:37:55 +02:00
  • e6f3853426 feat(finess): whitelist de mono-mots distinctifs courts (EMBRUNS, etc.) Domi31tls 2026-04-15 09:35:16 +02:00
  • fd95ae5f2a fix(finess): inclure les entjur + supprimer code mort _FINESS_ETAB_NAMES Domi31tls 2026-04-15 09:33:07 +02:00
  • 8e458c16ca fix(frozen): data/*.txt dans bundle, feedback UI pendant chargement modèles Domi31tls 2026-04-15 08:50:42 +02:00
  • 4b5925306e feat(gui): exposer additional_stopwords dans le panneau Paramètres avancés Domi31tls 2026-04-14 10:28:11 +02:00
  • 59acf390f4 refactor: externaliser DPI labels et companion blacklist (modifiables sans recompiler) Domi31tls 2026-04-14 10:26:18 +02:00
  • b5058b9c4b fix(whitelist): GUI whitelist_phrases enfin lue et appliquée par le core Domi31tls 2026-04-14 10:23:09 +02:00
  • b23355ed23 docs: scripts de génération des fiches produit et technique DSI/RSSI/DPO Domi31tls 2026-04-14 10:17:14 +02:00
  • 51c75558bc fix: pyzbar FP sur tableaux — carrés noirs sur dates/heures dans les grilles Domi31tls 2026-03-31 15:27:52 +02:00
  • 2f19f7c470 fix: DR. Ute (3 chars), SAINT-GERMES composé, SODIUM MACO/BAX pharma Domi31tls 2026-03-31 15:17:37 +02:00
  • c157205751 fix: labels DPI masqués (Date, Note, Type, Heure) + whitelist désactivée Domi31tls 2026-03-31 12:07:51 +02:00
  • 4d33610655 fix: cross-validation respecte bypass_stopwords pour les noms forcés (Dr/Mme) Domi31tls 2026-03-31 11:07:59 +02:00
  • 2a4b9d79a1 Revert "refactor: réduction stop-words manuels — NER cross-validation suffit" Domi31tls 2026-03-31 11:04:51 +02:00
  • fb7896f88d refactor: réduction stop-words manuels — NER cross-validation suffit Domi31tls 2026-03-31 09:26:54 +02:00
  • 22fbf1c772 feat(ner-first): integrate NER-first flow into pipeline (steps 5-6) Domi31tls 2026-03-31 08:38:56 +02:00
  • 23e19e17e4 feat(ner-first): add NER-first architecture scaffolding (steps 1-4) Domi31tls 2026-03-31 08:31:44 +02:00
  • 219ac18854 chore: ajout launcher.py + spec PyInstaller au repo Domi31tls 2026-03-31 08:17:33 +02:00
  • ac5c35ae2d feat: externalisation des listes — stop-words et villes modifiables sans code Domi31tls 2026-03-31 07:45:42 +02:00
  • b2ee6ad835 feat: config externe à côté de l'exe — mise à jour sans recompiler Domi31tls 2026-03-30 18:09:02 +02:00
  • 898ad9d82d feat: export/import paramètres par email + script merge côté serveur Domi31tls 2026-03-30 17:58:47 +02:00
  • 106f1fcd2e fix: sync texte↔raster + GUI listes whitelist/blacklist améliorées Domi31tls 2026-03-30 17:34:51 +02:00
  • f9fbae1f27 feat: whitelist phrases + panneau paramètres avancés dans la GUI Domi31tls 2026-03-30 15:03:08 +02:00
  • dcccd60c39 chore: GUI v5.4 — version bump + étape 1 formats listés Domi31tls 2026-03-18 22:42:51 +01:00
  • 63a4a013a2 feat: GUI multi-formats + fichier unique + textes mis à jour Domi31tls 2026-03-18 09:39:06 +01:00
  • 437877e1c8 feat: support multi-formats — DOCX, images, ODT, RTF, TXT, HTML Domi31tls 2026-03-18 09:25:26 +01:00
  • 3992b43925 fix: import sys manquant — crash 'name sys is not defined' en mode frozen Domi31tls 2026-03-18 01:06:58 +01:00
  • d1bdfb1aca fix: fenêtres fantômes PyInstaller — désactiver ProcessPoolExecutor en mode frozen Domi31tls 2026-03-18 00:51:54 +01:00
  • 65a02952c5 fix: retour relecteur #2 — page scannée noire, labels DPI, stop-words Domi31tls 2026-03-17 12:11:26 +01:00
  • ad7f1ffa8a fix: FP médicaments dans raster + texte — RE_EXTRACT_STAFF_ROLE + FINESS + stop-words Domi31tls 2026-03-17 07:11:57 +01:00
  • 2731bc1ce7 feat: OCR docTR par page — plus de seuil global, traite chaque page pauvre individuellement Domi31tls 2026-03-16 20:28:27 +01:00
  • 7c05ff9aaf fix: téléphone +33(0) non détecté + noms médecins homonymes de termes médicaux Domi31tls 2026-03-16 18:33:32 +01:00
  • 27d19ebed7 fix: corrections retours relecteur — fuites adresses/établissements + FP médicaments Domi31tls 2026-03-16 18:04:08 +01:00
  • d957e72aff feat: vérification ressources GPU/RAM avant exécution + évaluateur 100/100 Domi31tls 2026-03-16 10:27:33 +01:00
  • 49ff464e6e feat: réduction FP + gazetteers adresses FINESS + batch parallèle + corrections multi-axes Domi31tls 2026-03-16 09:26:56 +01:00
  • a827d860f1 fix: corrections retours collaborateurs — FP médicaments, N° venue, taille PDF Domi31tls 2026-03-12 10:38:27 +01:00
  • eb14cd219d feat(phase3): CamemBERT v3 + détection villes + initiales + texte espacé + docs réglementaires Domi31tls 2026-03-11 12:16:13 +01:00
  • c9572c383a feat(phase2): Fine-tuning CamemBERT-bio v2 (F1=0.90) + enrichissement données Domi31tls 2026-03-10 02:06:08 +01:00
  • 274e2fa586 feat: serveur API FastAPI pour microservice anonymisation Domi31tls 2026-03-10 02:04:52 +01:00
  • 7a2af5c905 feat(phase2): Détection établissements par Aho-Corasick sur 108K noms FINESS Domi31tls 2026-03-09 22:56:43 +01:00
  • 4488a1d4a0 fix(phase2): Corrections audit 30 fichiers — FP stop words, villes, établissements, noms composés Domi31tls 2026-03-09 22:45:26 +01:00
  • 19e089ea38 feat(phase2): Intégration CamemBERT-bio ONNX comme 3e signal NER (vote triple) Domi31tls 2026-03-09 13:42:56 +01:00
  • 26b210607c feat(phase2): Gazetteers FINESS 102K établissements + fine-tuning CamemBERT-bio F1=89% Domi31tls 2026-03-09 13:27:37 +01:00
  • 6e0e8c7312 feat(phase2): Gazetteers INSEE (36K prénoms + 34K communes) + silver annotations Domi31tls 2026-03-09 12:03:17 +01:00
  • 26ac02b0cb feat(phase2): Multi-signal NER — BDPM gazetteers, confiance EDS, safe patterns, GLiNER Domi31tls 2026-03-09 12:01:46 +01:00
  • 782551c1c6 fix(phase2): Ajout stop words cliniques — 117 FP en moins (RESPI, NEPHRO, URINE, etc.) Domi31tls 2026-03-09 09:58:58 +01:00
  • 8629a0cda0 fix(phase2): Élimination FP cross-line + word boundaries — 0 fuite, 0 FP médical Domi31tls 2026-03-08 11:24:22 +01:00
  • e967a67052 feat(phase2): Extraction layout-aware multi-colonnes — 322 fuites → 0, -103 FP Domi31tls 2026-03-06 18:19:08 +01:00
  • bc2fe667a0 fix: Corrections qualité Phase 1 — 261 fuites en moins, 0 régression Domi31tls 2026-03-06 17:32:28 +01:00
  • f9532d5543 chore: add .gitignore, remove PDFs/models/zips from history Domi31tls 2026-03-05 00:37:19 +01:00
  • 4e6fd97e84 Fix fuites soignants + lieux de naissance : 8/8 noms masqués, 0 lieu en clair Domi31tls 2026-03-04 17:10:18 +01:00
  • cede2d64d6 docs(phase1): Résumé exécutif Phase 1 pour l'utilisateur Domi31tls 2026-03-02 23:37:42 +01:00
  • 98a21d7ccc docs(phase1): Documentation complète des résultats Phase 1 Domi31tls 2026-03-02 23:37:19 +01:00
  • ea761823d6 feat(phase1): Implémentation corrections qualité Phase 1 Domi31tls 2026-03-02 23:36:29 +01:00
  • 47a71df930 chore: Avant implémentation Phase 1 corrections qualité Domi31tls 2026-03-02 23:34:06 +01:00
  • 93617bab55 analysis: Analyse complète des causes racines de la régression de qualité Domi31tls 2026-03-02 23:13:30 +01:00
  • dfa6e2957b docs: Analyse complète de la régression de qualité - Causes racines identifiées Domi31tls 2026-03-02 23:09:25 +01:00
  • eb797a4761 analysis: Analyse réelle de la qualité - Identification des faux positifs médicaux Domi31tls 2026-03-02 22:41:14 +01:00
  • 85e19af655 docs: Statut final du projet - Tous objectifs atteints Domi31tls 2026-03-02 22:30:00 +01:00
  • d6915247fe docs: Documentation du bouton Arrêter déjà implémenté dans le GUI Domi31tls 2026-03-02 22:05:33 +01:00
  • bf30f622d9 feat(gui): Ajout bouton Arrêter pour stopper le traitement en cours Domi31tls 2026-03-02 22:04:00 +01:00
  • b46ea83900 test: Vérifier que le GUI fonctionne après correction Domi31tls 2026-03-02 21:54:55 +01:00
  • 5163cb1657 fix(gui): Retirer paramètre use_vlm non supporté par process_pdf Domi31tls 2026-03-02 21:53:54 +01:00
  • 09231be5e8 docs: Analyse finale validation corpus - système fonctionnel Domi31tls 2026-03-02 21:38:30 +01:00
  • 3b1f6cdfbe gui: Ajout indicateurs qualité (fuites, performances) Domi31tls 2026-03-02 21:34:18 +01:00
  • 78adb3ba70 fix: Corriger bug _DOCTR_AVAILABLE non défini Domi31tls 2026-03-02 21:19:48 +01:00
  • 63bd4ace1d feat: Validation corpus complet - 100% qualité confirmée Domi31tls 2026-03-02 19:55:48 +01:00
  • ee34042179 feat: Optimize EPISODE false positives - filter trackare filename episodes Domi31tls 2026-03-02 15:33:29 +01:00
  • 883f14ab79 test: Validation correction fuites - Rappel 100%, Précision 88.27% maintenue Domi31tls 2026-03-02 15:16:30 +01:00
  • f92da4d54e fix: Propagation globale sélective v2 - Normalisation dates + Multi-pass Domi31tls 2026-03-02 12:22:58 +01:00
  • 871221ea56 docs: Résumé complet Phase 2 optimisations Domi31tls 2026-03-02 12:00:06 +01:00
  • f188116bc1 fix: Propagation globale sélective pour corriger fuites dates CRO Domi31tls 2026-03-02 11:59:32 +01:00
  • 6806aee587 feat: Filtre hospitalier pour éliminer les faux positifs Domi31tls 2026-03-02 11:21:48 +01:00
  • 70ff0b9e12 feat: Désactivation NOM_EXTRACTED et *_GLOBAL - Précision 18.97% → 88.27% (+69.3pts) Domi31tls 2026-03-02 11:15:43 +01:00
  • dfa45041d7 feat: Analyse propagation globale - 100% des *_GLOBAL et NOM_EXTRACTED sont des FP Domi31tls 2026-03-02 11:01:14 +01:00
  • 4eba826ca5 feat: Analyse baseline - 77.7% FP dus à NOM_EXTRACTED, 19.2% à propagation globale Domi31tls 2026-03-02 10:59:10 +01:00
  • 0ba5424eb0 feat: Annotation automatique et évaluation qualité baseline - Rappel 100%, Précision 18.97% Domi31tls 2026-03-02 10:51:38 +01:00
  • 99b6e7f1d1 docs: Rapport détaillé des résultats baseline Domi31tls 2026-03-02 10:42:53 +01:00
  • 30a6ebcc19 feat: Benchmark de performance baseline - 2.62s/doc moyen, 92% dans objectif Domi31tls 2026-03-02 10:42:15 +01:00
  • f61e767ee6 demo: Test d'anonymisation sur document réel Domi31tls 2026-03-02 10:19:55 +01:00
  • c78f9f415d demo: Ajout script de démonstration et correction tests Domi31tls 2026-03-02 10:14:56 +01:00
  • 340348b820 feat: Phase 1 - Système d'évaluation de la qualité Domi31tls 2026-03-02 10:07:41 +01:00
  • 0067738df6 spec: Architecture complète avec VLM (5 couches détection) Domi31tls 2026-03-02 09:52:49 +01:00
  • cb84698c2d Stop words +170 : détection automatique FP via dictionnaire français (audit_fp_detector.py) Domi31tls 2026-02-28 10:04:33 +01:00
  • 84be2a5176 Stop words : +15 FP supplémentaires (apyréxie, mode, retraitée, villes, ass, cat) Domi31tls 2026-02-27 16:46:04 +01:00
  • 7991436caa Fix faux positifs NOM : +50 stop words médicaux, blacklist companion, limite RE_EXTRACT_STAFF_ROLE Domi31tls 2026-02-27 14:28:29 +01:00
  • 96d55584c7 Fix 62 fuites résiduelles : DATE_NAISSANCE global, CHCB, Centre Hospitalier de la Côte Basque Domi31tls 2026-02-27 12:07:58 +01:00
  • 0684b77d68 Qualité anonymisation : 10 améliorations (audit 59 OGC, +98% établissements, 0 FP médical) Domi31tls 2026-02-27 10:43:30 +01:00
  • 86274b3b2a Sécurité VLM : format JSON forcé, modèle local uniquement, fix logging critique Domi31tls 2026-02-27 02:38:30 +01:00