-
012445755a
fix(splash): étapes de chargement dans le splash NATIF (pas le tkinter)
main
Domi31tls
2026-04-15 23:34:40 +02:00
-
4b825976bd
feat(splash): afficher les étapes de chargement dans le splash
Domi31tls
2026-04-15 22:23:57 +02:00
-
ab5a24fa68
feat(ui): refonte UI — logo aivanonym + palette magenta/pêche + onglets + v5.5
Domi31tls
2026-04-15 22:04:41 +02:00
-
6586b89b8f
feat(gui): afficher version + build date + commit dans titre et status bar
Domi31tls
2026-04-15 18:40:58 +02:00
-
234137ec50
fix(frozen): ajouter optimum aux hiddenimports PyInstaller
Domi31tls
2026-04-15 18:37:20 +02:00
-
003be68ca8
chore(rebuild): script PowerShell robuste — rename + verif timestamp
Domi31tls
2026-04-15 17:48:19 +02:00
-
8e43d8d1ae
fix(detect): accepter prénoms 3 chars après Dr/Mme (Ute, Eva, Léo…)
Domi31tls
2026-04-15 17:21:54 +02:00
-
f17438c2ec
ui(splash): retirer ligne statique qui chevauche le texte dynamique
Domi31tls
2026-04-15 16:15:02 +02:00
-
0a377bc001
feat(splash): splash natif PyInstaller — couvre la décompression onefile
Domi31tls
2026-04-15 15:28:45 +02:00
-
e2e2a7c8e3
fix(redact): masquer tokens collés à ponctuation ("Douar,nécessitant")
Domi31tls
2026-04-15 14:10:34 +02:00
-
ea214db170
chore(yaml): nettoyer force_mask_terms — déléguer aux gazetteers nationaux
Domi31tls
2026-04-15 13:08:41 +02:00
-
aa3db69a9b
fix(regex): RE_HOPITAL_VILLE accepte les ALL-CAPS (CENTRE HOSPITALIER)
Domi31tls
2026-04-15 09:40:08 +02:00
-
83769f6e63
feat(ville): énumérations + CP nu + suffixe CEDEX dans règle contextuelle
Domi31tls
2026-04-15 09:37:55 +02:00
-
e6f3853426
feat(finess): whitelist de mono-mots distinctifs courts (EMBRUNS, etc.)
Domi31tls
2026-04-15 09:35:16 +02:00
-
fd95ae5f2a
fix(finess): inclure les entjur + supprimer code mort _FINESS_ETAB_NAMES
Domi31tls
2026-04-15 09:33:07 +02:00
-
8e458c16ca
fix(frozen): data/*.txt dans bundle, feedback UI pendant chargement modèles
Domi31tls
2026-04-15 08:50:42 +02:00
-
4b5925306e
feat(gui): exposer additional_stopwords dans le panneau Paramètres avancés
Domi31tls
2026-04-14 10:28:11 +02:00
-
59acf390f4
refactor: externaliser DPI labels et companion blacklist (modifiables sans recompiler)
Domi31tls
2026-04-14 10:26:18 +02:00
-
b5058b9c4b
fix(whitelist): GUI whitelist_phrases enfin lue et appliquée par le core
Domi31tls
2026-04-14 10:23:09 +02:00
-
b23355ed23
docs: scripts de génération des fiches produit et technique DSI/RSSI/DPO
Domi31tls
2026-04-14 10:17:14 +02:00
-
51c75558bc
fix: pyzbar FP sur tableaux — carrés noirs sur dates/heures dans les grilles
Domi31tls
2026-03-31 15:27:52 +02:00
-
2f19f7c470
fix: DR. Ute (3 chars), SAINT-GERMES composé, SODIUM MACO/BAX pharma
Domi31tls
2026-03-31 15:17:37 +02:00
-
c157205751
fix: labels DPI masqués (Date, Note, Type, Heure) + whitelist désactivée
Domi31tls
2026-03-31 12:07:51 +02:00
-
4d33610655
fix: cross-validation respecte bypass_stopwords pour les noms forcés (Dr/Mme)
Domi31tls
2026-03-31 11:07:59 +02:00
-
2a4b9d79a1
Revert "refactor: réduction stop-words manuels — NER cross-validation suffit"
Domi31tls
2026-03-31 11:04:51 +02:00
-
fb7896f88d
refactor: réduction stop-words manuels — NER cross-validation suffit
Domi31tls
2026-03-31 09:26:54 +02:00
-
22fbf1c772
feat(ner-first): integrate NER-first flow into pipeline (steps 5-6)
Domi31tls
2026-03-31 08:38:56 +02:00
-
23e19e17e4
feat(ner-first): add NER-first architecture scaffolding (steps 1-4)
Domi31tls
2026-03-31 08:31:44 +02:00
-
219ac18854
chore: ajout launcher.py + spec PyInstaller au repo
Domi31tls
2026-03-31 08:17:33 +02:00
-
ac5c35ae2d
feat: externalisation des listes — stop-words et villes modifiables sans code
Domi31tls
2026-03-31 07:45:42 +02:00
-
b2ee6ad835
feat: config externe à côté de l'exe — mise à jour sans recompiler
Domi31tls
2026-03-30 18:09:02 +02:00
-
898ad9d82d
feat: export/import paramètres par email + script merge côté serveur
Domi31tls
2026-03-30 17:58:47 +02:00
-
106f1fcd2e
fix: sync texte↔raster + GUI listes whitelist/blacklist améliorées
Domi31tls
2026-03-30 17:34:51 +02:00
-
f9fbae1f27
feat: whitelist phrases + panneau paramètres avancés dans la GUI
Domi31tls
2026-03-30 15:03:08 +02:00
-
dcccd60c39
chore: GUI v5.4 — version bump + étape 1 formats listés
Domi31tls
2026-03-18 22:42:51 +01:00
-
63a4a013a2
feat: GUI multi-formats + fichier unique + textes mis à jour
Domi31tls
2026-03-18 09:39:06 +01:00
-
437877e1c8
feat: support multi-formats — DOCX, images, ODT, RTF, TXT, HTML
Domi31tls
2026-03-18 09:25:26 +01:00
-
3992b43925
fix: import sys manquant — crash 'name sys is not defined' en mode frozen
Domi31tls
2026-03-18 01:06:58 +01:00
-
d1bdfb1aca
fix: fenêtres fantômes PyInstaller — désactiver ProcessPoolExecutor en mode frozen
Domi31tls
2026-03-18 00:51:54 +01:00
-
65a02952c5
fix: retour relecteur #2 — page scannée noire, labels DPI, stop-words
Domi31tls
2026-03-17 12:11:26 +01:00
-
ad7f1ffa8a
fix: FP médicaments dans raster + texte — RE_EXTRACT_STAFF_ROLE + FINESS + stop-words
Domi31tls
2026-03-17 07:11:57 +01:00
-
2731bc1ce7
feat: OCR docTR par page — plus de seuil global, traite chaque page pauvre individuellement
Domi31tls
2026-03-16 20:28:27 +01:00
-
7c05ff9aaf
fix: téléphone +33(0) non détecté + noms médecins homonymes de termes médicaux
Domi31tls
2026-03-16 18:33:32 +01:00
-
27d19ebed7
fix: corrections retours relecteur — fuites adresses/établissements + FP médicaments
Domi31tls
2026-03-16 18:04:08 +01:00
-
d957e72aff
feat: vérification ressources GPU/RAM avant exécution + évaluateur 100/100
Domi31tls
2026-03-16 10:27:33 +01:00
-
49ff464e6e
feat: réduction FP + gazetteers adresses FINESS + batch parallèle + corrections multi-axes
Domi31tls
2026-03-16 09:26:56 +01:00
-
a827d860f1
fix: corrections retours collaborateurs — FP médicaments, N° venue, taille PDF
Domi31tls
2026-03-12 10:38:27 +01:00
-
eb14cd219d
feat(phase3): CamemBERT v3 + détection villes + initiales + texte espacé + docs réglementaires
Domi31tls
2026-03-11 12:16:13 +01:00
-
c9572c383a
feat(phase2): Fine-tuning CamemBERT-bio v2 (F1=0.90) + enrichissement données
Domi31tls
2026-03-10 02:06:08 +01:00
-
274e2fa586
feat: serveur API FastAPI pour microservice anonymisation
Domi31tls
2026-03-10 02:04:52 +01:00
-
7a2af5c905
feat(phase2): Détection établissements par Aho-Corasick sur 108K noms FINESS
Domi31tls
2026-03-09 22:56:43 +01:00
-
4488a1d4a0
fix(phase2): Corrections audit 30 fichiers — FP stop words, villes, établissements, noms composés
Domi31tls
2026-03-09 22:45:26 +01:00
-
19e089ea38
feat(phase2): Intégration CamemBERT-bio ONNX comme 3e signal NER (vote triple)
Domi31tls
2026-03-09 13:42:56 +01:00
-
26b210607c
feat(phase2): Gazetteers FINESS 102K établissements + fine-tuning CamemBERT-bio F1=89%
Domi31tls
2026-03-09 13:27:37 +01:00
-
6e0e8c7312
feat(phase2): Gazetteers INSEE (36K prénoms + 34K communes) + silver annotations
Domi31tls
2026-03-09 12:03:17 +01:00
-
26ac02b0cb
feat(phase2): Multi-signal NER — BDPM gazetteers, confiance EDS, safe patterns, GLiNER
Domi31tls
2026-03-09 12:01:46 +01:00
-
782551c1c6
fix(phase2): Ajout stop words cliniques — 117 FP en moins (RESPI, NEPHRO, URINE, etc.)
Domi31tls
2026-03-09 09:58:58 +01:00
-
8629a0cda0
fix(phase2): Élimination FP cross-line + word boundaries — 0 fuite, 0 FP médical
Domi31tls
2026-03-08 11:24:22 +01:00
-
e967a67052
feat(phase2): Extraction layout-aware multi-colonnes — 322 fuites → 0, -103 FP
Domi31tls
2026-03-06 18:19:08 +01:00
-
bc2fe667a0
fix: Corrections qualité Phase 1 — 261 fuites en moins, 0 régression
Domi31tls
2026-03-06 17:32:28 +01:00
-
f9532d5543
chore: add .gitignore, remove PDFs/models/zips from history
Domi31tls
2026-03-05 00:37:19 +01:00
-
4e6fd97e84
Fix fuites soignants + lieux de naissance : 8/8 noms masqués, 0 lieu en clair
Domi31tls
2026-03-04 17:10:18 +01:00
-
cede2d64d6
docs(phase1): Résumé exécutif Phase 1 pour l'utilisateur
Domi31tls
2026-03-02 23:37:42 +01:00
-
98a21d7ccc
docs(phase1): Documentation complète des résultats Phase 1
Domi31tls
2026-03-02 23:37:19 +01:00
-
ea761823d6
feat(phase1): Implémentation corrections qualité Phase 1
Domi31tls
2026-03-02 23:36:29 +01:00
-
47a71df930
chore: Avant implémentation Phase 1 corrections qualité
Domi31tls
2026-03-02 23:34:06 +01:00
-
93617bab55
analysis: Analyse complète des causes racines de la régression de qualité
Domi31tls
2026-03-02 23:13:30 +01:00
-
dfa6e2957b
docs: Analyse complète de la régression de qualité - Causes racines identifiées
Domi31tls
2026-03-02 23:09:25 +01:00
-
eb797a4761
analysis: Analyse réelle de la qualité - Identification des faux positifs médicaux
Domi31tls
2026-03-02 22:41:14 +01:00
-
85e19af655
docs: Statut final du projet - Tous objectifs atteints
Domi31tls
2026-03-02 22:30:00 +01:00
-
d6915247fe
docs: Documentation du bouton Arrêter déjà implémenté dans le GUI
Domi31tls
2026-03-02 22:05:33 +01:00
-
bf30f622d9
feat(gui): Ajout bouton Arrêter pour stopper le traitement en cours
Domi31tls
2026-03-02 22:04:00 +01:00
-
b46ea83900
test: Vérifier que le GUI fonctionne après correction
Domi31tls
2026-03-02 21:54:55 +01:00
-
5163cb1657
fix(gui): Retirer paramètre use_vlm non supporté par process_pdf
Domi31tls
2026-03-02 21:53:54 +01:00
-
09231be5e8
docs: Analyse finale validation corpus - système fonctionnel
Domi31tls
2026-03-02 21:38:30 +01:00
-
3b1f6cdfbe
gui: Ajout indicateurs qualité (fuites, performances)
Domi31tls
2026-03-02 21:34:18 +01:00
-
78adb3ba70
fix: Corriger bug _DOCTR_AVAILABLE non défini
Domi31tls
2026-03-02 21:19:48 +01:00
-
63bd4ace1d
feat: Validation corpus complet - 100% qualité confirmée
Domi31tls
2026-03-02 19:55:48 +01:00
-
ee34042179
feat: Optimize EPISODE false positives - filter trackare filename episodes
Domi31tls
2026-03-02 15:33:29 +01:00
-
883f14ab79
test: Validation correction fuites - Rappel 100%, Précision 88.27% maintenue
Domi31tls
2026-03-02 15:16:30 +01:00
-
f92da4d54e
fix: Propagation globale sélective v2 - Normalisation dates + Multi-pass
Domi31tls
2026-03-02 12:22:58 +01:00
-
871221ea56
docs: Résumé complet Phase 2 optimisations
Domi31tls
2026-03-02 12:00:06 +01:00
-
f188116bc1
fix: Propagation globale sélective pour corriger fuites dates CRO
Domi31tls
2026-03-02 11:59:32 +01:00
-
6806aee587
feat: Filtre hospitalier pour éliminer les faux positifs
Domi31tls
2026-03-02 11:21:48 +01:00
-
70ff0b9e12
feat: Désactivation NOM_EXTRACTED et *_GLOBAL - Précision 18.97% → 88.27% (+69.3pts)
Domi31tls
2026-03-02 11:15:43 +01:00
-
dfa45041d7
feat: Analyse propagation globale - 100% des *_GLOBAL et NOM_EXTRACTED sont des FP
Domi31tls
2026-03-02 11:01:14 +01:00
-
4eba826ca5
feat: Analyse baseline - 77.7% FP dus à NOM_EXTRACTED, 19.2% à propagation globale
Domi31tls
2026-03-02 10:59:10 +01:00
-
0ba5424eb0
feat: Annotation automatique et évaluation qualité baseline - Rappel 100%, Précision 18.97%
Domi31tls
2026-03-02 10:51:38 +01:00
-
99b6e7f1d1
docs: Rapport détaillé des résultats baseline
Domi31tls
2026-03-02 10:42:53 +01:00
-
30a6ebcc19
feat: Benchmark de performance baseline - 2.62s/doc moyen, 92% dans objectif
Domi31tls
2026-03-02 10:42:15 +01:00
-
f61e767ee6
demo: Test d'anonymisation sur document réel
Domi31tls
2026-03-02 10:19:55 +01:00
-
c78f9f415d
demo: Ajout script de démonstration et correction tests
Domi31tls
2026-03-02 10:14:56 +01:00
-
340348b820
feat: Phase 1 - Système d'évaluation de la qualité
Domi31tls
2026-03-02 10:07:41 +01:00
-
0067738df6
spec: Architecture complète avec VLM (5 couches détection)
Domi31tls
2026-03-02 09:52:49 +01:00
-
cb84698c2d
Stop words +170 : détection automatique FP via dictionnaire français (audit_fp_detector.py)
Domi31tls
2026-02-28 10:04:33 +01:00
-
84be2a5176
Stop words : +15 FP supplémentaires (apyréxie, mode, retraitée, villes, ass, cat)
Domi31tls
2026-02-27 16:46:04 +01:00
-
7991436caa
Fix faux positifs NOM : +50 stop words médicaux, blacklist companion, limite RE_EXTRACT_STAFF_ROLE
Domi31tls
2026-02-27 14:28:29 +01:00
-
96d55584c7
Fix 62 fuites résiduelles : DATE_NAISSANCE global, CHCB, Centre Hospitalier de la Côte Basque
Domi31tls
2026-02-27 12:07:58 +01:00
-
0684b77d68
Qualité anonymisation : 10 améliorations (audit 59 OGC, +98% établissements, 0 FP médical)
Domi31tls
2026-02-27 10:43:30 +01:00
-
86274b3b2a
Sécurité VLM : format JSON forcé, modèle local uniquement, fix logging critique
Domi31tls
2026-02-27 02:38:30 +01:00