- Parseur trackare spécifique (détection par contenu, extraction structurée des PII)
- Support format "Dr X. NOM" et "Mme X. NOM" (initiales + noms composés avec tiret)
- Détection noms personnel médical (Aide, Cadre Infirmier, etc.)
- Masquage RPPS, établissements (EHPAD/SSR/USLD standalone), lieux de naissance
- Stop words médicaux enrichis (~270 entrées : DCI, spécialités, termes contextuels)
- Détection compagnon (noms adjacents à des noms connus dans le texte brut)
- Protection noms composés (JEAN-PIERRE traité comme un tout, pas JEAN + PIERRE)
- Nettoyage codes postaux orphelins, téléphones fragmentés/partiels
- Désactivation masquage dates génériques, AGE avec contexte obligatoire
- GUI : extraction OGC depuis le nom du répertoire parent, incrustation sur les pages
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
- Re-ajoute --nofollow-import-to pour tous les packages externes lourds
(onnxruntime, numpy, transformers, PIL, fitz, pdfplumber, etc.)
- Ajoute --no-deployment-flag=excluded-module-usage pour autoriser
leur import à l'exécution
- Nouvelle étape : pip install --target=dist pour copier les packages
Python directement dans le dossier de distribution
- Nuitka ne compile en C que nos 4 modules + stdlib + tkinter
- Les packages externes restent en bytecode Python natif (fiable)
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
- _app_dir() utilise toujours Path(__file__).parent au lieu de
dir() qui ne détecte pas __compiled__ dans une fonction
- Ajout crash.log + messagebox en cas d'erreur fatale
(même avec --windows-console-mode=disable)
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
Les flags --nofollow-import-to excluent complètement les modules du bundle
au lieu de juste sauter leur compilation C. pdfplumber, fitz, PIL etc.
étaient absents de l'exe. Augmente aussi le timeout à 120min.
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
- --standalone sans --onefile : produit un dossier au lieu d'un exe compressé
- Windows Defender ne bloque plus (pas de technique d'extraction suspecte)
- Le dossier est zippé pour distribution facile
- Renommé en Pseudonymisation/ pour plus de clarté
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
orderedset ne compile pas sur Windows/Python 3.12
(longintrepr.h manquant). C'est optionnel pour Nuitka.
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
- Cache Nuitka entre les builds (accélère les rebuilds)
- --nofollow-import-to pour les gros packages déjà compilés
(onnxruntime, numpy, transformers, PIL, etc.)
- Nuitka les inclut tels quels sans les recompiler en C
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>