Domi31tls 4583283bd4 Fix 2 fuites PII : prénom REGINA + nom composé NOCENT-EJNAINI cross-line
- Retirer "regina" de _MEDICAL_STOP_WORDS_SET (bloquait la détection du prénom)
- Ajouter regex "Prénom de naissance" / "Prénom utilisé" dans _extract_document_names
- Substitution tolérante aux sauts de ligne pour noms composés (tiret + \s*)
- Conserver les parties longues (>=5 chars) des noms composés dans _global_name_tokens
  au lieu de les supprimer (le texte PDF peut les scinder sur des lignes séparées)

Vérifié : REGINA 33→0, NOCENT 90→0, EJNAINI 90→0 occurrences en clair

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-02-26 23:41:40 +01:00

placer tout les fichiers dans un répertoire. faire un chmod 777 install.sh pour lui donner les droits d'execution lancer ./install.sh pour lancer l'installation complete

L'installation peut prendre du temps, elle charge deux modele IA nlp. Elle crée un environement virtuel python.

Description
No description provided
Readme 247 MiB
Languages
Python 98.2%
Batchfile 1%
PowerShell 0.5%
Shell 0.3%