a827d860f1511f8e1eae26ba22d403b8d44d031e
- Fix critique: whole-word search dans redact_pdf_raster et redact_pdf_vector pour éviter le substring matching (ex: "Luc" dans "FLUCONAZOLE", "TATIN" dans "ATORVASTATINE"). Appliqué à tous les kinds nom/NER. - Ajout regex RE_VENUE_SEJOUR pour N° venue / N° séjour (BACTERIO, Trackare) - DDN multiline élargi: tolère 0-3 lignes entre label DDN et date (tableaux BACTERIO) - N° venue multiline: détection dans tableaux BACTERIO interleaved - Réduction taille PDF raster: 150 DPI + JPEG quality 85 (était 300 DPI PNG) Ratio moyen: 19.5x (était 30-50x) - Score qualité maintenu: 97.0/100 (grade A), 0 régression Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
placer tout les fichiers dans un répertoire. faire un chmod 777 install.sh pour lui donner les droits d'execution lancer ./install.sh pour lancer l'installation complete
L'installation peut prendre du temps, elle charge deux modele IA nlp. Elle crée un environement virtuel python.
Description
Languages
Python
98.2%
Batchfile
1%
PowerShell
0.5%
Shell
0.3%