ad7f1ffa8a79637b3b9e97a24d9b5444ff23ed65
Bug #1 (critique) : RE_EXTRACT_STAFF_ROLE matchait à l'intérieur des mots (IDE dans METOCLOPRAMIDE, AS dans ATORVASTATINE) → ajout \b word boundaries et suppression du ? optionnel sur ASH (AS matchait partout) Bug #2 : raster multi-mots utilisait page.search_for() (substring matching) → ajout vérification frontières de mots pour les tokens multi-mots dans redact_pdf_raster et redact_pdf_vector FP FINESS Aho-Corasick : - "resistance" (Centre de la Résistance) matchait "résistance aux fluoroquinolones" - "radiotherapie" matchait "tumorectomie, radiothérapie et hormonothérapie" → ajout blacklist : resistance, radiotherapie, chimiotherapie, etc. FP villes : "COU" (commune) matchait dans "prurit (cou, décolleté, dos)" → ajout COU, DOS, SEIN, BRAS à _VILLE_BLACKLIST Stop-words : ajout "totale", "partielle", "prothese", "unicompartimentale" Score évaluation maintenu à 100.0/100 (A+) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
placer tout les fichiers dans un répertoire. faire un chmod 777 install.sh pour lui donner les droits d'execution lancer ./install.sh pour lancer l'installation complete
L'installation peut prendre du temps, elle charge deux modele IA nlp. Elle crée un environement virtuel python.
Description
Languages
Python
98.2%
Batchfile
1%
PowerShell
0.5%
Shell
0.3%