aa3db69a9b8be87037c2e3aa1106922ffc1719bd
Le pattern type utilisait [Cc]entre\s+[Hh]ospitalier : seule la 1re lettre de chaque mot était ambidextre, la suite devait être en minuscules. "CENTRE HOSPITALIER COTE BASQUE" (tout majuscule) échappait → compensé par regex YAML force_mask_regex "Centre\s+Hospitalier\s+…". Fix : utiliser (?i:…) case-insensitive localement sur les sous-motifs "type d'établissement" et "déterminants" (de, du, la…) tout en gardant le nom propre strict (1re lettre majuscule obligatoire). Évite les FP tout en capturant les majuscules complètes. Cas validés : - "Centre Hospitalier de Bayonne" → match (inchangé) - "CENTRE HOSPITALIER COTE BASQUE" → match (nouveau) - "POLYCLINIQUE CÔTE BASQUE SUD" → match (nouveau) - "CLINIQUE SAINT-JEAN" → match (nouveau) - "examen hôpital de Bordeaux" → pas de match (exclusion préservée) Test YAML stripped : CENTRE HOSPITALIER et COTE BASQUE sont maintenant masqués par ETAB (regex/AC) au lieu de force_term. Après ce fix + Fix #4, on peut retirer les regex "Centre\s+Hospitalier…" et "Polyclinique…" du YAML. Non-régression : 122 hits sur trackare-18007562 avec YAML complet. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
placer tout les fichiers dans un répertoire. faire un chmod 777 install.sh pour lui donner les droits d'execution lancer ./install.sh pour lancer l'installation complete
L'installation peut prendre du temps, elle charge deux modele IA nlp. Elle crée un environement virtuel python.
Description
Languages
Python
98.2%
Batchfile
1%
PowerShell
0.5%
Shell
0.3%