fb7896f88d709dfae3df4819f7e9c0a924ca3e3d
La cross-validation NER (_cross_validate_name_candidates) gère désormais les décisions contextuelles nom/terme-médical. Les stop-words purement médicaux sont supprimés : - data/stopwords_manuels.txt : 1307 → 233 entrées (uniquement les mots ambigus qui sont aussi des noms/prénoms INSEE) - _MEDICAL_STOP_WORDS_SET hardcodé : ~400 → 80 entrées essentielles (mots courts, formes galéniques, titres hospitaliers) - Les enrichissements BDPM (~7300), edsnlp (~2000) et fichier externe sont conservés tels quels Score qualité inchangé : 100/100 (A+), 0 fuite, 0 faux positif. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
placer tout les fichiers dans un répertoire. faire un chmod 777 install.sh pour lui donner les droits d'execution lancer ./install.sh pour lancer l'installation complete
L'installation peut prendre du temps, elle charge deux modele IA nlp. Elle crée un environement virtuel python.
Description
Languages
Python
98.2%
Batchfile
1%
PowerShell
0.5%
Shell
0.3%