refactor: réduction stop-words manuels — NER cross-validation suffit
La cross-validation NER (_cross_validate_name_candidates) gère désormais les décisions contextuelles nom/terme-médical. Les stop-words purement médicaux sont supprimés : - data/stopwords_manuels.txt : 1307 → 233 entrées (uniquement les mots ambigus qui sont aussi des noms/prénoms INSEE) - _MEDICAL_STOP_WORDS_SET hardcodé : ~400 → 80 entrées essentielles (mots courts, formes galéniques, titres hospitaliers) - Les enrichissements BDPM (~7300), edsnlp (~2000) et fichier externe sont conservés tels quels Score qualité inchangé : 100/100 (A+), 0 fuite, 0 faux positif. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
This commit is contained in: