fix(c8): remove 'grand' from stopwords (was filtering INSEE name)
Le mot "grand" en stopword filtrait les noms INSEE valides comme GRAND, BILLON-GRAND lors du masquage NER. Sur le corpus audit_30 : 17 fuites du nom "GRAND" dans trackare-05012965-23060770. Fix : suppression de la ligne (pipeline INSEE exige contexte fort pour masquer, "grand" minuscule isolé ne sera pas FP). Tests à venir : tests/unit/test_c8_grand_regression.py (Qwen) Ref: docs/coordination/inbox/for-dom/2026-05-29_qwen_analyse-regression-grand.md Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -546,7 +546,6 @@ glycosurie
|
|||||||
glycémie
|
glycémie
|
||||||
gouttes
|
gouttes
|
||||||
grancher
|
grancher
|
||||||
grand
|
|
||||||
gsc
|
gsc
|
||||||
gynécologie
|
gynécologie
|
||||||
gélule
|
gélule
|
||||||
|
|||||||
Reference in New Issue
Block a user