feat(phase2): Gazetteers INSEE (36K prénoms + 34K communes) + silver annotations

- Prénoms INSEE renforcent la confiance NER (prénom connu → ne pas filtrer)
- Communes INSEE disponibles pour distinction ville/nom de famille
- Export 29 fichiers silver annotations (252K tokens, 12.8K entités) pour fine-tuning

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
2026-03-09 12:03:17 +01:00
parent 26ac02b0cb
commit 6e0e8c7312
32 changed files with 322066 additions and 3 deletions

File diff suppressed because it is too large Load Diff