feat: dictionnaire CIM-10 complet (10 893 codes) + robustesse regex
- Nouveau module cim10_dict.py : extraction depuis metadata.json FAISS,
lookup intelligent avec normalisation Unicode (accents, trémas, apostrophes)
- cim10_extractor : _lookup_cim10 utilise le dictionnaire complet,
_find_dp normalisé, _find_das élargi à 20 patterns (cardio, métabo,
infectieux, rénal...), biologie +6 tests (TGO/TGP, Hb, créatinine),
traitements sans limite de lignes
- document_classifier : scoring pondéré, classify_with_confidence(), scan 5000 chars
- CLI --build-dict pour regénérer data/cim10_dict.json
- 32 nouveaux tests unitaires (124 total, 0 échec)
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>