t2a_v2/tests at 1844d1be7e4dd61b45e8dc737040beee3dbf96a2 - t2a_v2 - Gitea Aivanov : Git with a cup of tea

Dom/t2a_v2

Files

History

dom 1844d1be7e feat: sanitisation déterministe des codes CIM-10 hors périmètre CPAM

Le LLM (deepseek) propose systématiquement des codes alternatifs (D62,
T81.0, T80, R39.2) malgré l'interdiction dans le prompt. Ces codes
déclenchaient des warnings CRITIQUE → Tier C automatique.

Solution conforme au principe "LLM propose, moteur de règles dispose" :
- _sanitize_unauthorized_codes() supprime les codes hors whitelist du
  texte de la réponse AVANT toute validation
- Nettoyage propre : "D62 — libellé" → "libellé", "(D62)" → ""
- _build_whitelist_prefixes() factorisé en helper partagé
- Sanitisation appliquée après génération ET après correction
- 9 tests unitaires couvrant tous les cas (parenthèses, tirets, multiple)

Résultat live : 0 warning CRITIQUE "code hors périmètre" sur 3 dossiers
(vs 6 warnings CRITIQUE avant). Le seul CRITIQUE restant est le score
adversarial bas, qui reflète des limites de raisonnement du modèle.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>

2026-02-20 15:18:42 +01:00

..

__init__.py

feat: pipeline T2A - anonymisation, extraction CIM-10 et intégration edsnlp

2026-02-10 15:24:12 +01:00

conftest.py

feat: infrastructure — pyproject.toml, requirements-dev, conftest, pytest-cov

2026-02-20 10:06:11 +01:00

test_anonymization.py

feat: pipeline T2A - anonymisation, extraction CIM-10 et intégration edsnlp

2026-02-10 15:24:12 +01:00

test_atih_rules.py

feat: fix extraction DP Trackare + 5 règles ATIH (veto engine)

2026-02-20 00:39:07 +01:00

test_bio_normals.py

feat: BIO_NORMALS 33 analytes + interprétations cliniques + cohérence DAS/bio étendue

2026-02-20 11:00:53 +01:00

test_ccam_dict.py

feat: dictionnaire CCAM complet (8 257 codes) + index FAISS enrichi + validation actes

2026-02-11 11:41:39 +01:00

test_ccam_noncumul.py

feat: Phase 4 — viewer enrichi, non-cumul CCAM, fusion multi-PDFs + rebuild FAISS (21 141 vecteurs)

2026-02-11 12:43:34 +01:00

test_cim10_supplements.py

fix: filtre DAS=DP + correction D55.9→D64.9 + enrichissement supplements CIM-10

2026-02-13 14:03:10 +01:00

test_clinical_context.py

feat: résumé clinique enrichi + preuves cliniques + validation QC batch

2026-02-17 21:47:27 +01:00

test_cpam_parser.py

feat: cache Ollama + parallélisation ThreadPool + filtrage DAS renforcé + modules GHM/CPAM/export RUM

2026-02-12 13:44:34 +01:00

test_cpam_response.py

feat: sanitisation déterministe des codes CIM-10 hors périmètre CPAM

2026-02-20 15:18:42 +01:00

test_das_filter.py

feat: CODE_CORRECTIONS 12 règles déterministes + sentinel REJECT

2026-02-20 11:01:06 +01:00

test_das_llm.py

feat: enrichissement CIM-10 sous-codes + normes biologiques dans prompt DAS

2026-02-12 23:46:42 +01:00

test_decision_engine.py

feat: qualité DP Phase 2 — filtre OCR étendu, abréviations médicales, promotion DAS→DP

2026-02-20 08:37:10 +01:00

test_exclusion_rules.py

feat: règles métier T2A Phase 1 — exclusions diagnostiques, sévérité CMA et alertes codage

2026-02-11 08:53:14 +01:00

test_extraction.py

feat: pipeline T2A - anonymisation, extraction CIM-10 et intégration edsnlp

2026-02-10 15:24:12 +01:00

test_fusion.py

feat: mode hybride Ollama — gemma3:27b pour CPAM, 12b pour codage

2026-02-17 17:53:53 +01:00

test_ghm.py

feat: cache Ollama + parallélisation ThreadPool + filtrage DAS renforcé + modules GHM/CPAM/export RUM

2026-02-12 13:44:34 +01:00

test_integration.py

feat: pipeline T2A - anonymisation, extraction CIM-10 et intégration edsnlp

2026-02-10 15:24:12 +01:00

test_justification.py

feat: résumé clinique enrichi + preuves cliniques + validation QC batch

2026-02-17 21:47:27 +01:00

test_medical.py

feat: traçabilité source systématique + viewer interactif

2026-02-18 20:59:50 +01:00

test_ollama_cache.py

feat: architecture multi-modèles LLM + quality engine + benchmark

2026-02-20 00:21:09 +01:00

test_ollama_client.py

fix: réparation JSON tronqué + retry 429 + whitelist codes CPAM anti-hallucination

2026-02-20 13:33:39 +01:00

test_page_tracker.py

feat: mode hybride Ollama — gemma3:27b pour CPAM, 12b pour codage

2026-02-17 17:53:53 +01:00

test_rag.py

feat: 3 quick wins — source DAS, fallback code parent, filtre anatomique

2026-02-15 11:34:32 +01:00

test_referentiels.py

feat: pass LLM hybride pour DAS + interface admin référentiels RAG

2026-02-12 23:12:39 +01:00

test_rum_export.py

feat: cache Ollama + parallélisation ThreadPool + filtrage DAS renforcé + modules GHM/CPAM/export RUM

2026-02-12 13:44:34 +01:00

test_severity.py

feat: mode hybride Ollama — gemma3:27b pour CPAM, 12b pour codage

2026-02-17 17:53:53 +01:00

test_splitter.py

feat: mode hybride Ollama — gemma3:27b pour CPAM, 12b pour codage

2026-02-17 17:53:53 +01:00

test_viewer.py

feat: architecture multi-modèles LLM + quality engine + benchmark

2026-02-20 00:21:09 +01:00