diff --git a/.claude/projects/-home-dom-ai-t2a/memory/regles_metier_t2a.md b/.claude/projects/-home-dom-ai-t2a/memory/regles_metier_t2a.md
deleted file mode 100644
index c4f01cc..0000000
--- a/.claude/projects/-home-dom-ai-t2a/memory/regles_metier_t2a.md
+++ /dev/null
@@ -1,32 +0,0 @@
-# Règles métier T2A — Connaissances critiques
-
-## 1. Index alphabétique CIM-10
-- Ne pas se contenter de vectoriser les codes (liste analytique)
-- Vectoriser les **index alphabétiques** : un médecin cherche "Gastrite", pas "K29.7"
-- Le lien langage naturel → code est bien plus riche dans l'index alphabétique
-
-## 2. Validité temporelle des codes CCAM
-- Chaque code CCAM a une date de début et de fin de validité
-- Si un acte est hors période de validité (supprimé ou remplacé dans une version), le **groupage plantera**
-- Le RAG doit toujours vérifier les dates de validité des codes dans les tables de référence
-- Version actuelle : CCAM V4 2025
-
-## 3. Diagnostics d'exclusion (piège IA classique)
-- Si le patient a un symptôme (R10.4 "Douleur abdominale") ET un diagnostic précis (K35.8 "Appendicite"),
-  le symptôme est **exclu** au profit du diagnostic précis
-- Règle : les codes **Chapitres I à XIV** de la CIM-10 priment sur les codes **Chapitre XVIII** (symptômes)
-- Le reranker doit implémenter cette priorisation
-
-## 4. Hiérarchie des actes CCAM (non-cumul)
-- La CCAM n'est pas que du texte, c'est de la **combinatoire**
-- Règles de non-cumul : deux actes anatomiquement incompatibles ou inclus l'un dans l'autre → **alerte**
-- Doit être vérifié selon le référentiel CCAM
-
-## 5. Sévérité CMA/CMS (nerf de la guerre GHM)
-- CMA = Complications ou Morbidités Associées
-- CMS = Complications ou Morbidités Associées Sévères
-- La détection des CMA/CMS détermine le passage du **niveau 1 au niveau 4 du GHM**
-- Différence de valorisation financière énorme
-- Le NLP doit chercher spécifiquement les **marqueurs de sévérité**
-  - Ex: "Insuffisance rénale **aiguë**" vs "**chronique**" → codes et niveaux différents
-  - Ex: "Dénutrition **sévère**" vs "modérée"
diff --git a/benchmark_cpam_models.py b/benchmark_cpam_models.py
deleted file mode 100644
index 4fc9225..0000000
--- a/benchmark_cpam_models.py
+++ /dev/null
@@ -1,506 +0,0 @@
-#!/usr/bin/env python3
-"""Benchmark CPAM TIM — test complet multi-modèles sur dossiers réels.
-
-Teste generate_cpam_response() avec chaque modèle local candidat
-pour évaluer : validité JSON, compliance TIM, cohérence bio, codes inventés.
-
-Usage:
-    python benchmark_cpam_models.py [dossier_name]
-"""
-
-import json
-import logging
-import os
-import sys
-import time
-import importlib
-from pathlib import Path
-
-sys.path.insert(0, str(Path(__file__).parent))
-
-logging.basicConfig(
-    level=logging.INFO,
-    format="%(asctime)s %(levelname)-5s %(name)s — %(message)s",
-    datefmt="%H:%M:%S",
-)
-logger = logging.getLogger("benchmark_cpam")
-
-# Modèles locaux à tester (pas de cloud)
-MODELS_TO_TEST = [
-    "gemma3:27b",
-    "gemma3:27b-it-qat",
-    "qwen3:32b",
-    "qwen3:14b",
-    "mistral-small3.2:24b",
-    "llama3.3:70b",
-]
-
-# Dossier de test par défaut
-DEFAULT_DOSSIER = "183_23087212"
-
-# Seuils bio connus (ground truth pour vérification)
-BIO_GROUND_TRUTH = {
-    "Créatinine": {"valeur": 84, "norme_min": 50, "norme_max": 120, "status": "NORMAL"},
-    "Sodium": {"valeur": 140, "norme_min": 135, "norme_max": 145, "status": "NORMAL"},
-    "Potassium": {"valeur": 3.9, "norme_min": 3.5, "norme_max": 5.0, "status": "NORMAL"},
-    "Hémoglobine": {"valeur": 12.6, "norme_min": 12, "norme_max": 17, "status": "NORMAL"},
-    "Plaquettes": {"valeur": 268, "norme_min": 150, "norme_max": 400, "status": "NORMAL"},
-    "Glycémie": {"valeur": 4.8, "norme_min": 3.9, "norme_max": 5.5, "status": "NORMAL"},
-}
-
-
-def load_dossier(name: str):
-    """Charge un dossier JSON depuis output/structured/."""
-    from src.config import DossierMedical
-    base = Path(__file__).parent / "output" / "structured" / name
-    fusionne = list(base.glob("*_fusionne_cim10.json"))
-    json_files = fusionne if fusionne else sorted(base.glob("*.json"))
-    if not json_files:
-        logger.error("Aucun JSON trouvé pour %s", name)
-        return None
-    with open(json_files[0], encoding="utf-8") as f:
-        data = json.load(f)
-    return DossierMedical(**data)
-
-
-def set_model(model_name: str):
-    """Force le modèle CPAM dans la config au runtime."""
-    import src.config as cfg
-    import src.medical.ollama_client as oc
-    cfg.OLLAMA_MODELS["cpam"] = model_name
-    # Timeout adapté aux gros modèles locaux (600s = 10 min)
-    cfg.OLLAMA_TIMEOUT = 600
-    oc.OLLAMA_TIMEOUT = 600  # Propagation directe (importé par valeur)
-    logger.info("Modèle CPAM forcé → %s (timeout=600s)", model_name)
-
-
-def check_model_available(model_name: str) -> bool:
-    """Vérifie si le modèle est disponible localement dans Ollama."""
-    import requests
-    try:
-        resp = requests.get(f"{os.environ.get('OLLAMA_URL', 'http://localhost:11434')}/api/tags", timeout=5)
-        if resp.status_code == 200:
-            models = [m["name"] for m in resp.json().get("models", [])]
-            # Vérifier correspondance exacte ou avec :latest
-            for m in models:
-                if m == model_name or m == f"{model_name}:latest":
-                    return True
-                # Gérer les cas comme "gemma3:27b" qui match "gemma3:27b"
-                if model_name in m:
-                    return True
-            return False
-    except Exception:
-        return False
-
-
-def is_tim_format(result: dict) -> bool:
-    """Vérifie si le résultat est au format TIM."""
-    return isinstance(result, dict) and "moyens_defense" in result
-
-
-def check_bio_coherence(result: dict) -> list[dict]:
-    """Vérifie la cohérence bio/diagnostic dans les sorties du modèle.
-
-    Returns:
-        Liste d'erreurs trouvées avec détails.
-    """
-    errors = []
-    if not isinstance(result, dict):
-        return errors
-
-    # Sérialiser tout le résultat en texte pour chercher les erreurs
-    full_text = json.dumps(result, ensure_ascii=False).lower()
-
-    # Vérification 1: Créatinine 84 qualifiée d'anormale
-    creat_patterns = [
-        "insuffisance rénale",
-        "ira", "irc",
-        "fonction rénale altérée", "fonction rénale dégradée",
-        "créatinine élevée", "creatinine élevée",
-        "créatinine augmentée", "hypercréatininémie",
-    ]
-
-    # Chercher si créatinine 84 est associée à un diagnostic d'IR
-    if "84" in full_text and "créatinine" in full_text:
-        # Chercher dans les arguments et preuves
-        for pattern in creat_patterns:
-            if pattern in full_text:
-                errors.append({
-                    "type": "BIO_HALLUCINATION",
-                    "severity": "CRITICAL",
-                    "detail": f"Créatinine 84 µmol/L (NORMAL 50-120) qualifiée comme '{pattern}'",
-                    "ground_truth": "Créatinine 84 = NORMAL",
-                })
-                break
-
-    # Vérification 2: confrontation_bio cohérente
-    confrontation = result.get("confrontation_bio", [])
-    for entry in confrontation:
-        if not isinstance(entry, dict):
-            continue
-        verdict = str(entry.get("verdict", "")).upper()
-        test = str(entry.get("test", "")).lower()
-        valeur = entry.get("valeur")
-
-        # Vérifier contre ground truth
-        for gt_test, gt_data in BIO_GROUND_TRUTH.items():
-            if gt_test.lower() in test:
-                if gt_data["status"] == "NORMAL" and "confirmé" in verdict.lower():
-                    errors.append({
-                        "type": "CONFRONTATION_ERROR",
-                        "severity": "CRITICAL",
-                        "detail": f"{gt_test} = {gt_data['valeur']} (NORMAL) mais verdict = {verdict}",
-                        "ground_truth": f"{gt_test} norme [{gt_data['norme_min']}-{gt_data['norme_max']}]",
-                    })
-
-    # Vérification 3: codes_non_defendables
-    codes_nd = result.get("codes_non_defendables", [])
-    if isinstance(codes_nd, list):
-        # Vérifier que N17.9 (IRA) est signalé comme non défendable
-        # car créatinine 84 = NORMAL
-        nd_codes = [c.get("code", "") for c in codes_nd if isinstance(c, dict)]
-
-        # Chercher si le modèle défend N17.9 malgré bio normale
-        moyens = result.get("moyens_defense", [])
-        for m in moyens:
-            if not isinstance(m, dict):
-                continue
-            titre = str(m.get("titre", "")).upper()
-            argument = str(m.get("argument", "")).upper()
-            for code in ["N17", "N19"]:
-                if code in titre or code in argument:
-                    # Le modèle défend un code d'IR — vérifier la créatinine
-                    if code not in " ".join(nd_codes):
-                        errors.append({
-                            "type": "DEFENDS_UNDEFENDABLE",
-                            "severity": "HIGH",
-                            "detail": f"Code {code} (IRA/IR) défendu dans moyens_defense malgré créatinine 84 (NORMAL)",
-                            "ground_truth": "Créatinine 84 = NORMAL → N17/N19 non défendable sur base bio",
-                        })
-
-    return errors
-
-
-def check_code_validity(result: dict) -> list[dict]:
-    """Vérifie que les codes CIM-10 utilisés sont plausibles."""
-    import re
-    errors = []
-    if not isinstance(result, dict):
-        return errors
-
-    full_text = json.dumps(result, ensure_ascii=False)
-    # Extraire tous les codes CIM-10 mentionnés
-    codes = set(re.findall(r'\b([A-Z]\d{2}(?:\.\d{1,2})?)\b', full_text))
-
-    # Codes suspects connus
-    suspicious_codes = {
-        "Q61.9": "Maladie polykystique — probablement inventé pour Bricker fragile",
-        "Z45.80": "Code Z45.8 existe mais Z45.80 est suspect (vérifier)",
-    }
-
-    for code in codes:
-        if code in suspicious_codes:
-            errors.append({
-                "type": "SUSPICIOUS_CODE",
-                "severity": "MEDIUM",
-                "detail": f"Code {code}: {suspicious_codes[code]}",
-            })
-
-    return errors
-
-
-def evaluate_tim_structure(result: dict) -> dict:
-    """Évalue la complétude de la structure TIM."""
-    scores = {}
-
-    if not is_tim_format(result):
-        return {"format": "LEGACY", "tim_compliant": False}
-
-    scores["format"] = "TIM"
-    scores["tim_compliant"] = True
-
-    # Champs obligatoires TIM
-    required_fields = [
-        "objet", "rappel_faits", "moyens_defense", "confrontation_bio",
-        "asymetrie_information", "reponse_points_cpam", "codes_non_defendables",
-        "references", "conclusion_dispositive",
-    ]
-
-    present = []
-    missing = []
-    for field in required_fields:
-        if result.get(field):
-            present.append(field)
-        else:
-            missing.append(field)
-
-    scores["fields_present"] = len(present)
-    scores["fields_total"] = len(required_fields)
-    scores["fields_missing"] = missing
-
-    # Qualité des moyens de défense
-    moyens = result.get("moyens_defense", [])
-    scores["moyens_count"] = len(moyens)
-
-    total_preuves = 0
-    preuves_with_ref = 0
-    for m in moyens:
-        if isinstance(m, dict):
-            for p in m.get("preuves", []):
-                if isinstance(p, dict):
-                    total_preuves += 1
-                    if p.get("ref"):
-                        preuves_with_ref += 1
-
-    scores["preuves_count"] = total_preuves
-    scores["preuves_with_ref"] = preuves_with_ref
-
-    # Confrontation bio
-    confrontation = result.get("confrontation_bio", [])
-    scores["confrontation_count"] = len(confrontation) if isinstance(confrontation, list) else 0
-
-    # Codes non défendables
-    codes_nd = result.get("codes_non_defendables", [])
-    scores["codes_nd_count"] = len(codes_nd) if isinstance(codes_nd, list) else 0
-
-    # Références
-    refs = result.get("references", [])
-    scores["refs_count"] = len(refs) if isinstance(refs, list) else 0
-
-    # Conclusion dispositive
-    conclusion = result.get("conclusion_dispositive", "")
-    scores["conclusion_len"] = len(conclusion)
-    scores["has_maintien"] = "maintien" in conclusion.lower() if conclusion else False
-
-    return scores
-
-
-def run_benchmark_for_model(model_name: str, dossier_name: str) -> dict:
-    """Lance le pipeline CPAM complet pour un modèle donné."""
-    from src.control.cpam_response import generate_cpam_response
-    from src.control.cpam_validation import _is_new_tim_format
-
-    result_data = {
-        "model": model_name,
-        "dossier": dossier_name,
-        "timestamp": time.strftime("%Y-%m-%d %H:%M:%S"),
-    }
-
-    # Charger le dossier
-    dossier = load_dossier(dossier_name)
-    if not dossier:
-        result_data["error"] = "Dossier non trouvé"
-        return result_data
-
-    if not dossier.controles_cpam:
-        result_data["error"] = "Pas de contrôle CPAM"
-        return result_data
-
-    controle = dossier.controles_cpam[0]
-    result_data["ogc"] = controle.numero_ogc
-    result_data["titre"] = controle.titre
-
-    # Forcer le modèle
-    set_model(model_name)
-
-    # Lancer le pipeline complet
-    logger.info("=" * 70)
-    logger.info("BENCHMARK : %s → dossier %s", model_name, dossier_name)
-    logger.info("=" * 70)
-
-    t0 = time.time()
-    try:
-        text, parsed, rag_sources = generate_cpam_response(dossier, controle)
-        elapsed = time.time() - t0
-    except Exception as e:
-        elapsed = time.time() - t0
-        result_data["error"] = str(e)
-        result_data["elapsed_s"] = round(elapsed, 1)
-        logger.exception("Erreur pipeline pour %s", model_name)
-        return result_data
-
-    result_data["elapsed_s"] = round(elapsed, 1)
-    result_data["text_len"] = len(text)
-    result_data["rag_sources"] = len(rag_sources)
-    result_data["quality_tier"] = controle.quality_tier or "?"
-    result_data["requires_review"] = controle.requires_review
-
-    if parsed is None:
-        result_data["error"] = "LLM a retourné None"
-        result_data["json_valid"] = False
-        return result_data
-
-    result_data["json_valid"] = True
-    result_data["is_tim"] = is_tim_format(parsed)
-
-    # Évaluation structure TIM
-    tim_eval = evaluate_tim_structure(parsed)
-    result_data["tim_eval"] = tim_eval
-
-    # Vérification cohérence bio
-    bio_errors = check_bio_coherence(parsed)
-    result_data["bio_errors"] = bio_errors
-    result_data["bio_errors_count"] = len(bio_errors)
-    result_data["bio_critical_count"] = len([e for e in bio_errors if e["severity"] == "CRITICAL"])
-
-    # Vérification codes
-    code_errors = check_code_validity(parsed)
-    result_data["code_errors"] = code_errors
-    result_data["code_errors_count"] = len(code_errors)
-
-    # Sauvegarder la sortie brute
-    result_data["parsed_response"] = parsed
-    result_data["text_output"] = text[:3000]  # Tronquer pour lisibilité
-
-    return result_data
-
-
-def print_summary(results: list[dict]):
-    """Affiche un tableau résumé comparatif."""
-    print("\n" + "=" * 100)
-    print("BENCHMARK CPAM TIM — RÉSUMÉ COMPARATIF")
-    print("=" * 100)
-
-    # En-tête
-    header = (
-        f"{'Modèle':<25} {'JSON':>4} {'TIM':>4} {'Tier':>4} {'Temps':>7} "
-        f"{'Moyens':>6} {'Bio':>4} {'ND':>3} {'Refs':>4} {'Chars':>6} "
-        f"{'BioErr':>6} {'CritE':>5}"
-    )
-    print(header)
-    print("-" * 100)
-
-    for r in results:
-        if "error" in r and r.get("json_valid") is None:
-            print(f"{r['model']:<25} ERREUR: {r['error']}")
-            continue
-
-        tim_eval = r.get("tim_eval", {})
-        print(
-            f"{r['model']:<25} "
-            f"{'OK' if r.get('json_valid') else 'FAIL':>4} "
-            f"{'OK' if r.get('is_tim') else 'NO':>4} "
-            f"{r.get('quality_tier', '?'):>4} "
-            f"{r.get('elapsed_s', 0):>6.0f}s "
-            f"{tim_eval.get('moyens_count', 0):>6} "
-            f"{tim_eval.get('confrontation_count', 0):>4} "
-            f"{tim_eval.get('codes_nd_count', 0):>3} "
-            f"{tim_eval.get('refs_count', 0):>4} "
-            f"{r.get('text_len', 0):>6} "
-            f"{r.get('bio_errors_count', 0):>6} "
-            f"{r.get('bio_critical_count', 0):>5}"
-        )
-
-    # Détail des erreurs bio par modèle
-    print("\n" + "=" * 100)
-    print("DÉTAIL DES ERREURS BIOLOGIQUES")
-    print("=" * 100)
-
-    for r in results:
-        errors = r.get("bio_errors", [])
-        if not errors:
-            print(f"\n{r['model']}: ✓ Aucune erreur bio détectée")
-            continue
-
-        print(f"\n{r['model']}: ✗ {len(errors)} erreur(s)")
-        for e in errors:
-            severity_icon = "🔴" if e["severity"] == "CRITICAL" else "🟡" if e["severity"] == "HIGH" else "⚪"
-            print(f"  {severity_icon} [{e['severity']}] {e['type']}: {e['detail']}")
-            if "ground_truth" in e:
-                print(f"     Vérité terrain: {e['ground_truth']}")
-
-    # Détail codes suspects
-    print("\n" + "=" * 100)
-    print("CODES CIM-10 SUSPECTS")
-    print("=" * 100)
-
-    for r in results:
-        code_errors = r.get("code_errors", [])
-        if not code_errors:
-            print(f"\n{r['model']}: ✓ Aucun code suspect")
-            continue
-        print(f"\n{r['model']}: ✗ {len(code_errors)} code(s) suspect(s)")
-        for e in code_errors:
-            print(f"  ⚠ {e['detail']}")
-
-    # Champs TIM manquants
-    print("\n" + "=" * 100)
-    print("COMPLIANCE FORMAT TIM")
-    print("=" * 100)
-
-    for r in results:
-        tim_eval = r.get("tim_eval", {})
-        if not tim_eval:
-            print(f"\n{r['model']}: N/A")
-            continue
-
-        missing = tim_eval.get("fields_missing", [])
-        total = tim_eval.get("fields_total", 9)
-        present = tim_eval.get("fields_present", 0)
-
-        status = "✓ COMPLET" if not missing else f"✗ {present}/{total} champs"
-        print(f"\n{r['model']}: {status}")
-        if missing:
-            print(f"  Manquants: {', '.join(missing)}")
-
-        if tim_eval.get("has_maintien"):
-            print(f"  ✓ Conclusion dispositive avec demande de maintien")
-        elif tim_eval.get("conclusion_len", 0) > 0:
-            print(f"  ⚠ Conclusion présente ({tim_eval['conclusion_len']} chars) mais sans 'maintien'")
-        else:
-            print(f"  ✗ Pas de conclusion dispositive")
-
-
-def main():
-    dossier_name = sys.argv[1] if len(sys.argv) > 1 else DEFAULT_DOSSIER
-
-    # Vérifier quels modèles sont disponibles
-    available = []
-    unavailable = []
-    for model in MODELS_TO_TEST:
-        if check_model_available(model):
-            available.append(model)
-        else:
-            unavailable.append(model)
-
-    print(f"Modèles disponibles: {len(available)}/{len(MODELS_TO_TEST)}")
-    for m in available:
-        print(f"  ✓ {m}")
-    for m in unavailable:
-        print(f"  ✗ {m} (non trouvé)")
-
-    if not available:
-        print("ERREUR: Aucun modèle local disponible")
-        sys.exit(1)
-
-    print(f"\nDossier de test: {dossier_name}")
-    print(f"Début du benchmark...\n")
-
-    results = []
-    for model in available:
-        try:
-            result = run_benchmark_for_model(model, dossier_name)
-            results.append(result)
-
-            # Sauvegarder les résultats intermédiaires
-            output_path = Path(__file__).parent / "output" / "benchmark_cpam_tim.json"
-            output_path.parent.mkdir(parents=True, exist_ok=True)
-            with open(output_path, "w", encoding="utf-8") as f:
-                json.dump(results, f, ensure_ascii=False, indent=2, default=str)
-
-        except Exception as e:
-            logger.exception("Erreur fatale pour %s", model)
-            results.append({"model": model, "error": str(e)})
-
-    # Résumé comparatif
-    print_summary(results)
-
-    # Sauvegarder les résultats finaux
-    output_path = Path(__file__).parent / "output" / "benchmark_cpam_tim.json"
-    with open(output_path, "w", encoding="utf-8") as f:
-        json.dump(results, f, ensure_ascii=False, indent=2, default=str)
-    print(f"\nRésultats détaillés sauvegardés dans: {output_path}")
-
-
-if __name__ == "__main__":
-    main()
diff --git a/config/completude_rules.yaml b/config/completude_rules.yaml
new file mode 100644
index 0000000..11d06c4
--- /dev/null
+++ b/config/completude_rules.yaml
@@ -0,0 +1,437 @@
+# Règles de complétude documentaire DIM
+# Pour chaque famille diagnostique : éléments obligatoires/recommandés
+# qui doivent être présents dans le dossier pour justifier le code.
+#
+# Catégories : biologie | imagerie | document | acte | clinique
+# Importance : obligatoire | recommande
+# match_type : bio (biologie_cle.test), imagerie (imagerie.type), document (doc_types),
+#              clinique (sejour.imc/poids/taille), acte (actes_ccam)
+#
+# Seuils (optionnel) : confrontation valeur ↔ diagnostic
+#   type: below | above | range
+#   value / value_m / value_f / range_min / range_max
+#   message_ok / message_ko
+
+version: 2
+
+# --- Règles par préfixe CIM-10 ---
+diagnostics:
+
+  denutrition:
+    prefixes: ["E43", "E44", "E46"]
+    libelle_famille: "Dénutrition"
+    items:
+      - categorie: biologie
+        element: Albumine
+        match_bio: ["albumine"]
+        importance: obligatoire
+        impact_cpam: "Albumine exigée par la CPAM pour valider une dénutrition (critère ATIH)"
+        seuil:
+          code_filter: "E43"
+          type: below
+          value: 30
+          message_ok: "Albumine < 30 g/L confirme la dénutrition sévère"
+          message_ko: "Albumine ≥ 30 g/L : dénutrition sévère non confirmée biologiquement"
+      - categorie: biologie
+        element: Albumine
+        match_bio: ["albumine"]
+        importance: obligatoire
+        impact_cpam: "Albumine exigée pour dénutrition modérée"
+        seuil:
+          code_filter: "E44"
+          type: range
+          range_min: 30
+          range_max: 35
+          message_ok: "Albumine entre 30-35 g/L confirme la dénutrition modérée"
+          message_ko: "Albumine hors plage 30-35 g/L pour dénutrition modérée"
+      - categorie: clinique
+        element: IMC
+        match_clinique: imc
+        importance: obligatoire
+        impact_cpam: "IMC nécessaire pour classifier le degré de dénutrition"
+        seuil:
+          code_filter: "E43"
+          type: below
+          value: 18.5
+          message_ok: "IMC < 18.5 confirme la dénutrition sévère"
+          message_ko: "IMC ≥ 18.5 : dénutrition sévère non confirmée"
+      - categorie: clinique
+        element: IMC
+        match_clinique: imc
+        importance: obligatoire
+        impact_cpam: "IMC nécessaire pour dénutrition modérée"
+        seuil:
+          code_filter: "E44"
+          type: range
+          range_min: 18.5
+          range_max: 21
+          message_ok: "IMC entre 18.5-21 confirme la dénutrition modérée"
+          message_ko: "IMC hors plage 18.5-21 pour dénutrition modérée"
+      - categorie: biologie
+        element: Préalbumine
+        match_bio: ["prealbumine", "préalbumine", "transthyretine", "transthyrétine"]
+        importance: recommande
+        impact_cpam: "Renforce la preuve de dénutrition si albumine limite"
+
+  anemie:
+    prefixes: ["D50", "D62", "D63", "D64"]
+    libelle_famille: "Anémie"
+    items:
+      - categorie: biologie
+        element: Hémoglobine
+        match_bio: ["hemoglobine", "hémoglobine", "hb"]
+        importance: obligatoire
+        impact_cpam: "Hémoglobine indispensable pour confirmer et qualifier une anémie"
+        seuil:
+          type: below
+          value_m: 13
+          value_f: 12
+          message_ok: "Hémoglobine basse confirme l'anémie"
+          message_ko: "Hémoglobine normale : anémie non confirmée biologiquement"
+      - categorie: biologie
+        element: Ferritine
+        match_bio: ["ferritine"]
+        importance: recommande
+        impact_cpam: "Permet de typer l'anémie (carentielle vs inflammatoire)"
+      - categorie: biologie
+        element: VGM
+        match_bio: ["vgm", "volume globulaire moyen"]
+        importance: recommande
+        impact_cpam: "Oriente l'étiologie (microcytaire/macrocytaire)"
+
+  insuffisance_renale:
+    prefixes: ["N17", "N18", "N19"]
+    libelle_famille: "Insuffisance rénale"
+    items:
+      - categorie: biologie
+        element: Créatinine
+        match_bio: ["creatinine", "créatinine", "creat"]
+        importance: obligatoire
+        impact_cpam: "Créatinine obligatoire pour confirmer une insuffisance rénale"
+        seuil:
+          type: above
+          value: 120
+          message_ok: "Créatinine > 120 µmol/L confirme l'insuffisance rénale"
+          message_ko: "Créatinine ≤ 120 µmol/L : IR non confirmée biologiquement"
+      - categorie: biologie
+        element: DFG
+        match_bio: ["dfg", "clairance", "dfge", "débit de filtration"]
+        importance: recommande
+        impact_cpam: "Permet de stadifier l'IR selon KDIGO"
+      - categorie: biologie
+        element: Urée
+        match_bio: ["uree", "urée"]
+        importance: recommande
+        impact_cpam: "Élément complémentaire de la fonction rénale"
+
+  sepsis:
+    prefixes: ["A40", "A41"]
+    libelle_famille: "Sepsis / Septicémie"
+    items:
+      - categorie: biologie
+        element: CRP
+        match_bio: ["crp", "proteine c reactive", "protéine c réactive"]
+        importance: obligatoire
+        impact_cpam: "Marqueur inflammatoire essentiel pour documenter un sepsis"
+        seuil:
+          type: above
+          value: 50
+          message_ok: "CRP > 50 mg/L confirme le syndrome inflammatoire"
+          message_ko: "CRP ≤ 50 mg/L : syndrome inflammatoire non significatif"
+      - categorie: biologie
+        element: Leucocytes
+        match_bio: ["leucocytes", "gb", "globules blancs"]
+        importance: obligatoire
+        impact_cpam: "Leucocytose ou leucopénie attendue dans le sepsis"
+        seuil:
+          type: outside_range
+          range_min: 4
+          range_max: 10
+          message_ok: "Leucocytes hors norme (< 4 ou > 10 G/L) : compatible avec sepsis"
+          message_ko: "Leucocytes normaux (4-10 G/L) : sepsis non confirmé biologiquement"
+      - categorie: biologie
+        element: Procalcitonine
+        match_bio: ["procalcitonine", "pct"]
+        importance: recommande
+        impact_cpam: "Marqueur spécifique d'infection bactérienne, renforce la preuve"
+      - categorie: biologie
+        element: Hémocultures
+        match_bio: ["hemoculture", "hémoculture", "hemocultures", "hémocultures"]
+        importance: recommande
+        impact_cpam: "Documentation bactériologique du sepsis"
+
+  troubles_electrolytiques:
+    prefixes: ["E87"]
+    libelle_famille: "Troubles électrolytiques"
+    items:
+      - categorie: biologie
+        element: Sodium
+        match_bio: ["sodium", "natremie", "natrémie", "na"]
+        importance: obligatoire
+        impact_cpam: "Ionogramme obligatoire pour justifier un trouble électrolytique"
+        seuil:
+          type: below
+          value: 135
+          message_ok: "Sodium < 135 mmol/L confirme l'hyponatrémie"
+          message_ko: "Sodium ≥ 135 mmol/L : hyponatrémie non confirmée"
+      - categorie: biologie
+        element: Potassium
+        match_bio: ["potassium", "kaliemie", "kaliémie", "k"]
+        importance: obligatoire
+        impact_cpam: "Ionogramme obligatoire pour justifier un trouble électrolytique"
+        seuil:
+          type: outside_range
+          range_min: 3.5
+          range_max: 5.0
+          message_ok: "Potassium hors norme : trouble confirmé"
+          message_ko: "Potassium normal (3.5-5.0) : trouble non confirmé"
+
+  diabete:
+    prefixes: ["E10", "E11"]
+    libelle_famille: "Diabète"
+    items:
+      - categorie: biologie
+        element: HbA1c
+        match_bio: ["hba1c", "hemoglobine glyquee", "hémoglobine glyquée"]
+        importance: recommande
+        impact_cpam: "HbA1c attendue pour documenter l'équilibre glycémique"
+      - categorie: biologie
+        element: Glycémie
+        match_bio: ["glycemie", "glycémie", "glucose"]
+        importance: recommande
+        impact_cpam: "Glycémie de base pour confirmer le diagnostic"
+
+  pancreatite:
+    prefixes: ["K85"]
+    libelle_famille: "Pancréatite aiguë"
+    items:
+      - categorie: biologie
+        element: Lipasémie
+        match_bio: ["lipase", "lipasemie", "lipasémie"]
+        importance: obligatoire
+        impact_cpam: "Lipase > 3N est le critère diagnostique de référence"
+        seuil:
+          type: above
+          value: 180
+          message_ok: "Lipase > 180 UI/L (3× la normale) confirme la pancréatite"
+          message_ko: "Lipase ≤ 180 UI/L : critère diagnostique non atteint"
+      - categorie: imagerie
+        element: Scanner abdominal
+        match_imagerie: ["scanner", "tdm", "tomodensitometrie"]
+        importance: recommande
+        impact_cpam: "Scanner recommandé pour évaluer la sévérité (Balthazar)"
+
+  embolie_pulmonaire:
+    prefixes: ["I26"]
+    libelle_famille: "Embolie pulmonaire"
+    items:
+      - categorie: imagerie
+        element: Angioscanner thoracique
+        match_imagerie: ["angioscanner", "scanner", "tdm", "angiotdm"]
+        importance: obligatoire
+        impact_cpam: "Imagerie indispensable pour confirmer une EP"
+      - categorie: biologie
+        element: D-dimères
+        match_bio: ["d-dimeres", "d-dimères", "ddimeres", "d dimeres"]
+        importance: recommande
+        impact_cpam: "D-dimères utiles si négatifs pour exclure, non suffisants seuls"
+
+  tumeurs_malignes:
+    prefixes: ["C"]
+    libelle_famille: "Tumeur maligne"
+    items:
+      - categorie: document
+        element: ANAPATH
+        match_document: ["anapath", "anatomopathologie", "biopsie"]
+        importance: obligatoire
+        impact_cpam: "Compte-rendu anatomopathologique exigé pour tout code C (tumeur maligne)"
+
+  pathologies_hepatiques:
+    prefixes: ["K70", "K71", "K72", "K73", "K74", "K75", "K76", "K77"]
+    libelle_famille: "Pathologie hépatique"
+    items:
+      - categorie: biologie
+        element: ASAT
+        match_bio: ["asat", "got", "aspartate aminotransferase"]
+        importance: obligatoire
+        impact_cpam: "Bilan hépatique obligatoire pour documenter une atteinte hépatique"
+        seuil:
+          type: above
+          value: 40
+          message_ok: "ASAT > 40 UI/L confirme la cytolyse hépatique"
+          message_ko: "ASAT ≤ 40 UI/L : cytolyse non confirmée"
+      - categorie: biologie
+        element: ALAT
+        match_bio: ["alat", "gpt", "alanine aminotransferase"]
+        importance: obligatoire
+        impact_cpam: "Bilan hépatique obligatoire"
+        seuil:
+          type: above
+          value: 40
+          message_ok: "ALAT > 40 UI/L confirme la cytolyse hépatique"
+          message_ko: "ALAT ≤ 40 UI/L : cytolyse non confirmée"
+      - categorie: biologie
+        element: Bilirubine
+        match_bio: ["bilirubine", "bili"]
+        importance: recommande
+        impact_cpam: "Bilirubine renforce la documentation d'une atteinte hépatique"
+
+  obesite:
+    prefixes: ["E66"]
+    libelle_famille: "Obésité"
+    items:
+      - categorie: clinique
+        element: IMC
+        match_clinique: imc
+        importance: obligatoire
+        impact_cpam: "IMC ≥ 30 indispensable pour coder une obésité"
+        seuil:
+          type: above
+          value: 30
+          message_ok: "IMC ≥ 30 confirme l'obésité"
+          message_ko: "IMC < 30 : obésité non confirmée"
+      - categorie: clinique
+        element: Poids
+        match_clinique: poids
+        importance: obligatoire
+        impact_cpam: "Poids nécessaire pour calculer l'IMC"
+
+  insuffisance_cardiaque:
+    prefixes: ["I50"]
+    libelle_famille: "Insuffisance cardiaque"
+    items:
+      - categorie: biologie
+        element: BNP / NT-proBNP
+        match_bio: ["bnp", "nt-probnp", "ntprobnp", "pro-bnp"]
+        importance: obligatoire
+        impact_cpam: "BNP/NT-proBNP attendu pour confirmer une insuffisance cardiaque"
+        seuil:
+          type: above
+          value: 100
+          message_ok: "BNP > 100 pg/mL (ou NT-proBNP > 300) confirme l'IC"
+          message_ko: "BNP ≤ 100 pg/mL : IC non confirmée biologiquement"
+      - categorie: imagerie
+        element: Échographie cardiaque
+        match_imagerie: ["echographie cardiaque", "échocardiographie", "echo coeur", "ett", "eto"]
+        importance: recommande
+        impact_cpam: "ETT recommandée pour documenter la FEVG"
+
+  # --- 8 NOUVELLES FAMILLES ---
+
+  avc_ait:
+    prefixes: ["I60", "I61", "I62", "I63", "I64", "G45"]
+    libelle_famille: "AVC / AIT"
+    items:
+      - categorie: imagerie
+        element: Scanner/IRM cérébral
+        match_imagerie: ["scanner cerebral", "irm cerebral", "irm cérébral", "scanner cérébral", "tdm cerebral", "tdm cérébral", "irm encephalique", "irm encéphalique"]
+        importance: obligatoire
+        impact_cpam: "Imagerie cérébrale indispensable pour confirmer un AVC/AIT"
+      - categorie: biologie
+        element: ECG
+        match_bio: ["ecg", "electrocardiogramme", "électrocardiogramme"]
+        importance: recommande
+        impact_cpam: "ECG recommandé pour rechercher une cause cardioembolique"
+
+  idm:
+    prefixes: ["I21", "I22"]
+    libelle_famille: "Infarctus du myocarde"
+    items:
+      - categorie: biologie
+        element: Troponine
+        match_bio: ["troponine", "tnc", "tni", "tnt", "troponine i", "troponine t", "troponine us"]
+        importance: obligatoire
+        impact_cpam: "Troponine obligatoire pour confirmer un IDM"
+        seuil:
+          type: above
+          value: 0.04
+          message_ok: "Troponine > 0.04 confirme la nécrose myocardique"
+          message_ko: "Troponine ≤ 0.04 : IDM non confirmé biologiquement"
+      - categorie: biologie
+        element: ECG
+        match_bio: ["ecg", "electrocardiogramme", "électrocardiogramme"]
+        importance: recommande
+        impact_cpam: "ECG recommandé pour caractériser l'IDM (ST+/ST-)"
+      - categorie: imagerie
+        element: Coronarographie
+        match_imagerie: ["coronarographie", "coronaro", "coro"]
+        importance: recommande
+        impact_cpam: "Coronarographie recommandée pour documenter les lésions"
+
+  pneumopathie:
+    prefixes: ["J12", "J13", "J14", "J15", "J16", "J17", "J18"]
+    libelle_famille: "Pneumopathie"
+    items:
+      - categorie: imagerie
+        element: Radio/Scanner thoracique
+        match_imagerie: ["radio thorax", "radiographie thoracique", "scanner thoracique", "tdm thoracique", "rx thorax", "radio pulmonaire"]
+        importance: obligatoire
+        impact_cpam: "Imagerie thoracique indispensable pour confirmer une pneumopathie"
+      - categorie: biologie
+        element: CRP
+        match_bio: ["crp", "proteine c reactive", "protéine c réactive"]
+        importance: recommande
+        impact_cpam: "CRP recommandée pour documenter le syndrome inflammatoire"
+
+  tvp:
+    prefixes: ["I80"]
+    libelle_famille: "Thrombose veineuse profonde"
+    items:
+      - categorie: imagerie
+        element: Écho-doppler veineux
+        match_imagerie: ["echo-doppler", "écho-doppler", "echo doppler", "écho doppler", "doppler veineux", "echodoppler"]
+        importance: obligatoire
+        impact_cpam: "Écho-doppler veineux indispensable pour confirmer une TVP"
+
+  insuffisance_respiratoire:
+    prefixes: ["J96"]
+    libelle_famille: "Insuffisance respiratoire"
+    items:
+      - categorie: biologie
+        element: Gaz du sang
+        match_bio: ["gaz du sang", "gazometrie", "gazométrie", "gds", "pao2", "paco2"]
+        importance: obligatoire
+        impact_cpam: "Gazométrie artérielle obligatoire pour confirmer une insuffisance respiratoire"
+
+  fractures:
+    prefixes: ["S02", "S12", "S22", "S32", "S42", "S52", "S62", "S72", "S82", "S92"]
+    libelle_famille: "Fracture"
+    items:
+      - categorie: imagerie
+        element: Imagerie osseuse
+        match_imagerie: ["radio", "radiographie", "scanner", "tdm", "irm", "rx"]
+        importance: obligatoire
+        impact_cpam: "Imagerie indispensable pour confirmer une fracture"
+
+  infection_urinaire:
+    prefixes: ["N39.0"]
+    libelle_famille: "Infection urinaire"
+    items:
+      - categorie: biologie
+        element: ECBU
+        match_bio: ["ecbu", "examen cytobacteriologique", "examen cytobactériologique"]
+        importance: obligatoire
+        impact_cpam: "ECBU obligatoire pour documenter une infection urinaire"
+
+  fa_flutter:
+    prefixes: ["I48"]
+    libelle_famille: "Fibrillation auriculaire / Flutter"
+    items:
+      - categorie: biologie
+        element: ECG
+        match_bio: ["ecg", "electrocardiogramme", "électrocardiogramme"]
+        importance: obligatoire
+        impact_cpam: "ECG obligatoire pour documenter une FA/flutter"
+
+# --- Règles par préfixe CCAM (actes) ---
+actes:
+
+  chirurgie:
+    description: "Acte chirurgical nécessitant un CRO"
+    prefixes: ["H", "J", "K", "L"]
+    items:
+      - categorie: document
+        element: CRO
+        match_document: ["cro", "compte rendu operatoire", "compte-rendu opératoire"]
+        importance: obligatoire
+        impact_cpam: "Compte-rendu opératoire obligatoire pour tout acte chirurgical"
diff --git a/config/diagnostic_conflicts.yaml b/config/diagnostic_conflicts.yaml
index 1311ef5..a519202 100644
--- a/config/diagnostic_conflicts.yaml
+++ b/config/diagnostic_conflicts.yaml
@@ -26,9 +26,9 @@ mutual_exclusions:
 
 incompatibilities:
   - pair: ["E66", "E40", "E41", "E42", "E43", "E44", "E45", "E46"]
-    atih_ref: "Guide Méthodologique MCO : Incompatibilité clinique Obésité / Dénutrition"
-    message: "Obésité (E66) et Dénutrition/Malnutrition (E40-E46) sont cliniquement incompatibles"
-    severity: "HARD"
+    atih_ref: "HAS/FFN nov 2021 : un patient obèse peut être dénutri"
+    message: "Obésité et Dénutrition coexistent — vérifier critères HAS 2021 (perte de poids, sarcopénie, albumine)"
+    severity: "MEDIUM"
 
   - pair: ["I10", "I95"]
     atih_ref: "Guide Méthodologique MCO : Incohérence Hypertension / Hypotension sur le même séjour"
diff --git a/data/referentiels/05a0fa6fce4c_doc.txt b/data/referentiels/05a0fa6fce4c_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/05a0fa6fce4c_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/069835fec62e_doc.txt b/data/referentiels/069835fec62e_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/069835fec62e_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/0888d9578448_doc.txt b/data/referentiels/0888d9578448_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/0888d9578448_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/125445ca1a8c_doc.txt b/data/referentiels/125445ca1a8c_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/125445ca1a8c_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/137b40623e82_doc.txt b/data/referentiels/137b40623e82_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/137b40623e82_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/1703dd92913f_doc.txt b/data/referentiels/1703dd92913f_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/1703dd92913f_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/194272ef6cb6_doc.txt b/data/referentiels/194272ef6cb6_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/194272ef6cb6_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/1a40d11c7ce2_doc.txt b/data/referentiels/1a40d11c7ce2_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/1a40d11c7ce2_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/1d2ca361391c_doc.txt b/data/referentiels/1d2ca361391c_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/1d2ca361391c_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/1dcd51d112fa_doc.txt b/data/referentiels/1dcd51d112fa_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/1dcd51d112fa_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/2959a910a2c7_doc.txt b/data/referentiels/2959a910a2c7_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/2959a910a2c7_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/296a7659371b_doc.txt b/data/referentiels/296a7659371b_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/296a7659371b_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/2cc26c4814fa_doc.txt b/data/referentiels/2cc26c4814fa_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/2cc26c4814fa_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/34a82abfeed8_doc.txt b/data/referentiels/34a82abfeed8_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/34a82abfeed8_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/355efa6754f3_doc.txt b/data/referentiels/355efa6754f3_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/355efa6754f3_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/38db1deeb44b_doc.txt b/data/referentiels/38db1deeb44b_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/38db1deeb44b_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/3b4263ae98ed_doc.txt b/data/referentiels/3b4263ae98ed_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/3b4263ae98ed_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/3be5e4086d28_doc.txt b/data/referentiels/3be5e4086d28_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/3be5e4086d28_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/3cf652bb995b_doc.txt b/data/referentiels/3cf652bb995b_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/3cf652bb995b_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/3d4843057817_doc.txt b/data/referentiels/3d4843057817_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/3d4843057817_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/3d66e17ba0d0_doc.txt b/data/referentiels/3d66e17ba0d0_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/3d66e17ba0d0_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/40ee4a3989a8_doc.txt b/data/referentiels/40ee4a3989a8_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/40ee4a3989a8_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/4482c0366139_doc.txt b/data/referentiels/4482c0366139_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/4482c0366139_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/494f0cbfc6c9_doc.txt b/data/referentiels/494f0cbfc6c9_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/494f0cbfc6c9_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/4cbf5a2f32e9_doc.txt b/data/referentiels/4cbf5a2f32e9_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/4cbf5a2f32e9_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/4cd7ef13d52b_doc.txt b/data/referentiels/4cd7ef13d52b_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/4cd7ef13d52b_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/54e1b1dd4a67_doc.txt b/data/referentiels/54e1b1dd4a67_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/54e1b1dd4a67_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/56f212d01d3b_doc.txt b/data/referentiels/56f212d01d3b_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/56f212d01d3b_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/5730828b446e_doc.txt b/data/referentiels/5730828b446e_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/5730828b446e_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/58861d936da0_doc.txt b/data/referentiels/58861d936da0_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/58861d936da0_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/58c9917aadc8_doc.txt b/data/referentiels/58c9917aadc8_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/58c9917aadc8_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/5bf7f469fb6e_doc.txt b/data/referentiels/5bf7f469fb6e_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/5bf7f469fb6e_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/5cb62535997e_doc.txt b/data/referentiels/5cb62535997e_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/5cb62535997e_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/5d8a689f1382_doc.txt b/data/referentiels/5d8a689f1382_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/5d8a689f1382_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/6399e1eb44f6_doc.txt b/data/referentiels/6399e1eb44f6_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/6399e1eb44f6_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/64fc5d4c3823_doc.txt b/data/referentiels/64fc5d4c3823_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/64fc5d4c3823_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/66d2a8635226_doc.txt b/data/referentiels/66d2a8635226_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/66d2a8635226_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/672069a8f736_doc.txt b/data/referentiels/672069a8f736_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/672069a8f736_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/6722da4cf32d_doc.txt b/data/referentiels/6722da4cf32d_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/6722da4cf32d_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/6bfb8994f705_doc.txt b/data/referentiels/6bfb8994f705_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/6bfb8994f705_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/729f6ee656dd_doc.txt b/data/referentiels/729f6ee656dd_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/729f6ee656dd_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/7301f806827c_doc.txt b/data/referentiels/7301f806827c_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/7301f806827c_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/76e115a64038_doc.txt b/data/referentiels/76e115a64038_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/76e115a64038_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/7a4733e0d5e4_doc.txt b/data/referentiels/7a4733e0d5e4_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/7a4733e0d5e4_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/8cb453139f03_doc.txt b/data/referentiels/8cb453139f03_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/8cb453139f03_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/8d328f086dca_doc.txt b/data/referentiels/8d328f086dca_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/8d328f086dca_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/8f013169f274_doc.txt b/data/referentiels/8f013169f274_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/8f013169f274_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/92678916f30a_doc.txt b/data/referentiels/92678916f30a_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/92678916f30a_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/95ff88932e4b_doc.txt b/data/referentiels/95ff88932e4b_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/95ff88932e4b_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/9868a897db14_doc.txt b/data/referentiels/9868a897db14_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/9868a897db14_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/99b5655320a3_doc.txt b/data/referentiels/99b5655320a3_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/99b5655320a3_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/9a744b5be9d9_doc.txt b/data/referentiels/9a744b5be9d9_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/9a744b5be9d9_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/9acdc87d76eb_doc.txt b/data/referentiels/9acdc87d76eb_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/9acdc87d76eb_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/9d7b10eb80ae_doc.txt b/data/referentiels/9d7b10eb80ae_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/9d7b10eb80ae_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/a2085a755e76_doc.txt b/data/referentiels/a2085a755e76_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/a2085a755e76_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/a7890918b179_doc.txt b/data/referentiels/a7890918b179_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/a7890918b179_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/aa47e9df4c87_doc.txt b/data/referentiels/aa47e9df4c87_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/aa47e9df4c87_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/acdc545f7084_doc.txt b/data/referentiels/acdc545f7084_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/acdc545f7084_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/af465fd5f46c_doc.txt b/data/referentiels/af465fd5f46c_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/af465fd5f46c_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/b91b3d1137ea_doc.txt b/data/referentiels/b91b3d1137ea_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/b91b3d1137ea_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/b99eab98827b_doc.txt b/data/referentiels/b99eab98827b_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/b99eab98827b_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/baad196b3922_doc.txt b/data/referentiels/baad196b3922_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/baad196b3922_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/c23aaacb2500_doc.txt b/data/referentiels/c23aaacb2500_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/c23aaacb2500_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/c2416aa58551_doc.txt b/data/referentiels/c2416aa58551_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/c2416aa58551_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/c374b1367f9b_doc.txt b/data/referentiels/c374b1367f9b_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/c374b1367f9b_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/c727c72f961f_doc.txt b/data/referentiels/c727c72f961f_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/c727c72f961f_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/ceb092e53be9_doc.txt b/data/referentiels/ceb092e53be9_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/ceb092e53be9_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/d730316cc3c9_doc.txt b/data/referentiels/d730316cc3c9_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/d730316cc3c9_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/d90325a71d7f_doc.txt b/data/referentiels/d90325a71d7f_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/d90325a71d7f_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/de4ddff34d9d_doc.txt b/data/referentiels/de4ddff34d9d_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/de4ddff34d9d_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/ccam_dict.json b/data/referentiels/dicts/ccam_dict.json
similarity index 100%
rename from data/ccam_dict.json
rename to data/referentiels/dicts/ccam_dict.json
diff --git a/data/cim10_dict.json b/data/referentiels/dicts/cim10_dict.json
similarity index 100%
rename from data/cim10_dict.json
rename to data/referentiels/dicts/cim10_dict.json
diff --git a/data/cim10_supplements.json b/data/referentiels/dicts/cim10_supplements.json
similarity index 100%
rename from data/cim10_supplements.json
rename to data/referentiels/dicts/cim10_supplements.json
diff --git a/data/referentiels/e05e34fcbd72_doc.txt b/data/referentiels/e05e34fcbd72_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/e05e34fcbd72_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/e1c432b8205c_doc.txt b/data/referentiels/e1c432b8205c_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/e1c432b8205c_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/e7d7bc0d6442_doc.txt b/data/referentiels/e7d7bc0d6442_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/e7d7bc0d6442_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/eb0097daee70_doc.txt b/data/referentiels/eb0097daee70_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/eb0097daee70_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/ed2f9419f888_doc.txt b/data/referentiels/ed2f9419f888_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/ed2f9419f888_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/ed9b09aa85d1_doc.txt b/data/referentiels/ed9b09aa85d1_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/ed9b09aa85d1_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/f0f535fff6dd_doc.txt b/data/referentiels/f0f535fff6dd_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/f0f535fff6dd_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/f8df0a0c88ae_doc.txt b/data/referentiels/f8df0a0c88ae_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/f8df0a0c88ae_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/fafe9322c8b6_doc.txt b/data/referentiels/fafe9322c8b6_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/fafe9322c8b6_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/fd9ce3d5ab4a_doc.txt b/data/referentiels/fd9ce3d5ab4a_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/fd9ce3d5ab4a_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/fdca908e8386_doc.txt b/data/referentiels/fdca908e8386_doc.txt
deleted file mode 100644
index 08cf610..0000000
--- a/data/referentiels/fdca908e8386_doc.txt
+++ /dev/null
@@ -1 +0,0 @@
-test content
\ No newline at end of file
diff --git a/data/referentiels/index.json b/data/referentiels/index.json
deleted file mode 100644
index 719ace8..0000000
--- a/data/referentiels/index.json
+++ /dev/null
@@ -1,962 +0,0 @@
-[
-  {
-    "id": "ac8013d3cc19",
-    "filename": "cocoa_2025.pdf",
-    "stored_name": "ac8013d3cc19_cocoa_2025.pdf",
-    "extension": ".pdf",
-    "size_bytes": 10957912,
-    "date_added": "2026-02-13T18:49:21.460420",
-    "status": "indexed",
-    "chunks_count": 1451
-  },
-  {
-    "id": "74a91bddbbc5",
-    "filename": "Annexe-4_Diagnostics_classes_CMA_V11e_1.pdf",
-    "stored_name": "74a91bddbbc5_Annexe-4_Diagnostics_classes_CMA_V11e_1.pdf",
-    "extension": ".pdf",
-    "size_bytes": 2628897,
-    "date_added": "2026-02-13T18:56:50.591977",
-    "status": "indexed",
-    "chunks_count": 119
-  },
-  {
-    "id": "a41d8e848d83",
-    "filename": "Arbre_decision_GHM_V11e.pdf",
-    "stored_name": "a41d8e848d83_Arbre_decision_GHM_V11e.pdf",
-    "extension": ".pdf",
-    "size_bytes": 865310,
-    "date_added": "2026-02-13T18:57:38.442496",
-    "status": "indexed",
-    "chunks_count": 39
-  },
-  {
-    "id": "eac6ef00d4b1",
-    "filename": "Fascicule_01_Generalites.pdf",
-    "stored_name": "eac6ef00d4b1_Fascicule_01_Generalites.pdf",
-    "extension": ".pdf",
-    "size_bytes": 227388,
-    "date_added": "2026-02-13T18:57:57.012085",
-    "status": "indexed",
-    "chunks_count": 15
-  },
-  {
-    "id": "98796a23a254",
-    "filename": "Fascicule_02_Maladies_digestives.pdf",
-    "stored_name": "98796a23a254_Fascicule_02_Maladies_digestives.pdf",
-    "extension": ".pdf",
-    "size_bytes": 1997744,
-    "date_added": "2026-02-13T18:58:00.128820",
-    "status": "indexed",
-    "chunks_count": 11
-  },
-  {
-    "id": "d84f93e576e2",
-    "filename": "Fascicule_03_Tumeurs.pdf",
-    "stored_name": "d84f93e576e2_Fascicule_03_Tumeurs.pdf",
-    "extension": ".pdf",
-    "size_bytes": 190486,
-    "date_added": "2026-02-13T18:58:02.888607",
-    "status": "indexed",
-    "chunks_count": 8
-  },
-  {
-    "id": "b7fc87c608fb",
-    "filename": "Fascicule_04_Metabolisme.pdf",
-    "stored_name": "b7fc87c608fb_Fascicule_04_Metabolisme.pdf",
-    "extension": ".pdf",
-    "size_bytes": 215837,
-    "date_added": "2026-02-13T18:58:04.955721",
-    "status": "indexed",
-    "chunks_count": 9
-  },
-  {
-    "id": "d684a79fbe67",
-    "filename": "Fascicule_05_Gyneco_Obstetrique.pdf",
-    "stored_name": "d684a79fbe67_Fascicule_05_Gyneco_Obstetrique.pdf",
-    "extension": ".pdf",
-    "size_bytes": 202202,
-    "date_added": "2026-02-13T18:58:07.846589",
-    "status": "indexed",
-    "chunks_count": 13
-  },
-  {
-    "id": "4104b8e4fd8a",
-    "filename": "Fascicule_06_Neonatalogie.pdf",
-    "stored_name": "4104b8e4fd8a_Fascicule_06_Neonatalogie.pdf",
-    "extension": ".pdf",
-    "size_bytes": 210932,
-    "date_added": "2026-02-13T18:58:11.260714",
-    "status": "indexed",
-    "chunks_count": 3
-  },
-  {
-    "id": "0abf0d45e8a1",
-    "filename": "Fascicule_07_Evolutions_2010.pdf",
-    "stored_name": "0abf0d45e8a1_Fascicule_07_Evolutions_2010.pdf",
-    "extension": ".pdf",
-    "size_bytes": 186738,
-    "date_added": "2026-02-13T18:58:14.876505",
-    "status": "indexed",
-    "chunks_count": 8
-  },
-  {
-    "id": "9263bc2f01a3",
-    "filename": "Fascicule_08_Maladies_infectieuses.pdf",
-    "stored_name": "9263bc2f01a3_Fascicule_08_Maladies_infectieuses.pdf",
-    "extension": ".pdf",
-    "size_bytes": 350016,
-    "date_added": "2026-02-13T18:58:16.917217",
-    "status": "indexed",
-    "chunks_count": 13
-  },
-  {
-    "id": "f2ad7f16b33c",
-    "filename": "Fascicule_09_AVC.pdf",
-    "stored_name": "f2ad7f16b33c_Fascicule_09_AVC.pdf",
-    "extension": ".pdf",
-    "size_bytes": 232964,
-    "date_added": "2026-02-13T18:58:20.531239",
-    "status": "indexed",
-    "chunks_count": 12
-  },
-  {
-    "id": "c3d95a59830d",
-    "filename": "Fascicule_10_SCA_Coronariens.pdf",
-    "stored_name": "c3d95a59830d_Fascicule_10_SCA_Coronariens.pdf",
-    "extension": ".pdf",
-    "size_bytes": 1154051,
-    "date_added": "2026-02-13T18:58:23.595682",
-    "status": "indexed",
-    "chunks_count": 14
-  },
-  {
-    "id": "e3f9b22577e9",
-    "filename": "Instruction_DGOS_controle_T2A_2025.pdf",
-    "stored_name": "e3f9b22577e9_Instruction_DGOS_controle_T2A_2025.pdf",
-    "extension": ".pdf",
-    "size_bytes": 183370,
-    "date_added": "2026-02-13T18:58:27.824485",
-    "status": "indexed",
-    "chunks_count": 6
-  },
-  {
-    "id": "ec634b8c41b7",
-    "filename": "Racines_GHM_V11e.pdf",
-    "stored_name": "ec634b8c41b7_Racines_GHM_V11e.pdf",
-    "extension": ".pdf",
-    "size_bytes": 1038277,
-    "date_added": "2026-02-13T18:58:29.172516",
-    "status": "indexed",
-    "chunks_count": 28
-  },
-  {
-    "id": "3d66e17ba0d0",
-    "filename": "doc.txt",
-    "stored_name": "3d66e17ba0d0_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-13T19:19:27.599390",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "aa47e9df4c87",
-    "filename": "doc.txt",
-    "stored_name": "aa47e9df4c87_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-15T09:32:01.870981",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "76e115a64038",
-    "filename": "doc.txt",
-    "stored_name": "76e115a64038_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-15T11:01:08.160353",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "4482c0366139",
-    "filename": "doc.txt",
-    "stored_name": "4482c0366139_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-15T11:16:42.415804",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "2cc26c4814fa",
-    "filename": "doc.txt",
-    "stored_name": "2cc26c4814fa_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-15T11:34:08.451232",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "64fc5d4c3823",
-    "filename": "doc.txt",
-    "stored_name": "64fc5d4c3823_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-16T09:06:21.240083",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "acdc545f7084",
-    "filename": "doc.txt",
-    "stored_name": "acdc545f7084_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-16T09:22:08.212507",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "ed9b09aa85d1",
-    "filename": "doc.txt",
-    "stored_name": "ed9b09aa85d1_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-16T10:00:36.048389",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "40ee4a3989a8",
-    "filename": "doc.txt",
-    "stored_name": "40ee4a3989a8_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-16T16:13:58.459392",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "b91b3d1137ea",
-    "filename": "doc.txt",
-    "stored_name": "b91b3d1137ea_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-16T18:05:10.123359",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "4cbf5a2f32e9",
-    "filename": "doc.txt",
-    "stored_name": "4cbf5a2f32e9_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-17T15:35:18.585381",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "e1c432b8205c",
-    "filename": "doc.txt",
-    "stored_name": "e1c432b8205c_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-17T15:38:12.028798",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "5d8a689f1382",
-    "filename": "doc.txt",
-    "stored_name": "5d8a689f1382_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-17T17:50:27.245228",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "56f212d01d3b",
-    "filename": "doc.txt",
-    "stored_name": "56f212d01d3b_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-17T20:45:27.099123",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "8f013169f274",
-    "filename": "doc.txt",
-    "stored_name": "8f013169f274_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-17T21:38:16.120598",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "1703dd92913f",
-    "filename": "doc.txt",
-    "stored_name": "1703dd92913f_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-17T21:38:38.344136",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "54e1b1dd4a67",
-    "filename": "doc.txt",
-    "stored_name": "54e1b1dd4a67_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-17T22:38:56.083967",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "34a82abfeed8",
-    "filename": "doc.txt",
-    "stored_name": "34a82abfeed8_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-17T23:06:34.960186",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "c2416aa58551",
-    "filename": "doc.txt",
-    "stored_name": "c2416aa58551_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-18T01:14:46.112702",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "1d2ca361391c",
-    "filename": "doc.txt",
-    "stored_name": "1d2ca361391c_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-18T01:33:22.494456",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "d90325a71d7f",
-    "filename": "doc.txt",
-    "stored_name": "d90325a71d7f_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-18T16:14:48.107850",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "069835fec62e",
-    "filename": "doc.txt",
-    "stored_name": "069835fec62e_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-18T16:59:24.203902",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "fdca908e8386",
-    "filename": "doc.txt",
-    "stored_name": "fdca908e8386_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-18T17:09:19.975724",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "1a40d11c7ce2",
-    "filename": "doc.txt",
-    "stored_name": "1a40d11c7ce2_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-18T17:16:38.902039",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "c23aaacb2500",
-    "filename": "doc.txt",
-    "stored_name": "c23aaacb2500_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-18T17:47:58.846313",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "194272ef6cb6",
-    "filename": "doc.txt",
-    "stored_name": "194272ef6cb6_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-18T18:12:01.478708",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "ceb092e53be9",
-    "filename": "doc.txt",
-    "stored_name": "ceb092e53be9_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-18T19:07:00.583443",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "7a4733e0d5e4",
-    "filename": "doc.txt",
-    "stored_name": "7a4733e0d5e4_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-18T20:08:57.513991",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "137b40623e82",
-    "filename": "doc.txt",
-    "stored_name": "137b40623e82_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-18T20:52:56.476132",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "ed2f9419f888",
-    "filename": "doc.txt",
-    "stored_name": "ed2f9419f888_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-18T20:56:16.490848",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "8cb453139f03",
-    "filename": "doc.txt",
-    "stored_name": "8cb453139f03_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-18T22:02:43.776660",
-    "status": "empty",
-    "chunks_count": 0
-  },
-  {
-    "id": "99b5655320a3",
-    "filename": "doc.txt",
-    "stored_name": "99b5655320a3_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-19T21:49:41.866454",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "1dcd51d112fa",
-    "filename": "doc.txt",
-    "stored_name": "1dcd51d112fa_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-19T21:55:50.222804",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "f0f535fff6dd",
-    "filename": "doc.txt",
-    "stored_name": "f0f535fff6dd_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T00:32:36.876520",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "95ff88932e4b",
-    "filename": "doc.txt",
-    "stored_name": "95ff88932e4b_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T00:37:19.557847",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "c374b1367f9b",
-    "filename": "doc.txt",
-    "stored_name": "c374b1367f9b_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T00:54:58.766985",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "3d4843057817",
-    "filename": "doc.txt",
-    "stored_name": "3d4843057817_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T07:53:19.319030",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "a7890918b179",
-    "filename": "doc.txt",
-    "stored_name": "a7890918b179_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T08:34:04.709457",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "2959a910a2c7",
-    "filename": "doc.txt",
-    "stored_name": "2959a910a2c7_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T08:58:43.251311",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "6bfb8994f705",
-    "filename": "doc.txt",
-    "stored_name": "6bfb8994f705_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T09:41:44.435821",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "af465fd5f46c",
-    "filename": "doc.txt",
-    "stored_name": "af465fd5f46c_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T09:49:12.702389",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "9acdc87d76eb",
-    "filename": "doc.txt",
-    "stored_name": "9acdc87d76eb_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T10:05:41.099435",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "fd9ce3d5ab4a",
-    "filename": "doc.txt",
-    "stored_name": "fd9ce3d5ab4a_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T10:13:19.388621",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "d730316cc3c9",
-    "filename": "doc.txt",
-    "stored_name": "d730316cc3c9_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T11:00:27.449271",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "729f6ee656dd",
-    "filename": "doc.txt",
-    "stored_name": "729f6ee656dd_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T13:05:32.351072",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "5cb62535997e",
-    "filename": "doc.txt",
-    "stored_name": "5cb62535997e_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T13:09:17.380478",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "e05e34fcbd72",
-    "filename": "doc.txt",
-    "stored_name": "e05e34fcbd72_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T13:25:48.234786",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "3be5e4086d28",
-    "filename": "doc.txt",
-    "stored_name": "3be5e4086d28_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T13:28:18.714479",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "05a0fa6fce4c",
-    "filename": "doc.txt",
-    "stored_name": "05a0fa6fce4c_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T13:30:49.983388",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "355efa6754f3",
-    "filename": "doc.txt",
-    "stored_name": "355efa6754f3_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T13:33:19.957742",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "296a7659371b",
-    "filename": "doc.txt",
-    "stored_name": "296a7659371b_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T13:54:25.789025",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "a2085a755e76",
-    "filename": "doc.txt",
-    "stored_name": "a2085a755e76_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T15:18:26.416055",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "0888d9578448",
-    "filename": "doc.txt",
-    "stored_name": "0888d9578448_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-20T15:36:22.929880",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "9868a897db14",
-    "filename": "doc.txt",
-    "stored_name": "9868a897db14_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-23T10:52:01.419915",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "92678916f30a",
-    "filename": "doc.txt",
-    "stored_name": "92678916f30a_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-23T11:58:45.783806",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "672069a8f736",
-    "filename": "doc.txt",
-    "stored_name": "672069a8f736_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T00:57:54.123633",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "58c9917aadc8",
-    "filename": "doc.txt",
-    "stored_name": "58c9917aadc8_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T01:28:00.491272",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "c727c72f961f",
-    "filename": "doc.txt",
-    "stored_name": "c727c72f961f_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T01:32:52.129247",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "eb0097daee70",
-    "filename": "doc.txt",
-    "stored_name": "eb0097daee70_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T09:08:38.795651",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "3cf652bb995b",
-    "filename": "doc.txt",
-    "stored_name": "3cf652bb995b_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T09:48:18.303211",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "baad196b3922",
-    "filename": "doc.txt",
-    "stored_name": "baad196b3922_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T11:23:58.954922",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "fafe9322c8b6",
-    "filename": "doc.txt",
-    "stored_name": "fafe9322c8b6_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T11:44:19.935971",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "125445ca1a8c",
-    "filename": "doc.txt",
-    "stored_name": "125445ca1a8c_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T12:10:28.989034",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "4cd7ef13d52b",
-    "filename": "doc.txt",
-    "stored_name": "4cd7ef13d52b_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T12:17:00.137647",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "9d7b10eb80ae",
-    "filename": "doc.txt",
-    "stored_name": "9d7b10eb80ae_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T12:20:52.693361",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "66d2a8635226",
-    "filename": "doc.txt",
-    "stored_name": "66d2a8635226_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T12:23:23.223763",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "3b4263ae98ed",
-    "filename": "doc.txt",
-    "stored_name": "3b4263ae98ed_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T12:25:52.874338",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "494f0cbfc6c9",
-    "filename": "doc.txt",
-    "stored_name": "494f0cbfc6c9_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T12:28:23.446703",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "6722da4cf32d",
-    "filename": "doc.txt",
-    "stored_name": "6722da4cf32d_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T12:30:52.978054",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "e7d7bc0d6442",
-    "filename": "doc.txt",
-    "stored_name": "e7d7bc0d6442_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T12:33:24.030133",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "38db1deeb44b",
-    "filename": "doc.txt",
-    "stored_name": "38db1deeb44b_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T12:36:50.360844",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "b99eab98827b",
-    "filename": "doc.txt",
-    "stored_name": "b99eab98827b_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T13:13:46.029012",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "58861d936da0",
-    "filename": "doc.txt",
-    "stored_name": "58861d936da0_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T13:33:03.652242",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "8d328f086dca",
-    "filename": "doc.txt",
-    "stored_name": "8d328f086dca_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T14:04:15.520073",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "5bf7f469fb6e",
-    "filename": "doc.txt",
-    "stored_name": "5bf7f469fb6e_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T14:24:17.970507",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "f8df0a0c88ae",
-    "filename": "doc.txt",
-    "stored_name": "f8df0a0c88ae_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T14:29:08.330734",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "6399e1eb44f6",
-    "filename": "doc.txt",
-    "stored_name": "6399e1eb44f6_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T17:43:59.407587",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "de4ddff34d9d",
-    "filename": "doc.txt",
-    "stored_name": "de4ddff34d9d_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-24T17:48:19.167531",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "7301f806827c",
-    "filename": "doc.txt",
-    "stored_name": "7301f806827c_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-02-25T13:55:10.377377",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "9a744b5be9d9",
-    "filename": "doc.txt",
-    "stored_name": "9a744b5be9d9_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-03-04T10:47:16.045845",
-    "status": "uploaded",
-    "chunks_count": 0
-  },
-  {
-    "id": "5730828b446e",
-    "filename": "doc.txt",
-    "stored_name": "5730828b446e_doc.txt",
-    "extension": ".txt",
-    "size_bytes": 12,
-    "date_added": "2026-03-04T10:49:41.399210",
-    "status": "uploaded",
-    "chunks_count": 0
-  }
-]
\ No newline at end of file
diff --git a/data/referentiels/user/index.json b/data/referentiels/user/index.json
new file mode 100644
index 0000000..19333ac
--- /dev/null
+++ b/data/referentiels/user/index.json
@@ -0,0 +1,302 @@
+[
+  {
+    "id": "ac8013d3cc19",
+    "filename": "cocoa_2025.pdf",
+    "stored_name": "pdfs/cocoa_2025.pdf",
+    "extension": ".pdf",
+    "size_bytes": 10957912,
+    "date_added": "2026-02-13T18:49:21.460420",
+    "status": "indexed",
+    "chunks_count": 1451
+  },
+  {
+    "id": "74a91bddbbc5",
+    "filename": "Annexe-4_Diagnostics_classes_CMA_V11e_1.pdf",
+    "stored_name": "pdfs/Annexe-4_Diagnostics_classes_CMA_V11e_1.pdf",
+    "extension": ".pdf",
+    "size_bytes": 2628897,
+    "date_added": "2026-02-13T18:56:50.591977",
+    "status": "indexed",
+    "chunks_count": 119
+  },
+  {
+    "id": "a41d8e848d83",
+    "filename": "Arbre_decision_GHM_V11e.pdf",
+    "stored_name": "pdfs/Arbre_decision_GHM_V11e.pdf",
+    "extension": ".pdf",
+    "size_bytes": 865310,
+    "date_added": "2026-02-13T18:57:38.442496",
+    "status": "indexed",
+    "chunks_count": 39
+  },
+  {
+    "id": "eac6ef00d4b1",
+    "filename": "Fascicule_01_Generalites.pdf",
+    "stored_name": "pdfs/Fascicule_01_Generalites.pdf",
+    "extension": ".pdf",
+    "size_bytes": 227388,
+    "date_added": "2026-02-13T18:57:57.012085",
+    "status": "indexed",
+    "chunks_count": 15
+  },
+  {
+    "id": "98796a23a254",
+    "filename": "Fascicule_02_Maladies_digestives.pdf",
+    "stored_name": "pdfs/Fascicule_02_Maladies_digestives.pdf",
+    "extension": ".pdf",
+    "size_bytes": 1997744,
+    "date_added": "2026-02-13T18:58:00.128820",
+    "status": "indexed",
+    "chunks_count": 11
+  },
+  {
+    "id": "d84f93e576e2",
+    "filename": "Fascicule_03_Tumeurs.pdf",
+    "stored_name": "pdfs/Fascicule_03_Tumeurs.pdf",
+    "extension": ".pdf",
+    "size_bytes": 190486,
+    "date_added": "2026-02-13T18:58:02.888607",
+    "status": "indexed",
+    "chunks_count": 8
+  },
+  {
+    "id": "b7fc87c608fb",
+    "filename": "Fascicule_04_Metabolisme.pdf",
+    "stored_name": "pdfs/Fascicule_04_Metabolisme.pdf",
+    "extension": ".pdf",
+    "size_bytes": 215837,
+    "date_added": "2026-02-13T18:58:04.955721",
+    "status": "indexed",
+    "chunks_count": 9
+  },
+  {
+    "id": "d684a79fbe67",
+    "filename": "Fascicule_05_Gyneco_Obstetrique.pdf",
+    "stored_name": "pdfs/Fascicule_05_Gyneco_Obstetrique.pdf",
+    "extension": ".pdf",
+    "size_bytes": 202202,
+    "date_added": "2026-02-13T18:58:07.846589",
+    "status": "indexed",
+    "chunks_count": 13
+  },
+  {
+    "id": "4104b8e4fd8a",
+    "filename": "Fascicule_06_Neonatalogie.pdf",
+    "stored_name": "pdfs/Fascicule_06_Neonatalogie.pdf",
+    "extension": ".pdf",
+    "size_bytes": 210932,
+    "date_added": "2026-02-13T18:58:11.260714",
+    "status": "indexed",
+    "chunks_count": 3
+  },
+  {
+    "id": "0abf0d45e8a1",
+    "filename": "Fascicule_07_Evolutions_2010.pdf",
+    "stored_name": "pdfs/Fascicule_07_Evolutions_2010.pdf",
+    "extension": ".pdf",
+    "size_bytes": 186738,
+    "date_added": "2026-02-13T18:58:14.876505",
+    "status": "indexed",
+    "chunks_count": 8
+  },
+  {
+    "id": "9263bc2f01a3",
+    "filename": "Fascicule_08_Maladies_infectieuses.pdf",
+    "stored_name": "pdfs/Fascicule_08_Maladies_infectieuses.pdf",
+    "extension": ".pdf",
+    "size_bytes": 350016,
+    "date_added": "2026-02-13T18:58:16.917217",
+    "status": "indexed",
+    "chunks_count": 13
+  },
+  {
+    "id": "f2ad7f16b33c",
+    "filename": "Fascicule_09_AVC.pdf",
+    "stored_name": "pdfs/Fascicule_09_AVC.pdf",
+    "extension": ".pdf",
+    "size_bytes": 232964,
+    "date_added": "2026-02-13T18:58:20.531239",
+    "status": "indexed",
+    "chunks_count": 12
+  },
+  {
+    "id": "c3d95a59830d",
+    "filename": "Fascicule_10_SCA_Coronariens.pdf",
+    "stored_name": "pdfs/Fascicule_10_SCA_Coronariens.pdf",
+    "extension": ".pdf",
+    "size_bytes": 1154051,
+    "date_added": "2026-02-13T18:58:23.595682",
+    "status": "indexed",
+    "chunks_count": 14
+  },
+  {
+    "id": "e3f9b22577e9",
+    "filename": "Instruction_DGOS_controle_T2A_2025.pdf",
+    "stored_name": "pdfs/Instruction_DGOS_controle_T2A_2025.pdf",
+    "extension": ".pdf",
+    "size_bytes": 183370,
+    "date_added": "2026-02-13T18:58:27.824485",
+    "status": "indexed",
+    "chunks_count": 6
+  },
+  {
+    "id": "ec634b8c41b7",
+    "filename": "Racines_GHM_V11e.pdf",
+    "stored_name": "pdfs/Racines_GHM_V11e.pdf",
+    "extension": ".pdf",
+    "size_bytes": 1038277,
+    "date_added": "2026-02-13T18:58:29.172516",
+    "status": "indexed",
+    "chunks_count": 28
+  },
+  {
+    "id": "8d141123df27",
+    "filename": "CIM10_Annexe6_Codes_Etendus.pdf",
+    "stored_name": "pdfs/CIM10_Annexe6_Codes_Etendus.pdf",
+    "extension": ".pdf",
+    "size_bytes": 617770,
+    "date_added": "2026-03-07T15:28:28.027628",
+    "status": "indexed",
+    "chunks_count": 20
+  },
+  {
+    "id": "fb17b67c2def",
+    "filename": "Consignes_Maladies_infectieuses_Sepsis_2023.pdf",
+    "stored_name": "pdfs/Consignes_Maladies_infectieuses_Sepsis_2023.pdf",
+    "extension": ".pdf",
+    "size_bytes": 350016,
+    "date_added": "2026-03-07T15:28:28.086201",
+    "status": "indexed",
+    "chunks_count": 13
+  },
+  {
+    "id": "dc7433384451",
+    "filename": "Guide_Auditabilite_Recettes_T2A_MCO_DGOS.pdf",
+    "stored_name": "pdfs/Guide_Auditabilite_Recettes_T2A_MCO_DGOS.pdf",
+    "extension": ".pdf",
+    "size_bytes": 518327,
+    "date_added": "2026-03-07T15:28:28.095581",
+    "status": "indexed",
+    "chunks_count": 22
+  },
+  {
+    "id": "641736ac58d3",
+    "filename": "Guide_Controle_Externe_T2A_MCO_2018.pdf",
+    "stored_name": "pdfs/Guide_Controle_Externe_T2A_MCO_2018.pdf",
+    "extension": ".pdf",
+    "size_bytes": 1396760,
+    "date_added": "2026-03-07T15:28:28.102021",
+    "status": "indexed",
+    "chunks_count": 85
+  },
+  {
+    "id": "69e3549934f7",
+    "filename": "Manuel_GHM_V2025_Vol1.pdf",
+    "stored_name": "pdfs/Manuel_GHM_V2025_Vol1.pdf",
+    "extension": ".pdf",
+    "size_bytes": 2585227,
+    "date_added": "2026-03-07T15:28:28.129026",
+    "status": "indexed",
+    "chunks_count": 197
+  },
+  {
+    "id": "a1bf62b5ab59",
+    "filename": "Modifications_CIM10_2025.pdf",
+    "stored_name": "pdfs/Modifications_CIM10_2025.pdf",
+    "extension": ".pdf",
+    "size_bytes": 148331,
+    "date_added": "2026-03-07T15:28:28.160163",
+    "status": "indexed",
+    "chunks_count": 1
+  },
+  {
+    "id": "2b5d80882f11",
+    "filename": "Notice_Technique_PMSI_2025_Complement.pdf",
+    "stored_name": "pdfs/Notice_Technique_PMSI_2025_Complement.pdf",
+    "extension": ".pdf",
+    "size_bytes": 809283,
+    "date_added": "2026-03-07T15:28:28.166667",
+    "status": "indexed",
+    "chunks_count": 33
+  },
+  {
+    "id": "4711362e73e0",
+    "filename": "Notice_Technique_PMSI_2026.pdf",
+    "stored_name": "pdfs/Notice_Technique_PMSI_2026.pdf",
+    "extension": ".pdf",
+    "size_bytes": 500882,
+    "date_added": "2026-03-07T15:28:28.179923",
+    "status": "indexed",
+    "chunks_count": 25
+  },
+  {
+    "id": "c4b9e698487f",
+    "filename": "Precisions_Emploi_Codes_CIM10.pdf",
+    "stored_name": "pdfs/Precisions_Emploi_Codes_CIM10.pdf",
+    "extension": ".pdf",
+    "size_bytes": 107249,
+    "date_added": "2026-03-07T15:28:28.194446",
+    "status": "indexed",
+    "chunks_count": 3
+  },
+  {
+    "id": "0484aaaa7894",
+    "filename": "CIM10_Annexe7_Codes_Etendus.pdf",
+    "stored_name": "pdfs/CIM10_Annexe7_Codes_Etendus.pdf",
+    "extension": ".pdf",
+    "size_bytes": 320255,
+    "date_added": "2026-03-07T15:28:28.034227",
+    "status": "indexed",
+    "chunks_count": 10
+  },
+  {
+    "id": "bc5f2ddb482d",
+    "filename": "Consignes_COVID19_2021.pdf",
+    "stored_name": "pdfs/Consignes_COVID19_2021.pdf",
+    "extension": ".pdf",
+    "size_bytes": 410286,
+    "date_added": "2026-03-07T15:28:28.057809",
+    "status": "indexed",
+    "chunks_count": 22
+  },
+  {
+    "id": "04f31fa9c177",
+    "filename": "Consignes_Evenements_Thromboemboliques_2018.pdf",
+    "stored_name": "pdfs/Consignes_Evenements_Thromboemboliques_2018.pdf",
+    "extension": ".pdf",
+    "size_bytes": 670783,
+    "date_added": "2026-03-07T15:28:28.064644",
+    "status": "indexed",
+    "chunks_count": 4
+  },
+  {
+    "id": "a26a76317880",
+    "filename": "Consignes_Infections_Site_Operatoire_2018.pdf",
+    "stored_name": "pdfs/Consignes_Infections_Site_Operatoire_2018.pdf",
+    "extension": ".pdf",
+    "size_bytes": 662484,
+    "date_added": "2026-03-07T15:28:28.070314",
+    "status": "indexed",
+    "chunks_count": 4
+  },
+  {
+    "id": "7f51d4aa2563",
+    "filename": "Instruction_DGOS_Controle_T2A_Campagne_2025.pdf",
+    "stored_name": "pdfs/Instruction_DGOS_Controle_T2A_Campagne_2025.pdf",
+    "extension": ".pdf",
+    "size_bytes": 183370,
+    "date_added": "2026-03-07T15:28:28.109600",
+    "status": "indexed",
+    "chunks_count": 6
+  },
+  {
+    "id": "0e7f5da15e05",
+    "filename": "Manuel_GHM_V2026_Vol1_Provisoire.pdf",
+    "stored_name": "pdfs/Manuel_GHM_V2026_Vol1_Provisoire.pdf",
+    "extension": ".pdf",
+    "size_bytes": 2645392,
+    "date_added": "2026-03-07T15:28:28.144893",
+    "status": "indexed",
+    "chunks_count": 193
+  }
+]
\ No newline at end of file
diff --git a/gunicorn.conf.py b/gunicorn.conf.py
new file mode 100644
index 0000000..6dc07e3
--- /dev/null
+++ b/gunicorn.conf.py
@@ -0,0 +1,8 @@
+"""Configuration Gunicorn pour T2A Viewer."""
+
+bind = "0.0.0.0:7500"
+workers = 2
+timeout = 300
+accesslog = "-"
+errorlog = "-"
+loglevel = "info"
diff --git a/output/benchmark_cpam_tim.json b/output/benchmark_cpam_tim.json
deleted file mode 100644
index cc31d5e..0000000
--- a/output/benchmark_cpam_tim.json
+++ /dev/null
@@ -1,1105 +0,0 @@
-[
-  {
-    "model": "gemma3:27b",
-    "dossier": "183_23087212",
-    "timestamp": "2026-03-04 14:24:33",
-    "ogc": 183,
-    "titre": "Désaccord sur le DP et DAS",
-    "elapsed_s": 849.6,
-    "text_len": 3759,
-    "rag_sources": 0,
-    "quality_tier": "C",
-    "requires_review": true,
-    "json_valid": true,
-    "is_tim": false,
-    "tim_eval": {
-      "format": "LEGACY",
-      "tim_compliant": false
-    },
-    "bio_errors": [],
-    "bio_errors_count": 0,
-    "bio_critical_count": 0,
-    "code_errors": [],
-    "code_errors_count": 0,
-    "parsed_response": {
-      "rappel_faits": "Le patient a été hospitalisé pour une obstruction des voies urinaires et une hydronéphrose préexistante. Face à l'impossibilité de rétablir le drainage naturel, une néphrostomie a été posée. L'hospitalisation a duré [durée non précisée]. L'objectif était de décomprimer le système urinaire et de gérer les complications potentielles.",
-      "asymetrie_information": "La CPAM n'avait pas accès aux détails de l'imagerie [[IMG-1]] montrant l'obstruction et la nécessité de la néphrostomie, ni aux comptes rendus opératoires détaillant la complexité de l'intervention.",
-      "reponse_points_cpam": "Nous reconnaissons que la pose d'une néphrostomie est bien une intervention réalisée pendant l'hospitalisation. Cependant, nous maintenons que l'hydronéphrose préexistante est la cause sous-jacente de l'obstruction et que la néphrostomie est une solution palliative.",
-      "conclusion_dispositive": "Par conséquent, au vu des éléments cliniques objectifs (imagerie [[IMG-1]]), des règles CIM-10 applicables, et des informations complémentaires non transmises à l'UCR, nous demandons le MAINTIEN du codage : DP E66.04 (Obésité), DAS Z00.0, N10, N19, T83.1, I10, N17.9, Z43.3. Nous reconnaissons que le code N13.1 ne dispose pas d'un support documentaire suffisant et demandons son retrait.",
-      "codes_non_defendables": [
-        {
-          "code": "N13.1",
-          "raison": "Ce code n'apparaît pas dans les diagnostics de l'établissement.",
-          "recommandation": "Retrait recommandé — code indéfendable face à la CPAM"
-        }
-      ],
-      "references": [
-        {
-          "document": "IMG-1",
-          "page": "N/A",
-          "citation": "Absence totale de passage entre l'uretère gauche et le Bricker, Bricker extrêmement fragile, très légèrement endommagé."
-        }
-      ],
-      "confrontation_bio": [
-        {
-          "valeur": "Créatinine",
-          "résultat": "84",
-          "normal": "Oui"
-        },
-        {
-          "valeur": "Leucocytes",
-          "résultat": "8.18",
-          "normal": "Oui"
-        },
-        {
-          "valeur": "Sodium",
-          "résultat": "140",
-          "normal": "Oui"
-        }
-      ]
-    },
-    "text_output": "⚠ REVUE MANUELLE REQUISE (Qualité : C)\n\nREFERENCES\n- [IMG-1, p.N/A] Absence totale de passage entre l'uretère gauche et le Bricker, Bricker extrêmement fragile, très légèrement endommagé.\n\nAVERTISSEMENTS CRITIQUES\n- [CRITIQUE] Score adversarial très bas : 2/10\n\nAVERTISSEMENTS MINEURS\n- [MINEUR] Incohérence : ERREUR CRITIQUE 1 : Incohérence majeure sur le DP. La réponse défend E66.04 (Obésité) comme DP, mais les codes contestés mentionnent Z45.80 (suivi de dispositif implanté). Le DP réel du dossier devrait être lié à l'obstruction urinaire/hydronéphrose/néphrostomie, pas l'obésité qui est un facteur comorbide.\n- [MINEUR] Incohérence : ERREUR CRITIQUE 2 : Le code N13.1 (Hydronéphrose avec obstruction) est reconnu comme 'indéfendable' dans 'codes_non_defendables', mais la réponse le MAINTIENT dans la conclusion dispositive en demandant son 'retrait recommandé'. Cette contradiction logique invalide la conclusion.\n- [MINEUR] Incohérence : ERREUR CRITIQUE 3 : Absence totale de justification du DP E66.04. L'IMC 31.231 justifie une obésité, mais dans un contexte d'hospitalisation pour obstruction urinaire/néphrostomie, ce diagnostic ne peut être DP. Aucune documentation ne montre que l'obésité était le motif principal d'hospitalisation.\n- [MINEUR] Incohérence : ERREUR 4 : Le code Z43.3 (colostomie) apparaît dans les DAS, mais aucun élément du dossier ne mentionne une colostomie. Le patient a un Bricker (dérivation urinaire), pas une colostomie. Code potentiellement frauduleux.\n- [MINEUR] Incohérence : ERREUR 5 : Asymétrie d'information mal présentée. La réponse prétend que 'la CPAM n'avait pas accès' à IMG-1, mais IMG-1 est citée dans les références du dossier lui-même. Cet argument est factuellement faux.\n- [MINEUR] Incohérence : ERREUR 6 : DAS-1 codé Z00.0 (examen médical sans anomalie) est incohérent avec DAS-2 (pyélonéphrite sévère N10). Un patient avec pyélonéphrite n'a pas un examen 'sans anomalie'.\n- [MINEUR] Incohérence : ERREUR 7 : Redondance diagnostique non justifiée : N19 (insuffisance rénale non spécifiée) ET N17.9 (insuffisance rénale) sont tous deux codés. Seul un code d'insuffisance rénale devrait être utilisé, avec spécification du stade.\n- [MINEUR] Incohérence : ERREUR 8 : La confrontation_bio cite 3 valeurs (Créatinine, Leucocytes, Sodium) comme normales, ce qui est exact, mais omet de mentionner que TOUTES les valeurs biologiques du dossier sont normales. Cela ne soutient PAS une pyélonéphrite sévère (N10) qui devrait montrer une CRP élevée, une leucocytose, ou une créatinine élevée.\n- [MINEUR] Incohérence : ERREUR 9 : Incohérence clinique majeure : le diagnostic de 'pyélonéphrite sévère' (N10) n'est soutenu par AUCUN marqueur biologique. CRP, leucocytes, créatinine : tous normaux. Ceci est factuellement indéfendable.\n- [MINEUR] Incohérence : ERREUR 10 : Le code T83.1 (lésion traumatique du Bricker) est justifié par IMG-1 qui mentionne un Bricker 'très légèrement endommagé', mais coder une lésion 'très légère' comme T83.1 (traumatism"
-  },
-  {
-    "model": "gemma3:27b-it-qat",
-    "dossier": "183_23087212",
-    "timestamp": "2026-03-04 14:38:43",
-    "ogc": 183,
-    "titre": "Désaccord sur le DP et DAS",
-    "elapsed_s": 655.3,
-    "text_len": 8673,
-    "rag_sources": 0,
-    "quality_tier": "C",
-    "requires_review": true,
-    "json_valid": true,
-    "is_tim": true,
-    "tim_eval": {
-      "format": "TIM",
-      "tim_compliant": true,
-      "fields_present": 6,
-      "fields_total": 9,
-      "fields_missing": [
-        "confrontation_bio",
-        "codes_non_defendables",
-        "references"
-      ],
-      "moyens_count": 4,
-      "preuves_count": 4,
-      "preuves_with_ref": 4,
-      "confrontation_count": 0,
-      "codes_nd_count": 0,
-      "refs_count": 0,
-      "conclusion_len": 507,
-      "has_maintien": true
-    },
-    "bio_errors": [],
-    "bio_errors_count": 0,
-    "bio_critical_count": 0,
-    "code_errors": [
-      {
-        "type": "SUSPICIOUS_CODE",
-        "severity": "MEDIUM",
-        "detail": "Code Z45.80: Code Z45.8 existe mais Z45.80 est suspect (vérifier)"
-      }
-    ],
-    "code_errors_count": 1,
-    "parsed_response": {
-      "objet": "Contestation Désaccord sur le DP et DAS — OGC 183 — Mémoire en défense",
-      "rappel_faits": "Le patient a été hospitalisé pour la pose d'une néphrostomie suite à une obstruction de l'uretère gauche. Les interventions réalisées incluent une urétéroscopie et une Brickeroscopie. L'hospitalisation a duré 7 jours et s'est terminée par la pose d'une néphrostomie fonctionnelle. Le patient est conscient du risque de destruction progressive du rein gauche en cas de retrait de la néphrostomie.",
-      "moyens_defense": [
-        {
-          "numero": 1,
-          "titre": "Le Diagnostic Principal Z45.80 (Ajustement et entretien d’une prothèse interne) est justifié par l’acte principal réalisé pendant l’hospitalisation",
-          "argument": "L'intervention principale réalisée pendant l'hospitalisation est la pose d'une néphrostomie, suivie de sa surveillance et de son entretien. L'imagerie [[IMG-1]] démontre clairement l'absence de passage entre l'uretère gauche et le Bricker, justifiant la nécessité de cette intervention. Le code Z45.80 reflète donc l'acte majeur pris en charge durant le séjour. La Règle T7 du guide méthodologique préconise de coder l'acte principal réalisé pendant l'hospitalisation.",
-          "preuves": [
-            {
-              "ref": "[IMG-1]",
-              "fait": "Absence de passage entre l'uretère gauche et le Bricker",
-              "signification": "Justification de la pose de la néphrostomie"
-            }
-          ],
-          "source_reglementaire": "null"
-        },
-        {
-          "numero": 2,
-          "titre": "Le Diagnostic Associé N13.1 (Hydronéphrose avec rétrécissement urétéral, non classée ailleurs) est pertinent en raison de l'obstruction urétérale préexistante",
-          "argument": "L'hydronéphrose avec rétrécissement urétéral est la cause sous-jacente de l'obstruction qui a nécessité la pose de la néphrostomie. Bien que préexistante, cette condition a directement conduit à l'hospitalisation et aux interventions réalisées. Le code N13.1 permet de documenter cette pathologie contributive.",
-          "preuves": [
-            {
-              "ref": "[IMG-1]",
-              "fait": "Absence de passage entre l'uretère gauche et le Bricker",
-              "signification": "Indication d'une obstruction urétérale"
-            }
-          ],
-          "source_reglementaire": "null"
-        },
-        {
-          "numero": 3,
-          "titre": "Le Diagnostic Associé I10 (Hypertension essentielle (primitive)) est pertinent en tant que comorbidité",
-          "argument": "L'hypertension est une comorbidité significative qui peut influencer la prise en charge du patient et le risque de complications post-opératoires. Sa présence doit être documentée pour une meilleure gestion globale du patient.",
-          "preuves": [
-            {
-              "ref": "[COMPL-N]",
-              "fait": "Mention de l'hypertension dans les antécédents du patient",
-              "signification": "Comorbidité pertinente"
-            }
-          ],
-          "source_reglementaire": "null"
-        },
-        {
-          "numero": 4,
-          "titre": "Le Diagnostic Associé T83.1 (Complication mécanique d'autres prothèses et implants urinaires) est pertinent en raison de la lésion traumatique du Bricker suite à la Brickeroscopie",
-          "argument": "La Brickeroscopie a entraîné une lésion traumatique du Bricker, constituant une complication iatrogène de l'intervention. Le code T83.1 permet de documenter cet événement indésirable et sa prise en charge.",
-          "preuves": [
-            {
-              "ref": "[DAS-4]",
-              "fait": "Mention de la lésion traumatique du Bricker suite à la Brickeroscopie",
-              "signification": "Complication iatrogène"
-            }
-          ],
-          "source_reglementaire": "null"
-        }
-      ],
-      "confrontation_bio": [],
-      "asymetrie_information": "La CPAM n'avait pas accès aux détails précis de l'imagerie [[IMG-1]] montrant l'obstruction urétérale, ni aux comptes rendus opératoires détaillant les complications de la Brickeroscopie. De plus, elle n'avait pas connaissance de la présence d'une hypertension chez le patient.",
-      "reponse_points_cpam": "La CPAM a raison de souligner que la pose de la néphrostomie est l'acte principal réalisé pendant l'hospitalisation. Cependant, le code Z43.6 (Surveillance d'autres stomies des voies urinaires) ne reflète pas l'ensemble de la prise en charge, notamment la gestion de l'obstruction urétérale sous-jacente et les complications de l'intervention. Nous maintenons donc le code Z45.80 (Ajustement et entretien d’une prothèse interne) comme DP plus approprié.",
-      "codes_non_defendables": [],
-      "references": [],
-      "conclusion_dispositive": "Par conséquent, au vu des éléments cliniques objectifs (obstruction urétérale confirmée par l'imagerie [[IMG-1]]), des règles CIM-10 applicables, et des informations complémentaires non transmises à l'UCR, nous demandons le MAINTIEN du codage : DP Z45.80 (Ajustement et entretien d’une prothèse interne), DAS N13.1 (Hydronéphrose avec rétrécissement urétéral, non classée ailleurs), DAS I10 (Hypertension essentielle (primitive)), DAS T83.1 (Complication mécanique d'autres prothèses et implants urinaires)."
-    },
-    "text_output": "═══════════════════════════════════════════════════════\nMÉMOIRE EN DÉFENSE — Contestation Désaccord sur le DP et DAS — OGC 183 — Mémoire en défense\n═══════════════════════════════════════════════════════\n\n⚠ REVUE MANUELLE REQUISE (Qualité : C)\n\nRAPPEL DES FAITS\nLe patient a été hospitalisé pour la pose d'une néphrostomie suite à une obstruction de l'uretère gauche. Les interventions réalisées incluent une urétéroscopie et une Brickeroscopie. L'hospitalisation a duré 7 jours et s'est terminée par la pose d'une néphrostomie fonctionnelle. Le patient est conscient du risque de destruction progressive du rein gauche en cas de retrait de la néphrostomie.\n\n───────────────────────────────────────────────────────\n\nMOYEN N°1 — Le Diagnostic Principal Z45.80 (Ajustement et entretien d’une prothèse interne) est justifié par l’acte principal réalisé pendant l’hospitalisation\nL'intervention principale réalisée pendant l'hospitalisation est la pose d'une néphrostomie, suivie de sa surveillance et de son entretien. L'imagerie [[IMG-1]] démontre clairement l'absence de passage entre l'uretère gauche et le Bricker, justifiant la nécessité de cette intervention. Le code Z45.80 reflète donc l'acte majeur pris en charge durant le séjour. La Règle T7 du guide méthodologique préconise de coder l'acte principal réalisé pendant l'hospitalisation.\n  Preuve : [IMG-1] Absence de passage entre l'uretère gauche et le Bricker → Justification de la pose de la néphrostomie\n\nMOYEN N°2 — Le Diagnostic Associé N13.1 (Hydronéphrose avec rétrécissement urétéral, non classée ailleurs) est pertinent en raison de l'obstruction urétérale préexistante\nL'hydronéphrose avec rétrécissement urétéral est la cause sous-jacente de l'obstruction qui a nécessité la pose de la néphrostomie. Bien que préexistante, cette condition a directement conduit à l'hospitalisation et aux interventions réalisées. Le code N13.1 permet de documenter cette pathologie contributive.\n  Preuve : [IMG-1] Absence de passage entre l'uretère gauche et le Bricker → Indication d'une obstruction urétérale\n\nMOYEN N°3 — Le Diagnostic Associé I10 (Hypertension essentielle (primitive)) est pertinent en tant que comorbidité\nL'hypertension est une comorbidité significative qui peut influencer la prise en charge du patient et le risque de complications post-opératoires. Sa présence doit être documentée pour une meilleure gestion globale du patient.\n  Preuve : [COMPL-N] Mention de l'hypertension dans les antécédents du patient → Comorbidité pertinente\n\nMOYEN N°4 — Le Diagnostic Associé T83.1 (Complication mécanique d'autres prothèses et implants urinaires) est pertinent en raison de la lésion traumatique du Bricker suite à la Brickeroscopie\nLa Brickeroscopie a entraîné une lésion traumatique du Bricker, constituant une complication iatrogène de l'intervention. Le code T83.1 permet de documenter cet événement indésirable et sa prise en charge.\n  Preuve : [DAS-4] Mention de la lésion traumatique du Bricker suite à la Brickeroscopie "
-  },
-  {
-    "model": "qwen3:32b",
-    "dossier": "183_23087212",
-    "timestamp": "2026-03-04 14:49:38",
-    "ogc": 183,
-    "titre": "Désaccord sur le DP et DAS",
-    "elapsed_s": 302.0,
-    "text_len": 6715,
-    "rag_sources": 0,
-    "quality_tier": "C",
-    "requires_review": true,
-    "json_valid": true,
-    "is_tim": true,
-    "tim_eval": {
-      "format": "TIM",
-      "tim_compliant": true,
-      "fields_present": 9,
-      "fields_total": 9,
-      "fields_missing": [],
-      "moyens_count": 1,
-      "preuves_count": 2,
-      "preuves_with_ref": 2,
-      "confrontation_count": 1,
-      "codes_nd_count": 1,
-      "refs_count": 1,
-      "conclusion_len": 467,
-      "has_maintien": true
-    },
-    "bio_errors": [
-      {
-        "type": "CONFRONTATION_ERROR",
-        "severity": "CRITICAL",
-        "detail": "Créatinine = 84 (NORMAL) mais verdict = CONFIRMÉ",
-        "ground_truth": "Créatinine norme [50-120]"
-      }
-    ],
-    "bio_errors_count": 1,
-    "bio_critical_count": 1,
-    "code_errors": [
-      {
-        "type": "SUSPICIOUS_CODE",
-        "severity": "MEDIUM",
-        "detail": "Code Z45.80: Code Z45.8 existe mais Z45.80 est suspect (vérifier)"
-      }
-    ],
-    "code_errors_count": 1,
-    "parsed_response": {
-      "objet": "Contestation Désaccord sur le DP et DAS — OGC 183 — Mémoire en défense",
-      "rappel_faits": "Le patient a été hospitalisé pour une hydronéphrose liée à un rétrécissement urétéral. Des actes d'exploration ont été réalisés, notamment une échographie et une urographie. La durée du séjour était de 5 jours, et l'issue a été la mise en place d'une néphrostomie.",
-      "moyens_defense": [
-        {
-          "numero": 1,
-          "titre": "Le DP Z45.80 est justifié par l'entretien de la prothèse urinaire",
-          "argument": "Le patient a nécessité l'ajustement et l'entretien d'une prothèse interne urinaire, ce qui justifie le code Z45.80. Cela est confirmé par les actes réalisés et les complications mécaniques constatées.",
-          "preuves": [
-            {
-              "ref": "[ACTE-1]",
-              "fait": "Mise en place d'une néphrostomie",
-              "signification": "Nécessité d'entretien de la prothèse"
-            },
-            {
-              "ref": "[DAS-1]",
-              "fait": "Complication mécanique d'autres prothèses et implants urinaires (T83.1)",
-              "signification": "Justification de l'entretien de la prothèse"
-            }
-          ],
-          "source_reglementaire": "[Document - page 12] 'Z45.80 — Ajustement et entretien d’une prothèse interne urinaire'"
-        }
-      ],
-      "confrontation_bio": [
-        {
-          "diagnostic": "Z45.80",
-          "test": "Créatinine",
-          "valeur": 120,
-          "seuil": "50-120",
-          "verdict": "CONFIRMÉ"
-        }
-      ],
-      "asymetrie_information": "La CPAM n'avait pas accès aux résultats complets de l'imagerie et aux détails des actes chirurgicaux réalisés.",
-      "reponse_points_cpam": "La CPAM a raison de souligner que l'hydronéphrose connue avant l'hospitalisation ne peut pas être le DP. Cependant, le code Z45.80 est justifié par l'entretien de la prothèse urinaire, confirmé par les actes réalisés.",
-      "codes_non_defendables": [
-        {
-          "code": "N13.1",
-          "raison": "L'hydronéphrose est connue avant l'hospitalisation et ne peut pas être le DP",
-          "recommandation": "Retrait recommandé — code indéfendable face à la CPAM"
-        }
-      ],
-      "references": [
-        {
-          "document": "Dictionnaire CIM-10",
-          "page": "45",
-          "citation": "Z45.80 — Ajustement et entretien d’une prothèse interne urinaire"
-        }
-      ],
-      "conclusion_dispositive": "Par conséquent, au vu des éléments cliniques objectifs (citer les preu1ves clés), des règles CIM-10 applicables (citer les sources), et des informations complémentaires non transmises à l'UCR, nous demandons le MAINTIEN du codage : DP Z45.80 — Ajustement et entretien d’une prothèse interne urinaire, DAS N13.1 — Hydronéphrose avec rétrécissement urétéral, non classée ailleurs. Nous reconnaissons que le code N13.1 ne dispose pas d'un support documentaire suffisant."
-    },
-    "text_output": "═══════════════════════════════════════════════════════\nMÉMOIRE EN DÉFENSE — Contestation Désaccord sur le DP et DAS — OGC 183 — Mémoire en défense\n═══════════════════════════════════════════════════════\n\n⚠ REVUE MANUELLE REQUISE (Qualité : C)\n\nRAPPEL DES FAITS\nLe patient a été hospitalisé pour une hydronéphrose liée à un rétrécissement urétéral. Des actes d'exploration ont été réalisés, notamment une échographie et une urographie. La durée du séjour était de 5 jours, et l'issue a été la mise en place d'une néphrostomie.\n\n───────────────────────────────────────────────────────\n\nMOYEN N°1 — Le DP Z45.80 est justifié par l'entretien de la prothèse urinaire\nLe patient a nécessité l'ajustement et l'entretien d'une prothèse interne urinaire, ce qui justifie le code Z45.80. Cela est confirmé par les actes réalisés et les complications mécaniques constatées.\n  Preuve : [ACTE-1] Mise en place d'une néphrostomie → Nécessité d'entretien de la prothèse\n  Preuve : [DAS-1] Complication mécanique d'autres prothèses et implants urinaires (T83.1) → Justification de l'entretien de la prothèse\n  Source : [Document - page 12] 'Z45.80 — Ajustement et entretien d’une prothèse interne urinaire'\n\n───────────────────────────────────────────────────────\n\nCONFRONTATION BIOLOGIE / DIAGNOSTIC\n┌─────────────────┬─────────────┬──────────────┬───────────┬───────────────┐\n│ Diagnostic      │ Test requis │ Seuil        │ Valeur    │ Verdict       │\n├─────────────────┼─────────────┼──────────────┼───────────┼───────────────┤\n│ Z45.80           │ Créatinine   │ 50-120        │ 120        │ CONFIRMÉ       │\n└─────────────────┴─────────────┴──────────────┴───────────┴───────────────┘\n\n───────────────────────────────────────────────────────\n\n⚠ CODES NON DÉFENDABLES (honnêteté intellectuelle)\n- N13.1 : L'hydronéphrose est connue avant l'hospitalisation et ne peut pas être le DP\n  → Retrait recommandé — code indéfendable face à la CPAM\n\n───────────────────────────────────────────────────────\n\nASYMÉTRIE D'INFORMATION\nLa CPAM n'avait pas accès aux résultats complets de l'imagerie et aux détails des actes chirurgicaux réalisés.\n\n───────────────────────────────────────────────────────\n\nRÉPONSE AUX POINTS DE LA CPAM\nLa CPAM a raison de souligner que l'hydronéphrose connue avant l'hospitalisation ne peut pas être le DP. Cependant, le code Z45.80 est justifié par l'entretien de la prothèse urinaire, confirmé par les actes réalisés.\n\n───────────────────────────────────────────────────────\n\nRÉFÉRENCES RÉGLEMENTAIRES\n- [Dictionnaire CIM-10, p.45] Z45.80 — Ajustement et entretien d’une prothèse interne urinaire\n\n═══════════════════════════════════════════════════════\n\nCONCLUSION\nPar conséquent, au vu des éléments cliniques objectifs (citer les preu1ves clés), des règles CIM-10 applicables (citer les sources), et des informations complémentaires non transmises à l'UCR, nous demandons le MAINTIEN du codage : DP Z45.80 — Ajustement et entretien d’une prothèse interne urinaire, DAS N13.1 — Hydronéphr"
-  },
-  {
-    "model": "qwen3:14b",
-    "dossier": "183_23087212",
-    "timestamp": "2026-03-04 14:54:40",
-    "ogc": 183,
-    "titre": "Désaccord sur le DP et DAS",
-    "elapsed_s": 27.6,
-    "text_len": 2436,
-    "rag_sources": 0,
-    "quality_tier": "C",
-    "requires_review": true,
-    "json_valid": true,
-    "is_tim": false,
-    "tim_eval": {
-      "format": "LEGACY",
-      "tim_compliant": false
-    },
-    "bio_errors": [],
-    "bio_errors_count": 0,
-    "bio_critical_count": 0,
-    "code_errors": [],
-    "code_errors_count": 0,
-    "parsed_response": {},
-    "text_output": "⚠ REVUE MANUELLE REQUISE (Qualité : C)\n\nAVERTISSEMENTS CRITIQUES\n- [CRITIQUE] Score adversarial très bas : 1/10\n\nAVERTISSEMENTS MINEURS\n- [MINEUR] Incohérence : ABSENCE CRITIQUE : Le champ 'RÉPONSE GÉNÉRÉE' est vide ({}). Aucun mémoire en défense n'a été fourni pour relecture. Impossible de vérifier les moyens de défense, la cohérence argumentative ou la qualité de la défense CPAM.\n- [MINEUR] Incohérence : INCOHÉRENCE CODES : Les codes contestés (DP UCR: Z45.80 et DA UCR: N13.1) ne sont pas présents dans le diagnostic principal [DP] ni dans les diagnostics associés [DAS-1 à DAS-7]. Le DP documenté est E66.04 (Obésité), pas Z45.80. Cette absence rend impossible la vérification de la défense sur ces codes spécifiques.\n- [MINEUR] Incohérence : DONNÉES BIOLOGIQUES INCOMPLÈTES : Plusieurs valeurs biologiques critiques manquent (urée, CRP, VS, ASAT, ALAT, etc.) alors qu'elles seraient pertinentes pour justifier une pyélonéphrite sévère [DAS-2: N10] et une insuffisance rénale [DAS-6: N17.9].\n- [MINEUR] Incohérence : CHLORE NON INTERPRÉTÉ : [BIO-3] Chlore: 110 — aucune norme fournie dans les normes de référence. Impossible de vérifier si cette valeur est normale ou pathologique.\n- [MINEUR] Incohérence : VGM NON INTERPRÉTÉ : [BIO-5] VGM: 91.8 — aucune norme fournie. Impossible de qualifier cette valeur.\n- [MINEUR] Incohérence : DOCUMENTATION CLINIQUE FRAGMENTÉE : [IMG-1] contient du texte tronqué ('permettant de de', 'a permis de c') rendant l'interprétation de l'imagerie impossible. Les conclusions cliniques ne peuvent pas être vérifiées.\n- [MINEUR] Incohérence : ANTÉCÉDENTS INCOMPLETS : [ANT-1] à [ANT-7] sont des fragments de texte sans contexte clair. [ANT-7] est vide. Impossible de vérifier la cohérence du consentement éclairé ou des options thérapeutiques documentées.\n- [MINEUR] Incohérence : ABSENCE DE JUSTIFICATION DIAGNOSTIQUE : Aucune preuve traçable ne lie les valeurs biologiques normales aux diagnostics graves codifiés (pyélonéphrite sévère N10, insuffisance rénale N17.9). Les biologiques [BIO-1] à [BIO-9] sont tous normaux, ce qui contredit potentiellement la sévérité clinique revendiquée.\n- [MINEUR] Incohérence : INCOHÉRENCE CLINIQUE MAJEURE : Un patient avec une 'pyélonéphrite sévère' et une 'insuffisance rénale' devrait présenter une créatinine élevée, une urée élevée, une CRP élevée et une VS élevée. [BIO-8] Créatinine: 84 est NORMAL. Cette normalité n'est pas expliquée dans le dossier."
-  },
-  {
-    "model": "mistral-small3.2:24b",
-    "dossier": "183_23087212",
-    "timestamp": "2026-03-04 14:55:08",
-    "ogc": 183,
-    "titre": "Désaccord sur le DP et DAS",
-    "elapsed_s": 429.9,
-    "text_len": 8655,
-    "rag_sources": 0,
-    "quality_tier": "C",
-    "requires_review": true,
-    "json_valid": true,
-    "is_tim": true,
-    "tim_eval": {
-      "format": "TIM",
-      "tim_compliant": true,
-      "fields_present": 9,
-      "fields_total": 9,
-      "fields_missing": [],
-      "moyens_count": 3,
-      "preuves_count": 6,
-      "preuves_with_ref": 6,
-      "confrontation_count": 2,
-      "codes_nd_count": 2,
-      "refs_count": 1,
-      "conclusion_len": 616,
-      "has_maintien": true
-    },
-    "bio_errors": [
-      {
-        "type": "CONFRONTATION_ERROR",
-        "severity": "CRITICAL",
-        "detail": "Créatinine = 84 (NORMAL) mais verdict = NON CONFIRMÉ (VALEUR NORMALE)",
-        "ground_truth": "Créatinine norme [50-120]"
-      },
-      {
-        "type": "CONFRONTATION_ERROR",
-        "severity": "CRITICAL",
-        "detail": "Créatinine = 84 (NORMAL) mais verdict = NON CONFIRMÉ (VALEUR NORMALE)",
-        "ground_truth": "Créatinine norme [50-120]"
-      }
-    ],
-    "bio_errors_count": 2,
-    "bio_critical_count": 2,
-    "code_errors": [],
-    "code_errors_count": 0,
-    "parsed_response": {
-      "objet": "Contestation Désaccord sur le DP et DAS — OGC 183 — Mémoire en défense",
-      "rappel_faits": "Patient hospitalisé pour hydronéphrose obstructive secondaire à une complication mécanique d'une prothèse urinaire (Bricker). Actes réalisés : urétéroscopie et Brickeroscopie. Issue : mise en place d'une néphrostomie. Durée : non précisée.",
-      "moyens_defense": [
-        {
-          "numero": 1,
-          "titre": "Le DP E66.04 (Obésité) est justifié par l'IMC et son rôle dans la complication",
-          "argument": "L'obésité (IMC = 35) est un facteur de risque avéré pour les complications mécaniques des prothèses urinaires. Le compte-rendu clinique mentionne explicitement son implication dans la pathologie actuelle.",
-          "preuves": [
-            {
-              "ref": "[DP]",
-              "fait": "Obésité documentée avec IMC = 35",
-              "signification": "Facteur de risque majeur pour la complication mécanique"
-            },
-            {
-              "ref": "[ANT-1]",
-              "fait": "Antécédents d'obésité et de complications associées",
-              "signification": "Contexte clinique cohérent"
-            }
-          ],
-          "source_reglementaire": null
-        },
-        {
-          "numero": 2,
-          "titre": "Le DAS T83.1 (Complication mécanique de prothèse urinaire) est objectivement documenté",
-          "argument": "Le TDM abdominal et les actes d'urétéroscopie/Brickeroscopie confirment la complication mécanique de la prothèse urinaire, justifiant ce code.",
-          "preuves": [
-            {
-              "ref": "[IMG-1]",
-              "fait": "TDM montrant obstruction urétérale liée à la prothèse",
-              "signification": "Preuve objective de la complication"
-            },
-            {
-              "ref": "[ACTE-1]",
-              "fait": "Actes d'urétéroscopie et Brickeroscopie pour gestion de la complication",
-              "signification": "Preuve de la prise en charge spécifique"
-            }
-          ],
-          "source_reglementaire": null
-        },
-        {
-          "numero": 3,
-          "titre": "Le DAS N13.1 (Hydronéphrose) est un diagnostic préexistant et justifie la néphrostomie",
-          "argument": "L'hydronéphrose était connue avant l'hospitalisation et a nécessité la mise en place d'une néphrostomie, ce qui justifie son codage en DAS.",
-          "preuves": [
-            {
-              "ref": "[DAS-3]",
-              "fait": "Hydronéphrose documentée comme diagnostic préexistant",
-              "signification": "Contexte clinique cohérent"
-            },
-            {
-              "ref": "[TRT-1]",
-              "fait": "Nécessité de néphrostomie pour gestion de l'hydronéphrose",
-              "signification": "Preuve de la pertinence du code"
-            }
-          ],
-          "source_reglementaire": null
-        }
-      ],
-      "confrontation_bio": [
-        {
-          "diagnostic": "N19 (Insuffisance rénale)",
-          "test": "Créatinine",
-          "valeur": "non précisée",
-          "seuil": "non applicable",
-          "verdict": "NON CONFIRMÉ (valeur normale)"
-        },
-        {
-          "diagnostic": "N17.9 (IRA)",
-          "test": "Créatinine",
-          "valeur": "non précisée",
-          "seuil": "non applicable",
-          "verdict": "NON CONFIRMÉ (valeur normale)"
-        }
-      ],
-      "asymetrie_information": "La CPAM n'avait pas accès aux détails des actes d'urétéroscopie et Brickeroscopie, ni aux antécédents complets d'obésité et de complications associées.",
-      "reponse_points_cpam": "Nous reconnaissons que le code Z43.6 (Surveillance de néphrostomie) pourrait être pertinent, mais le DP E66.04 (Obésité) est justifié par son rôle causal dans la complication mécanique. L'hydronéphrose (N13.1) reste un diagnostic associé pertinent.",
-      "codes_non_defendables": [
-        {
-          "code": "N19",
-          "raison": "Créatinine normale — insuffisance rénale non confirmée biologiquement",
-          "recommandation": "Retrait recommandé — code indéfendable face à la CPAM"
-        },
-        {
-          "code": "N17.9",
-          "raison": "Créatinine normale — IRA non confirmée biologiquement",
-          "recommandation": "Retrait recommandé — code indéfendable face à la CPAM"
-        }
-      ],
-      "references": [
-        {
-          "document": "Guide de codage CIM-10",
-          "page": "non précisée",
-          "citation": "Les diagnostics doivent être justifiés par des preuves objectives ou des antécédents documentés."
-        }
-      ],
-      "conclusion_dispositive": "Par conséquent, au vu des éléments cliniques objectifs (obésité documentée, complication mécanique prouvée, hydronéphrose préexistante), des règles CIM-10 applicables, et des informations complémentaires non transmises à l'UCR, nous demandons le MAINTIEN du codage : DP E66.04 (Obésité due à un excès calorique de l'adulte avec indice de masse corporelle égal), DAS T83.1 (Complication mécanique d'autres prothèses et implants urinaires), DAS N13.1 (Hydronéphrose avec rétrécissement urétéral, non classée ailleurs). Nous reconnaissons que les codes N19 et N17.9 ne disposent pas d'un support documentaire suffisant."
-    },
-    "text_output": "═══════════════════════════════════════════════════════\nMÉMOIRE EN DÉFENSE — Contestation Désaccord sur le DP et DAS — OGC 183 — Mémoire en défense\n═══════════════════════════════════════════════════════\n\n⚠ REVUE MANUELLE REQUISE (Qualité : C)\n\nRAPPEL DES FAITS\nPatient hospitalisé pour hydronéphrose obstructive secondaire à une complication mécanique d'une prothèse urinaire (Bricker). Actes réalisés : urétéroscopie et Brickeroscopie. Issue : mise en place d'une néphrostomie. Durée : non précisée.\n\n───────────────────────────────────────────────────────\n\nMOYEN N°1 — Le DP E66.04 (Obésité) est justifié par l'IMC et son rôle dans la complication\nL'obésité (IMC = 35) est un facteur de risque avéré pour les complications mécaniques des prothèses urinaires. Le compte-rendu clinique mentionne explicitement son implication dans la pathologie actuelle.\n  Preuve : [DP] Obésité documentée avec IMC = 35 → Facteur de risque majeur pour la complication mécanique\n  Preuve : [ANT-1] Antécédents d'obésité et de complications associées → Contexte clinique cohérent\n\nMOYEN N°2 — Le DAS T83.1 (Complication mécanique de prothèse urinaire) est objectivement documenté\nLe TDM abdominal et les actes d'urétéroscopie/Brickeroscopie confirment la complication mécanique de la prothèse urinaire, justifiant ce code.\n  Preuve : [IMG-1] TDM montrant obstruction urétérale liée à la prothèse → Preuve objective de la complication\n  Preuve : [ACTE-1] Actes d'urétéroscopie et Brickeroscopie pour gestion de la complication → Preuve de la prise en charge spécifique\n\nMOYEN N°3 — Le DAS N13.1 (Hydronéphrose) est un diagnostic préexistant et justifie la néphrostomie\nL'hydronéphrose était connue avant l'hospitalisation et a nécessité la mise en place d'une néphrostomie, ce qui justifie son codage en DAS.\n  Preuve : [DAS-3] Hydronéphrose documentée comme diagnostic préexistant → Contexte clinique cohérent\n  Preuve : [TRT-1] Nécessité de néphrostomie pour gestion de l'hydronéphrose → Preuve de la pertinence du code\n\n───────────────────────────────────────────────────────\n\nCONFRONTATION BIOLOGIE / DIAGNOSTIC\n┌─────────────────┬─────────────┬──────────────┬───────────┬───────────────┐\n│ Diagnostic      │ Test requis │ Seuil        │ Valeur    │ Verdict       │\n├─────────────────┼─────────────┼──────────────┼───────────┼───────────────┤\n│ N19 (Insuffisance│ Créatinine   │ non applicable│ non précisé│ NON CONFIRMÉ (v│\n│ N17.9 (IRA)      │ Créatinine   │ non applicable│ non précisé│ NON CONFIRMÉ (v│\n└─────────────────┴─────────────┴──────────────┴───────────┴───────────────┘\n\n───────────────────────────────────────────────────────\n\n⚠ CODES NON DÉFENDABLES (honnêteté intellectuelle)\n- N19 : Créatinine normale — insuffisance rénale non confirmée biologiquement\n  → Retrait recommandé — code indéfendable face à la CPAM\n- N17.9 : Créatinine normale — IRA non confirmée biologiquement\n  → Retrait recommandé — code indéfendable face à la CPAM\n\n───────────────────────────────────────────────────────\n\nASYMÉ"
-  },
-  {
-    "model": "llama3.3:70b",
-    "dossier": "183_23087212",
-    "timestamp": "2026-03-04 15:02:18",
-    "ogc": 183,
-    "titre": "Désaccord sur le DP et DAS",
-    "elapsed_s": 1742.9,
-    "text_len": 30499,
-    "rag_sources": 0,
-    "quality_tier": "C",
-    "requires_review": true,
-    "json_valid": true,
-    "is_tim": true,
-    "tim_eval": {
-      "format": "TIM",
-      "tim_compliant": true,
-      "fields_present": 9,
-      "fields_total": 9,
-      "fields_missing": [],
-      "moyens_count": 9,
-      "preuves_count": 22,
-      "preuves_with_ref": 22,
-      "confrontation_count": 4,
-      "codes_nd_count": 6,
-      "refs_count": 5,
-      "conclusion_len": 3322,
-      "has_maintien": false
-    },
-    "bio_errors": [
-      {
-        "type": "BIO_HALLUCINATION",
-        "severity": "CRITICAL",
-        "detail": "Créatinine 84 µmol/L (NORMAL 50-120) qualifiée comme 'insuffisance rénale'",
-        "ground_truth": "Créatinine 84 = NORMAL"
-      },
-      {
-        "type": "CONFRONTATION_ERROR",
-        "severity": "CRITICAL",
-        "detail": "Créatinine = 84 (NORMAL) mais verdict = NON CONFIRMÉ — VALEUR NORMALE",
-        "ground_truth": "Créatinine norme [50-120]"
-      },
-      {
-        "type": "CONFRONTATION_ERROR",
-        "severity": "CRITICAL",
-        "detail": "Créatinine = 84 (NORMAL) mais verdict = NON CONFIRMÉ — VALEUR NORMALE",
-        "ground_truth": "Créatinine norme [50-120]"
-      }
-    ],
-    "bio_errors_count": 3,
-    "bio_critical_count": 3,
-    "code_errors": [
-      {
-        "type": "SUSPICIOUS_CODE",
-        "severity": "MEDIUM",
-        "detail": "Code Z45.80: Code Z45.8 existe mais Z45.80 est suspect (vérifier)"
-      }
-    ],
-    "code_errors_count": 1,
-    "parsed_response": {
-      "objet": "Contestation Désaccord sur le DP et DAS — Mémoire en défense structuré",
-      "rappel_faits": "Patient masculin, 68 ans, hospitalisé 3 jours pour prise en charge d'une obstruction urétéro-iléale (absence de passage entre uretère gauche et Bricker) diagnostiquée en imagerie [IMG-1]. Actes réalisés : TDM abdominal [ACTE-1], urétéroscopie descendante, Brickeroscopie avec lésion traumatique iatrogène du Bricker [IMG-1]. Mise en place d'une néphrostomie. Sortie après décision thérapeutique partagée.",
-      "moyens_defense": [
-        {
-          "numero": 1,
-          "titre": "La CPAM a raison sur le DP : Z43.6 (Surveillance de néphrostomie) est plus pertinent que E66.04 (Obésité)",
-          "argument": "L'établissement a codé en DP l'obésité [DP] (E66.04 — Obésité due à un excès calorique de l'adulte avec IMC égal à 31.231), alors que l'acte médical principal et consommateur de ressources du séjour est la mise en place d'une néphrostomie suite à l'obstruction urétéro-iléale [IMG-1]. Selon la règle hiérarchique CIM-10, le DP doit être le diagnostic qui a CONSOMMÉ LE PLUS DE RESSOURCES pendant le séjour, non le diagnostic comorbide le plus grave. L'obésité est une condition chronique préexistante qui n'a motivé ni traitement spécifique, ni allongement de durée, ni modification de surveillance pendant ces 3 jours. En revanche, l'obstruction urétéro-iléale et la mise en place de néphrostomie ont justifié l'hospitalisation, les actes d'imagerie [ACTE-1], les gestes endoscopiques [IMG-1], et la décision thérapeutique documentée [ANT-3] à [ANT-6]. Le code Z43.6 (Surveillance d'autres stomies des voies urinaires — Néphrostomie) est donc le DP approprié, conformément à la logique T2A qui valorise l'acte thérapeutique principal.",
-          "preuves": [
-            {
-              "ref": "[DP]",
-              "fait": "DP établissement = E66.04 (Obésité, IMC 31.231)",
-              "signification": "Diagnostic comorbide, non motif d'hospitalisation"
-            },
-            {
-              "ref": "[IMG-1]",
-              "fait": "Absence totale de passage entre uretère gauche et Bricker ; urétéroscopie descendante et Brickeroscopie réalisées ; Bricker endommagé iatrogènement",
-              "signification": "Acte thérapeutique principal justifiant l'hospitalisation"
-            },
-            {
-              "ref": "[ACTE-1]",
-              "fait": "TDM abdominal (ZCQK002) réalisée",
-              "signification": "Imagerie diagnostique directement liée à l'obstruction, non à l'obésité"
-            },
-            {
-              "ref": "[ANT-3] à [ANT-6]",
-              "fait": "Documentation de la décision thérapeutique : retrait de néphrostomie vs. maintien vs. reconstruction",
-              "signification": "Preuve que la néphrostomie est le centre du séjour"
-            }
-          ],
-          "source_reglementaire": "Guide méthodologique T2A — Règle hiérarchique DP : 'Le diagnostic principal est celui qui a consommé le plus de ressources pendant le séjour, indépendamment de sa gravité relative'. La mise en place d'une stomie urinaire (néphrostomie) se code en DP avec un code Z43.x ou Z45.x selon le contexte (surveillance vs. ajustement)."
-        },
-        {
-          "numero": 2,
-          "titre": "Reconnaissance du bien-fondé de la proposition UCR : Z43.6 vs. Z45.80 — clarification du code exact",
-          "argument": "L'UCR propose Z45.80 (Ajustement et entretien d'une prothèse interne urinaire) comme DP. Cependant, le dossier clinique [IMG-1] décrit une MISE EN PLACE de néphrostomie (acte de création de stomie), non un ajustement ou entretien d'une prothèse préexistante. Selon la CIM-10 officielle : Z43.6 s'applique à la 'Surveillance d'autres stomies des voies urinaires — Néphrostomie', tandis que Z45.80 s'applique à l' 'Ajustement et entretien d'une prothèse interne urinaire' (implant préexistant). Le contexte clinique [IMG-1] indique que la néphrostomie a été créée PENDANT ce séjour en réponse à l'obstruction urétéro-iléale, ce qui correspond à Z43.6 plutôt qu'à Z45.80. Toutefois, nous reconnaissons que la CPAM a raison de rejeter E66.04 comme DP et que le codage doit être centré sur la néphrostomie. La différence entre Z43.6 et Z45.80 est mineure et ne modifie pas le groupage GHM/GHS selon la règle T7 citée par l'UCR.",
-          "preuves": [
-            {
-              "ref": "[IMG-1]",
-              "fait": "Mise en place de néphrostomie (acte de création, non d'ajustement)",
-              "signification": "Justifie Z43.6 plutôt que Z45.80"
-            },
-            {
-              "ref": "Définition CIM-10 Z43.6",
-              "fait": "Surveillance d'autres stomies des voies urinaires — Néphrostomie",
-              "signification": "Code approprié pour création/surveillance de néphrostomie"
-            },
-            {
-              "ref": "Définition CIM-10 Z45.80",
-              "fait": "Ajustement et entretien d'une prothèse interne urinaire",
-              "signification": "Code pour entretien de prothèse préexistante, non création"
-            }
-          ],
-          "source_reglementaire": "CIM-10 — Codes Z43.x (Surveillance de stomies) vs. Z45.x (Ajustement de prothèses) — distinction basée sur le type d'acte (création vs. entretien)"
-        },
-        {
-          "numero": 3,
-          "titre": "Rejet des codes d'insuffisance rénale (N17.9 et N19) : incohérence biologique majeure",
-          "argument": "L'établissement a codé deux diagnostics d'insuffisance rénale : N17.9 (Insuffisance rénale aigüe, sans précision) [DAS-6] et N19 (Insuffisance rénale, sans précision) [DAS-3]. Or, la biologie du dossier montre une créatinine = 84 µmol/L [BIO-8], valeur NORMALE (norme 50-120 µmol/L). L'insuffisance rénale aiguë (N17.9) requiert une créatinine ÉLEVÉE (> 130 µmol/L chez l'homme) et/ou une augmentation rapide de la créatinine basale. L'insuffisance rénale chronique (N19) requiert également une créatinine pathologique. La créatinine normale [BIO-8] CONTREDIT formellement ces deux diagnostics. Ces codes ne disposent d'AUCUN support biologique et doivent être RETIRÉS. Nous reconnaissons que cette incohérence rend ces codes indéfendables face à la CPAM.",
-          "preuves": [
-            {
-              "ref": "[BIO-8]",
-              "fait": "Créatinine = 84 µmol/L [norme 50-120]",
-              "signification": "Valeur NORMALE — fonction rénale conservée"
-            },
-            {
-              "ref": "[DAS-6]",
-              "fait": "N17.9 — Insuffisance rénale aigüe, sans précision",
-              "signification": "Requiert créatinine > 130 µmol/L — NON CONFIRMÉ"
-            },
-            {
-              "ref": "[DAS-3]",
-              "fait": "N19 — Insuffisance rénale, sans précision",
-              "signification": "Requiert créatinine pathologique — NON CONFIRMÉ"
-            }
-          ],
-          "source_reglementaire": "CIM-10 — Seuils biologiques pour insuffisance rénale : créatinine > 130 µmol/L (H) / > 110 µmol/L (F). Valeur normale EXCLUT le diagnostic d'insuffisance rénale."
-        },
-        {
-          "numero": 4,
-          "titre": "Rejet du code N10 (Pyélonéphrite sévère) : absence de preuve clinique et biologique",
-          "argument": "L'établissement a codé N10 (Néphrite tubulo-interstitielle aigüe) [DAS-2] comme diagnostic associé. Or, le dossier ne contient AUCUNE preuve objective de pyélonéphrite : (1) Pas de fièvre documentée ; (2) Pas de leucocyturie ou bactériurie mentionnée ; (3) Leucocytes = 8.18 × 10⁹/L [BIO-7], valeur NORMALE (norme 4-10) — pas de leucocytose ; (4) Pas de culture d'urine positive citée ; (5) L'imagerie [IMG-1] décrit une obstruction urétéro-iléale, non une pyélonéphrite. Le code N10 repose sur le seul jugement clinique sans preuve biologique ou paraclinique. Il doit être RETIRÉ.",
-          "preuves": [
-            {
-              "ref": "[BIO-7]",
-              "fait": "Leucocytes = 8.18 × 10⁹/L [norme 4-10]",
-              "signification": "Valeur NORMALE — pas de leucocytose infectieuse"
-            },
-            {
-              "ref": "[IMG-1]",
-              "fait": "TDM abdominal : absence de passage urétéro-iléal, Bricker fragile endommagé",
-              "signification": "Obstruction mécanique, non infection rénale"
-            },
-            {
-              "ref": "[DAS-2]",
-              "fait": "N10 — Néphrite tubulo-interstitielle aigüe",
-              "signification": "Aucune preuve biologique (leucocytes normaux) ou clinique (pas de fièvre documentée)"
-            }
-          ],
-          "source_reglementaire": "CIM-10 — N10 requiert preuve d'infection rénale (fièvre, leucocytose, bactériurie, imagerie compatible). Absence de preuve = code non justifié."
-        },
-        {
-          "numero": 5,
-          "titre": "Rejet du code Z00.0 (Examen médical général) : code générique inapproprié en DP/DAS",
-          "argument": "L'établissement a codé Z00.0 (Examen médical général) [DAS-1]. Ce code R/Z (symptôme ou raison de consultation) est INTERDIT en DP si une étiologie est identifiée, et son utilisation en DAS est inappropriée quand un diagnostic spécifique existe. Le séjour n'était pas une visite de dépistage générale, mais une prise en charge d'une obstruction urétéro-iléale [IMG-1] avec mise en place de néphrostomie. Le code Z00.0 doit être RETIRÉ.",
-          "preuves": [
-            {
-              "ref": "[DAS-1]",
-              "fait": "Z00.0 — Examen médical général",
-              "signification": "Code générique inapproprié — étiologie spécifique identifiée (obstruction urétéro-iléale)"
-            },
-            {
-              "ref": "[IMG-1]",
-              "fait": "Diagnostic spécifique : obstruction urétéro-iléale avec mise en place de néphrostomie",
-              "signification": "Justifie le rejet de Z00.0"
-            }
-          ],
-          "source_reglementaire": "Guide méthodologique T2A — Codes R/Z interdits en DP si étiologie identifiée. Z00.0 est un code de raison de consultation générale, non applicable à une hospitalisation pour acte thérapeutique spécifique."
-        },
-        {
-          "numero": 6,
-          "titre": "Maintien du code T83.1 (Lésion traumatique du Bricker) : preuve documentée en imagerie",
-          "argument": "L'établissement a codé T83.1 (Complication mécanique d'autres prothèses et implants urinaires) [DAS-4]. Le dossier clinique [IMG-1] documente explicitement : 'Bricker extrêmement fragile, qui a été très légèrement endommagé au cours de cette Brickeroscopie'. Cette lésion iatrogène est une complication mécanique directe du Bricker (prothèse urinaire), justifiant pleinement le code T83.1. Ce code doit être MAINTENU.",
-          "preuves": [
-            {
-              "ref": "[IMG-1]",
-              "fait": "Bricker endommagé iatrogènement lors de la Brickeroscopie",
-              "signification": "Complication mécanique de prothèse urinaire — T83.1 justifié"
-            },
-            {
-              "ref": "[DAS-4]",
-              "fait": "T83.1 — Complication mécanique d'autres prothèses et implants urinaires",
-              "signification": "Code approprié et documenté"
-            }
-          ],
-          "source_reglementaire": "CIM-10 — T83.1 s'applique aux complications mécaniques de prothèses urinaires. La lésion du Bricker documentée en imagerie justifie ce code."
-        },
-        {
-          "numero": 7,
-          "titre": "Maintien du code I10 (Hypertension artérielle) : diagnostic comorbide documenté",
-          "argument": "L'établissement a codé I10 (Hypertension essentielle primitive) [DAS-5]. Bien que le dossier ne contienne pas de valeurs tensionnelles explicites, l'hypertension est un diagnostic comorbide fréquent chez un patient de 68 ans et peut justifier un traitement antihypertenseur pendant l'hospitalisation. En l'absence de preuve CONTRE ce diagnostic (pas de tension normale documentée), et en présence d'une indication clinique plausible, ce code peut être MAINTENU comme diagnostic associé. Toutefois, si la CPAM conteste l'absence de preuve documentée, nous reconnaissons que ce code repose sur le jugement clinique sans valeur tensionnelle citée.",
-          "preuves": [
-            {
-              "ref": "[DAS-5]",
-              "fait": "I10 — Hypertension essentielle (primitive)",
-              "signification": "Diagnostic comorbide plausible chez patient 68 ans, sans preuve contre"
-            }
-          ],
-          "source_reglementaire": "CIM-10 — I10 s'applique à l'hypertension essentielle. Absence de preuve documentée, mais absence de preuve contre. Maintien possible en DAS si cliniquement justifié."
-        },
-        {
-          "numero": 8,
-          "titre": "Rejet du code Z43.3 (Surveillance de colostomie) : absence de colostomie dans le dossier",
-          "argument": "L'établissement a codé Z43.3 (Surveillance de colostomie) [DAS-7]. Or, le dossier clinique ne mentionne AUCUNE colostomie. L'acte réalisé est une NÉPHROSTOMIE (stomie urinaire), non une colostomie (stomie digestive). Z43.3 s'applique à la surveillance de colostomie, code qui n'a aucune pertinence dans ce séjour. Ce code doit être RETIRÉ. Il s'agit probablement d'une erreur de codage (confusion entre néphrostomie et colostomie).",
-          "preuves": [
-            {
-              "ref": "[DAS-7]",
-              "fait": "Z43.3 — Surveillance de colostomie",
-              "signification": "Code inapproprié — aucune colostomie mentionnée dans le dossier"
-            },
-            {
-              "ref": "[IMG-1]",
-              "fait": "Acte réalisé : néphrostomie (stomie urinaire), non colostomie",
-              "signification": "Justifie le rejet de Z43.3"
-            }
-          ],
-          "source_reglementaire": "CIM-10 — Z43.3 s'applique à la surveillance de colostomie (stomie digestive). Néphrostomie se code en Z43.6 ou Z45.80, non Z43.3."
-        },
-        {
-          "numero": 9,
-          "titre": "Proposition de code manquant : N13.1 (Hydronéphrose avec rétrécissement urétéral) comme diagnostic associé",
-          "argument": "L'UCR propose N13.1 (Hydronéphrose avec rétrécissement urétéral, non classée ailleurs) comme diagnostic associé. Le dossier clinique [IMG-1] documente une 'absence totale de passage entre l'uretère gauche et le Bricker', ce qui constitue une obstruction urétérale fonctionnelle pouvant entraîner une hydronéphrose. Bien que le terme 'hydronéphrose' ne soit pas explicitement cité dans le compte rendu d'imagerie fourni, l'obstruction urétéro-iléale est la cause directe d'une hydronéphrose potentielle. Le code N13.1 est cliniquement pertinent et peut être AJOUTÉ comme diagnostic associé pour refléter la pathologie obstructive rénale.",
-          "preuves": [
-            {
-              "ref": "[IMG-1]",
-              "fait": "Absence totale de passage entre uretère gauche et Bricker",
-              "signification": "Obstruction urétérale — cause d'hydronéphrose"
-            },
-            {
-              "ref": "Définition CIM-10 N13.1",
-              "fait": "Hydronéphrose avec rétrécissement urétéral, non classée ailleurs",
-              "signification": "Code approprié pour obstruction urétérale"
-            }
-          ],
-          "source_reglementaire": "CIM-10 — N13.1 s'applique à l'hydronéphrose secondaire à rétrécissement ou obstruction urétérale. Pertinent dans ce contexte."
-        }
-      ],
-      "confrontation_bio": [
-        {
-          "diagnostic": "N17.9 — Insuffisance rénale aigüe, sans précision",
-          "test": "Créatinine",
-          "valeur": 84,
-          "seuil": "> 130 µmol/L (H)",
-          "verdict": "NON CONFIRMÉ — valeur NORMALE"
-        },
-        {
-          "diagnostic": "N19 — Insuffisance rénale, sans précision",
-          "test": "Créatinine",
-          "valeur": 84,
-          "seuil": "> 130 µmol/L (H)",
-          "verdict": "NON CONFIRMÉ — valeur NORMALE"
-        },
-        {
-          "diagnostic": "N10 — Néphrite tubulo-interstitielle aigüe",
-          "test": "Leucocytes",
-          "valeur": 8.18,
-          "seuil": "4-10 × 10⁹/L",
-          "verdict": "NON CONFIRMÉ — valeur NORMALE, pas de leucocytose"
-        },
-        {
-          "diagnostic": "E66.04 — Obésité",
-          "test": "IMC",
-          "valeur": 31.231,
-          "seuil": "> 30",
-          "verdict": "CONFIRMÉ biologiquement, mais NON PERTINENT comme DP (diagnostic comorbide, non motif d'hospitalisation)"
-        }
-      ],
-      "asymetrie_information": "L'UCR n'a reçu que le CRH et les codes, sans accès aux éléments cliniques détaillés suivants : (1) Biologie complète [BIO-1] à [BIO-9] montrant créatinine normale et leucocytes normaux, contredisant les diagnostics d'insuffisance rénale et pyélonéphrite ; (2) Compte rendu d'imagerie détaillé [IMG-1] décrivant l'obstruction urétéro-iléale, la Brickeroscopie, et la lésion iatrogène du Bricker ; (3) Documentation de la décision thérapeutique partagée [ANT-3] à [ANT-6] montrant que la néphrostomie est le centre du séjour. Ces informations manquantes ont probablement conduit l'UCR à accepter les codes proposés par l'établissement sans vérification biologique.",
-      "reponse_points_cpam": [
-        {
-          "point_cpam": "Le DP doit être Z43.6 (Surveillance de néphrostomie), non E66.04 (Obésité)",
-          "reconnaissance": "CORRECT. La CPAM a raison. L'obésité est une comorbidité chronique qui n'a motivé ni traitement spécifique, ni allongement de durée, ni modification de surveillance pendant ce séjour de 3 jours. L'acte médical principal et consommateur de ressources est la mise en place de néphrostomie suite à l'obstruction urétéro-iléale [IMG-1]. Selon la hiérarchie CIM-10, le DP doit être le diagnostic qui a consommé le plus de ressources, ce qui est clairement la néphrostomie, non l'obésité.",
-          "refutation_ou_concession": "CONCESSION PARTIELLE : Nous reconnaissons que E66.04 ne doit pas être DP. Cependant, nous proposons Z43.6 plutôt que Z45.80 proposé par l'UCR, car le dossier décrit une MISE EN PLACE de néphrostomie (création), non un ajustement de prothèse préexistante. Z43.6 (Surveillance d'autres stomies des voies urinaires — Néphrostomie) est plus approprié que Z45.80 (Ajustement et entretien d'une prothèse interne urinaire)."
-        },
-        {
-          "point_cpam": "L'ajout des autres codes DAS ne modifie pas le groupage GHM/GHS (Règle T7)",
-          "reconnaissance": "ACCEPTÉ. La CPAM cite correctement la Règle T7 du guide méthodologique : 'Situation de soins spécifique d'autres appareils'. Le groupage est déterminé par le DP et les actes CCAM, non par la totalité des DAS. Nous reconnaissons que le changement de DP de E66.04 à Z43.6 entraîne un groupage identique à celui proposé par les contrôleurs.",
-          "refutation_ou_concession": "ACCEPTATION COMPLÈTE sur le point de groupage. Cependant, cela ne justifie pas le maintien de codes DAS biologiquement indéfendables (N17.9, N19, N10, Z00.0, Z43.3)."
-        }
-      ],
-      "codes_non_defendables": [
-        {
-          "code": "N17.9 — Insuffisance rénale aigüe, sans précision",
-          "raison": "Créatinine = 84 µmol/L [norme 50-120] — valeur NORMALE. L'insuffisance rénale aiguë requiert créatinine > 130 µmol/L (H). Aucune preuve biologique. INCOHÉRENCE MAJEURE.",
-          "recommandation": "RETRAIT OBLIGATOIRE — code indéfendable face à la CPAM"
-        },
-        {
-          "code": "N19 — Insuffisance rénale, sans précision",
-          "raison": "Créatinine = 84 µmol/L [norme 50-120] — valeur NORMALE. L'insuffisance rénale requiert créatinine pathologique. Aucune preuve biologique. INCOHÉRENCE MAJEURE.",
-          "recommandation": "RETRAIT OBLIGATOIRE — code indéfendable face à la CPAM"
-        },
-        {
-          "code": "N10 — Néphrite tubulo-interstitielle aigüe",
-          "raison": "Leucocytes = 8.18 × 10⁹/L [norme 4-10] — valeur NORMALE. Pas de fièvre documentée, pas de bactériurie citée, pas de culture positive. Imagerie [IMG-1] décrit obstruction mécanique, non infection rénale. Aucune preuve objective.",
-          "recommandation": "RETRAIT OBLIGATOIRE — code repose sur jugement clinique sans preuve biologique ou paraclinique"
-        },
-        {
-          "code": "Z00.0 — Examen médical général",
-          "raison": "Code générique inapproprié. Le séjour n'était pas une visite de dépistage, mais une prise en charge d'obstruction urétéro-iléale [IMG-1] avec mise en place de néphrostomie. Étiologie spécifique identifiée.",
-          "recommandation": "RETRAIT OBLIGATOIRE — code R/Z interdit en DAS quand diagnostic spécifique existe"
-        },
-        {
-          "code": "Z43.3 — Surveillance de colostomie",
-          "raison": "Aucune colostomie mentionnée dans le dossier. L'acte réalisé est une NÉPHROSTOMIE (stomie urinaire), non colostomie (stomie digestive). Erreur de codage probable.",
-          "recommandation": "RETRAIT OBLIGATOIRE — code sans pertinence clinique"
-        },
-        {
-          "code": "E66.04 — Obésité due à un excès calorique de l'adulte",
-          "raison": "Bien que biologiquement confirmée (IMC 31.231), ce code ne doit PAS être DP. L'obésité est une comorbidité chronique qui n'a motivé ni traitement spécifique, ni allongement de durée, ni modification de surveillance pendant ce séjour. Le DP doit être la néphrostomie [IMG-1].",
-          "recommandation": "RETRAIT EN DP — peut être maintenu en DAS si pertinent, mais ne doit pas être DP"
-        }
-      ],
-      "references": [
-        {
-          "document": "Dossier médical — Compte rendu d'imagerie (TDM abdominal)",
-          "page": "Non spécifiée",
-          "citation": "Une absence totale de passage entre l'uretère gauche et le Bricker. [...] Bricker extrêmement fragile, qui a été très légèrement endommagé au cours de cette Brickeroscopie."
-        },
-        {
-          "document": "Dossier médical — Biologie",
-          "page": "Non spécifiée",
-          "citation": "Créatinine: 84 µmol/L [norme 50-120] — NORMAL. Leucocytes: 8.18 × 10⁹/L [norme 4-10] — NORMAL."
-        },
-        {
-          "document": "Guide méthodologique T2A",
-          "page": "Non spécifiée",
-          "citation": "Le diagnostic principal est celui qui a consommé le plus de ressources pendant le séjour, indépendamment de sa gravité relative."
-        },
-        {
-          "document": "CIM-10 — Codes Z43.x et Z45.x",
-          "page": "Non spécifiée",
-          "citation": "Z43.6 — Surveillance d'autres stomies des voies urinaires (Néphrostomie). Z45.80 — Ajustement et entretien d'une prothèse interne urinaire."
-        },
-        {
-          "document": "CIM-10 — Codes d'insuffisance rénale",
-          "page": "Non spécifiée",
-          "citation": "N17.9 — Insuffisance rénale aigüe, sans précision (requiert créatinine > 130 µmol/L chez l'homme). N19 — Insuffisance rénale, sans précision (requiert créatinine pathologique)."
-        }
-      ],
-      "conclusion_dispositive": "Par conséquent, au vu des éléments cliniques objectifs et des règles CIM-10 applicables, nous demandons les modifications suivantes au codage :\n\n**DP PROPOSÉ : Z43.6 — Surveillance d'autres stomies des voies urinaires (Néphrostomie)**\nJustification : L'acte médical principal et consommateur de ressources du séjour est la mise en place d'une néphrostomie suite à l'obstruction urétéro-iléale documentée en imagerie [IMG-1]. Selon la hiérarchie CIM-10, le DP doit être le diagnostic qui a consommé le plus de ressources, ce qui est clairement la néphrostomie, non l'obésité [DP] proposée initialement. La CPAM a raison de rejeter E66.04 comme DP.\n\n**DAS À MAINTENIR :**\n- T83.1 — Complication mécanique d'autres prothèses et implants urinaires [DAS-4] : JUSTIFIÉ par la lésion iatrogène du Bricker documentée en imagerie [IMG-1]\n- I10 — Hypertension essentielle (primitive) [DAS-5] : MAINTENU comme diagnostic comorbide plausible chez patient 68 ans (sans preuve contre)\n- N13.1 — Hydronéphrose avec rétrécissement urétéral, non classée ailleurs : À AJOUTER (pertinent pour refléter l'obstruction urétéro-iléale [IMG-1])\n\n**DAS À RETIRER :**\n- N17.9 — Insuffisance rénale aigüe, sans précision [DAS-6] : RETIRÉ — Créatinine = 84 µmol/L [BIO-8] (NORMALE, norme 50-120). Aucune preuve biologique d'insuffisance rénale aiguë.\n- N19 — Insuffisance rénale, sans précision [DAS-3] : RETIRÉ — Créatinine = 84 µmol/L [BIO-8] (NORMALE). Aucune preuve biologique d'insuffisance rénale.\n- N10 — Néphrite tubulo-interstitielle aigüe [DAS-2] : RETIRÉ — Leucocytes = 8.18 × 10⁹/L [BIO-7] (NORMAL, norme 4-10). Pas de fièvre documentée, pas de bactériurie citée. Imagerie [IMG-1] décrit obstruction mécanique, non infection rénale.\n- Z00.0 — Examen médical général [DAS-1] : RETIRÉ — Code générique inapproprié. Étiologie spécifique identifiée (obstruction urétéro-iléale).\n- Z43.3 — Surveillance de colostomie [DAS-7] : RETIRÉ — Aucune colostomie dans le dossier. Acte réalisé : néphrostomie (stomie urinaire), non colostomie.\n- E66.04 — Obésité [DP] : RETIRÉ EN DP — Peut être maintenu en DAS si pertinent, mais ne doit pas être DP (diagnostic comorbide, non motif d'hospitalisation).\n\n**RECONNAISSANCE DES POINTS CPAM :**\nNous reconnaissons que la CPAM a raison sur le point fondamental : le DP doit être centré sur la néphrostomie, non sur l'obésité. La Règle T7 du guide méthodologique (Situation de soins spécifique d'autres appareils) s'applique correctement, et le groupage GHM/GHS ne sera pas modifié par ces corrections.\n\n**ASYMÉTRIE D'INFORMATION :**\nL'UCR n'a reçu que le CRH et les codes, sans accès à la biologie complète [BIO-1] à [BIO-9] et au compte rendu d'imagerie détaillé [IMG-1]. Ces informations manquantes ont probablement conduit à l'acceptation de codes biologiquement indéfendables (N17.9, N19, N10). La transmission de ces éléments cliniques objectifs aurait permis à l'UCR de détecter les incohérences et de proposer un codage plus rigoureux.\n\n**CODAGE FINAL PROPOSÉ :**\n- **DP : Z43.6** — Surveillance d'autres stomies des voies urinaires (Néphrostomie)\n- **DAS : T83.1, I10, N13.1**\n- **Retrait : N17.9, N19, N10, Z00.0, Z43.3, E66.04 (en DP)**\n\nCe codage reflète fidèlement la réalité clinique du séjour, est soutenu par les preuves objectives du dossier, et respecte les règles CIM-10 et T2A applicables."
-    },
-    "text_output": "═══════════════════════════════════════════════════════\nMÉMOIRE EN DÉFENSE — Contestation Désaccord sur le DP et DAS — Mémoire en défense structuré\n═══════════════════════════════════════════════════════\n\n⚠ REVUE MANUELLE REQUISE (Qualité : C)\n\nRAPPEL DES FAITS\nPatient masculin, 68 ans, hospitalisé 3 jours pour prise en charge d'une obstruction urétéro-iléale (absence de passage entre uretère gauche et Bricker) diagnostiquée en imagerie [IMG-1]. Actes réalisés : TDM abdominal [ACTE-1], urétéroscopie descendante, Brickeroscopie avec lésion traumatique iatrogène du Bricker [IMG-1]. Mise en place d'une néphrostomie. Sortie après décision thérapeutique partagée.\n\n───────────────────────────────────────────────────────\n\nMOYEN N°1 — La CPAM a raison sur le DP : Z43.6 (Surveillance de néphrostomie) est plus pertinent que E66.04 (Obésité)\nL'établissement a codé en DP l'obésité [DP] (E66.04 — Obésité due à un excès calorique de l'adulte avec IMC égal à 31.231), alors que l'acte médical principal et consommateur de ressources du séjour est la mise en place d'une néphrostomie suite à l'obstruction urétéro-iléale [IMG-1]. Selon la règle hiérarchique CIM-10, le DP doit être le diagnostic qui a CONSOMMÉ LE PLUS DE RESSOURCES pendant le séjour, non le diagnostic comorbide le plus grave. L'obésité est une condition chronique préexistante qui n'a motivé ni traitement spécifique, ni allongement de durée, ni modification de surveillance pendant ces 3 jours. En revanche, l'obstruction urétéro-iléale et la mise en place de néphrostomie ont justifié l'hospitalisation, les actes d'imagerie [ACTE-1], les gestes endoscopiques [IMG-1], et la décision thérapeutique documentée [ANT-3] à [ANT-6]. Le code Z43.6 (Surveillance d'autres stomies des voies urinaires — Néphrostomie) est donc le DP approprié, conformément à la logique T2A qui valorise l'acte thérapeutique principal.\n  Preuve : [DP] DP établissement = E66.04 (Obésité, IMC 31.231) → Diagnostic comorbide, non motif d'hospitalisation\n  Preuve : [IMG-1] Absence totale de passage entre uretère gauche et Bricker ; urétéroscopie descendante et Brickeroscopie réalisées ; Bricker endommagé iatrogènement → Acte thérapeutique principal justifiant l'hospitalisation\n  Preuve : [ACTE-1] TDM abdominal (ZCQK002) réalisée → Imagerie diagnostique directement liée à l'obstruction, non à l'obésité\n  Preuve : [ANT-3] à [ANT-6] Documentation de la décision thérapeutique : retrait de néphrostomie vs. maintien vs. reconstruction → Preuve que la néphrostomie est le centre du séjour\n  Source : Guide méthodologique T2A — Règle hiérarchique DP : 'Le diagnostic principal est celui qui a consommé le plus de ressources pendant le séjour, indépendamment de sa gravité relative'. La mise en place d'une stomie urinaire (néphrostomie) se code en DP avec un code Z43.x ou Z45.x selon le contexte (surveillance vs. ajustement).\n\nMOYEN N°2 — Reconnaissance du bien-fondé de la proposition UCR : Z43.6 vs. Z45.80 — clarification du code exact\nL'UCR propose Z45"
-  },
-  {
-    "model": "gpt-oss:latest",
-    "dossier": "183_23087212",
-    "timestamp": "2026-03-04 15:33:47",
-    "ogc": 183,
-    "titre": "Désaccord sur le DP et DAS",
-    "elapsed_s": 319.6,
-    "text_len": 29124,
-    "rag_sources": 0,
-    "quality_tier": "B",
-    "requires_review": false,
-    "json_valid": true,
-    "is_tim": true,
-    "tim_eval": {
-      "format": "TIM",
-      "tim_compliant": true,
-      "fields_present": 9,
-      "fields_total": 9,
-      "fields_missing": [],
-      "moyens_count": 8,
-      "preuves_count": 16,
-      "preuves_with_ref": 16,
-      "confrontation_count": 4,
-      "codes_nd_count": 5,
-      "refs_count": 4,
-      "conclusion_len": 2941,
-      "has_maintien": true
-    },
-    "bio_errors": [
-      {
-        "type": "BIO_HALLUCINATION",
-        "severity": "CRITICAL",
-        "detail": "Créatinine 84 µmol/L (NORMAL 50-120) qualifiée comme 'insuffisance rénale'",
-        "ground_truth": "Créatinine 84 = NORMAL"
-      },
-      {
-        "type": "CONFRONTATION_ERROR",
-        "severity": "CRITICAL",
-        "detail": "Créatinine = 84 (NORMAL) mais verdict = NON CONFIRMÉ — VALEUR NORMALE",
-        "ground_truth": "Créatinine norme [50-120]"
-      },
-      {
-        "type": "CONFRONTATION_ERROR",
-        "severity": "CRITICAL",
-        "detail": "Créatinine = 84 (NORMAL) mais verdict = NON CONFIRMÉ — VALEUR NORMALE",
-        "ground_truth": "Créatinine norme [50-120]"
-      }
-    ],
-    "bio_errors_count": 3,
-    "bio_critical_count": 3,
-    "code_errors": [
-      {
-        "type": "SUSPICIOUS_CODE",
-        "severity": "MEDIUM",
-        "detail": "Code Z45.80: Code Z45.8 existe mais Z45.80 est suspect (vérifier)"
-      }
-    ],
-    "code_errors_count": 1,
-    "parsed_response": {
-      "objet": "Contestation Désaccord sur le DP et DAS — Mémoire en défense structuré",
-      "rappel_faits": "Patient masculin, 68 ans, hospitalisé 3 jours pour obstruction urétéro-iléale sur Bricker (antécédent de dérivation urinaire). Diagnostic d'entrée : pyélonéphrite sévère avec hydronéphrose. Actes réalisés : TDM abdominal [ACTE-1], urétéroscopie descendante, Brickeroscopie avec lésion iatrogène du Bricker [IMG-1]. Créatinine normale [BIO-8]. Sortie avec néphrostomie temporaire en attente de décision thérapeutique définitive.",
-      "moyens_defense": [
-        {
-          "numero": 1,
-          "titre": "Le DP doit refléter le motif principal du séjour (obstruction urétéro-iléale aiguë avec pyélonéphrite), non une comorbidité pré-existante",
-          "argument": "L'établissement a codé E66.04 (Obésité) en DP, alors que l'IMC = 31.0 [DP] est une donnée anthropométrique stable, pré-existante, et n'a pas motivé l'hospitalisation. Le motif réel du séjour est l'urgence urologique : obstruction complète du passage urétéro-iléal [IMG-1] entraînant une pyélonéphrite sévère [DAS-2] et une lésion traumatique du Bricker [DAS-4] lors de la tentative de rétablissement du passage. Selon la règle CIM-10 fondamentale, le DP est le diagnostic qui a consommé le plus de ressources et justifie la durée de séjour. Ici, c'est l'intervention urologique d'urgence (urétéroscopie + Brickeroscopie) et la mise en place d'un drainage urinaire (néphrostomie), non la gestion de l'obésité. L'obésité n'a reçu aucun traitement spécifique, n'a pas allongé la durée de séjour, et n'a pas modifié la surveillance. Elle doit être codée en DAS si elle a une pertinence clinique documentée, mais ne peut être DP.",
-          "preuves": [
-            {
-              "ref": "[IMG-1]",
-              "fait": "TDM abdominal : absence totale de passage entre l'uretère gauche et le Bricker ; urétéroscopie descendante jusqu'à la jonction urétéro-iléale sans passage possible ; Brickeroscopie révélant un Bricker extrêmement fragile, endommagé lors de la manœuvre",
-              "signification": "Obstruction urétéro-iléale complète justifiant l'intervention d'urgence"
-            },
-            {
-              "ref": "[DAS-2]",
-              "fait": "Pyélonéphrite sévère (N10) codée en DAS",
-              "signification": "Complication infectieuse aiguë justifiant l'urgence de l'intervention"
-            },
-            {
-              "ref": "[DAS-4]",
-              "fait": "Lésion traumatique du Bricker (T83.1) codée en DAS",
-              "signification": "Complication iatrogène directe de l'acte réalisé lors du séjour"
-            },
-            {
-              "ref": "[DP]",
-              "fait": "IMC = 31.0 (obésité légère), valeur stable et pré-existante",
-              "signification": "Comorbidité chronique, non motif d'hospitalisation"
-            }
-          ],
-          "source_reglementaire": "Guide méthodologique T2A — Règle générale : Le DP est le diagnostic qui a consommé le plus de ressources et justifie la durée de séjour et les actes réalisés. Une comorbidité pré-existante sans traitement spécifique ne peut être DP."
-        },
-        {
-          "numero": 2,
-          "titre": "L'UCR reconnaît que Z43.6 (Surveillance de néphrostomie) ou Z45.80 (Ajustement d'une prothèse urinaire) est l'acte effectivement réalisé, mais ce codage occulte la complication iatrogène majeure",
-          "argument": "L'UCR propose Z45.80 (Ajustement et entretien d'une prothèse interne urinaire) en DP, arguant que c'est l'acte effectivement réalisé. Nous reconnaissons que la mise en place d'une néphrostomie a bien eu lieu et que Z43.6 ou Z45.80 est pertinent. CEPENDANT, le codage en DP de Z45.80 seul masque la réalité clinique du séjour : il ne s'agit pas d'un simple ajustement de routine, mais d'une intervention d'urgence pour obstruction complète avec complication iatrogène (lésion du Bricker). Le code Z45.80 décrit une action (ajustement), pas le motif clinique qui a justifié cette action. Selon la hiérarchie diagnostique CIM-10, lorsqu'une complication aiguë (pyélonéphrite + obstruction) justifie une intervention, le DP doit refléter cette complication, pas seulement l'acte de surveillance/ajustement. Z45.80 est un code de surveillance/suivi, approprié pour un séjour de routine ; ici, le séjour est motivé par une urgence aiguë. Le DP doit être N13.1 (Hydronéphrose avec rétrécissement urétéral) ou N10 (Pyélonéphrite), avec Z45.80 ou Z43.6 en DAS pour documenter l'acte réalisé.",
-          "preuves": [
-            {
-              "ref": "[IMG-1]",
-              "fait": "Absence totale de passage urétéro-iléal, Bricker fragile endommagé lors de la Brickeroscopie",
-              "signification": "Urgence aiguë, non routine d'ajustement"
-            },
-            {
-              "ref": "[DAS-2]",
-              "fait": "Pyélonéphrite sévère (N10)",
-              "signification": "Complication infectieuse aiguë justifiant l'intervention"
-            }
-          ],
-          "source_reglementaire": "CIM-10 — Z45.80 est défini comme 'Ajustement et entretien d'une prothèse interne urinaire', code de surveillance/suivi. Il ne décrit pas le motif clinique d'urgence. Selon le guide méthodologique, le DP doit être le diagnostic qui a consommé le plus de ressources, pas l'acte de surveillance."
-        },
-        {
-          "numero": 3,
-          "titre": "La lésion traumatique du Bricker (T83.1) est une complication iatrogène documentée et doit être maintenue en DAS",
-          "argument": "Le dossier d'imagerie [IMG-1] documente explicitement que le Bricker a été 'très légèrement endommagé au cours de cette Brickeroscopie'. Cette lésion est une complication mécanique directe de l'acte réalisé lors du séjour. Le code T83.1 (Complication mécanique d'autres prothèses et implants urinaires) est approprié et doit être maintenu en DAS. Cette complication a justifié la mise en place d'une néphrostomie temporaire et a modifié la prise en charge post-opératoire (surveillance accrue, décision thérapeutique différée). Elle répond aux critères de pertinence DAS : (1) traitement spécifique (drainage urinaire alternatif), (2) allongement potentiel de la durée de séjour, (3) modification de la surveillance. L'UCR ne conteste pas cette complication ; elle ne la mentionne pas dans sa proposition de codage, ce qui est une omission.",
-          "preuves": [
-            {
-              "ref": "[IMG-1]",
-              "fait": "Brickeroscopie : 'Bricker extrêmement fragile, qui a été très légèrement endommagé au cours de cette Brickeroscopie'",
-              "signification": "Complication mécanique iatrogène documentée"
-            },
-            {
-              "ref": "[DAS-4]",
-              "fait": "Lésion traumatique du Bricker (T83.1) codée en DAS",
-              "signification": "Code approprié pour cette complication"
-            }
-          ],
-          "source_reglementaire": "CIM-10 — T83.1 : Complication mécanique d'autres prothèses et implants urinaires. Applicable à toute lésion mécanique d'une dérivation urinaire (Bricker) survenue lors d'une intervention."
-        },
-        {
-          "numero": 4,
-          "titre": "Les codes d'insuffisance rénale (N17.9, N19) ne sont pas défendables biologiquement et doivent être retirés",
-          "argument": "L'établissement a codé deux diagnostics d'insuffisance rénale : N17.9 (Insuffisance rénale aiguë, sans précision) et N19 (Insuffisance rénale, sans précision) en DAS. Or, la créatinine du patient est 84 µmol/L [BIO-8], valeur NORMALE (norme 50-120 µmol/L). Une créatinine normale CONTREDIT formellement le diagnostic d'insuffisance rénale aiguë ou chronique. Selon les seuils CIM-10, une IRA requiert une créatinine > 130 µmol/L (chez l'homme) ; ici, la valeur est normale. Ces deux codes ne disposent d'aucun support biologique et doivent être retirés. L'obstruction urétéro-iléale a bien créé un risque d'insuffisance rénale (hydronéphrose), mais la fonction rénale est restée préservée lors du séjour. Si une insuffisance rénale était présente avant l'hospitalisation, elle n'est pas documentée dans le dossier fourni. Nous recommandons le retrait de N17.9 et N19.",
-          "preuves": [
-            {
-              "ref": "[BIO-8]",
-              "fait": "Créatinine = 84 µmol/L [norme 50-120 µmol/L]",
-              "signification": "Fonction rénale NORMALE, insuffisance rénale NON CONFIRMÉE"
-            }
-          ],
-          "source_reglementaire": "CIM-10 — N17.9 (IRA) et N19 (IR sans précision) requièrent une élévation de la créatinine. Seuil diagnostic : créatinine > 130 µmol/L (H) ou > 110 µmol/L (F). Valeur du dossier = 84 µmol/L → diagnostic non confirmé biologiquement."
-        },
-        {
-          "numero": 5,
-          "titre": "La pyélonéphrite sévère (N10) est justifiée cliniquement et doit être maintenue en DAS",
-          "argument": "L'établissement a codé N10 (Néphrite tubulo-interstitielle aiguë / Pyélonéphrite sévère) en DAS. Ce diagnostic est documenté comme motif d'entrée et justifie l'urgence de l'intervention. Bien que la biologie fournie ne contienne pas de marqueurs inflammatoires (CRP, procalcitonine, leucocytes), les leucocytes sont normaux [BIO-7 = 8.18, norme 4-10], ce qui ne contredit pas une pyélonéphrite (la leucocytose n'est pas obligatoire). Le diagnostic repose sur le contexte clinique : obstruction urétéro-iléale [IMG-1] + symptomatologie infectieuse (implicite dans le motif d'hospitalisation) + nécessité d'une intervention d'urgence. N10 est approprié en DAS et doit être maintenu.",
-          "preuves": [
-            {
-              "ref": "[IMG-1]",
-              "fait": "Obstruction urétéro-iléale complète créant un contexte de stase urinaire et d'infection",
-              "signification": "Contexte clinique justifiant le diagnostic de pyélonéphrite"
-            },
-            {
-              "ref": "[BIO-7]",
-              "fait": "Leucocytes = 8.18 [norme 4-10]",
-              "signification": "Valeur normale, mais n'exclut pas une infection localisée (pyélonéphrite)"
-            },
-            {
-              "ref": "[DAS-2]",
-              "fait": "Pyélonéphrite sévère (N10) codée en DAS",
-              "signification": "Code approprié pour l'infection du haut appareil urinaire"
-            }
-          ],
-          "source_reglementaire": "CIM-10 — N10 : Néphrite tubulo-interstitielle aiguë. Diagnostic clinique justifié par l'obstruction + contexte infectieux, même sans marqueurs inflammatoires élevés."
-        },
-        {
-          "numero": 6,
-          "titre": "L'hydronéphrose (N13.1) est pré-existante et ne peut être DP, mais doit être maintenue en DAS comme diagnostic étiologique",
-          "argument": "L'UCR propose N13.1 (Hydronéphrose avec rétrécissement urétéral) en DA (diagnostic associé). Nous reconnaissons que l'hydronéphrose est pré-existante (antécédent de dérivation urinaire avec obstruction chronique progressive). Selon la règle CIM-10, un diagnostic pré-existant ne peut être DP. CEPENDANT, N13.1 doit être maintenu en DAS car il décrit l'étiologie de la pyélonéphrite aiguë et justifie l'intervention. L'obstruction urétéro-iléale [IMG-1] est la cause directe de l'hydronéphrose et de la stase urinaire ayant entraîné l'infection. N13.1 est pertinent en DAS pour documenter le contexte anatomique de la complication infectieuse aiguë.",
-          "preuves": [
-            {
-              "ref": "[IMG-1]",
-              "fait": "Absence totale de passage urétéro-iléal, hydronéphrose secondaire",
-              "signification": "N13.1 décrit l'étiologie de la pyélonéphrite aiguë"
-            }
-          ],
-          "source_reglementaire": "CIM-10 — N13.1 : Hydronéphrose avec rétrécissement urétéral. Approprié en DAS pour documenter l'étiologie de la complication infectieuse aiguë, même si pré-existant."
-        },
-        {
-          "numero": 7,
-          "titre": "L'hypertension artérielle (I10) et la colostomie (Z43.3) ne disposent pas de support documentaire suffisant dans le dossier fourni",
-          "argument": "L'établissement a codé I10 (Hypertension essentielle) et Z43.3 (Surveillance de colostomie) en DAS. Or, le dossier fourni ne contient aucune mention explicite d'hypertension artérielle (pas de valeurs tensionnelles, pas de traitement antihypertenseur documenté, pas de diagnostic d'HTA dans le texte clinique). De même, Z43.3 (colostomie) n'est pas mentionné dans le dossier ; le patient a un Bricker (dérivation urinaire), pas une colostomie (dérivation fécale). Z43.3 est un code erroné. I10 peut être une comorbidité, mais sans documentation explicite, elle ne peut être codée. Nous recommandons le retrait de I10 et Z43.3, ou leur remplacement par Z43.6 (Surveillance de néphrostomie) si une surveillance de stomie urinaire est pertinente.",
-          "preuves": [
-            {
-              "ref": "[Dossier]",
-              "fait": "Aucune mention d'hypertension artérielle, aucune valeur tensionnelle, aucune mention de colostomie",
-              "signification": "Codes non documentés, non défendables"
-            }
-          ],
-          "source_reglementaire": "Règle CIM-10 : Un diagnostic ne peut être codé que s'il est explicitement documenté dans le dossier ou déduit de preuves objectives (biologie, imagerie, actes). Absence de documentation = code non défendable."
-        },
-        {
-          "numero": 8,
-          "titre": "L'asymétrie informationnelle : la CPAM n'avait pas accès aux éléments cliniques objectifs justifiant les codes",
-          "argument": "L'UCR a rendu son avis en ne disposant que du CRH (compte rendu d'hospitalisation) et des codes, SANS accès à la biologie complète, à l'imagerie détaillée, ni aux actes CCAM. Les éléments suivants n'ont pas été transmis à la CPAM et justifient le codage établissement : (1) [IMG-1] : description détaillée de l'obstruction urétéro-iléale et de la lésion du Bricker, justifiant N10, T83.1, et la nécessité d'une intervention d'urgence ; (2) [BIO-8] : créatinine normale, contredisant les codes d'insuffisance rénale ; (3) [ACTE-1] : TDM abdominal, acte diagnostique justifiant la durée de séjour. Sans ces éléments, l'UCR a conclu que le DP était Z45.80 (ajustement de routine), alors que le dossier complet montre une urgence aiguë avec complication iatrogène. Cette asymétrie informationnelle a biaisé l'avis de l'UCR.",
-          "preuves": [
-            {
-              "ref": "[IMG-1]",
-              "fait": "Imagerie détaillée non transmise à la CPAM",
-              "signification": "Justifie la nature urgente du séjour"
-            },
-            {
-              "ref": "[BIO-8]",
-              "fait": "Créatinine normale non transmise à la CPAM",
-              "signification": "Contredit les codes d'insuffisance rénale"
-            }
-          ],
-          "source_reglementaire": "Principe de transparence informationnelle : L'UCR doit disposer de tous les éléments cliniques objectifs pour rendre un avis motivé. Une décision fondée sur des informations incomplètes peut être contestée."
-        }
-      ],
-      "confrontation_bio": [
-        {
-          "diagnostic": "N17.9 — Insuffisance rénale aiguë, sans précision",
-          "test": "Créatinine",
-          "valeur": 84,
-          "seuil": "> 130 µmol/L (H)",
-          "verdict": "NON CONFIRMÉ — valeur NORMALE"
-        },
-        {
-          "diagnostic": "N19 — Insuffisance rénale, sans précision",
-          "test": "Créatinine",
-          "valeur": 84,
-          "seuil": "> 130 µmol/L (H)",
-          "verdict": "NON CONFIRMÉ — valeur NORMALE"
-        },
-        {
-          "diagnostic": "N10 — Pyélonéphrite sévère",
-          "test": "Leucocytes",
-          "valeur": 8.18,
-          "seuil": "4-10 (normal)",
-          "verdict": "COMPATIBLE — leucocytose non obligatoire pour pyélonéphrite localisée"
-        },
-        {
-          "diagnostic": "I10 — Hypertension essentielle",
-          "test": "Aucune valeur tensionnelle documentée",
-          "valeur": "N/A",
-          "seuil": "N/A",
-          "verdict": "NON DOCUMENTÉ — code non défendable"
-        }
-      ],
-      "asymetrie_information": "La CPAM n'avait pas accès à : (1) [IMG-1] — description détaillée de l'obstruction urétéro-iléale complète et de la lésion du Bricker lors de la Brickeroscopie, élément central justifiant l'urgence et la complication iatrogène ; (2) [BIO-8] — créatinine = 84 µmol/L (NORMALE), contredisant les codes d'insuffisance rénale ; (3) [ACTE-1] — TDM abdominal, acte diagnostique justifiant la durée de séjour. Sans ces éléments objectifs, l'UCR a conclu que le séjour était une routine d'ajustement (Z45.80), alors que le dossier complet montre une urgence aiguë avec complication iatrogène majeure.",
-      "reponse_points_cpam": [
-        {
-          "point_cpam": "Le DP doit être Z45.80 (Ajustement et entretien d'une prothèse interne urinaire) car c'est l'acte effectivement réalisé",
-          "reconnaissance": "PARTIELLEMENT JUSTE — Une néphrostomie a bien été mise en place, et Z45.80 ou Z43.6 décrit cet acte.",
-          "refutation": "CEPENDANT, Z45.80 est un code de surveillance/suivi, approprié pour un séjour de routine. Ici, le séjour est motivé par une URGENCE AIGUË : obstruction complète [IMG-1] + pyélonéphrite sévère [DAS-2] + complication iatrogène (lésion du Bricker) [DAS-4]. Selon la hiérarchie CIM-10, le DP doit refléter le motif clinique qui a justifié l'intervention, pas seulement l'acte de surveillance. Le DP doit être N13.1 (Hydronéphrose avec rétrécissement urétéral) ou N10 (Pyélonéphrite), avec Z45.80 en DAS pour documenter l'acte réalisé."
-        },
-        {
-          "point_cpam": "L'hydronéphrose (N13.1) est pré-existante et ne peut être DP",
-          "reconnaissance": "JUSTE — L'hydronéphrose est effectivement pré-existante (antécédent de dérivation urinaire).",
-          "refutation": "MAIS N13.1 doit être maintenu en DAS car il décrit l'étiologie de la pyélonéphrite aiguë et justifie l'intervention. L'obstruction urétéro-iléale [IMG-1] est la cause directe de la stase urinaire et de l'infection. N13.1 est pertinent en DAS pour documenter le contexte anatomique."
-        },
-        {
-          "point_cpam": "L'obésité (E66.04) n'est pas le DP car elle n'a pas consommé de ressources spécifiques",
-          "reconnaissance": "JUSTE — L'obésité est une comorbidité pré-existante sans traitement spécifique lors du séjour.",
-          "refutation": "Nous reconnaissons que E66.04 ne doit pas être DP. Le DP doit refléter le motif principal du séjour : l'urgence urologique (obstruction + pyélonéphrite + intervention). E66.04 peut être codé en DAS si pertinent cliniquement, mais ne peut être DP."
-        },
-        {
-          "point_cpam": "L'ajout des autres codes DAS ne modifie pas le groupage GHM/GHS (Règle T7)",
-          "reconnaissance": "TECHNIQUEMENT JUSTE — La Règle T7 du guide méthodologique stipule que certains DAS n'impactent pas le groupage.",
-          "refutation": "CEPENDANT, cet argument ne justifie pas le retrait de codes cliniquement pertinents. La Règle T7 est une règle de groupage, pas une règle de codage clinique. Les codes doivent refléter la réalité clinique du séjour, indépendamment de leur impact sur le groupage. De plus, la lésion du Bricker (T83.1) est une complication iatrogène majeure qui doit être documentée, même si elle n'impacte pas le groupage."
-        }
-      ],
-      "codes_non_defendables": [
-        {
-          "code": "N17.9 — Insuffisance rénale aiguë, sans précision",
-          "raison": "Créatinine = 84 µmol/L [norme 50-120] — valeur NORMALE. Diagnostic d'IRA requiert créatinine > 130 µmol/L (H). Biologie contredit formellement le diagnostic.",
-          "recommandation": "RETRAIT RECOMMANDÉ — Code indéfendable face à la CPAM. Aucun support biologique."
-        },
-        {
-          "code": "N19 — Insuffisance rénale, sans précision",
-          "raison": "Créatinine = 84 µmol/L [norme 50-120] — valeur NORMALE. Diagnostic d'insuffisance rénale requiert élévation de la créatinine. Biologie contredit formellement le diagnostic.",
-          "recommandation": "RETRAIT RECOMMANDÉ — Code indéfendable face à la CPAM. Aucun support biologique."
-        },
-        {
-          "code": "I10 — Hypertension essentielle (primitive)",
-          "raison": "Aucune mention d'hypertension artérielle dans le dossier fourni. Pas de valeurs tensionnelles documentées, pas de traitement antihypertenseur mentionné. Code non documenté.",
-          "recommandation": "RETRAIT RECOMMANDÉ — Code non documenté, non défendable. Si HTA est présente, elle doit être explicitement mentionnée dans le CRH."
-        },
-        {
-          "code": "Z43.3 — Surveillance de colostomie",
-          "raison": "Patient a un Bricker (dérivation urinaire), pas une colostomie (dérivation fécale). Code anatomiquement erroné. Aucune mention de colostomie dans le dossier.",
-          "recommandation": "RETRAIT RECOMMANDÉ — Code erroné. Remplacer par Z43.6 (Surveillance de néphrostomie) ou Z45.80 (Ajustement de prothèse urinaire) si pertinent."
-        },
-        {
-          "code": "Z00.0 — Examen médical général",
-          "raison": "Code générique de surveillance/examen de routine. Inapproprié pour un séjour d'urgence avec intervention. Aucune justification clinique documentée.",
-          "recommandation": "RETRAIT RECOMMANDÉ — Code non pertinent pour ce séjour d'urgence. Remplacer par codes spécifiques de la pathologie (N10, N13.1, T83.1)."
-        }
-      ],
-      "references": [
-        {
-          "document": "Dossier médical — Imagerie (TDM abdominal + Urétéroscopie + Brickeroscopie)",
-          "page": "N/A",
-          "citation": "TDM abdominal — une absence totale de passage entre l'uretère gauche et le Bricker. Urétéroscopie descendante jusqu'en bas de l'uretère à la jonction urétéro-iléale. Aucun passage possible jusqu'au Bricker. Brickeroscopie : Bricker extrêmement fragile, très légèrement endommagé au cours de cette Brickeroscopie."
-        },
-        {
-          "document": "Dossier médical — Biologie",
-          "page": "N/A",
-          "citation": "Créatinine = 84 µmol/L [norme 50-120] — NORMALE. Leucocytes = 8.18 [norme 4-10] — NORMAL. Sodium = 140 [norme 135-145] — NORMAL. Potassium = 3.9 [norme 3.5-5.0] — NORMAL."
-        },
-        {
-          "document": "CIM-10 — Définitions officielles",
-          "page": "N/A",
-          "citation": "N17.9 : Insuffisance rénale aiguë, sans précision. N19 : Insuffisance rénale, sans précision. N10 : Néphrite tubulo-interstitielle aiguë. N13.1 : Hydronéphrose avec rétrécissement urétéral, non classée ailleurs. T83.1 : Complication mécanique d'autres prothèses et implants urinaires. Z45.80 : Ajustement et entretien d'une prothèse interne urinaire. Z43.6 : Surveillance de néphrostomie."
-        },
-        {
-          "document": "Guide méthodologique T2A — Règles de codage",
-          "page": "N/A",
-          "citation": "Le DP est le diagnostic qui a consommé le plus de ressources et justifie la durée de séjour et les actes réalisés. Un diagnostic pré-existant sans traitement spécifique ne peut être DP. Un code ne peut être utilisé que s'il est explicitement documenté ou déduit de preuves objectives."
-        }
-      ],
-      "conclusion_dispositive": "Par conséquent, au vu des éléments cliniques objectifs fournis (obstruction urétéro-iléale complète [IMG-1], pyélonéphrite sévère [DAS-2], lésion traumatique du Bricker [DAS-4], créatinine normale [BIO-8]), des règles CIM-10 applicables (hiérarchie diagnostique, pertinence clinique, support biologique), et des informations complémentaires non transmises à l'UCR lors de son avis initial, nous demandons la MODIFICATION du codage comme suit :\n\n**DP PROPOSÉ : N13.1 — Hydronéphrose avec rétrécissement urétéral, non classée ailleurs**\n(Justification : Étiologie de la pyélonéphrite aiguë et motif principal de l'intervention d'urgence. Bien que pré-existante, elle justifie le séjour et la durée de prise en charge.)\n\n**DAS À MAINTENIR :**\n- N10 — Néphrite tubulo-interstitielle aiguë (Pyélonéphrite sévère) — JUSTIFIÉ cliniquement\n- T83.1 — Complication mécanique d'autres prothèses et implants urinaires (Lésion du Bricker) — DOCUMENTÉ en imagerie\n- Z45.80 — Ajustement et entretien d'une prothèse interne urinaire (Mise en place de néphrostomie) — ACTE RÉALISÉ\n- Z43.6 — Surveillance de néphrostomie (si pertinent pour documenter la surveillance post-opératoire) — ALTERNATIF à Z45.80\n\n**DAS À RETIRER :**\n- N17.9 — Insuffisance rénale aiguë, sans précision — NON CONFIRMÉ biologiquement (créatinine = 84 µmol/L, NORMALE)\n- N19 — Insuffisance rénale, sans précision — NON CONFIRMÉ biologiquement (créatinine = 84 µmol/L, NORMALE)\n- I10 — Hypertension essentielle — NON DOCUMENTÉ dans le dossier\n- Z43.3 — Surveillance de colostomie — CODE ERRONÉ (patient a Bricker, pas colostomie)\n- Z00.0 — Examen médical général — NON PERTINENT pour urgence aiguë\n- E66.04 — Obésité — COMORBIDITÉ PRÉ-EXISTANTE, ne peut être DP\n\n**RECONNAISSANCE DES POINTS LÉGITIMES DE L'UCR :**\nNous reconnaissons que (1) l'hydronéphrose est pré-existante et ne peut être DP selon la règle stricte ; (2) une néphrostomie a bien été mise en place et doit être codée ; (3) la Règle T7 s'applique au groupage. CEPENDANT, ces points ne justifient pas le retrait de codes cliniquement pertinents ni l'omission de la complication iatrogène majeure (lésion du Bricker).\n\n**ALTERNATIVE DÉFENSIVE (si N13.1 en DP est jugé inacceptable par la CPAM) :**\nSi l'UCR maintient son position que N13.1 ne peut être DP (pré-existant), nous acceptons Z45.80 en DP, À CONDITION que les codes suivants soient maintenus en DAS : N10 (pyélonéphrite justifiant l'urgence), T83.1 (complication iatrogène), et que les codes d'insuffisance rénale (N17.9, N19) soient retirés (non confirmés biologiquement).\n\n**DEMANDE FORMELLE :**\nNous demandons à l'UCR de reconsidérer son avis en tenant compte de l'imagerie détaillée [IMG-1], de la biologie complète [BIO-8], et de la complication iatrogène documentée [DAS-4], éléments qui n'étaient pas disponibles lors de l'avis initial. Le codage proposé par l'établissement reflète mieux la réalité clinique du séjour qu'une simple routine d'ajustement."
-    },
-    "text_output": "═══════════════════════════════════════════════════════\nMÉMOIRE EN DÉFENSE — Contestation Désaccord sur le DP et DAS — Mémoire en défense structuré\n═══════════════════════════════════════════════════════\n\nRAPPEL DES FAITS\nPatient masculin, 68 ans, hospitalisé 3 jours pour obstruction urétéro-iléale sur Bricker (antécédent de dérivation urinaire). Diagnostic d'entrée : pyélonéphrite sévère avec hydronéphrose. Actes réalisés : TDM abdominal [ACTE-1], urétéroscopie descendante, Brickeroscopie avec lésion iatrogène du Bricker [IMG-1]. Créatinine normale [BIO-8]. Sortie avec néphrostomie temporaire en attente de décision thérapeutique définitive.\n\n───────────────────────────────────────────────────────\n\nMOYEN N°1 — Le DP doit refléter le motif principal du séjour (obstruction urétéro-iléale aiguë avec pyélonéphrite), non une comorbidité pré-existante\nL'établissement a codé E66.04 (Obésité) en DP, alors que l'IMC = 31.0 [DP] est une donnée anthropométrique stable, pré-existante, et n'a pas motivé l'hospitalisation. Le motif réel du séjour est l'urgence urologique : obstruction complète du passage urétéro-iléal [IMG-1] entraînant une pyélonéphrite sévère [DAS-2] et une lésion traumatique du Bricker [DAS-4] lors de la tentative de rétablissement du passage. Selon la règle CIM-10 fondamentale, le DP est le diagnostic qui a consommé le plus de ressources et justifie la durée de séjour. Ici, c'est l'intervention urologique d'urgence (urétéroscopie + Brickeroscopie) et la mise en place d'un drainage urinaire (néphrostomie), non la gestion de l'obésité. L'obésité n'a reçu aucun traitement spécifique, n'a pas allongé la durée de séjour, et n'a pas modifié la surveillance. Elle doit être codée en DAS si elle a une pertinence clinique documentée, mais ne peut être DP.\n  Preuve : [IMG-1] TDM abdominal : absence totale de passage entre l'uretère gauche et le Bricker ; urétéroscopie descendante jusqu'à la jonction urétéro-iléale sans passage possible ; Brickeroscopie révélant un Bricker extrêmement fragile, endommagé lors de la manœuvre → Obstruction urétéro-iléale complète justifiant l'intervention d'urgence\n  Preuve : [DAS-2] Pyélonéphrite sévère (N10) codée en DAS → Complication infectieuse aiguë justifiant l'urgence de l'intervention\n  Preuve : [DAS-4] Lésion traumatique du Bricker (T83.1) codée en DAS → Complication iatrogène directe de l'acte réalisé lors du séjour\n  Preuve : [DP] IMC = 31.0 (obésité légère), valeur stable et pré-existante → Comorbidité chronique, non motif d'hospitalisation\n  Source : Guide méthodologique T2A — Règle générale : Le DP est le diagnostic qui a consommé le plus de ressources et justifie la durée de séjour et les actes réalisés. Une comorbidité pré-existante sans traitement spécifique ne peut être DP.\n\nMOYEN N°2 — L'UCR reconnaît que Z43.6 (Surveillance de néphrostomie) ou Z45.80 (Ajustement d'une prothèse urinaire) est l'acte effectivement réalisé, mais ce codage occulte la complication iatrogène majeure\nL'UCR propose Z45.80 (Aj"
-  }
-]
\ No newline at end of file
diff --git a/requirements.txt b/requirements.txt
index 1e003c7..09b16a9 100644
--- a/requirements.txt
+++ b/requirements.txt
@@ -15,4 +15,7 @@ python-dotenv>=1.0.0
 openpyxl>=3.0.0
 pandas>=2.0.0
 PyMuPDF>=1.24.0
+python-docx>=1.0.0
 PyYAML>=6.0
+gunicorn>=22.0.0
+flask-httpauth>=4.0.0
diff --git a/scripts/benchmark_models.py b/scripts/benchmark_models.py
deleted file mode 100644
index f865ee7..0000000
--- a/scripts/benchmark_models.py
+++ /dev/null
@@ -1,313 +0,0 @@
-#!/usr/bin/env python3
-"""Benchmark A/B : gemma3:12b (base) vs pmsi-coder-v2 (fine-tuné).
-
-Compare les codes CIM-10 produits par les deux modèles sur N dossiers.
-Teste DP + DAS (échantillon) pour chaque dossier.
-
-Usage: python scripts/benchmark_models.py [--n 50] [--das-max 5]
-"""
-
-from __future__ import annotations
-
-import json
-import random
-import sys
-import time
-from pathlib import Path
-
-sys.path.insert(0, str(Path(__file__).resolve().parent.parent))
-
-from src.config import STRUCTURED_DIR, OLLAMA_URL, DossierMedical
-from src.medical.cim10_dict import load_dict, normalize_code, validate_code
-
-import requests
-
-MODEL_BASE = "gemma3:12b"
-MODEL_FINETUNED = "pmsi-coder-v2"
-
-PROMPT_TEMPLATE = """Tu es un médecin DIM expert en codage PMSI.
-Code le diagnostic suivant en CIM-10. Choisis le code le plus spécifique possible.
-
-DIAGNOSTIC : "{texte}"
-TYPE : {type_diag}
-
-{contexte}
-
-Réponds UNIQUEMENT avec un objet JSON :
-{{"code": "X99.9", "confidence": "high|medium|low", "justification": "explication courte"}}"""
-
-
-def call_model(prompt: str, model: str, timeout: int = 120) -> tuple[dict | None, float]:
-    """Appelle un modèle Ollama et retourne (résultat, durée_s)."""
-    t0 = time.time()
-    try:
-        resp = requests.post(
-            f"{OLLAMA_URL}/api/generate",
-            json={
-                "model": model,
-                "prompt": prompt,
-                "stream": False,
-                "format": "json",
-                "options": {"temperature": 0.1, "num_predict": 500},
-            },
-            timeout=timeout,
-        )
-        resp.raise_for_status()
-        raw = resp.json().get("response", "")
-        duration = time.time() - t0
-        try:
-            return json.loads(raw), duration
-        except json.JSONDecodeError:
-            return None, duration
-    except Exception as e:
-        return None, time.time() - t0
-
-
-def load_dossiers(n: int) -> list[dict]:
-    """Charge N dossiers fusionnés diversifiés."""
-    dossiers = []
-    for subdir in sorted(STRUCTURED_DIR.iterdir()):
-        if not subdir.is_dir():
-            continue
-        for f in subdir.glob("*fusionne*.json"):
-            if ".gemma_" in f.name or ".bak" in f.name:
-                continue
-            try:
-                data = json.loads(f.read_text(encoding="utf-8"))
-                d = DossierMedical.model_validate(data)
-                if d.diagnostic_principal and d.diagnostic_principal.cim10_suggestion:
-                    dossiers.append({
-                        "name": subdir.name,
-                        "dossier": d,
-                        "path": str(f),
-                    })
-            except Exception:
-                continue
-            break
-    random.seed(42)
-    random.shuffle(dossiers)
-    return dossiers[:n]
-
-
-def build_contexte(d: DossierMedical) -> str:
-    """Construit un contexte clinique résumé."""
-    parts = []
-    s = d.sejour
-    if s.age is not None:
-        parts.append(f"Patient {s.sexe or '?'}, {s.age} ans")
-    if s.duree_sejour is not None:
-        parts.append(f"Durée séjour : {s.duree_sejour}j")
-    if d.diagnostic_principal:
-        parts.append(f"DP : {d.diagnostic_principal.texte}")
-    bio = [f"{b.test}={b.valeur}" for b in d.biologie_cle[:5] if b.valeur]
-    if bio:
-        parts.append(f"Bio : {', '.join(bio)}")
-    return "CONTEXTE : " + " | ".join(parts) if parts else ""
-
-
-def code_match_level(code_a: str, code_b: str) -> str:
-    """Retourne le niveau de correspondance entre deux codes."""
-    if code_a == code_b:
-        return "exact"
-    if code_a[:3] == code_b[:3]:
-        return "categorie"
-    return "diff"
-
-
-def run_benchmark(n: int = 50, das_max: int = 5):
-    print(f"=== Benchmark A/B : {MODEL_BASE} vs {MODEL_FINETUNED} ===")
-    print(f"    Dossiers : {n}, DAS max/dossier : {das_max}\n")
-
-    # Vérifier que les deux modèles sont disponibles
-    for model in [MODEL_BASE, MODEL_FINETUNED]:
-        try:
-            resp = requests.post(
-                f"{OLLAMA_URL}/api/generate",
-                json={"model": model, "prompt": "test", "stream": False,
-                      "options": {"num_predict": 1}},
-                timeout=60,
-            )
-            resp.raise_for_status()
-            print(f"  {model} : OK")
-        except Exception as e:
-            print(f"  {model} : ERREUR — {e}")
-            sys.exit(1)
-
-    dossiers = load_dossiers(n)
-    print(f"\nDossiers chargés : {len(dossiers)}\n")
-
-    cim10 = load_dict()
-    t_global_start = time.time()
-
-    dp_results = []
-    das_results = []
-
-    for i, item in enumerate(dossiers, 1):
-        d = item["dossier"]
-        dp = d.diagnostic_principal
-        name = item["name"]
-        ctx = build_contexte(d)
-
-        # === DP ===
-        prompt_dp = PROMPT_TEMPLATE.format(
-            texte=dp.texte,
-            type_diag="DP (diagnostic principal)",
-            contexte=ctx,
-        )
-        res_base, t_base = call_model(prompt_dp, MODEL_BASE)
-        res_ft, t_ft = call_model(prompt_dp, MODEL_FINETUNED)
-
-        code_base = normalize_code(res_base.get("code", "")) if res_base else "ERREUR"
-        code_ft = normalize_code(res_ft.get("code", "")) if res_ft else "ERREUR"
-        conf_base = res_base.get("confidence", "?") if res_base else "?"
-        conf_ft = res_ft.get("confidence", "?") if res_ft else "?"
-        valid_base = validate_code(code_base)[0] if code_base != "ERREUR" else False
-        valid_ft = validate_code(code_ft)[0] if code_ft != "ERREUR" else False
-
-        pipeline_code = dp.cim10_suggestion
-        match_level = code_match_level(code_base, code_ft)
-
-        dp_result = {
-            "dossier": name,
-            "texte": dp.texte[:80],
-            "pipeline": pipeline_code,
-            "base": code_base,
-            "ft": code_ft,
-            "conf_base": conf_base,
-            "conf_ft": conf_ft,
-            "valid_base": valid_base,
-            "valid_ft": valid_ft,
-            "match": match_level,
-            "t_base": round(t_base, 2),
-            "t_ft": round(t_ft, 2),
-        }
-        dp_results.append(dp_result)
-
-        tag = {"exact": "=", "categorie": "~", "diff": "X"}[match_level]
-        print(f"  [{i:2d}/{len(dossiers)}] {name:<20s} DP=\"{dp.texte[:35]:<35s}\" "
-              f"base={code_base:<7s} ft={code_ft:<7s} [{tag}] "
-              f"({t_base:.1f}s / {t_ft:.1f}s)")
-
-        # === DAS (échantillon) ===
-        das_list = [das for das in d.diagnostics_associes
-                    if das.texte and das.cim10_suggestion]
-        if len(das_list) > das_max:
-            random.seed(hash(name))
-            das_list = random.sample(das_list, das_max)
-
-        for das in das_list:
-            prompt_das = PROMPT_TEMPLATE.format(
-                texte=das.texte,
-                type_diag="DAS (diagnostic associé significatif)",
-                contexte=ctx,
-            )
-            res_b, tb = call_model(prompt_das, MODEL_BASE)
-            res_f, tf = call_model(prompt_das, MODEL_FINETUNED)
-
-            cb = normalize_code(res_b.get("code", "")) if res_b else "ERREUR"
-            cf = normalize_code(res_f.get("code", "")) if res_f else "ERREUR"
-            vb = validate_code(cb)[0] if cb != "ERREUR" else False
-            vf = validate_code(cf)[0] if cf != "ERREUR" else False
-
-            das_results.append({
-                "dossier": name,
-                "texte": das.texte[:80],
-                "pipeline": das.cim10_suggestion,
-                "base": cb,
-                "ft": cf,
-                "conf_base": (res_b or {}).get("confidence", "?"),
-                "conf_ft": (res_f or {}).get("confidence", "?"),
-                "valid_base": vb,
-                "valid_ft": vf,
-                "match": code_match_level(cb, cf),
-                "t_base": round(tb, 2),
-                "t_ft": round(tf, 2),
-            })
-
-    t_global = time.time() - t_global_start
-
-    # === RÉSUMÉ ===
-    print(f"\n{'='*75}")
-    print(f"RÉSUMÉ — {len(dp_results)} dossiers, {len(das_results)} DAS testés")
-    print(f"Durée totale : {t_global/60:.1f} min\n")
-
-    for label, results in [("DP", dp_results), ("DAS", das_results)]:
-        if not results:
-            continue
-        nt = len(results)
-        n_exact = sum(1 for r in results if r["match"] == "exact")
-        n_cat = sum(1 for r in results if r["match"] == "categorie")
-        n_diff = sum(1 for r in results if r["match"] == "diff")
-        n_vb = sum(1 for r in results if r["valid_base"])
-        n_vf = sum(1 for r in results if r["valid_ft"])
-        avg_tb = sum(r["t_base"] for r in results) / nt
-        avg_tf = sum(r["t_ft"] for r in results) / nt
-
-        # Confiance
-        conf_b = {}
-        conf_f = {}
-        for r in results:
-            conf_b[r["conf_base"]] = conf_b.get(r["conf_base"], 0) + 1
-            conf_f[r["conf_ft"]] = conf_f.get(r["conf_ft"], 0) + 1
-
-        # Concordance avec pipeline (gemma run original)
-        n_base_eq_pipe = sum(1 for r in results if r["base"] == r["pipeline"])
-        n_ft_eq_pipe = sum(1 for r in results if r["ft"] == r["pipeline"])
-        n_base_cat_pipe = sum(1 for r in results
-                             if r["base"][:3] == r["pipeline"][:3])
-        n_ft_cat_pipe = sum(1 for r in results
-                           if r["ft"][:3] == r["pipeline"][:3])
-
-        print(f"  --- {label} ({nt} diagnostics) ---")
-        print(f"  Concordance base↔ft :")
-        print(f"    Exact      : {n_exact}/{nt} ({100*n_exact/nt:.0f}%)")
-        print(f"    Catégorie  : {n_exact+n_cat}/{nt} ({100*(n_exact+n_cat)/nt:.0f}%)")
-        print(f"    Différent  : {n_diff}/{nt} ({100*n_diff/nt:.0f}%)")
-        print(f"  Codes valides :")
-        print(f"    base       : {n_vb}/{nt} ({100*n_vb/nt:.0f}%)")
-        print(f"    ft         : {n_vf}/{nt} ({100*n_vf/nt:.0f}%)")
-        print(f"  vs pipeline (gemma original) :")
-        print(f"    base=pipe  : {n_base_eq_pipe}/{nt} exact, {n_base_cat_pipe}/{nt} catégorie")
-        print(f"    ft=pipe    : {n_ft_eq_pipe}/{nt} exact, {n_ft_cat_pipe}/{nt} catégorie")
-        print(f"  Temps moyen  : base={avg_tb:.2f}s  ft={avg_tf:.2f}s  (Δ={100*(avg_tf-avg_tb)/avg_tb:+.0f}%)")
-        print(f"  Confiance base : {conf_b}")
-        print(f"  Confiance ft   : {conf_f}")
-        print()
-
-    # Lister les différences DP
-    diffs_dp = [r for r in dp_results if r["match"] == "diff"]
-    if diffs_dp:
-        print(f"  Différences DP ({len(diffs_dp)}) :")
-        for r in diffs_dp:
-            vb = "✓" if r["valid_base"] else "✗"
-            vf = "✓" if r["valid_ft"] else "✗"
-            print(f"    {r['dossier']:<18s} \"{r['texte'][:40]}\"")
-            print(f"      base={r['base']:<7s}{vb}  ft={r['ft']:<7s}{vf}  pipe={r['pipeline']}")
-
-    # Sauvegarder
-    out = {
-        "meta": {
-            "date": time.strftime("%Y-%m-%dT%H:%M:%S"),
-            "model_base": MODEL_BASE,
-            "model_ft": MODEL_FINETUNED,
-            "n_dossiers": len(dp_results),
-            "n_das": len(das_results),
-            "duration_min": round(t_global / 60, 1),
-        },
-        "dp": dp_results,
-        "das": das_results,
-    }
-    out_path = Path(__file__).parent.parent / "output" / "benchmark_ab.json"
-    out_path.write_text(json.dumps(out, ensure_ascii=False, indent=2), encoding="utf-8")
-    print(f"\nRésultats détaillés : {out_path}")
-
-
-if __name__ == "__main__":
-    import argparse
-    parser = argparse.ArgumentParser()
-    parser.add_argument("--n", type=int, default=50,
-                        help="Nombre de dossiers à tester")
-    parser.add_argument("--das-max", type=int, default=5,
-                        help="Max DAS testés par dossier")
-    args = parser.parse_args()
-    run_benchmark(args.n, args.das_max)
diff --git a/scripts/benchmark_nuke3_compare.py b/scripts/benchmark_nuke3_compare.py
deleted file mode 100644
index dc3509a..0000000
--- a/scripts/benchmark_nuke3_compare.py
+++ /dev/null
@@ -1,874 +0,0 @@
-#!/usr/bin/env python3
-"""Benchmark NUKE-3 — rapport comparatif LLM off vs on.
-
-Analyse les dossiers JSON existants (output/structured/) pour produire
-des métriques DIM-like sur la sélection DP (NUKE-3).
-
-Mode 1 (par défaut) : analyse les JSON existants (pas d'Ollama requis).
-Mode 2 (--rerun)     : relance le pipeline 2× (LLM off puis LLM on) —
-                        nécessite Ollama pour le mode "on".
-
-Usage:
-  python scripts/benchmark_nuke3_compare.py                    # analyse offline
-  python scripts/benchmark_nuke3_compare.py --n 10             # top 10 dossiers
-  python scripts/benchmark_nuke3_compare.py --rerun --n 5      # relance pipeline
-  python scripts/benchmark_nuke3_compare.py --dossiers A,B,C   # dossiers spécifiques
-  python scripts/benchmark_nuke3_compare.py --gold data/gold_crh/gold_crh.jsonl
-  python scripts/benchmark_nuke3_compare.py --offline --case-id 74_23141536
-  python scripts/benchmark_nuke3_compare.py --offline --top-errors 20
-  python scripts/benchmark_nuke3_compare.py --offline --dim-pack 20
-"""
-
-from __future__ import annotations
-
-import argparse
-import csv
-import json
-import os
-import subprocess
-import sys
-import time
-from datetime import datetime
-from pathlib import Path
-from statistics import mean
-
-ROOT = Path(__file__).resolve().parent.parent
-sys.path.insert(0, str(ROOT))
-
-OUTPUT_DIR = ROOT / "output" / "structured"
-INPUT_DIR = ROOT / "input"
-REPORT_PATH = ROOT / "docs" / "NUKE3_BENCHMARK_REPORT.md"
-PY = str(ROOT / ".venv" / "bin" / "python3")
-
-
-# ---------------------------------------------------------------------------
-# Chargement JSON
-# ---------------------------------------------------------------------------
-
-def find_merged_json(dossier_id: str) -> Path | None:
-    """Trouve le JSON fusionné d'un dossier."""
-    d = OUTPUT_DIR / dossier_id
-    if not d.exists():
-        return None
-    fusions = list(d.glob("*fusionne_cim10.json"))
-    if fusions:
-        return fusions[0]
-    cim10s = list(d.glob("*_cim10.json"))
-    return cim10s[0] if cim10s else None
-
-
-def load_dossier_json(dossier_id: str) -> dict | None:
-    """Charge le JSON d'un dossier."""
-    path = find_merged_json(dossier_id)
-    if not path:
-        return None
-    try:
-        return json.loads(path.read_text("utf-8"))
-    except (json.JSONDecodeError, OSError):
-        return None
-
-
-def select_dossiers(n: int, specific: list[str] | None) -> list[str]:
-    """Sélectionne les dossiers à analyser."""
-    if specific:
-        return [d.strip() for d in specific if d.strip()]
-
-    all_dirs = sorted(
-        d.name for d in OUTPUT_DIR.iterdir()
-        if d.is_dir() and find_merged_json(d.name) is not None
-    )
-    return all_dirs[:n] if n > 0 else all_dirs
-
-
-# ---------------------------------------------------------------------------
-# Analyse NUKE-3 d'un dossier
-# ---------------------------------------------------------------------------
-
-def analyze_dp_selection(data: dict) -> dict:
-    """Extrait les métriques NUKE-3 d'un dossier."""
-    dp_sel = data.get("dp_selection")
-
-    result = {
-        "has_dp_selection": dp_sel is not None,
-        "verdict": None,
-        "confidence": None,
-        "chosen_code": None,
-        "n_candidates": 0,
-        "n_evidence": 0,
-        "is_comorbidity_dp": False,
-        "is_symptom_dp": False,
-        "is_act_only_dp": False,
-        "has_evidence": False,
-        "delta": None,
-        "reason": None,
-    }
-
-    if not dp_sel:
-        return result
-
-    result["verdict"] = dp_sel.get("verdict")
-    result["confidence"] = dp_sel.get("confidence")
-    result["chosen_code"] = dp_sel.get("chosen_code")
-
-    candidates = dp_sel.get("candidates", [])
-    result["n_candidates"] = len(candidates)
-
-    evidence = dp_sel.get("evidence", [])
-    result["n_evidence"] = len(evidence)
-    result["has_evidence"] = len(evidence) > 0
-
-    result["reason"] = dp_sel.get("reason")
-
-    # Debug scores
-    debug = dp_sel.get("debug_scores") or {}
-    result["delta"] = debug.get("delta")
-
-    # Flags du gagnant
-    if candidates:
-        winner = candidates[0]
-        result["is_comorbidity_dp"] = winner.get("is_comorbidity_like", False)
-        result["is_symptom_dp"] = winner.get("is_symptom_like", False)
-        result["is_act_only_dp"] = winner.get("is_act_only", False)
-
-    return result
-
-
-# ---------------------------------------------------------------------------
-# Agrégation
-# ---------------------------------------------------------------------------
-
-def compute_metrics(analyses: list[dict]) -> dict:
-    """Calcule les métriques agrégées DIM-like."""
-    n = len(analyses)
-    if n == 0:
-        return {"n": 0}
-
-    with_selection = [a for a in analyses if a["has_dp_selection"]]
-    n_sel = len(with_selection)
-
-    confirmed = [a for a in with_selection if a["verdict"] == "CONFIRMED"]
-    review = [a for a in with_selection if a["verdict"] == "REVIEW"]
-
-    # Métriques principales
-    confirmed_rate = len(confirmed) / n_sel if n_sel else 0
-
-    # Evidence
-    confirmed_with_evidence = sum(1 for a in confirmed if a["has_evidence"])
-    confirmed_evidence_rate = confirmed_with_evidence / len(confirmed) if confirmed else 0
-
-    # Codes problématiques en DP
-    symptom_count = sum(1 for a in with_selection if a["is_symptom_dp"])
-    comorbidity_count = sum(1 for a in with_selection if a["is_comorbidity_dp"])
-    act_only_count = sum(1 for a in with_selection if a["is_act_only_dp"])
-
-    # Confidence
-    conf_high = sum(1 for a in with_selection if a["confidence"] == "high")
-    conf_med = sum(1 for a in with_selection if a["confidence"] == "medium")
-    conf_low = sum(1 for a in with_selection if a["confidence"] == "low")
-
-    # R-codes en DP (symptômes)
-    r_code_count = sum(
-        1 for a in with_selection
-        if a["chosen_code"] and a["chosen_code"].startswith("R")
-    )
-
-    return {
-        "n_total": n,
-        "n_with_selection": n_sel,
-        "confirmed_count": len(confirmed),
-        "review_count": len(review),
-        "confirmed_rate": round(confirmed_rate, 3),
-        "review_rate": round(1 - confirmed_rate, 3) if n_sel else 0,
-        "confirmed_evidence_rate": round(confirmed_evidence_rate, 3),
-        "dp_symptom_rate": round(symptom_count / n_sel, 3) if n_sel else 0,
-        "dp_comorbidity_rate": round(comorbidity_count / n_sel, 3) if n_sel else 0,
-        "dp_act_only_rate": round(act_only_count / n_sel, 3) if n_sel else 0,
-        "dp_r_code_rate": round(r_code_count / n_sel, 3) if n_sel else 0,
-        "confidence": {
-            "high": conf_high,
-            "medium": conf_med,
-            "low": conf_low,
-        },
-        "confidence_high_rate": round(conf_high / n_sel, 3) if n_sel else 0,
-    }
-
-
-# ---------------------------------------------------------------------------
-# Évaluation gold CRH
-# ---------------------------------------------------------------------------
-
-def load_gold(gold_path: str | Path) -> dict:
-    """Charge le gold JSONL et retourne un index case_id → GoldCRHCase."""
-    from src.eval.gold_models import load_gold_index
-    return load_gold_index(Path(gold_path))
-
-
-def evaluate_gold_cases(
-    dossier_details: list[dict],
-    gold_index: dict,
-) -> list[dict]:
-    """Évalue les dossiers présents dans le gold. Retourne une liste d'évaluations."""
-    from src.eval.gold_models import evaluate_dp
-
-    evals: list[dict] = []
-    for d in dossier_details:
-        case_id = d["id"]
-        if case_id not in gold_index:
-            continue
-        gold_case = gold_index[case_id]
-        sel = d.get("dp_selection") or {}
-        chosen_code = sel.get("chosen_code")
-        verdict = sel.get("verdict")
-        confidence = sel.get("confidence")
-
-        ev = evaluate_dp(chosen_code, gold_case)
-        ev["verdict"] = verdict
-        ev["confidence_nuke3"] = confidence
-        evals.append(ev)
-    return evals
-
-
-def compute_gold_metrics(evals: list[dict]) -> dict:
-    """Calcule les métriques agrégées sur les cas gold."""
-    n = len(evals)
-    if n == 0:
-        return {"n": 0}
-
-    strict = sum(1 for e in evals if e["exact_match_strict"])
-    tolerant = sum(1 for e in evals if e["exact_match_tolerant_codes"])
-    family3 = sum(1 for e in evals if e["family3_match_tolerant"])
-    acceptable = sum(1 for e in evals if e["acceptable_match"])
-    symptom_bad = sum(1 for e in evals if e["symptom_not_allowed"])
-
-    # Confirmed-only accuracy
-    confirmed_evals = [e for e in evals if e["verdict"] == "CONFIRMED"]
-    n_conf = len(confirmed_evals)
-    conf_acceptable = sum(1 for e in confirmed_evals if e["acceptable_match"])
-
-    return {
-        "n": n,
-        "exact_match_strict": strict,
-        "exact_match_strict_rate": round(strict / n, 3),
-        "exact_match_tolerant": tolerant,
-        "exact_match_tolerant_rate": round(tolerant / n, 3),
-        "family3_match": family3,
-        "family3_match_rate": round(family3 / n, 3),
-        "acceptable_match": acceptable,
-        "acceptable_match_rate": round(acceptable / n, 3),
-        "confirmed_accuracy_tolerant": round(conf_acceptable / n_conf, 3) if n_conf else None,
-        "confirmed_count": n_conf,
-        "symptom_not_allowed": symptom_bad,
-        "symptom_not_allowed_rate": round(symptom_bad / n, 3),
-    }
-
-
-def write_gold_eval_csv(evals: list[dict], csv_path: Path) -> None:
-    """Écrit le CSV d'évaluation gold."""
-    cols = [
-        "case_id", "chosen_code", "verdict", "confidence_nuke3",
-        "dp_expected_code", "acceptable_match", "exact_match_strict",
-        "symptom_not_allowed", "allow_symptom_dp", "confidence_gold",
-    ]
-    csv_path.parent.mkdir(parents=True, exist_ok=True)
-    with open(csv_path, "w", newline="", encoding="utf-8") as f:
-        writer = csv.DictWriter(f, fieldnames=cols, extrasaction="ignore")
-        writer.writeheader()
-        for ev in evals:
-            row = {
-                "case_id": ev["case_id"],
-                "chosen_code": ev["chosen_code"] or "",
-                "verdict": ev["verdict"] or "",
-                "confidence_nuke3": ev["confidence_nuke3"] or "",
-                "dp_expected_code": ev["dp_expected_code"],
-                "acceptable_match": ev["acceptable_match"],
-                "exact_match_strict": ev["exact_match_strict"],
-                "symptom_not_allowed": ev["symptom_not_allowed"],
-                "allow_symptom_dp": ev["allow_symptom_dp"],
-                "confidence_gold": ev["confidence_gold"],
-            }
-            writer.writerow(row)
-
-
-# ---------------------------------------------------------------------------
-# Re-run pipeline (mode --rerun)
-# ---------------------------------------------------------------------------
-
-def check_ollama() -> bool:
-    """Vérifie que Ollama est joignable."""
-    try:
-        import urllib.request
-        url = os.environ.get("OLLAMA_URL", "http://localhost:11434")
-        req = urllib.request.Request(f"{url}/api/tags", method="GET")
-        urllib.request.urlopen(req, timeout=5)
-        return True
-    except Exception:
-        return False
-
-
-def run_pipeline_with_env(dossier_id: str, llm_flag: str) -> bool:
-    """Lance le pipeline sur un dossier avec T2A_DP_RANKER_LLM=flag."""
-    env = os.environ.copy()
-    env["T2A_DP_RANKER_LLM"] = llm_flag
-
-    try:
-        result = subprocess.run(
-            [PY, "-m", "src.main", str(INPUT_DIR / dossier_id)],
-            capture_output=True, text=True, cwd=str(ROOT),
-            timeout=600, env=env,
-        )
-        return result.returncode == 0
-    except Exception as e:
-        print(f"    ERREUR: {e}")
-        return False
-
-
-# ---------------------------------------------------------------------------
-# Rapport Markdown
-# ---------------------------------------------------------------------------
-
-def _pct(v: float) -> str:
-    return f"{v * 100:.1f}%"
-
-
-def generate_report(
-    metrics_off: dict,
-    metrics_on: dict | None,
-    dossier_details: list[dict],
-    args: argparse.Namespace,
-    gold_metrics: dict | None = None,
-    gold_evals: list[dict] | None = None,
-) -> str:
-    """Génère le rapport Markdown."""
-    lines: list[str] = []
-    now = datetime.now().strftime("%Y-%m-%d %H:%M")
-
-    # Commit hash
-    try:
-        commit = subprocess.check_output(
-            ["git", "rev-parse", "--short", "HEAD"],
-            cwd=str(ROOT), text=True, stderr=subprocess.DEVNULL,
-        ).strip()
-    except Exception:
-        commit = "?"
-
-    lines.append("# NUKE-3 — Benchmark Report")
-    lines.append("")
-    lines.append(f"**Date** : {now}  ")
-    lines.append(f"**Commit** : `{commit}`  ")
-    lines.append(f"**Dossiers analysés** : {metrics_off['n_total']}  ")
-    lines.append(f"**Mode** : {'rerun pipeline' if args.rerun else 'analyse offline (JSON existants)'}  ")
-    lines.append("")
-
-    # Table comparative
-    lines.append("## Métriques DIM-like")
-    lines.append("")
-
-    if metrics_on:
-        lines.append("| Métrique | LLM OFF | LLM ON | Delta |")
-        lines.append("|----------|---------|--------|-------|")
-
-        rows = [
-            ("CONFIRMED rate", "confirmed_rate"),
-            ("REVIEW rate", "review_rate"),
-            ("CONFIRMED + evidence", "confirmed_evidence_rate"),
-            ("DP symptôme (R*)", "dp_symptom_rate"),
-            ("DP comorbidité", "dp_comorbidity_rate"),
-            ("DP acte-seul", "dp_act_only_rate"),
-            ("DP R-code", "dp_r_code_rate"),
-            ("Confidence high", "confidence_high_rate"),
-        ]
-        for label, key in rows:
-            v_off = metrics_off.get(key, 0)
-            v_on = metrics_on.get(key, 0)
-            delta = v_on - v_off
-            sign = "+" if delta > 0 else ""
-            lines.append(
-                f"| {label} | {_pct(v_off)} | {_pct(v_on)} | {sign}{_pct(delta)} |"
-            )
-    else:
-        lines.append("| Métrique | Valeur |")
-        lines.append("|----------|--------|")
-        rows_single = [
-            ("CONFIRMED rate", "confirmed_rate"),
-            ("REVIEW rate", "review_rate"),
-            ("CONFIRMED + evidence", "confirmed_evidence_rate"),
-            ("DP symptôme (R*)", "dp_symptom_rate"),
-            ("DP comorbidité", "dp_comorbidity_rate"),
-            ("DP acte-seul", "dp_act_only_rate"),
-            ("DP R-code", "dp_r_code_rate"),
-            ("Confidence high", "confidence_high_rate"),
-        ]
-        for label, key in rows_single:
-            v = metrics_off.get(key, 0)
-            lines.append(f"| {label} | {_pct(v)} |")
-
-    lines.append("")
-
-    # Volumes
-    lines.append("## Volumes")
-    lines.append("")
-    lines.append(f"- Dossiers avec dp_selection : {metrics_off['n_with_selection']}/{metrics_off['n_total']}")
-    lines.append(f"- CONFIRMED : {metrics_off['confirmed_count']}")
-    lines.append(f"- REVIEW : {metrics_off['review_count']}")
-    c = metrics_off.get("confidence", {})
-    lines.append(f"- Confidence — high: {c.get('high', 0)}, medium: {c.get('medium', 0)}, low: {c.get('low', 0)}")
-    lines.append("")
-
-    # Détail par dossier
-    lines.append("## Détail par dossier")
-    lines.append("")
-    lines.append("| Dossier | Verdict | Code | Confidence | Evidence | Candidats | Reason |")
-    lines.append("|---------|---------|------|------------|----------|-----------|--------|")
-    for d in dossier_details:
-        sel = d.get("dp_selection", {})
-        if not sel:
-            lines.append(f"| {d['id']} | - | - | - | - | - | pas de dp_selection |")
-            continue
-        lines.append(
-            f"| {d['id']} "
-            f"| {sel.get('verdict', '-')} "
-            f"| {sel.get('chosen_code', '-')} "
-            f"| {sel.get('confidence', '-')} "
-            f"| {sel.get('n_evidence', 0)} "
-            f"| {sel.get('n_candidates', 0)} "
-            f"| {(sel.get('reason') or '-')[:60]} |"
-        )
-
-    # Section gold CRH
-    if gold_metrics and gold_metrics.get("n", 0) > 0:
-        gm = gold_metrics
-        lines.append("")
-        lines.append("## Évaluation Gold CRH")
-        lines.append("")
-        lines.append(f"**Cas gold évalués** : {gm['n']}  ")
-        lines.append("")
-        lines.append("| Métrique | Valeur |")
-        lines.append("|----------|--------|")
-        lines.append(f"| Exact match (strict) | {_pct(gm['exact_match_strict_rate'])} ({gm['exact_match_strict']}/{gm['n']}) |")
-        lines.append(f"| Exact match (codes tolérants) | {_pct(gm['exact_match_tolerant_rate'])} ({gm['exact_match_tolerant']}/{gm['n']}) |")
-        lines.append(f"| Family3 match (tolérant) | {_pct(gm['family3_match_rate'])} ({gm['family3_match']}/{gm['n']}) |")
-        lines.append(f"| Acceptable match (codes OU family3) | {_pct(gm['acceptable_match_rate'])} ({gm['acceptable_match']}/{gm['n']}) |")
-        if gm["confirmed_accuracy_tolerant"] is not None:
-            lines.append(f"| Confirmed accuracy (tolérant) | {_pct(gm['confirmed_accuracy_tolerant'])} ({gm['confirmed_count']} CONFIRMED) |")
-        lines.append(f"| Symptôme non autorisé | {gm['symptom_not_allowed']}/{gm['n']} |")
-        lines.append("")
-
-        # Détail par cas gold
-        if gold_evals:
-            lines.append("### Détail par cas gold")
-            lines.append("")
-            lines.append("| Case ID | Choisi | Attendu | Strict | Acceptable | Symptôme interdit | Verdict |")
-            lines.append("|---------|--------|---------|--------|------------|-------------------|---------|")
-            for ev in gold_evals:
-                ok_s = "OK" if ev["exact_match_strict"] else "FAIL"
-                ok_a = "OK" if ev["acceptable_match"] else "FAIL"
-                sym = "OUI" if ev["symptom_not_allowed"] else "-"
-                lines.append(
-                    f"| {ev['case_id']} "
-                    f"| {ev['chosen_code'] or '-'} "
-                    f"| {ev['dp_expected_code']} "
-                    f"| {ok_s} "
-                    f"| {ok_a} "
-                    f"| {sym} "
-                    f"| {ev['verdict'] or '-'} |"
-                )
-            lines.append("")
-
-    lines.append("")
-    lines.append("---")
-    lines.append(f"*Généré par `scripts/benchmark_nuke3_compare.py` — {now}*")
-
-    # Règle DIM rappel
-    lines.append("")
-    lines.append("> **Règle DIM** : `CONFIRMED` ⇒ `evidence` obligatoirement non vide.")
-    lines.append("> Un DP sans preuve exploitable est automatiquement `REVIEW`.")
-
-    return "\n".join(lines)
-
-
-# ---------------------------------------------------------------------------
-# Main
-# ---------------------------------------------------------------------------
-
-def _rebuild_and_select(data: dict) -> dict:
-    """Reconstruit un DossierMedical depuis le JSON et exécute select_dp() offline.
-
-    Utile quand les JSON n'ont pas de champ dp_selection (générés avant NUKE-3).
-    """
-    from src.config import DossierMedical, Diagnostic, Sejour
-    from src.medical.dp_selector import select_dp
-
-    dp_raw = data.get("diagnostic_principal", {})
-    das_raw = data.get("diagnostics_associes", [])
-    doc_type = data.get("document_type", "crh")
-    sej_raw = data.get("sejour", {})
-
-    dp_diag = None
-    if dp_raw and dp_raw.get("texte"):
-        dp_diag = Diagnostic(
-            texte=dp_raw.get("texte", ""),
-            cim10_suggestion=dp_raw.get("cim10_suggestion") or dp_raw.get("cim10_final"),
-            cim10_confidence=dp_raw.get("cim10_confidence"),
-            source=dp_raw.get("source"),
-        )
-    das_list = []
-    for d_item in das_raw:
-        code = d_item.get("cim10_suggestion") or d_item.get("cim10_final")
-        if not code:
-            continue
-        das_list.append(Diagnostic(
-            texte=d_item.get("texte", ""),
-            cim10_suggestion=code,
-            cim10_confidence=d_item.get("cim10_confidence"),
-            source=d_item.get("source"),
-            status=d_item.get("status"),
-        ))
-
-    safe_sej = {k: v for k, v in sej_raw.items() if k in Sejour.model_fields}
-    dossier = DossierMedical(
-        document_type=doc_type,
-        sejour=Sejour(**safe_sej),
-        diagnostic_principal=dp_diag,
-        diagnostics_associes=das_list,
-    )
-
-    # Construire synthese depuis les champs disponibles.
-    # Les JSONs pré-NUKE-3 n'ont pas de sections CRH stockées.
-    # On récupère le texte de conclusion depuis les source_excerpt si besoin.
-    conclusion = data.get("conclusion_medicale", "")
-    if not conclusion:
-        # Chercher "CONCLUSION" dans source_excerpt des DAS ou traitements.
-        # Prendre l'extrait le plus long (les courts sont souvent tronqués).
-        best = ""
-        for container in (das_raw, data.get("traitements_sortie", [])):
-            for item in container:
-                excerpt = item.get("source_excerpt", "")
-                up = excerpt.upper()
-                if "CONCLUSION" in up:
-                    idx = up.index("CONCLUSION")
-                    candidate = excerpt[idx:]
-                    if len(candidate) > len(best):
-                        best = candidate
-        conclusion = best
-
-    synthese = {
-        "motif": data.get("motif_hospitalisation", ""),
-        "conclusion": conclusion,
-        "diag_sortie": data.get("synthese_medicale", {}).get("diag_sortie", ""),
-        "diag_principal": data.get("synthese_medicale", {}).get("diag_principal", ""),
-        "synthese": data.get("synthese_medicale", {}).get("synthese", ""),
-    }
-
-    selection = select_dp(dossier, synthese, config={"llm_enabled": False})
-    dossier.dp_selection = selection
-
-    # Finalizer DP (arbitrage Trackare vs CRH, traçabilité)
-    try:
-        from src.medical.dp_finalizer import finalize_dp
-        finalize_dp(dossier)
-    except Exception:
-        pass
-
-    # Utiliser dp_final si disponible, sinon dp_selection
-    final = dossier.dp_final or selection
-
-    # Convertir en dict compatible analyze_dp_selection
-    cands = [c.model_dump() for c in final.candidates]
-    result = {
-        "dp_selection": {
-            "verdict": final.verdict,
-            "confidence": final.confidence,
-            "chosen_code": final.chosen_code,
-            "chosen_term": final.chosen_term,
-            "candidates": cands,
-            "evidence": final.evidence,
-            "reason": final.reason,
-            "debug_scores": final.debug_scores,
-        }
-    }
-    if dossier.dp_final:
-        result["dp_final"] = dossier.dp_final.model_dump(exclude_none=True)
-    if dossier.quality_flags:
-        result["quality_flags"] = dossier.quality_flags
-    return result
-
-
-def _run_debug_reports(
-    args: argparse.Namespace,
-    dossier_ids: list[str],
-    dossier_details: list[dict],
-    gold_index: dict | None,
-    gold_evals: list[dict] | None,
-    out_dir: Path,
-) -> None:
-    """Exécute les modes --case-id, --top-errors, --dim-pack."""
-    from src.eval.gold_debug import (
-        build_case_report,
-        write_case_report,
-        build_error_entry,
-        sort_error_entries,
-        write_top_errors_csv,
-        write_top_errors_md,
-        write_top_errors_jsonl,
-        select_dim_pack_cases,
-        write_dim_pack,
-    )
-    from src.eval.gold_models import evaluate_dp
-
-    has_debug = args.case_id or args.top_errors > 0 or args.dim_pack > 0
-    if not has_debug:
-        return
-
-    # Helper : build full report for a case
-    def _build_report_for(case_id: str) -> dict | None:
-        data = load_dossier_json(case_id)
-        if not data:
-            return None
-
-        # Offline rebuild si nécessaire
-        if args.offline and not data.get("dp_selection"):
-            rebuilt = _rebuild_and_select(data)
-            data["dp_selection"] = rebuilt["dp_selection"]
-
-        dp_sel = data.get("dp_selection")
-
-        gold_case_dict = None
-        eval_result = None
-        if gold_index and case_id in gold_index:
-            gc = gold_index[case_id]
-            gold_case_dict = gc.model_dump()
-            chosen_code = (dp_sel or {}).get("chosen_code")
-            eval_result = evaluate_dp(chosen_code, gc)
-
-        return build_case_report(case_id, data, dp_sel, gold_case_dict, eval_result)
-
-    # --case-id
-    if args.case_id:
-        cid = args.case_id.strip()
-        data = load_dossier_json(cid)
-        if not data:
-            print(f"ERREUR: output JSON introuvable pour {cid}")
-            print(f"  Suggestion : relancer le pipeline avec --rerun ou vérifier output/structured/{cid}/")
-            sys.exit(1)
-        if gold_index and cid not in gold_index:
-            print(f"ERREUR: {cid} absent du gold ({len(gold_index)} cas chargés)")
-            sys.exit(1)
-
-        report = _build_report_for(cid)
-        if report:
-            jp, mp = write_case_report(report, out_dir)
-            print(f"\n=== Case debug: {cid} ===")
-            print(f"  JSON : {jp}")
-            print(f"  MD   : {mp}")
-
-    # --top-errors
-    if args.top_errors > 0:
-        if not gold_index:
-            print("ERREUR: --top-errors requiert --gold (ou auto-détection gold_crh.jsonl)")
-            sys.exit(1)
-
-        # Build reports for all gold cases
-        all_reports: list[dict] = []
-        gold_case_ids = set(gold_index.keys())
-        for cid in dossier_ids:
-            if cid not in gold_case_ids:
-                continue
-            r = _build_report_for(cid)
-            if r:
-                all_reports.append(r)
-
-        entries = [build_error_entry(r) for r in all_reports]
-        entries = sort_error_entries(entries)
-        entries = entries[:args.top_errors]
-
-        csv_p = out_dir / "NUKE3_GOLD_TOP_ERRORS.csv"
-        md_p = out_dir / "NUKE3_GOLD_TOP_ERRORS.md"
-        jsonl_p = out_dir / "NUKE3_GOLD_TOP_ERRORS.jsonl"
-
-        write_top_errors_csv(entries, csv_p)
-        write_top_errors_md(entries, md_p)
-        write_top_errors_jsonl(entries, jsonl_p)
-
-        print(f"\n=== Top {len(entries)} erreurs gold ===")
-        print(f"  CSV   : {csv_p}")
-        print(f"  MD    : {md_p}")
-        print(f"  JSONL : {jsonl_p}")
-
-    # --dim-pack
-    if args.dim_pack > 0:
-        # Build reports for all CRH (non-trackare) dossiers
-        all_reports_dim: list[dict] = []
-        for cid in dossier_ids:
-            r = _build_report_for(cid)
-            if r and r["document_type"] != "trackare":
-                all_reports_dim.append(r)
-            elif r and r["prediction"]["verdict"] == "REVIEW":
-                # Include trackare-sans-DP too (they go through scoring)
-                all_reports_dim.append(r)
-
-        selected = select_dim_pack_cases(all_reports_dim, args.dim_pack)
-        csv_p, cases_dir = write_dim_pack(selected, out_dir)
-
-        print(f"\n=== DIM Pack ({len(selected)} cas) ===")
-        print(f"  CSV       : {csv_p}")
-        print(f"  Cas JSON  : {cases_dir}/")
-
-
-def main():
-    parser = argparse.ArgumentParser(description="Benchmark NUKE-3 comparatif")
-    parser.add_argument("--n", type=int, default=0, help="Nombre de dossiers (0=tous)")
-    parser.add_argument("--dossiers", type=str, default="", help="IDs séparés par virgules")
-    parser.add_argument("--rerun", action="store_true", help="Relancer le pipeline (nécessite Ollama pour LLM on)")
-    parser.add_argument("--offline", action="store_true",
-                        help="Exécuter NUKE-3 offline (reconstruit DossierMedical depuis JSON, LLM off)")
-    parser.add_argument("--gold", type=str, default="",
-                        help="Fichier JSONL gold CRH (évaluation tolérante)")
-    parser.add_argument("--case-id", type=str, default="",
-                        help="Rapport détaillé pour un cas (ex: 74_23141536)")
-    parser.add_argument("--top-errors", type=int, default=0,
-                        help="Top N erreurs gold (ex: 20)")
-    parser.add_argument("--dim-pack", type=int, default=0,
-                        help="Pack DIM de N cas CRH à annoter (ex: 20)")
-    parser.add_argument("--out-dir", type=str, default=str(ROOT / "docs" / "gold_debug"),
-                        help="Dossier de sortie pour debug reports")
-    parser.add_argument("--output", type=str, default=str(REPORT_PATH), help="Chemin du rapport")
-    args = parser.parse_args()
-
-    specific = [d.strip() for d in args.dossiers.split(",") if d.strip()] if args.dossiers else None
-    dossier_ids = select_dossiers(args.n, specific)
-
-    if not dossier_ids:
-        print("ERREUR: aucun dossier trouvé")
-        sys.exit(1)
-
-    print(f"NUKE-3 benchmark — {len(dossier_ids)} dossiers")
-
-    # Mode rerun
-    if args.rerun:
-        ollama_ok = check_ollama()
-        print(f"  Ollama: {'OK' if ollama_ok else 'INDISPONIBLE'}")
-
-        # Pass 1 : LLM OFF
-        print("\n=== Pass 1 : T2A_DP_RANKER_LLM=0 ===")
-        for did in dossier_ids:
-            ok = run_pipeline_with_env(did, "0")
-            status = "OK" if ok else "FAIL"
-            print(f"  {did}: {status}")
-
-    # Analyse JSON existants (ou résultat du pass 1)
-    print("\n=== Analyse des dossiers ===")
-    analyses_off: list[dict] = []
-    dossier_details: list[dict] = []
-
-    for did in dossier_ids:
-        data = load_dossier_json(did)
-        if not data:
-            print(f"  {did}: JSON introuvable")
-            dossier_details.append({"id": did, "dp_selection": None})
-            continue
-
-        # Mode offline : reconstruire le DossierMedical et exécuter select_dp
-        if args.offline and not data.get("dp_selection"):
-            rebuilt = _rebuild_and_select(data)
-            data["dp_selection"] = rebuilt["dp_selection"]
-
-        analysis = analyze_dp_selection(data)
-        analyses_off.append(analysis)
-        dossier_details.append({"id": did, "dp_selection": analysis})
-
-        verdict = analysis["verdict"] or "-"
-        code = analysis["chosen_code"] or "-"
-        print(f"  {did}: {verdict} — {code} (evidence: {analysis['n_evidence']})")
-
-    metrics_off = compute_metrics(analyses_off)
-
-    # Pass 2 : LLM ON (si rerun + Ollama dispo)
-    metrics_on = None
-    if args.rerun:
-        if not check_ollama():
-            print("\nWARN: Ollama indisponible — pass LLM ON ignorée")
-            print("       Le rapport ne contiendra que les métriques LLM OFF")
-        else:
-            print("\n=== Pass 2 : T2A_DP_RANKER_LLM=1 ===")
-            for did in dossier_ids:
-                ok = run_pipeline_with_env(did, "1")
-                status = "OK" if ok else "FAIL"
-                print(f"  {did}: {status}")
-
-            analyses_on: list[dict] = []
-            for did in dossier_ids:
-                data = load_dossier_json(did)
-                if data:
-                    analyses_on.append(analyze_dp_selection(data))
-            metrics_on = compute_metrics(analyses_on)
-
-    # Gold CRH
-    gold_metrics = None
-    gold_evals = None
-    gold_index = None
-
-    gold_path = args.gold
-    if not gold_path:
-        # Auto-détection
-        default_gold = ROOT / "data" / "gold_crh" / "gold_crh.jsonl"
-        if default_gold.exists():
-            gold_path = str(default_gold)
-
-    if gold_path:
-        try:
-            gold_index = load_gold(gold_path)
-            print(f"\n=== Évaluation Gold CRH ({len(gold_index)} cas) ===")
-            gold_evals = evaluate_gold_cases(dossier_details, gold_index)
-            gold_metrics = compute_gold_metrics(gold_evals)
-
-            for ev in gold_evals:
-                match_str = "OK" if ev["acceptable_match"] else "FAIL"
-                sym_str = " [R* interdit]" if ev["symptom_not_allowed"] else ""
-                print(f"  {ev['case_id']}: {ev['chosen_code'] or '-'} vs {ev['dp_expected_code']}"
-                      f" → {match_str}{sym_str}")
-
-            # CSV évaluation
-            csv_out = ROOT / "docs" / "NUKE3_GOLD_EVAL.csv"
-            write_gold_eval_csv(gold_evals, csv_out)
-            print(f"\nCSV évaluation : {csv_out}")
-        except Exception as e:
-            print(f"\nERREUR gold : {e}")
-            gold_metrics = None
-            gold_evals = None
-
-    # --- Debug reports (--case-id, --top-errors, --dim-pack) ---
-    out_dir = Path(args.out_dir)
-    _run_debug_reports(args, dossier_ids, dossier_details, gold_index, gold_evals, out_dir)
-
-    # Rapport
-    report = generate_report(
-        metrics_off, metrics_on, dossier_details, args,
-        gold_metrics=gold_metrics, gold_evals=gold_evals,
-    )
-    output_path = Path(args.output)
-    output_path.parent.mkdir(parents=True, exist_ok=True)
-    output_path.write_text(report, encoding="utf-8")
-    print(f"\nRapport écrit : {output_path}")
-
-    # Résumé console
-    print(f"\n{'='*50}")
-    print(f"CONFIRMED : {metrics_off['confirmed_count']}/{metrics_off['n_with_selection']}"
-          f" ({_pct(metrics_off['confirmed_rate'])})")
-    print(f"REVIEW    : {metrics_off['review_count']}/{metrics_off['n_with_selection']}"
-          f" ({_pct(metrics_off['review_rate'])})")
-    print(f"Evidence  : {_pct(metrics_off['confirmed_evidence_rate'])} des CONFIRMED")
-    print(f"DP symptôme  : {_pct(metrics_off['dp_symptom_rate'])}")
-    print(f"DP comorbidité: {_pct(metrics_off['dp_comorbidity_rate'])}")
-    if gold_metrics and gold_metrics.get("n", 0) > 0:
-        gm = gold_metrics
-        print(f"\n--- Gold CRH ({gm['n']} cas) ---")
-        print(f"Strict match     : {_pct(gm['exact_match_strict_rate'])}")
-        print(f"Acceptable match : {_pct(gm['acceptable_match_rate'])}")
-        if gm['confirmed_accuracy_tolerant'] is not None:
-            print(f"Confirmed acc.   : {_pct(gm['confirmed_accuracy_tolerant'])}")
-        print(f"Symptôme interdit: {gm['symptom_not_allowed']}")
-    print(f"{'='*50}")
-
-
-if __name__ == "__main__":
-    main()
diff --git a/scripts/benchmark_quality.py b/scripts/benchmark_quality.py
deleted file mode 100644
index c6fb564..0000000
--- a/scripts/benchmark_quality.py
+++ /dev/null
@@ -1,722 +0,0 @@
-#!/usr/bin/env python3
-"""Benchmark qualité T2A — validation end-to-end sur vrais dossiers.
-
-Compare la qualité des codes CIM-10, vetos, downgrades et CPAM
-entre runs successifs. Chaque run est sauvegardé dans un répertoire
-isolé pour permettre des comparaisons A/B.
-
-Usage:
-  python scripts/benchmark_quality.py --n 10
-  python scripts/benchmark_quality.py --n 10 --compare RUN_ID
-  python scripts/benchmark_quality.py --dossiers 116_23065570,45_23183041
-  python scripts/benchmark_quality.py --gold-standard
-"""
-
-from __future__ import annotations
-
-import argparse
-import json
-import os
-import shutil
-import subprocess
-import sys
-import time
-from datetime import datetime
-from pathlib import Path
-from statistics import mean, median
-
-ROOT = Path(__file__).resolve().parent.parent
-sys.path.insert(0, str(ROOT))
-
-BENCHMARKS_DIR = ROOT / "output" / "benchmarks"
-GOLD_STANDARD_FILE = ROOT / "data" / "gold_standard" / "_selection.json"
-INPUT_DIR = ROOT / "input"
-OUTPUT_DIR = ROOT / "output" / "structured"
-PY = str(ROOT / ".venv" / "bin" / "python3")
-
-
-# ---------------------------------------------------------------------------
-# Sélection des dossiers
-# ---------------------------------------------------------------------------
-
-def _gold_standard_ids() -> list[str]:
-    """Charge les IDs du gold standard."""
-    if not GOLD_STANDARD_FILE.exists():
-        print(f"ERREUR: {GOLD_STANDARD_FILE} introuvable")
-        sys.exit(1)
-    data = json.loads(GOLD_STANDARD_FILE.read_text("utf-8"))
-    # Format: "116_23065570/116_23065570_fusionne_cim10" → on prend la partie avant /
-    return [d.split("/")[0] for d in data["dossiers"]]
-
-
-def select_dossiers(n: int, gold_standard: bool, specific: list[str] | None, seed: int = 42) -> list[str]:
-    """Sélectionne les dossiers à benchmarker."""
-    if specific:
-        # Vérifier que les dossiers existent
-        valid = []
-        for d in specific:
-            if (INPUT_DIR / d).is_dir():
-                valid.append(d)
-            else:
-                print(f"  WARN: dossier {d} introuvable dans input/")
-        return valid
-
-    if gold_standard:
-        ids = _gold_standard_ids()
-        return ids[:n] if n < len(ids) else ids
-
-    # Sinon : prendre N dossiers depuis input/ (tri déterministe + seed pour reproductibilité)
-    all_dirs = sorted(
-        d.name for d in INPUT_DIR.iterdir()
-        if d.is_dir() and any(d.glob("*.pdf"))
-    )
-    if not all_dirs:
-        print("ERREUR: aucun dossier avec PDF dans input/")
-        sys.exit(1)
-
-    import random
-    rng = random.Random(seed)
-    rng.shuffle(all_dirs)
-    return all_dirs[:n]
-
-
-# ---------------------------------------------------------------------------
-# Exécution pipeline
-# ---------------------------------------------------------------------------
-
-def run_pipeline(dossier_id: str, clean: bool) -> tuple[float, bool]:
-    """Exécute le pipeline sur un dossier. Retourne (durée_s, succès)."""
-    input_path = INPUT_DIR / dossier_id
-
-    if clean:
-        for subdir in ["structured", "reports", "anonymized"]:
-            target = ROOT / "output" / subdir / dossier_id
-            if target.exists():
-                shutil.rmtree(target)
-
-    t0 = time.time()
-    try:
-        result = subprocess.run(
-            [PY, "-m", "src.main", str(input_path)],
-            capture_output=True,
-            text=True,
-            cwd=str(ROOT),
-            timeout=600,  # 10 min max par dossier
-        )
-        duration = time.time() - t0
-        if result.returncode != 0:
-            print(f"    STDERR: {result.stderr[-500:]}")
-            return duration, False
-        return duration, True
-    except subprocess.TimeoutExpired:
-        return time.time() - t0, False
-    except Exception as e:
-        print(f"    EXCEPTION: {e}")
-        return time.time() - t0, False
-
-
-# ---------------------------------------------------------------------------
-# Chargement dictionnaire CIM-10
-# ---------------------------------------------------------------------------
-
-def load_cim10_dict() -> dict[str, str]:
-    """Charge le dictionnaire CIM-10 (sans passer par le singleton)."""
-    dict_path = ROOT / "data" / "cim10_dict.json"
-    supp_path = ROOT / "data" / "cim10_supplements.json"
-    d = {}
-    if dict_path.exists():
-        d = json.loads(dict_path.read_text("utf-8"))
-    if supp_path.exists():
-        for code, label in json.loads(supp_path.read_text("utf-8")).items():
-            d.setdefault(code, label)
-    return d
-
-
-def normalize_code(code: str) -> str:
-    """K810 → K81.0, k85.1 → K85.1."""
-    code = code.strip().upper()
-    if len(code) > 3 and "." not in code:
-        code = code[:3] + "." + code[3:]
-    return code
-
-
-def is_valid_code(code: str, cim10: dict[str, str]) -> bool:
-    """Vérifie si un code CIM-10 existe dans le dictionnaire."""
-    nc = normalize_code(code)
-    return nc in cim10 or code.upper().strip() in cim10
-
-
-# ---------------------------------------------------------------------------
-# Analyse d'un dossier
-# ---------------------------------------------------------------------------
-
-def find_merged_json(dossier_id: str) -> Path | None:
-    """Trouve le JSON fusionné d'un dossier."""
-    d = OUTPUT_DIR / dossier_id
-    if not d.exists():
-        return None
-    # Chercher le fusionné d'abord
-    fusions = list(d.glob("*fusionne_cim10.json"))
-    if fusions:
-        return fusions[0]
-    # Sinon premier _cim10.json
-    cim10s = list(d.glob("*_cim10.json"))
-    return cim10s[0] if cim10s else None
-
-
-def analyze_dossier(dossier_id: str, cim10: dict[str, str], duration: float) -> dict:
-    """Analyse le JSON de sortie d'un dossier et extrait les métriques."""
-    result = {
-        "dossier_id": dossier_id,
-        "processing_time_s": round(duration, 1),
-        "success": False,
-    }
-
-    json_path = find_merged_json(dossier_id)
-    if not json_path:
-        return result
-
-    try:
-        data = json.loads(json_path.read_text("utf-8"))
-    except (json.JSONDecodeError, OSError):
-        return result
-
-    result["success"] = True
-
-    # --- DP ---
-    dp = data.get("diagnostic_principal", {})
-    dp_code = dp.get("cim10_final") or dp.get("cim10_suggestion") or ""
-    dp_suggestion = dp.get("cim10_suggestion") or ""
-    result["dp"] = {
-        "texte": (dp.get("texte") or "")[:80],
-        "code_suggestion": dp_suggestion,
-        "code_final": dp_code,
-        "confidence": dp.get("cim10_confidence", ""),
-        "has_code": bool(dp_code),
-        "valid_code": is_valid_code(dp_code, cim10) if dp_code else False,
-        "downgraded": bool(dp_code and dp_suggestion and dp_code != dp_suggestion),
-    }
-
-    # --- DAS ---
-    das_list = data.get("diagnostics_associes", [])
-    das_codes = []
-    das_conf = {"high": 0, "medium": 0, "low": 0}
-    das_valid = 0
-    das_no_code = 0
-    das_downgraded = 0
-
-    for d_item in das_list:
-        code = d_item.get("cim10_final") or d_item.get("cim10_suggestion") or ""
-        suggestion = d_item.get("cim10_suggestion") or ""
-        conf = d_item.get("cim10_confidence", "low")
-
-        if not code:
-            das_no_code += 1
-            continue
-
-        das_codes.append(code)
-        if conf in das_conf:
-            das_conf[conf] += 1
-
-        if is_valid_code(code, cim10):
-            das_valid += 1
-
-        if code and suggestion and code != suggestion:
-            das_downgraded += 1
-
-    n_das_with_code = len(das_codes)
-    result["das"] = {
-        "total": len(das_list),
-        "with_code": n_das_with_code,
-        "no_code": das_no_code,
-        "valid": das_valid,
-        "validity_rate": round(das_valid / n_das_with_code, 3) if n_das_with_code else 0,
-        "confidence": das_conf,
-        "downgraded": das_downgraded,
-        "downgrade_rate": round(das_downgraded / n_das_with_code, 3) if n_das_with_code else 0,
-        "codes_uniques": sorted(set(das_codes)),
-    }
-
-    # --- Metrics du dossier ---
-    metrics = data.get("metrics", {})
-    result["metrics"] = {
-        "das_active": metrics.get("das_active", 0),
-        "das_removed": metrics.get("das_removed", 0),
-        "das_ruled_out": metrics.get("das_ruled_out", 0),
-    }
-
-    # --- Veto ---
-    veto = data.get("veto_report", {})
-    issues = veto.get("issues", [])
-    result["veto"] = {
-        "verdict": veto.get("verdict", "NO_REPORT"),
-        "score": veto.get("score_contestabilite", 0),
-        "issues_count": len(issues),
-        "hard_count": sum(1 for i in issues if i.get("severity") == "HARD"),
-        "top_issues": [i.get("veto", i.get("type", "?")) for i in issues[:5]],
-    }
-
-    # --- GHM ---
-    ghm = data.get("ghm_estimation")
-    result["ghm"] = {
-        "estimated": ghm is not None and bool(ghm),
-        "cmd": ghm.get("cmd") if ghm else None,
-        "severity": ghm.get("severity") if ghm else None,
-        "ghm": ghm.get("ghm") if ghm else None,
-    }
-
-    # --- CPAM ---
-    cpam = data.get("controles_cpam", [])
-    result["cpam"] = {
-        "controls_count": len(cpam),
-        "has_response": any(bool(c.get("contre_argumentation")) for c in cpam),
-        "sources_count": sum(len(c.get("sources_reponse", [])) for c in cpam),
-    }
-
-    # --- Biologie ---
-    bio = data.get("biologie_cle", [])
-    result["biologie"] = {
-        "tests_count": len(bio),
-        "anomalies": sum(1 for b in bio if b.get("anomalie")),
-    }
-
-    # --- Codes CIM-10 invalides (détail) ---
-    invalid_codes = []
-    if dp_code and not is_valid_code(dp_code, cim10):
-        invalid_codes.append(f"DP:{dp_code}")
-    for code in das_codes:
-        if not is_valid_code(code, cim10):
-            invalid_codes.append(f"DAS:{code}")
-    result["invalid_codes"] = invalid_codes
-
-    return result
-
-
-# ---------------------------------------------------------------------------
-# Agrégation
-# ---------------------------------------------------------------------------
-
-def compute_aggregate(per_dossier: list[dict]) -> dict:
-    """Calcule les métriques agrégées sur tous les dossiers."""
-    successful = [d for d in per_dossier if d.get("success")]
-    n = len(successful)
-    if n == 0:
-        return {"n_total": len(per_dossier), "n_success": 0}
-
-    # DP
-    dp_has_code = sum(1 for d in successful if d["dp"]["has_code"])
-    dp_valid = sum(1 for d in successful if d["dp"]["valid_code"])
-    dp_conf = {"high": 0, "medium": 0, "low": 0}
-    for d in successful:
-        c = d["dp"]["confidence"]
-        if c in dp_conf:
-            dp_conf[c] += 1
-    dp_downgraded = sum(1 for d in successful if d["dp"]["downgraded"])
-
-    # DAS
-    total_das = sum(d["das"]["total"] for d in successful)
-    total_das_with_code = sum(d["das"]["with_code"] for d in successful)
-    total_das_valid = sum(d["das"]["valid"] for d in successful)
-    total_das_downgraded = sum(d["das"]["downgraded"] for d in successful)
-    das_conf_agg = {"high": 0, "medium": 0, "low": 0}
-    for d in successful:
-        for k in das_conf_agg:
-            das_conf_agg[k] += d["das"]["confidence"].get(k, 0)
-
-    # Veto
-    verdicts = {}
-    total_hard = 0
-    for d in successful:
-        v = d["veto"]["verdict"]
-        verdicts[v] = verdicts.get(v, 0) + 1
-        total_hard += d["veto"]["hard_count"]
-
-    # GHM
-    ghm_estimated = sum(1 for d in successful if d["ghm"]["estimated"])
-
-    # CPAM
-    cpam_total = sum(d["cpam"]["controls_count"] for d in successful)
-    cpam_with_response = sum(1 for d in successful if d["cpam"]["has_response"])
-
-    # Temps
-    times = [d["processing_time_s"] for d in successful]
-    times_sorted = sorted(times)
-    p90_idx = int(len(times_sorted) * 0.9)
-
-    # Codes invalides
-    all_invalid = []
-    for d in successful:
-        all_invalid.extend(d.get("invalid_codes", []))
-
-    return {
-        "n_total": len(per_dossier),
-        "n_success": n,
-        "n_failed": len(per_dossier) - n,
-        "dp": {
-            "has_code_rate": round(dp_has_code / n, 3),
-            "valid_code_rate": round(dp_valid / n, 3),
-            "confidence": dp_conf,
-            "downgraded": dp_downgraded,
-        },
-        "das": {
-            "total": total_das,
-            "mean_per_dossier": round(total_das / n, 1),
-            "with_code": total_das_with_code,
-            "valid": total_das_valid,
-            "validity_rate": round(total_das_valid / total_das_with_code, 3) if total_das_with_code else 0,
-            "confidence": das_conf_agg,
-            "confidence_high_rate": round(das_conf_agg["high"] / total_das_with_code, 3) if total_das_with_code else 0,
-            "downgraded": total_das_downgraded,
-            "downgrade_rate": round(total_das_downgraded / total_das_with_code, 3) if total_das_with_code else 0,
-        },
-        "veto": {
-            "verdicts": verdicts,
-            "hard_total": total_hard,
-            "dossiers_with_hard": sum(1 for d in successful if d["veto"]["hard_count"] > 0),
-        },
-        "ghm": {
-            "estimated_rate": round(ghm_estimated / n, 3),
-        },
-        "cpam": {
-            "controls_total": cpam_total,
-            "with_response": cpam_with_response,
-        },
-        "timing": {
-            "mean_s": round(mean(times), 1),
-            "median_s": round(median(times), 1),
-            "p90_s": round(times_sorted[p90_idx], 1) if times_sorted else 0,
-            "total_s": round(sum(times), 1),
-        },
-        "invalid_codes": all_invalid,
-        "invalid_codes_count": len(all_invalid),
-    }
-
-
-# ---------------------------------------------------------------------------
-# Rapport texte
-# ---------------------------------------------------------------------------
-
-def _pct(val: float) -> str:
-    return f"{val * 100:.1f}%"
-
-
-def _bar(val: float, width: int = 20) -> str:
-    filled = int(val * width)
-    return "█" * filled + "░" * (width - filled)
-
-
-def generate_report(run_id: str, config: dict, agg: dict, per_dossier: list[dict]) -> str:
-    """Génère un rapport lisible."""
-    lines = []
-    w = 66
-
-    lines.append("=" * w)
-    lines.append(f"  BENCHMARK QUALITÉ T2A — {run_id}")
-    lines.append("=" * w)
-    lines.append(f"  Date     : {config['timestamp']}")
-    lines.append(f"  Modèles  : coding={config['models'].get('coding','?')}  cpam={config['models'].get('cpam','?')}")
-    lines.append(f"             validation={config['models'].get('validation','?')}  qc={config['models'].get('qc','?')}")
-    lines.append(f"  Dossiers : {agg['n_success']}/{agg['n_total']} traités  ({agg.get('n_failed',0)} échecs)")
-    lines.append(f"  Durée    : {agg['timing']['total_s']:.0f}s ({agg['timing']['mean_s']:.1f}s/dossier)")
-    lines.append("-" * w)
-
-    # DP
-    dp = agg["dp"]
-    lines.append("")
-    lines.append("  DIAGNOSTIC PRINCIPAL (DP)")
-    lines.append(f"    Code obtenu     : {_bar(dp['has_code_rate'])} {_pct(dp['has_code_rate'])}")
-    lines.append(f"    Code CIM-10 valide : {_bar(dp['valid_code_rate'])} {_pct(dp['valid_code_rate'])}")
-    lines.append(f"    Confiance high  : {dp['confidence'].get('high',0)}/{agg['n_success']}  "
-                 f"medium: {dp['confidence'].get('medium',0)}  low: {dp['confidence'].get('low',0)}")
-    lines.append(f"    Downgrades      : {dp['downgraded']}")
-
-    # DAS
-    das = agg["das"]
-    lines.append("")
-    lines.append("  DIAGNOSTICS ASSOCIÉS (DAS)")
-    lines.append(f"    Total           : {das['total']}  (moy {das['mean_per_dossier']}/dossier)")
-    lines.append(f"    Avec code       : {das['with_code']}/{das['total']}")
-    lines.append(f"    Codes valides   : {_bar(das['validity_rate'])} {_pct(das['validity_rate'])}")
-    lines.append(f"    Confiance       : high={das['confidence']['high']}  "
-                 f"medium={das['confidence']['medium']}  low={das['confidence']['low']}")
-    lines.append(f"    Confiance high  : {_bar(das['confidence_high_rate'])} {_pct(das['confidence_high_rate'])}")
-    lines.append(f"    Downgrades      : {das['downgraded']} ({_pct(das['downgrade_rate'])})")
-
-    # Veto
-    veto = agg["veto"]
-    lines.append("")
-    lines.append("  VETOS / QUALITÉ")
-    for v, count in sorted(veto["verdicts"].items(), key=lambda x: -x[1]):
-        lines.append(f"    {v:12s} : {count}")
-    lines.append(f"    Issues HARD     : {veto['hard_total']} (dans {veto['dossiers_with_hard']} dossiers)")
-
-    # GHM
-    lines.append("")
-    lines.append("  GHM")
-    lines.append(f"    Estimé          : {_bar(agg['ghm']['estimated_rate'])} {_pct(agg['ghm']['estimated_rate'])}")
-
-    # CPAM
-    if agg["cpam"]["controls_total"] > 0:
-        lines.append("")
-        lines.append("  CPAM")
-        lines.append(f"    Contrôles       : {agg['cpam']['controls_total']}")
-        lines.append(f"    Avec réponse    : {agg['cpam']['with_response']}")
-
-    # Temps
-    lines.append("")
-    lines.append("  TEMPS DE TRAITEMENT")
-    lines.append(f"    Moyen  : {agg['timing']['mean_s']:.1f}s")
-    lines.append(f"    Médian : {agg['timing']['median_s']:.1f}s")
-    lines.append(f"    P90    : {agg['timing']['p90_s']:.1f}s")
-    lines.append(f"    Total  : {agg['timing']['total_s']:.0f}s")
-
-    # Codes invalides
-    if agg["invalid_codes"]:
-        lines.append("")
-        lines.append(f"  CODES CIM-10 INVALIDES ({agg['invalid_codes_count']})")
-        for code in agg["invalid_codes"][:20]:
-            lines.append(f"    {code}")
-        if agg["invalid_codes_count"] > 20:
-            lines.append(f"    ... et {agg['invalid_codes_count'] - 20} autres")
-
-    # Détail par dossier
-    lines.append("")
-    lines.append("-" * w)
-    lines.append("  DÉTAIL PAR DOSSIER")
-    lines.append("-" * w)
-    lines.append(f"  {'Dossier':<25s} {'DP':>6s} {'DAS':>4s} {'Valid%':>7s} {'Veto':>10s} {'Temps':>6s}")
-    lines.append(f"  {'-'*25:<25s} {'-'*6:>6s} {'-'*4:>4s} {'-'*7:>7s} {'-'*10:>10s} {'-'*6:>6s}")
-
-    for d in sorted(per_dossier, key=lambda x: x["dossier_id"]):
-        if not d.get("success"):
-            lines.append(f"  {d['dossier_id']:<25s} {'ÉCHEC':>6s}")
-            continue
-        dp_code = d["dp"]["code_final"] or "-"
-        dp_mark = "✓" if d["dp"]["valid_code"] else "✗"
-        n_das = d["das"]["total"]
-        vr = f"{d['das']['validity_rate']*100:.0f}%" if d["das"]["with_code"] else "-"
-        verdict = d["veto"]["verdict"]
-        t = f"{d['processing_time_s']:.0f}s"
-        lines.append(f"  {d['dossier_id']:<25s} {dp_code:>5s}{dp_mark} {n_das:>4d} {vr:>7s} {verdict:>10s} {t:>6s}")
-
-    lines.append("")
-    lines.append("=" * w)
-    return "\n".join(lines)
-
-
-# ---------------------------------------------------------------------------
-# Comparaison entre runs
-# ---------------------------------------------------------------------------
-
-def compare_runs(current_agg: dict, baseline_agg: dict, baseline_id: str) -> str:
-    """Compare deux runs et génère un rapport diff."""
-    lines = []
-    w = 66
-    lines.append("")
-    lines.append("=" * w)
-    lines.append(f"  COMPARAISON avec {baseline_id}")
-    lines.append("=" * w)
-
-    def _delta(cur: float, base: float, is_pct: bool = True) -> str:
-        d = cur - base
-        sign = "+" if d >= 0 else ""
-        if is_pct:
-            return f"{sign}{d*100:.1f}%"
-        return f"{sign}{d:.1f}"
-
-    def _row(label: str, cur_val: float, base_val: float, is_pct: bool = True):
-        if is_pct:
-            cur_s = _pct(cur_val)
-            base_s = _pct(base_val)
-        else:
-            cur_s = f"{cur_val:.1f}"
-            base_s = f"{base_val:.1f}"
-        delta_s = _delta(cur_val, base_val, is_pct)
-        lines.append(f"    {label:<24s} {base_s:>10s} {cur_s:>10s} {delta_s:>10s}")
-
-    lines.append(f"    {'Métrique':<24s} {'Baseline':>10s} {'Actuel':>10s} {'Delta':>10s}")
-    lines.append(f"    {'-'*24:<24s} {'-'*10:>10s} {'-'*10:>10s} {'-'*10:>10s}")
-
-    _row("DP code valide", current_agg["dp"]["valid_code_rate"], baseline_agg["dp"]["valid_code_rate"])
-    _row("DAS validité", current_agg["das"]["validity_rate"], baseline_agg["das"]["validity_rate"])
-    _row("DAS confiance high", current_agg["das"]["confidence_high_rate"], baseline_agg["das"]["confidence_high_rate"])
-    _row("DAS downgrade", current_agg["das"]["downgrade_rate"], baseline_agg["das"]["downgrade_rate"])
-    _row("GHM estimé", current_agg["ghm"]["estimated_rate"], baseline_agg["ghm"]["estimated_rate"])
-    _row("DAS moy/dossier", current_agg["das"]["mean_per_dossier"], baseline_agg["das"]["mean_per_dossier"], is_pct=False)
-    _row("Temps moyen (s)", current_agg["timing"]["mean_s"], baseline_agg["timing"]["mean_s"], is_pct=False)
-
-    # Codes invalides
-    cur_inv = set(current_agg.get("invalid_codes", []))
-    base_inv = set(baseline_agg.get("invalid_codes", []))
-    new_inv = cur_inv - base_inv
-    fixed_inv = base_inv - cur_inv
-    if new_inv:
-        lines.append(f"\n    Nouveaux codes invalides : {', '.join(sorted(new_inv))}")
-    if fixed_inv:
-        lines.append(f"    Codes corrigés          : {', '.join(sorted(fixed_inv))}")
-
-    lines.append("=" * w)
-    return "\n".join(lines)
-
-
-# ---------------------------------------------------------------------------
-# Main
-# ---------------------------------------------------------------------------
-
-def get_current_config() -> dict:
-    """Récupère la configuration modèle actuelle."""
-    try:
-        from src.config import OLLAMA_MODELS, OLLAMA_MODEL, OLLAMA_URL
-        return {
-            "models": dict(OLLAMA_MODELS),
-            "ollama_model": OLLAMA_MODEL,
-            "ollama_url": OLLAMA_URL,
-        }
-    except ImportError:
-        return {
-            "models": {
-                "coding": os.environ.get("T2A_MODEL_CODING", "?"),
-                "cpam": os.environ.get("T2A_MODEL_CPAM", "?"),
-                "validation": os.environ.get("T2A_MODEL_VALIDATION", "?"),
-                "qc": os.environ.get("T2A_MODEL_QC", "?"),
-            },
-            "ollama_model": os.environ.get("OLLAMA_MODEL", "?"),
-        }
-
-
-def main():
-    parser = argparse.ArgumentParser(description="Benchmark qualité T2A")
-    parser.add_argument("--n", type=int, default=10, help="Nombre de dossiers")
-    parser.add_argument("--dossiers", type=str, help="IDs séparés par des virgules")
-    parser.add_argument("--gold-standard", action="store_true", help="Utiliser les 50 dossiers gold standard")
-    parser.add_argument("--compare", type=str, help="Run ID à comparer")
-    parser.add_argument("--label", type=str, default="", help="Label pour ce run")
-    parser.add_argument("--no-reprocess", action="store_true", help="Analyser les outputs existants sans relancer le pipeline")
-    parser.add_argument("--clean", action="store_true", help="Supprimer les outputs avant retraitement")
-    parser.add_argument("--seed", type=int, default=42, help="Seed pour la sélection aléatoire")
-    parser.add_argument("--workers", type=int, default=1, help="Nombre de dossiers traités en parallèle")
-    args = parser.parse_args()
-
-    # Sélection dossiers
-    specific = args.dossiers.split(",") if args.dossiers else None
-    dossiers = select_dossiers(args.n, args.gold_standard, specific, args.seed)
-    print(f"\n  Dossiers sélectionnés : {len(dossiers)}")
-    for d in dossiers:
-        print(f"    - {d}")
-
-    # Config
-    config = get_current_config()
-    run_id = datetime.now().strftime("%Y%m%d_%H%M%S")
-    if args.label:
-        run_id = f"{run_id}_{args.label}"
-    config["timestamp"] = datetime.now().isoformat()
-    config["run_id"] = run_id
-    config["dossiers"] = dossiers
-    config["args"] = {
-        "n": args.n,
-        "gold_standard": args.gold_standard,
-        "clean": args.clean,
-        "no_reprocess": args.no_reprocess,
-        "seed": args.seed,
-        "label": args.label,
-    }
-
-    print(f"\n  Run ID  : {run_id}")
-    print(f"  Modèles : {config['models']}")
-    print(f"  Reprocess: {'NON' if args.no_reprocess else 'OUI (clean=' + str(args.clean) + ')'}")
-    print()
-
-    # Charger dictionnaire CIM-10
-    cim10 = load_cim10_dict()
-    print(f"  Dictionnaire CIM-10 : {len(cim10)} codes")
-    print()
-
-    # Traitement
-    per_dossier = []
-    total = len(dossiers)
-
-    if args.workers > 1 and not args.no_reprocess:
-        # Mode parallèle : exécuter les pipelines en parallèle puis analyser
-        from concurrent.futures import ThreadPoolExecutor, as_completed
-        print(f"  Mode parallèle : {args.workers} workers")
-        pipeline_results: dict[str, tuple[float, bool]] = {}
-        done = 0
-        with ThreadPoolExecutor(max_workers=args.workers) as executor:
-            futures = {
-                executor.submit(run_pipeline, dossier_id, args.clean): dossier_id
-                for dossier_id in dossiers
-            }
-            for future in as_completed(futures):
-                dossier_id = futures[future]
-                try:
-                    duration, success = future.result()
-                except Exception as e:
-                    print(f"    EXCEPTION {dossier_id}: {e}")
-                    duration, success = 0.0, False
-                pipeline_results[dossier_id] = (duration, success)
-                done += 1
-                mark = "✓" if success else "✗"
-                print(f"  [{done}/{total}] {dossier_id} — {duration:.1f}s {mark}")
-
-        # Analyse séquentielle (ordre stable)
-        for dossier_id in dossiers:
-            duration, success = pipeline_results[dossier_id]
-            metrics = analyze_dossier(dossier_id, cim10, duration)
-            per_dossier.append(metrics)
-    else:
-        # Mode séquentiel (ou --no-reprocess)
-        for i, dossier_id in enumerate(dossiers, 1):
-            print(f"  [{i}/{total}] {dossier_id}", end="", flush=True)
-
-            if args.no_reprocess:
-                duration = 0.0
-                success = find_merged_json(dossier_id) is not None
-                if not success:
-                    print(" — pas de JSON")
-                else:
-                    print(" — analyse existant")
-            else:
-                print(" — traitement...", end="", flush=True)
-                duration, success = run_pipeline(dossier_id, args.clean)
-                print(f" {duration:.1f}s {'✓' if success else '✗'}")
-
-            metrics = analyze_dossier(dossier_id, cim10, duration)
-            per_dossier.append(metrics)
-
-    # Agrégation
-    agg = compute_aggregate(per_dossier)
-
-    # Rapport
-    report = generate_report(run_id, config, agg, per_dossier)
-    print(report)
-
-    # Comparaison si demandée
-    comparison = ""
-    if args.compare:
-        baseline_path = BENCHMARKS_DIR / args.compare / "metrics.json"
-        if baseline_path.exists():
-            baseline = json.loads(baseline_path.read_text("utf-8"))
-            comparison = compare_runs(agg, baseline["aggregate"], args.compare)
-            print(comparison)
-        else:
-            print(f"\n  WARN: run baseline {args.compare} introuvable ({baseline_path})")
-
-    # Sauvegarde
-    run_dir = BENCHMARKS_DIR / run_id
-    run_dir.mkdir(parents=True, exist_ok=True)
-
-    (run_dir / "config.json").write_text(
-        json.dumps(config, ensure_ascii=False, indent=2), encoding="utf-8"
-    )
-    (run_dir / "metrics.json").write_text(
-        json.dumps({"aggregate": agg, "per_dossier": per_dossier}, ensure_ascii=False, indent=2),
-        encoding="utf-8",
-    )
-    (run_dir / "report.txt").write_text(report + comparison, encoding="utf-8")
-
-    print(f"\n  Résultats sauvegardés dans : {run_dir}")
-    print(f"  Pour comparer un futur run : python scripts/benchmark_quality.py --compare {run_id}")
-
-
-if __name__ == "__main__":
-    main()
diff --git a/scripts/regenerate_tier_c.py b/scripts/regenerate_tier_c.py
deleted file mode 100644
index 329b3e3..0000000
--- a/scripts/regenerate_tier_c.py
+++ /dev/null
@@ -1,163 +0,0 @@
-#!/usr/bin/env python3
-"""Régénération ciblée des contrôles CPAM classés Tier C ou sans response_data.
-
-Usage :
-    cd /home/dom/ai/t2a_v2
-    .venv/bin/python3 scripts/regenerate_tier_c.py [--dry-run]
-
-Le script :
-1. Scanne output/structured/ pour trouver les contrôles Tier C + ceux sans response_data
-2. Pour chaque contrôle, relance generate_cpam_response() avec le pipeline corrigé
-3. Sauvegarde le JSON mis à jour (backup automatique .bak)
-
-Options :
-    --dry-run   Affiche les contrôles ciblés sans régénérer
-"""
-
-from __future__ import annotations
-
-import json
-import logging
-import shutil
-import sys
-import time
-from pathlib import Path
-
-# Ajouter le répertoire racine au path
-ROOT = Path(__file__).resolve().parent.parent
-sys.path.insert(0, str(ROOT))
-
-from src.config import DossierMedical
-from src.control.cpam_response import generate_cpam_response
-
-logging.basicConfig(
-    level=logging.INFO,
-    format="%(asctime)s %(levelname)-7s %(message)s",
-    datefmt="%H:%M:%S",
-)
-logger = logging.getLogger(__name__)
-
-STRUCTURED_DIR = ROOT / "output" / "structured"
-
-
-def find_targets() -> list[tuple[Path, int]]:
-    """Trouve les fichiers JSON contenant des contrôles Tier C ou sans response_data.
-
-    Returns:
-        Liste de (chemin_json, index_du_controle_dans_la_liste).
-    """
-    targets: list[tuple[Path, int]] = []
-
-    for sub in sorted(STRUCTURED_DIR.iterdir()):
-        if not sub.is_dir():
-            continue
-        for jf in sub.glob("*_fusionne_cim10.json"):
-            data = json.loads(jf.read_text(encoding="utf-8"))
-            controles = data.get("controles_cpam", [])
-            for i, ctrl in enumerate(controles):
-                tier = ctrl.get("quality_tier")
-                has_resp = ctrl.get("response_data") is not None
-                if tier == "C" or not has_resp:
-                    targets.append((jf, i))
-
-    return targets
-
-
-def regenerate(targets: list[tuple[Path, int]]) -> dict[str, int]:
-    """Régénère les contrôles CPAM ciblés.
-
-    Returns:
-        Statistiques {tier_A, tier_B, tier_C, errors}.
-    """
-    stats = {"A": 0, "B": 0, "C": 0, "errors": 0}
-    # Grouper par fichier pour ne charger/sauver qu'une fois par dossier
-    by_file: dict[Path, list[int]] = {}
-    for path, idx in targets:
-        by_file.setdefault(path, []).append(idx)
-
-    total = len(targets)
-    done = 0
-
-    for json_path, indices in by_file.items():
-        dossier_id = json_path.parent.name
-        logger.info("=== Dossier %s (%d contrôle(s) à régénérer) ===", dossier_id, len(indices))
-
-        # Charger le dossier
-        data = json.loads(json_path.read_text(encoding="utf-8"))
-        dossier = DossierMedical.model_validate(data)
-
-        modified = False
-
-        for idx in indices:
-            ctrl = dossier.controles_cpam[idx]
-            done += 1
-            old_tier = ctrl.quality_tier or "?"
-            logger.info("[%d/%d] OGC %d — %s (ancien tier: %s)",
-                        done, total, ctrl.numero_ogc, ctrl.titre[:60], old_tier)
-
-            t0 = time.time()
-            try:
-                text, response_data, sources = generate_cpam_response(dossier, ctrl)
-                elapsed = time.time() - t0
-
-                ctrl.contre_argumentation = text
-                ctrl.response_data = response_data
-                ctrl.sources_reponse = sources
-
-                new_tier = ctrl.quality_tier or "?"
-                stats[new_tier] = stats.get(new_tier, 0) + 1
-                modified = True
-
-                logger.info("  Résultat : tier %s → %s (%d chars, %.1fs)",
-                            old_tier, new_tier, len(text), elapsed)
-            except Exception:
-                logger.exception("  ERREUR sur OGC %d", ctrl.numero_ogc)
-                stats["errors"] += 1
-
-        if modified:
-            # Backup + sauvegarde
-            backup_path = json_path.with_suffix(".json.bak")
-            shutil.copy2(json_path, backup_path)
-            json_path.write_text(
-                dossier.model_dump_json(indent=2, exclude_none=True),
-                encoding="utf-8",
-            )
-            logger.info("  Sauvegardé : %s (backup: %s)", json_path.name, backup_path.name)
-
-    return stats
-
-
-def main() -> None:
-    dry_run = "--dry-run" in sys.argv
-
-    logger.info("Recherche des contrôles Tier C et sans response_data...")
-    targets = find_targets()
-
-    if not targets:
-        logger.info("Aucun contrôle à régénérer.")
-        return
-
-    logger.info("Trouvé %d contrôle(s) à régénérer :", len(targets))
-    for path, idx in targets:
-        data = json.loads(path.read_text(encoding="utf-8"))
-        ctrl = data["controles_cpam"][idx]
-        tier = ctrl.get("quality_tier", "?")
-        has_resp = "oui" if ctrl.get("response_data") else "NON"
-        logger.info("  %s OGC %d — tier %s, response_data: %s",
-                     path.parent.name, ctrl["numero_ogc"], tier, has_resp)
-
-    if dry_run:
-        logger.info("Mode dry-run — aucune régénération effectuée.")
-        return
-
-    t0 = time.time()
-    stats = regenerate(targets)
-    elapsed = time.time() - t0
-
-    logger.info("=== TERMINÉ en %.1f min ===", elapsed / 60)
-    logger.info("Distribution : A=%d, B=%d, C=%d, erreurs=%d",
-                stats.get("A", 0), stats.get("B", 0), stats.get("C", 0), stats["errors"])
-
-
-if __name__ == "__main__":
-    main()
diff --git a/scripts/select_validation_dossiers.py b/scripts/select_validation_dossiers.py
deleted file mode 100644
index 5b70516..0000000
--- a/scripts/select_validation_dossiers.py
+++ /dev/null
@@ -1,231 +0,0 @@
-#!/usr/bin/env python3
-"""Sélectionne 50 dossiers pour le gold standard de validation DIM.
-
-- 25 dossiers CPAM (cas complexes, déjà contrôlés)
-- 25 dossiers non-CPAM stratifiés par CMD, confiance DP, nombre de DAS
-
-Crée data/gold_standard/_selection.json et initialise les annotations vides.
-"""
-
-from __future__ import annotations
-
-import json
-import random
-import sys
-from pathlib import Path
-
-# Ajouter le répertoire racine au path
-sys.path.insert(0, str(Path(__file__).resolve().parent.parent))
-
-from src.config import STRUCTURED_DIR, BASE_DIR, DossierMedical
-
-GOLD_DIR = BASE_DIR / "data" / "gold_standard"
-TARGET_TOTAL = 50
-TARGET_CPAM = 25
-
-
-def load_all_dossiers() -> list[dict]:
-    """Charge tous les dossiers fusionnés depuis output/structured/."""
-    dossiers = []
-    for subdir in sorted(STRUCTURED_DIR.iterdir()):
-        if not subdir.is_dir():
-            continue
-        # Chercher le fichier fusionné
-        fusionne = None
-        for f in subdir.glob("*fusionne*.json"):
-            fusionne = f
-            break
-        if not fusionne:
-            # Prendre le premier JSON du dossier
-            jsons = sorted(subdir.glob("*.json"))
-            if jsons:
-                fusionne = jsons[0]
-        if not fusionne:
-            continue
-
-        try:
-            data = json.loads(fusionne.read_text(encoding="utf-8"))
-            dossier = DossierMedical.model_validate(data)
-            rel_path = str(fusionne.relative_to(STRUCTURED_DIR))
-            group_name = subdir.name
-            dossiers.append({
-                "dossier_id": f"{group_name}/{fusionne.stem}",
-                "group_name": group_name,
-                "path_rel": rel_path,
-                "dossier": dossier,
-            })
-        except Exception as e:
-            print(f"  Erreur chargement {fusionne.name}: {e}")
-    return dossiers
-
-
-def select_dossiers(all_dossiers: list[dict]) -> list[dict]:
-    """Sélectionne les 50 dossiers selon la stratégie définie."""
-    # Séparer CPAM / non-CPAM
-    cpam = [d for d in all_dossiers if d["dossier"].controles_cpam]
-    non_cpam = [d for d in all_dossiers if not d["dossier"].controles_cpam]
-
-    print(f"Dossiers CPAM disponibles : {len(cpam)}")
-    print(f"Dossiers non-CPAM disponibles : {len(non_cpam)}")
-
-    # Prendre tous les CPAM (ou max TARGET_CPAM)
-    selected_cpam = cpam[:TARGET_CPAM]
-    remaining_target = TARGET_TOTAL - len(selected_cpam)
-
-    # Stratifier les non-CPAM
-    selected_non_cpam = stratified_sample(non_cpam, remaining_target)
-
-    selected = selected_cpam + selected_non_cpam
-    print(f"\nSélection finale : {len(selected)} dossiers")
-    print(f"  - CPAM : {len(selected_cpam)}")
-    print(f"  - Non-CPAM : {len(selected_non_cpam)}")
-
-    return selected
-
-
-def stratified_sample(dossiers: list[dict], n: int) -> list[dict]:
-    """Échantillonnage stratifié par CMD, confiance DP et nombre de DAS."""
-    if len(dossiers) <= n:
-        return dossiers
-
-    # Grouper par CMD
-    by_cmd: dict[str, list[dict]] = {}
-    for d in dossiers:
-        ghm = d["dossier"].ghm_estimation
-        cmd = ghm.cmd if ghm else "inconnu"
-        by_cmd.setdefault(cmd or "inconnu", []).append(d)
-
-    selected = []
-    seen_ids = set()
-
-    # Phase 1 : 1 dossier par CMD (diversité maximale)
-    cmds = sorted(by_cmd.keys())
-    random.seed(42)  # Reproductible
-    for cmd in cmds:
-        if len(selected) >= n:
-            break
-        candidates = by_cmd[cmd]
-        # Préférer un mix de confiances
-        random.shuffle(candidates)
-        d = candidates[0]
-        selected.append(d)
-        seen_ids.add(d["dossier_id"])
-
-    # Phase 2 : compléter avec diversité confiance DP
-    if len(selected) < n:
-        remaining = [d for d in dossiers if d["dossier_id"] not in seen_ids]
-        # Trier par confiance DP (low > medium > high pour surreprésenter les cas difficiles)
-        conf_order = {"low": 0, "medium": 1, "high": 2, None: 3}
-        remaining.sort(key=lambda d: (
-            conf_order.get(
-                d["dossier"].diagnostic_principal.cim10_confidence
-                if d["dossier"].diagnostic_principal else None,
-                3
-            ),
-            -len(d["dossier"].diagnostics_associes),  # beaucoup de DAS d'abord
-        ))
-        for d in remaining:
-            if len(selected) >= n:
-                break
-            selected.append(d)
-
-    return selected[:n]
-
-
-def create_empty_annotation(dossier_id: str, dossier: DossierMedical) -> dict:
-    """Crée une annotation vide pour un dossier."""
-    dp = dossier.diagnostic_principal
-    das_list = []
-    for i, das in enumerate(dossier.diagnostics_associes):
-        das_list.append({
-            "index": i,
-            "texte_original": das.texte,
-            "code_pipeline": das.cim10_suggestion or "",
-            "confidence": das.cim10_confidence or "",
-            "source": das.source or "",
-            "statut": "correct",
-            "code_corrige": None,
-            "commentaire": "",
-        })
-
-    return {
-        "dossier_id": dossier_id,
-        "validateur": "",
-        "date_validation": "",
-        "statut": "non_commence",
-        "dp": {
-            "texte_original": dp.texte if dp else "",
-            "code_pipeline": dp.cim10_suggestion if dp else "",
-            "confidence": dp.cim10_confidence if dp else "",
-            "statut": "correct",
-            "code_corrige": None,
-            "commentaire": "",
-        },
-        "das": das_list,
-        "das_ajoutes": [],
-        "commentaire_general": "",
-    }
-
-
-def main():
-    print("=== Sélection des dossiers pour validation DIM ===\n")
-
-    all_dossiers = load_all_dossiers()
-    print(f"Total dossiers chargés : {len(all_dossiers)}\n")
-
-    if not all_dossiers:
-        print("Aucun dossier trouvé dans output/structured/")
-        sys.exit(1)
-
-    selected = select_dossiers(all_dossiers)
-
-    # Créer le répertoire gold standard
-    GOLD_DIR.mkdir(parents=True, exist_ok=True)
-
-    # Sauvegarder la sélection
-    selection = {
-        "date_selection": __import__("datetime").datetime.now().isoformat(timespec="seconds"),
-        "total": len(selected),
-        "cpam": sum(1 for d in selected if d["dossier"].controles_cpam),
-        "non_cpam": sum(1 for d in selected if not d["dossier"].controles_cpam),
-        "dossiers": [d["dossier_id"] for d in selected],
-    }
-    selection_path = GOLD_DIR / "_selection.json"
-    selection_path.write_text(
-        json.dumps(selection, ensure_ascii=False, indent=2),
-        encoding="utf-8",
-    )
-    print(f"\nSélection sauvegardée : {selection_path}")
-
-    # Initialiser les annotations vides
-    created = 0
-    for d in selected:
-        dossier_id = d["dossier_id"]
-        safe_name = dossier_id.replace("/", "__") + ".json"
-        annot_path = GOLD_DIR / safe_name
-        if not annot_path.exists():
-            annotation = create_empty_annotation(dossier_id, d["dossier"])
-            annot_path.write_text(
-                json.dumps(annotation, ensure_ascii=False, indent=2),
-                encoding="utf-8",
-            )
-            created += 1
-
-    print(f"Annotations vides créées : {created}")
-    print(f"Annotations existantes préservées : {len(selected) - created}")
-
-    # Résumé
-    print(f"\n--- Résumé ---")
-    for i, d in enumerate(selected, 1):
-        dos = d["dossier"]
-        dp_code = dos.diagnostic_principal.cim10_suggestion if dos.diagnostic_principal else "?"
-        dp_conf = (dos.diagnostic_principal.cim10_confidence or "?") if dos.diagnostic_principal else "?"
-        n_das = len(dos.diagnostics_associes)
-        cpam_flag = " [CPAM]" if dos.controles_cpam else ""
-        ghm = dos.ghm_estimation
-        cmd = ghm.cmd if ghm else "?"
-        print(f"  {i:2d}. {d['group_name']:<20s} DP={dp_code:<6s} conf={dp_conf:<7s} DAS={n_das:2d} CMD={cmd}{cpam_flag}")
-
-
-if __name__ == "__main__":
-    main()
diff --git a/scripts_t2a_v2/benchmark_models.py b/scripts_t2a_v2/benchmark_models.py
deleted file mode 100644
index f865ee7..0000000
--- a/scripts_t2a_v2/benchmark_models.py
+++ /dev/null
@@ -1,313 +0,0 @@
-#!/usr/bin/env python3
-"""Benchmark A/B : gemma3:12b (base) vs pmsi-coder-v2 (fine-tuné).
-
-Compare les codes CIM-10 produits par les deux modèles sur N dossiers.
-Teste DP + DAS (échantillon) pour chaque dossier.
-
-Usage: python scripts/benchmark_models.py [--n 50] [--das-max 5]
-"""
-
-from __future__ import annotations
-
-import json
-import random
-import sys
-import time
-from pathlib import Path
-
-sys.path.insert(0, str(Path(__file__).resolve().parent.parent))
-
-from src.config import STRUCTURED_DIR, OLLAMA_URL, DossierMedical
-from src.medical.cim10_dict import load_dict, normalize_code, validate_code
-
-import requests
-
-MODEL_BASE = "gemma3:12b"
-MODEL_FINETUNED = "pmsi-coder-v2"
-
-PROMPT_TEMPLATE = """Tu es un médecin DIM expert en codage PMSI.
-Code le diagnostic suivant en CIM-10. Choisis le code le plus spécifique possible.
-
-DIAGNOSTIC : "{texte}"
-TYPE : {type_diag}
-
-{contexte}
-
-Réponds UNIQUEMENT avec un objet JSON :
-{{"code": "X99.9", "confidence": "high|medium|low", "justification": "explication courte"}}"""
-
-
-def call_model(prompt: str, model: str, timeout: int = 120) -> tuple[dict | None, float]:
-    """Appelle un modèle Ollama et retourne (résultat, durée_s)."""
-    t0 = time.time()
-    try:
-        resp = requests.post(
-            f"{OLLAMA_URL}/api/generate",
-            json={
-                "model": model,
-                "prompt": prompt,
-                "stream": False,
-                "format": "json",
-                "options": {"temperature": 0.1, "num_predict": 500},
-            },
-            timeout=timeout,
-        )
-        resp.raise_for_status()
-        raw = resp.json().get("response", "")
-        duration = time.time() - t0
-        try:
-            return json.loads(raw), duration
-        except json.JSONDecodeError:
-            return None, duration
-    except Exception as e:
-        return None, time.time() - t0
-
-
-def load_dossiers(n: int) -> list[dict]:
-    """Charge N dossiers fusionnés diversifiés."""
-    dossiers = []
-    for subdir in sorted(STRUCTURED_DIR.iterdir()):
-        if not subdir.is_dir():
-            continue
-        for f in subdir.glob("*fusionne*.json"):
-            if ".gemma_" in f.name or ".bak" in f.name:
-                continue
-            try:
-                data = json.loads(f.read_text(encoding="utf-8"))
-                d = DossierMedical.model_validate(data)
-                if d.diagnostic_principal and d.diagnostic_principal.cim10_suggestion:
-                    dossiers.append({
-                        "name": subdir.name,
-                        "dossier": d,
-                        "path": str(f),
-                    })
-            except Exception:
-                continue
-            break
-    random.seed(42)
-    random.shuffle(dossiers)
-    return dossiers[:n]
-
-
-def build_contexte(d: DossierMedical) -> str:
-    """Construit un contexte clinique résumé."""
-    parts = []
-    s = d.sejour
-    if s.age is not None:
-        parts.append(f"Patient {s.sexe or '?'}, {s.age} ans")
-    if s.duree_sejour is not None:
-        parts.append(f"Durée séjour : {s.duree_sejour}j")
-    if d.diagnostic_principal:
-        parts.append(f"DP : {d.diagnostic_principal.texte}")
-    bio = [f"{b.test}={b.valeur}" for b in d.biologie_cle[:5] if b.valeur]
-    if bio:
-        parts.append(f"Bio : {', '.join(bio)}")
-    return "CONTEXTE : " + " | ".join(parts) if parts else ""
-
-
-def code_match_level(code_a: str, code_b: str) -> str:
-    """Retourne le niveau de correspondance entre deux codes."""
-    if code_a == code_b:
-        return "exact"
-    if code_a[:3] == code_b[:3]:
-        return "categorie"
-    return "diff"
-
-
-def run_benchmark(n: int = 50, das_max: int = 5):
-    print(f"=== Benchmark A/B : {MODEL_BASE} vs {MODEL_FINETUNED} ===")
-    print(f"    Dossiers : {n}, DAS max/dossier : {das_max}\n")
-
-    # Vérifier que les deux modèles sont disponibles
-    for model in [MODEL_BASE, MODEL_FINETUNED]:
-        try:
-            resp = requests.post(
-                f"{OLLAMA_URL}/api/generate",
-                json={"model": model, "prompt": "test", "stream": False,
-                      "options": {"num_predict": 1}},
-                timeout=60,
-            )
-            resp.raise_for_status()
-            print(f"  {model} : OK")
-        except Exception as e:
-            print(f"  {model} : ERREUR — {e}")
-            sys.exit(1)
-
-    dossiers = load_dossiers(n)
-    print(f"\nDossiers chargés : {len(dossiers)}\n")
-
-    cim10 = load_dict()
-    t_global_start = time.time()
-
-    dp_results = []
-    das_results = []
-
-    for i, item in enumerate(dossiers, 1):
-        d = item["dossier"]
-        dp = d.diagnostic_principal
-        name = item["name"]
-        ctx = build_contexte(d)
-
-        # === DP ===
-        prompt_dp = PROMPT_TEMPLATE.format(
-            texte=dp.texte,
-            type_diag="DP (diagnostic principal)",
-            contexte=ctx,
-        )
-        res_base, t_base = call_model(prompt_dp, MODEL_BASE)
-        res_ft, t_ft = call_model(prompt_dp, MODEL_FINETUNED)
-
-        code_base = normalize_code(res_base.get("code", "")) if res_base else "ERREUR"
-        code_ft = normalize_code(res_ft.get("code", "")) if res_ft else "ERREUR"
-        conf_base = res_base.get("confidence", "?") if res_base else "?"
-        conf_ft = res_ft.get("confidence", "?") if res_ft else "?"
-        valid_base = validate_code(code_base)[0] if code_base != "ERREUR" else False
-        valid_ft = validate_code(code_ft)[0] if code_ft != "ERREUR" else False
-
-        pipeline_code = dp.cim10_suggestion
-        match_level = code_match_level(code_base, code_ft)
-
-        dp_result = {
-            "dossier": name,
-            "texte": dp.texte[:80],
-            "pipeline": pipeline_code,
-            "base": code_base,
-            "ft": code_ft,
-            "conf_base": conf_base,
-            "conf_ft": conf_ft,
-            "valid_base": valid_base,
-            "valid_ft": valid_ft,
-            "match": match_level,
-            "t_base": round(t_base, 2),
-            "t_ft": round(t_ft, 2),
-        }
-        dp_results.append(dp_result)
-
-        tag = {"exact": "=", "categorie": "~", "diff": "X"}[match_level]
-        print(f"  [{i:2d}/{len(dossiers)}] {name:<20s} DP=\"{dp.texte[:35]:<35s}\" "
-              f"base={code_base:<7s} ft={code_ft:<7s} [{tag}] "
-              f"({t_base:.1f}s / {t_ft:.1f}s)")
-
-        # === DAS (échantillon) ===
-        das_list = [das for das in d.diagnostics_associes
-                    if das.texte and das.cim10_suggestion]
-        if len(das_list) > das_max:
-            random.seed(hash(name))
-            das_list = random.sample(das_list, das_max)
-
-        for das in das_list:
-            prompt_das = PROMPT_TEMPLATE.format(
-                texte=das.texte,
-                type_diag="DAS (diagnostic associé significatif)",
-                contexte=ctx,
-            )
-            res_b, tb = call_model(prompt_das, MODEL_BASE)
-            res_f, tf = call_model(prompt_das, MODEL_FINETUNED)
-
-            cb = normalize_code(res_b.get("code", "")) if res_b else "ERREUR"
-            cf = normalize_code(res_f.get("code", "")) if res_f else "ERREUR"
-            vb = validate_code(cb)[0] if cb != "ERREUR" else False
-            vf = validate_code(cf)[0] if cf != "ERREUR" else False
-
-            das_results.append({
-                "dossier": name,
-                "texte": das.texte[:80],
-                "pipeline": das.cim10_suggestion,
-                "base": cb,
-                "ft": cf,
-                "conf_base": (res_b or {}).get("confidence", "?"),
-                "conf_ft": (res_f or {}).get("confidence", "?"),
-                "valid_base": vb,
-                "valid_ft": vf,
-                "match": code_match_level(cb, cf),
-                "t_base": round(tb, 2),
-                "t_ft": round(tf, 2),
-            })
-
-    t_global = time.time() - t_global_start
-
-    # === RÉSUMÉ ===
-    print(f"\n{'='*75}")
-    print(f"RÉSUMÉ — {len(dp_results)} dossiers, {len(das_results)} DAS testés")
-    print(f"Durée totale : {t_global/60:.1f} min\n")
-
-    for label, results in [("DP", dp_results), ("DAS", das_results)]:
-        if not results:
-            continue
-        nt = len(results)
-        n_exact = sum(1 for r in results if r["match"] == "exact")
-        n_cat = sum(1 for r in results if r["match"] == "categorie")
-        n_diff = sum(1 for r in results if r["match"] == "diff")
-        n_vb = sum(1 for r in results if r["valid_base"])
-        n_vf = sum(1 for r in results if r["valid_ft"])
-        avg_tb = sum(r["t_base"] for r in results) / nt
-        avg_tf = sum(r["t_ft"] for r in results) / nt
-
-        # Confiance
-        conf_b = {}
-        conf_f = {}
-        for r in results:
-            conf_b[r["conf_base"]] = conf_b.get(r["conf_base"], 0) + 1
-            conf_f[r["conf_ft"]] = conf_f.get(r["conf_ft"], 0) + 1
-
-        # Concordance avec pipeline (gemma run original)
-        n_base_eq_pipe = sum(1 for r in results if r["base"] == r["pipeline"])
-        n_ft_eq_pipe = sum(1 for r in results if r["ft"] == r["pipeline"])
-        n_base_cat_pipe = sum(1 for r in results
-                             if r["base"][:3] == r["pipeline"][:3])
-        n_ft_cat_pipe = sum(1 for r in results
-                           if r["ft"][:3] == r["pipeline"][:3])
-
-        print(f"  --- {label} ({nt} diagnostics) ---")
-        print(f"  Concordance base↔ft :")
-        print(f"    Exact      : {n_exact}/{nt} ({100*n_exact/nt:.0f}%)")
-        print(f"    Catégorie  : {n_exact+n_cat}/{nt} ({100*(n_exact+n_cat)/nt:.0f}%)")
-        print(f"    Différent  : {n_diff}/{nt} ({100*n_diff/nt:.0f}%)")
-        print(f"  Codes valides :")
-        print(f"    base       : {n_vb}/{nt} ({100*n_vb/nt:.0f}%)")
-        print(f"    ft         : {n_vf}/{nt} ({100*n_vf/nt:.0f}%)")
-        print(f"  vs pipeline (gemma original) :")
-        print(f"    base=pipe  : {n_base_eq_pipe}/{nt} exact, {n_base_cat_pipe}/{nt} catégorie")
-        print(f"    ft=pipe    : {n_ft_eq_pipe}/{nt} exact, {n_ft_cat_pipe}/{nt} catégorie")
-        print(f"  Temps moyen  : base={avg_tb:.2f}s  ft={avg_tf:.2f}s  (Δ={100*(avg_tf-avg_tb)/avg_tb:+.0f}%)")
-        print(f"  Confiance base : {conf_b}")
-        print(f"  Confiance ft   : {conf_f}")
-        print()
-
-    # Lister les différences DP
-    diffs_dp = [r for r in dp_results if r["match"] == "diff"]
-    if diffs_dp:
-        print(f"  Différences DP ({len(diffs_dp)}) :")
-        for r in diffs_dp:
-            vb = "✓" if r["valid_base"] else "✗"
-            vf = "✓" if r["valid_ft"] else "✗"
-            print(f"    {r['dossier']:<18s} \"{r['texte'][:40]}\"")
-            print(f"      base={r['base']:<7s}{vb}  ft={r['ft']:<7s}{vf}  pipe={r['pipeline']}")
-
-    # Sauvegarder
-    out = {
-        "meta": {
-            "date": time.strftime("%Y-%m-%dT%H:%M:%S"),
-            "model_base": MODEL_BASE,
-            "model_ft": MODEL_FINETUNED,
-            "n_dossiers": len(dp_results),
-            "n_das": len(das_results),
-            "duration_min": round(t_global / 60, 1),
-        },
-        "dp": dp_results,
-        "das": das_results,
-    }
-    out_path = Path(__file__).parent.parent / "output" / "benchmark_ab.json"
-    out_path.write_text(json.dumps(out, ensure_ascii=False, indent=2), encoding="utf-8")
-    print(f"\nRésultats détaillés : {out_path}")
-
-
-if __name__ == "__main__":
-    import argparse
-    parser = argparse.ArgumentParser()
-    parser.add_argument("--n", type=int, default=50,
-                        help="Nombre de dossiers à tester")
-    parser.add_argument("--das-max", type=int, default=5,
-                        help="Max DAS testés par dossier")
-    args = parser.parse_args()
-    run_benchmark(args.n, args.das_max)
diff --git a/scripts_t2a_v2/benchmark_quality.py b/scripts_t2a_v2/benchmark_quality.py
deleted file mode 100644
index c6fb564..0000000
--- a/scripts_t2a_v2/benchmark_quality.py
+++ /dev/null
@@ -1,722 +0,0 @@
-#!/usr/bin/env python3
-"""Benchmark qualité T2A — validation end-to-end sur vrais dossiers.
-
-Compare la qualité des codes CIM-10, vetos, downgrades et CPAM
-entre runs successifs. Chaque run est sauvegardé dans un répertoire
-isolé pour permettre des comparaisons A/B.
-
-Usage:
-  python scripts/benchmark_quality.py --n 10
-  python scripts/benchmark_quality.py --n 10 --compare RUN_ID
-  python scripts/benchmark_quality.py --dossiers 116_23065570,45_23183041
-  python scripts/benchmark_quality.py --gold-standard
-"""
-
-from __future__ import annotations
-
-import argparse
-import json
-import os
-import shutil
-import subprocess
-import sys
-import time
-from datetime import datetime
-from pathlib import Path
-from statistics import mean, median
-
-ROOT = Path(__file__).resolve().parent.parent
-sys.path.insert(0, str(ROOT))
-
-BENCHMARKS_DIR = ROOT / "output" / "benchmarks"
-GOLD_STANDARD_FILE = ROOT / "data" / "gold_standard" / "_selection.json"
-INPUT_DIR = ROOT / "input"
-OUTPUT_DIR = ROOT / "output" / "structured"
-PY = str(ROOT / ".venv" / "bin" / "python3")
-
-
-# ---------------------------------------------------------------------------
-# Sélection des dossiers
-# ---------------------------------------------------------------------------
-
-def _gold_standard_ids() -> list[str]:
-    """Charge les IDs du gold standard."""
-    if not GOLD_STANDARD_FILE.exists():
-        print(f"ERREUR: {GOLD_STANDARD_FILE} introuvable")
-        sys.exit(1)
-    data = json.loads(GOLD_STANDARD_FILE.read_text("utf-8"))
-    # Format: "116_23065570/116_23065570_fusionne_cim10" → on prend la partie avant /
-    return [d.split("/")[0] for d in data["dossiers"]]
-
-
-def select_dossiers(n: int, gold_standard: bool, specific: list[str] | None, seed: int = 42) -> list[str]:
-    """Sélectionne les dossiers à benchmarker."""
-    if specific:
-        # Vérifier que les dossiers existent
-        valid = []
-        for d in specific:
-            if (INPUT_DIR / d).is_dir():
-                valid.append(d)
-            else:
-                print(f"  WARN: dossier {d} introuvable dans input/")
-        return valid
-
-    if gold_standard:
-        ids = _gold_standard_ids()
-        return ids[:n] if n < len(ids) else ids
-
-    # Sinon : prendre N dossiers depuis input/ (tri déterministe + seed pour reproductibilité)
-    all_dirs = sorted(
-        d.name for d in INPUT_DIR.iterdir()
-        if d.is_dir() and any(d.glob("*.pdf"))
-    )
-    if not all_dirs:
-        print("ERREUR: aucun dossier avec PDF dans input/")
-        sys.exit(1)
-
-    import random
-    rng = random.Random(seed)
-    rng.shuffle(all_dirs)
-    return all_dirs[:n]
-
-
-# ---------------------------------------------------------------------------
-# Exécution pipeline
-# ---------------------------------------------------------------------------
-
-def run_pipeline(dossier_id: str, clean: bool) -> tuple[float, bool]:
-    """Exécute le pipeline sur un dossier. Retourne (durée_s, succès)."""
-    input_path = INPUT_DIR / dossier_id
-
-    if clean:
-        for subdir in ["structured", "reports", "anonymized"]:
-            target = ROOT / "output" / subdir / dossier_id
-            if target.exists():
-                shutil.rmtree(target)
-
-    t0 = time.time()
-    try:
-        result = subprocess.run(
-            [PY, "-m", "src.main", str(input_path)],
-            capture_output=True,
-            text=True,
-            cwd=str(ROOT),
-            timeout=600,  # 10 min max par dossier
-        )
-        duration = time.time() - t0
-        if result.returncode != 0:
-            print(f"    STDERR: {result.stderr[-500:]}")
-            return duration, False
-        return duration, True
-    except subprocess.TimeoutExpired:
-        return time.time() - t0, False
-    except Exception as e:
-        print(f"    EXCEPTION: {e}")
-        return time.time() - t0, False
-
-
-# ---------------------------------------------------------------------------
-# Chargement dictionnaire CIM-10
-# ---------------------------------------------------------------------------
-
-def load_cim10_dict() -> dict[str, str]:
-    """Charge le dictionnaire CIM-10 (sans passer par le singleton)."""
-    dict_path = ROOT / "data" / "cim10_dict.json"
-    supp_path = ROOT / "data" / "cim10_supplements.json"
-    d = {}
-    if dict_path.exists():
-        d = json.loads(dict_path.read_text("utf-8"))
-    if supp_path.exists():
-        for code, label in json.loads(supp_path.read_text("utf-8")).items():
-            d.setdefault(code, label)
-    return d
-
-
-def normalize_code(code: str) -> str:
-    """K810 → K81.0, k85.1 → K85.1."""
-    code = code.strip().upper()
-    if len(code) > 3 and "." not in code:
-        code = code[:3] + "." + code[3:]
-    return code
-
-
-def is_valid_code(code: str, cim10: dict[str, str]) -> bool:
-    """Vérifie si un code CIM-10 existe dans le dictionnaire."""
-    nc = normalize_code(code)
-    return nc in cim10 or code.upper().strip() in cim10
-
-
-# ---------------------------------------------------------------------------
-# Analyse d'un dossier
-# ---------------------------------------------------------------------------
-
-def find_merged_json(dossier_id: str) -> Path | None:
-    """Trouve le JSON fusionné d'un dossier."""
-    d = OUTPUT_DIR / dossier_id
-    if not d.exists():
-        return None
-    # Chercher le fusionné d'abord
-    fusions = list(d.glob("*fusionne_cim10.json"))
-    if fusions:
-        return fusions[0]
-    # Sinon premier _cim10.json
-    cim10s = list(d.glob("*_cim10.json"))
-    return cim10s[0] if cim10s else None
-
-
-def analyze_dossier(dossier_id: str, cim10: dict[str, str], duration: float) -> dict:
-    """Analyse le JSON de sortie d'un dossier et extrait les métriques."""
-    result = {
-        "dossier_id": dossier_id,
-        "processing_time_s": round(duration, 1),
-        "success": False,
-    }
-
-    json_path = find_merged_json(dossier_id)
-    if not json_path:
-        return result
-
-    try:
-        data = json.loads(json_path.read_text("utf-8"))
-    except (json.JSONDecodeError, OSError):
-        return result
-
-    result["success"] = True
-
-    # --- DP ---
-    dp = data.get("diagnostic_principal", {})
-    dp_code = dp.get("cim10_final") or dp.get("cim10_suggestion") or ""
-    dp_suggestion = dp.get("cim10_suggestion") or ""
-    result["dp"] = {
-        "texte": (dp.get("texte") or "")[:80],
-        "code_suggestion": dp_suggestion,
-        "code_final": dp_code,
-        "confidence": dp.get("cim10_confidence", ""),
-        "has_code": bool(dp_code),
-        "valid_code": is_valid_code(dp_code, cim10) if dp_code else False,
-        "downgraded": bool(dp_code and dp_suggestion and dp_code != dp_suggestion),
-    }
-
-    # --- DAS ---
-    das_list = data.get("diagnostics_associes", [])
-    das_codes = []
-    das_conf = {"high": 0, "medium": 0, "low": 0}
-    das_valid = 0
-    das_no_code = 0
-    das_downgraded = 0
-
-    for d_item in das_list:
-        code = d_item.get("cim10_final") or d_item.get("cim10_suggestion") or ""
-        suggestion = d_item.get("cim10_suggestion") or ""
-        conf = d_item.get("cim10_confidence", "low")
-
-        if not code:
-            das_no_code += 1
-            continue
-
-        das_codes.append(code)
-        if conf in das_conf:
-            das_conf[conf] += 1
-
-        if is_valid_code(code, cim10):
-            das_valid += 1
-
-        if code and suggestion and code != suggestion:
-            das_downgraded += 1
-
-    n_das_with_code = len(das_codes)
-    result["das"] = {
-        "total": len(das_list),
-        "with_code": n_das_with_code,
-        "no_code": das_no_code,
-        "valid": das_valid,
-        "validity_rate": round(das_valid / n_das_with_code, 3) if n_das_with_code else 0,
-        "confidence": das_conf,
-        "downgraded": das_downgraded,
-        "downgrade_rate": round(das_downgraded / n_das_with_code, 3) if n_das_with_code else 0,
-        "codes_uniques": sorted(set(das_codes)),
-    }
-
-    # --- Metrics du dossier ---
-    metrics = data.get("metrics", {})
-    result["metrics"] = {
-        "das_active": metrics.get("das_active", 0),
-        "das_removed": metrics.get("das_removed", 0),
-        "das_ruled_out": metrics.get("das_ruled_out", 0),
-    }
-
-    # --- Veto ---
-    veto = data.get("veto_report", {})
-    issues = veto.get("issues", [])
-    result["veto"] = {
-        "verdict": veto.get("verdict", "NO_REPORT"),
-        "score": veto.get("score_contestabilite", 0),
-        "issues_count": len(issues),
-        "hard_count": sum(1 for i in issues if i.get("severity") == "HARD"),
-        "top_issues": [i.get("veto", i.get("type", "?")) for i in issues[:5]],
-    }
-
-    # --- GHM ---
-    ghm = data.get("ghm_estimation")
-    result["ghm"] = {
-        "estimated": ghm is not None and bool(ghm),
-        "cmd": ghm.get("cmd") if ghm else None,
-        "severity": ghm.get("severity") if ghm else None,
-        "ghm": ghm.get("ghm") if ghm else None,
-    }
-
-    # --- CPAM ---
-    cpam = data.get("controles_cpam", [])
-    result["cpam"] = {
-        "controls_count": len(cpam),
-        "has_response": any(bool(c.get("contre_argumentation")) for c in cpam),
-        "sources_count": sum(len(c.get("sources_reponse", [])) for c in cpam),
-    }
-
-    # --- Biologie ---
-    bio = data.get("biologie_cle", [])
-    result["biologie"] = {
-        "tests_count": len(bio),
-        "anomalies": sum(1 for b in bio if b.get("anomalie")),
-    }
-
-    # --- Codes CIM-10 invalides (détail) ---
-    invalid_codes = []
-    if dp_code and not is_valid_code(dp_code, cim10):
-        invalid_codes.append(f"DP:{dp_code}")
-    for code in das_codes:
-        if not is_valid_code(code, cim10):
-            invalid_codes.append(f"DAS:{code}")
-    result["invalid_codes"] = invalid_codes
-
-    return result
-
-
-# ---------------------------------------------------------------------------
-# Agrégation
-# ---------------------------------------------------------------------------
-
-def compute_aggregate(per_dossier: list[dict]) -> dict:
-    """Calcule les métriques agrégées sur tous les dossiers."""
-    successful = [d for d in per_dossier if d.get("success")]
-    n = len(successful)
-    if n == 0:
-        return {"n_total": len(per_dossier), "n_success": 0}
-
-    # DP
-    dp_has_code = sum(1 for d in successful if d["dp"]["has_code"])
-    dp_valid = sum(1 for d in successful if d["dp"]["valid_code"])
-    dp_conf = {"high": 0, "medium": 0, "low": 0}
-    for d in successful:
-        c = d["dp"]["confidence"]
-        if c in dp_conf:
-            dp_conf[c] += 1
-    dp_downgraded = sum(1 for d in successful if d["dp"]["downgraded"])
-
-    # DAS
-    total_das = sum(d["das"]["total"] for d in successful)
-    total_das_with_code = sum(d["das"]["with_code"] for d in successful)
-    total_das_valid = sum(d["das"]["valid"] for d in successful)
-    total_das_downgraded = sum(d["das"]["downgraded"] for d in successful)
-    das_conf_agg = {"high": 0, "medium": 0, "low": 0}
-    for d in successful:
-        for k in das_conf_agg:
-            das_conf_agg[k] += d["das"]["confidence"].get(k, 0)
-
-    # Veto
-    verdicts = {}
-    total_hard = 0
-    for d in successful:
-        v = d["veto"]["verdict"]
-        verdicts[v] = verdicts.get(v, 0) + 1
-        total_hard += d["veto"]["hard_count"]
-
-    # GHM
-    ghm_estimated = sum(1 for d in successful if d["ghm"]["estimated"])
-
-    # CPAM
-    cpam_total = sum(d["cpam"]["controls_count"] for d in successful)
-    cpam_with_response = sum(1 for d in successful if d["cpam"]["has_response"])
-
-    # Temps
-    times = [d["processing_time_s"] for d in successful]
-    times_sorted = sorted(times)
-    p90_idx = int(len(times_sorted) * 0.9)
-
-    # Codes invalides
-    all_invalid = []
-    for d in successful:
-        all_invalid.extend(d.get("invalid_codes", []))
-
-    return {
-        "n_total": len(per_dossier),
-        "n_success": n,
-        "n_failed": len(per_dossier) - n,
-        "dp": {
-            "has_code_rate": round(dp_has_code / n, 3),
-            "valid_code_rate": round(dp_valid / n, 3),
-            "confidence": dp_conf,
-            "downgraded": dp_downgraded,
-        },
-        "das": {
-            "total": total_das,
-            "mean_per_dossier": round(total_das / n, 1),
-            "with_code": total_das_with_code,
-            "valid": total_das_valid,
-            "validity_rate": round(total_das_valid / total_das_with_code, 3) if total_das_with_code else 0,
-            "confidence": das_conf_agg,
-            "confidence_high_rate": round(das_conf_agg["high"] / total_das_with_code, 3) if total_das_with_code else 0,
-            "downgraded": total_das_downgraded,
-            "downgrade_rate": round(total_das_downgraded / total_das_with_code, 3) if total_das_with_code else 0,
-        },
-        "veto": {
-            "verdicts": verdicts,
-            "hard_total": total_hard,
-            "dossiers_with_hard": sum(1 for d in successful if d["veto"]["hard_count"] > 0),
-        },
-        "ghm": {
-            "estimated_rate": round(ghm_estimated / n, 3),
-        },
-        "cpam": {
-            "controls_total": cpam_total,
-            "with_response": cpam_with_response,
-        },
-        "timing": {
-            "mean_s": round(mean(times), 1),
-            "median_s": round(median(times), 1),
-            "p90_s": round(times_sorted[p90_idx], 1) if times_sorted else 0,
-            "total_s": round(sum(times), 1),
-        },
-        "invalid_codes": all_invalid,
-        "invalid_codes_count": len(all_invalid),
-    }
-
-
-# ---------------------------------------------------------------------------
-# Rapport texte
-# ---------------------------------------------------------------------------
-
-def _pct(val: float) -> str:
-    return f"{val * 100:.1f}%"
-
-
-def _bar(val: float, width: int = 20) -> str:
-    filled = int(val * width)
-    return "█" * filled + "░" * (width - filled)
-
-
-def generate_report(run_id: str, config: dict, agg: dict, per_dossier: list[dict]) -> str:
-    """Génère un rapport lisible."""
-    lines = []
-    w = 66
-
-    lines.append("=" * w)
-    lines.append(f"  BENCHMARK QUALITÉ T2A — {run_id}")
-    lines.append("=" * w)
-    lines.append(f"  Date     : {config['timestamp']}")
-    lines.append(f"  Modèles  : coding={config['models'].get('coding','?')}  cpam={config['models'].get('cpam','?')}")
-    lines.append(f"             validation={config['models'].get('validation','?')}  qc={config['models'].get('qc','?')}")
-    lines.append(f"  Dossiers : {agg['n_success']}/{agg['n_total']} traités  ({agg.get('n_failed',0)} échecs)")
-    lines.append(f"  Durée    : {agg['timing']['total_s']:.0f}s ({agg['timing']['mean_s']:.1f}s/dossier)")
-    lines.append("-" * w)
-
-    # DP
-    dp = agg["dp"]
-    lines.append("")
-    lines.append("  DIAGNOSTIC PRINCIPAL (DP)")
-    lines.append(f"    Code obtenu     : {_bar(dp['has_code_rate'])} {_pct(dp['has_code_rate'])}")
-    lines.append(f"    Code CIM-10 valide : {_bar(dp['valid_code_rate'])} {_pct(dp['valid_code_rate'])}")
-    lines.append(f"    Confiance high  : {dp['confidence'].get('high',0)}/{agg['n_success']}  "
-                 f"medium: {dp['confidence'].get('medium',0)}  low: {dp['confidence'].get('low',0)}")
-    lines.append(f"    Downgrades      : {dp['downgraded']}")
-
-    # DAS
-    das = agg["das"]
-    lines.append("")
-    lines.append("  DIAGNOSTICS ASSOCIÉS (DAS)")
-    lines.append(f"    Total           : {das['total']}  (moy {das['mean_per_dossier']}/dossier)")
-    lines.append(f"    Avec code       : {das['with_code']}/{das['total']}")
-    lines.append(f"    Codes valides   : {_bar(das['validity_rate'])} {_pct(das['validity_rate'])}")
-    lines.append(f"    Confiance       : high={das['confidence']['high']}  "
-                 f"medium={das['confidence']['medium']}  low={das['confidence']['low']}")
-    lines.append(f"    Confiance high  : {_bar(das['confidence_high_rate'])} {_pct(das['confidence_high_rate'])}")
-    lines.append(f"    Downgrades      : {das['downgraded']} ({_pct(das['downgrade_rate'])})")
-
-    # Veto
-    veto = agg["veto"]
-    lines.append("")
-    lines.append("  VETOS / QUALITÉ")
-    for v, count in sorted(veto["verdicts"].items(), key=lambda x: -x[1]):
-        lines.append(f"    {v:12s} : {count}")
-    lines.append(f"    Issues HARD     : {veto['hard_total']} (dans {veto['dossiers_with_hard']} dossiers)")
-
-    # GHM
-    lines.append("")
-    lines.append("  GHM")
-    lines.append(f"    Estimé          : {_bar(agg['ghm']['estimated_rate'])} {_pct(agg['ghm']['estimated_rate'])}")
-
-    # CPAM
-    if agg["cpam"]["controls_total"] > 0:
-        lines.append("")
-        lines.append("  CPAM")
-        lines.append(f"    Contrôles       : {agg['cpam']['controls_total']}")
-        lines.append(f"    Avec réponse    : {agg['cpam']['with_response']}")
-
-    # Temps
-    lines.append("")
-    lines.append("  TEMPS DE TRAITEMENT")
-    lines.append(f"    Moyen  : {agg['timing']['mean_s']:.1f}s")
-    lines.append(f"    Médian : {agg['timing']['median_s']:.1f}s")
-    lines.append(f"    P90    : {agg['timing']['p90_s']:.1f}s")
-    lines.append(f"    Total  : {agg['timing']['total_s']:.0f}s")
-
-    # Codes invalides
-    if agg["invalid_codes"]:
-        lines.append("")
-        lines.append(f"  CODES CIM-10 INVALIDES ({agg['invalid_codes_count']})")
-        for code in agg["invalid_codes"][:20]:
-            lines.append(f"    {code}")
-        if agg["invalid_codes_count"] > 20:
-            lines.append(f"    ... et {agg['invalid_codes_count'] - 20} autres")
-
-    # Détail par dossier
-    lines.append("")
-    lines.append("-" * w)
-    lines.append("  DÉTAIL PAR DOSSIER")
-    lines.append("-" * w)
-    lines.append(f"  {'Dossier':<25s} {'DP':>6s} {'DAS':>4s} {'Valid%':>7s} {'Veto':>10s} {'Temps':>6s}")
-    lines.append(f"  {'-'*25:<25s} {'-'*6:>6s} {'-'*4:>4s} {'-'*7:>7s} {'-'*10:>10s} {'-'*6:>6s}")
-
-    for d in sorted(per_dossier, key=lambda x: x["dossier_id"]):
-        if not d.get("success"):
-            lines.append(f"  {d['dossier_id']:<25s} {'ÉCHEC':>6s}")
-            continue
-        dp_code = d["dp"]["code_final"] or "-"
-        dp_mark = "✓" if d["dp"]["valid_code"] else "✗"
-        n_das = d["das"]["total"]
-        vr = f"{d['das']['validity_rate']*100:.0f}%" if d["das"]["with_code"] else "-"
-        verdict = d["veto"]["verdict"]
-        t = f"{d['processing_time_s']:.0f}s"
-        lines.append(f"  {d['dossier_id']:<25s} {dp_code:>5s}{dp_mark} {n_das:>4d} {vr:>7s} {verdict:>10s} {t:>6s}")
-
-    lines.append("")
-    lines.append("=" * w)
-    return "\n".join(lines)
-
-
-# ---------------------------------------------------------------------------
-# Comparaison entre runs
-# ---------------------------------------------------------------------------
-
-def compare_runs(current_agg: dict, baseline_agg: dict, baseline_id: str) -> str:
-    """Compare deux runs et génère un rapport diff."""
-    lines = []
-    w = 66
-    lines.append("")
-    lines.append("=" * w)
-    lines.append(f"  COMPARAISON avec {baseline_id}")
-    lines.append("=" * w)
-
-    def _delta(cur: float, base: float, is_pct: bool = True) -> str:
-        d = cur - base
-        sign = "+" if d >= 0 else ""
-        if is_pct:
-            return f"{sign}{d*100:.1f}%"
-        return f"{sign}{d:.1f}"
-
-    def _row(label: str, cur_val: float, base_val: float, is_pct: bool = True):
-        if is_pct:
-            cur_s = _pct(cur_val)
-            base_s = _pct(base_val)
-        else:
-            cur_s = f"{cur_val:.1f}"
-            base_s = f"{base_val:.1f}"
-        delta_s = _delta(cur_val, base_val, is_pct)
-        lines.append(f"    {label:<24s} {base_s:>10s} {cur_s:>10s} {delta_s:>10s}")
-
-    lines.append(f"    {'Métrique':<24s} {'Baseline':>10s} {'Actuel':>10s} {'Delta':>10s}")
-    lines.append(f"    {'-'*24:<24s} {'-'*10:>10s} {'-'*10:>10s} {'-'*10:>10s}")
-
-    _row("DP code valide", current_agg["dp"]["valid_code_rate"], baseline_agg["dp"]["valid_code_rate"])
-    _row("DAS validité", current_agg["das"]["validity_rate"], baseline_agg["das"]["validity_rate"])
-    _row("DAS confiance high", current_agg["das"]["confidence_high_rate"], baseline_agg["das"]["confidence_high_rate"])
-    _row("DAS downgrade", current_agg["das"]["downgrade_rate"], baseline_agg["das"]["downgrade_rate"])
-    _row("GHM estimé", current_agg["ghm"]["estimated_rate"], baseline_agg["ghm"]["estimated_rate"])
-    _row("DAS moy/dossier", current_agg["das"]["mean_per_dossier"], baseline_agg["das"]["mean_per_dossier"], is_pct=False)
-    _row("Temps moyen (s)", current_agg["timing"]["mean_s"], baseline_agg["timing"]["mean_s"], is_pct=False)
-
-    # Codes invalides
-    cur_inv = set(current_agg.get("invalid_codes", []))
-    base_inv = set(baseline_agg.get("invalid_codes", []))
-    new_inv = cur_inv - base_inv
-    fixed_inv = base_inv - cur_inv
-    if new_inv:
-        lines.append(f"\n    Nouveaux codes invalides : {', '.join(sorted(new_inv))}")
-    if fixed_inv:
-        lines.append(f"    Codes corrigés          : {', '.join(sorted(fixed_inv))}")
-
-    lines.append("=" * w)
-    return "\n".join(lines)
-
-
-# ---------------------------------------------------------------------------
-# Main
-# ---------------------------------------------------------------------------
-
-def get_current_config() -> dict:
-    """Récupère la configuration modèle actuelle."""
-    try:
-        from src.config import OLLAMA_MODELS, OLLAMA_MODEL, OLLAMA_URL
-        return {
-            "models": dict(OLLAMA_MODELS),
-            "ollama_model": OLLAMA_MODEL,
-            "ollama_url": OLLAMA_URL,
-        }
-    except ImportError:
-        return {
-            "models": {
-                "coding": os.environ.get("T2A_MODEL_CODING", "?"),
-                "cpam": os.environ.get("T2A_MODEL_CPAM", "?"),
-                "validation": os.environ.get("T2A_MODEL_VALIDATION", "?"),
-                "qc": os.environ.get("T2A_MODEL_QC", "?"),
-            },
-            "ollama_model": os.environ.get("OLLAMA_MODEL", "?"),
-        }
-
-
-def main():
-    parser = argparse.ArgumentParser(description="Benchmark qualité T2A")
-    parser.add_argument("--n", type=int, default=10, help="Nombre de dossiers")
-    parser.add_argument("--dossiers", type=str, help="IDs séparés par des virgules")
-    parser.add_argument("--gold-standard", action="store_true", help="Utiliser les 50 dossiers gold standard")
-    parser.add_argument("--compare", type=str, help="Run ID à comparer")
-    parser.add_argument("--label", type=str, default="", help="Label pour ce run")
-    parser.add_argument("--no-reprocess", action="store_true", help="Analyser les outputs existants sans relancer le pipeline")
-    parser.add_argument("--clean", action="store_true", help="Supprimer les outputs avant retraitement")
-    parser.add_argument("--seed", type=int, default=42, help="Seed pour la sélection aléatoire")
-    parser.add_argument("--workers", type=int, default=1, help="Nombre de dossiers traités en parallèle")
-    args = parser.parse_args()
-
-    # Sélection dossiers
-    specific = args.dossiers.split(",") if args.dossiers else None
-    dossiers = select_dossiers(args.n, args.gold_standard, specific, args.seed)
-    print(f"\n  Dossiers sélectionnés : {len(dossiers)}")
-    for d in dossiers:
-        print(f"    - {d}")
-
-    # Config
-    config = get_current_config()
-    run_id = datetime.now().strftime("%Y%m%d_%H%M%S")
-    if args.label:
-        run_id = f"{run_id}_{args.label}"
-    config["timestamp"] = datetime.now().isoformat()
-    config["run_id"] = run_id
-    config["dossiers"] = dossiers
-    config["args"] = {
-        "n": args.n,
-        "gold_standard": args.gold_standard,
-        "clean": args.clean,
-        "no_reprocess": args.no_reprocess,
-        "seed": args.seed,
-        "label": args.label,
-    }
-
-    print(f"\n  Run ID  : {run_id}")
-    print(f"  Modèles : {config['models']}")
-    print(f"  Reprocess: {'NON' if args.no_reprocess else 'OUI (clean=' + str(args.clean) + ')'}")
-    print()
-
-    # Charger dictionnaire CIM-10
-    cim10 = load_cim10_dict()
-    print(f"  Dictionnaire CIM-10 : {len(cim10)} codes")
-    print()
-
-    # Traitement
-    per_dossier = []
-    total = len(dossiers)
-
-    if args.workers > 1 and not args.no_reprocess:
-        # Mode parallèle : exécuter les pipelines en parallèle puis analyser
-        from concurrent.futures import ThreadPoolExecutor, as_completed
-        print(f"  Mode parallèle : {args.workers} workers")
-        pipeline_results: dict[str, tuple[float, bool]] = {}
-        done = 0
-        with ThreadPoolExecutor(max_workers=args.workers) as executor:
-            futures = {
-                executor.submit(run_pipeline, dossier_id, args.clean): dossier_id
-                for dossier_id in dossiers
-            }
-            for future in as_completed(futures):
-                dossier_id = futures[future]
-                try:
-                    duration, success = future.result()
-                except Exception as e:
-                    print(f"    EXCEPTION {dossier_id}: {e}")
-                    duration, success = 0.0, False
-                pipeline_results[dossier_id] = (duration, success)
-                done += 1
-                mark = "✓" if success else "✗"
-                print(f"  [{done}/{total}] {dossier_id} — {duration:.1f}s {mark}")
-
-        # Analyse séquentielle (ordre stable)
-        for dossier_id in dossiers:
-            duration, success = pipeline_results[dossier_id]
-            metrics = analyze_dossier(dossier_id, cim10, duration)
-            per_dossier.append(metrics)
-    else:
-        # Mode séquentiel (ou --no-reprocess)
-        for i, dossier_id in enumerate(dossiers, 1):
-            print(f"  [{i}/{total}] {dossier_id}", end="", flush=True)
-
-            if args.no_reprocess:
-                duration = 0.0
-                success = find_merged_json(dossier_id) is not None
-                if not success:
-                    print(" — pas de JSON")
-                else:
-                    print(" — analyse existant")
-            else:
-                print(" — traitement...", end="", flush=True)
-                duration, success = run_pipeline(dossier_id, args.clean)
-                print(f" {duration:.1f}s {'✓' if success else '✗'}")
-
-            metrics = analyze_dossier(dossier_id, cim10, duration)
-            per_dossier.append(metrics)
-
-    # Agrégation
-    agg = compute_aggregate(per_dossier)
-
-    # Rapport
-    report = generate_report(run_id, config, agg, per_dossier)
-    print(report)
-
-    # Comparaison si demandée
-    comparison = ""
-    if args.compare:
-        baseline_path = BENCHMARKS_DIR / args.compare / "metrics.json"
-        if baseline_path.exists():
-            baseline = json.loads(baseline_path.read_text("utf-8"))
-            comparison = compare_runs(agg, baseline["aggregate"], args.compare)
-            print(comparison)
-        else:
-            print(f"\n  WARN: run baseline {args.compare} introuvable ({baseline_path})")
-
-    # Sauvegarde
-    run_dir = BENCHMARKS_DIR / run_id
-    run_dir.mkdir(parents=True, exist_ok=True)
-
-    (run_dir / "config.json").write_text(
-        json.dumps(config, ensure_ascii=False, indent=2), encoding="utf-8"
-    )
-    (run_dir / "metrics.json").write_text(
-        json.dumps({"aggregate": agg, "per_dossier": per_dossier}, ensure_ascii=False, indent=2),
-        encoding="utf-8",
-    )
-    (run_dir / "report.txt").write_text(report + comparison, encoding="utf-8")
-
-    print(f"\n  Résultats sauvegardés dans : {run_dir}")
-    print(f"  Pour comparer un futur run : python scripts/benchmark_quality.py --compare {run_id}")
-
-
-if __name__ == "__main__":
-    main()
diff --git a/scripts_t2a_v2/regenerate_tier_c.py b/scripts_t2a_v2/regenerate_tier_c.py
deleted file mode 100644
index 329b3e3..0000000
--- a/scripts_t2a_v2/regenerate_tier_c.py
+++ /dev/null
@@ -1,163 +0,0 @@
-#!/usr/bin/env python3
-"""Régénération ciblée des contrôles CPAM classés Tier C ou sans response_data.
-
-Usage :
-    cd /home/dom/ai/t2a_v2
-    .venv/bin/python3 scripts/regenerate_tier_c.py [--dry-run]
-
-Le script :
-1. Scanne output/structured/ pour trouver les contrôles Tier C + ceux sans response_data
-2. Pour chaque contrôle, relance generate_cpam_response() avec le pipeline corrigé
-3. Sauvegarde le JSON mis à jour (backup automatique .bak)
-
-Options :
-    --dry-run   Affiche les contrôles ciblés sans régénérer
-"""
-
-from __future__ import annotations
-
-import json
-import logging
-import shutil
-import sys
-import time
-from pathlib import Path
-
-# Ajouter le répertoire racine au path
-ROOT = Path(__file__).resolve().parent.parent
-sys.path.insert(0, str(ROOT))
-
-from src.config import DossierMedical
-from src.control.cpam_response import generate_cpam_response
-
-logging.basicConfig(
-    level=logging.INFO,
-    format="%(asctime)s %(levelname)-7s %(message)s",
-    datefmt="%H:%M:%S",
-)
-logger = logging.getLogger(__name__)
-
-STRUCTURED_DIR = ROOT / "output" / "structured"
-
-
-def find_targets() -> list[tuple[Path, int]]:
-    """Trouve les fichiers JSON contenant des contrôles Tier C ou sans response_data.
-
-    Returns:
-        Liste de (chemin_json, index_du_controle_dans_la_liste).
-    """
-    targets: list[tuple[Path, int]] = []
-
-    for sub in sorted(STRUCTURED_DIR.iterdir()):
-        if not sub.is_dir():
-            continue
-        for jf in sub.glob("*_fusionne_cim10.json"):
-            data = json.loads(jf.read_text(encoding="utf-8"))
-            controles = data.get("controles_cpam", [])
-            for i, ctrl in enumerate(controles):
-                tier = ctrl.get("quality_tier")
-                has_resp = ctrl.get("response_data") is not None
-                if tier == "C" or not has_resp:
-                    targets.append((jf, i))
-
-    return targets
-
-
-def regenerate(targets: list[tuple[Path, int]]) -> dict[str, int]:
-    """Régénère les contrôles CPAM ciblés.
-
-    Returns:
-        Statistiques {tier_A, tier_B, tier_C, errors}.
-    """
-    stats = {"A": 0, "B": 0, "C": 0, "errors": 0}
-    # Grouper par fichier pour ne charger/sauver qu'une fois par dossier
-    by_file: dict[Path, list[int]] = {}
-    for path, idx in targets:
-        by_file.setdefault(path, []).append(idx)
-
-    total = len(targets)
-    done = 0
-
-    for json_path, indices in by_file.items():
-        dossier_id = json_path.parent.name
-        logger.info("=== Dossier %s (%d contrôle(s) à régénérer) ===", dossier_id, len(indices))
-
-        # Charger le dossier
-        data = json.loads(json_path.read_text(encoding="utf-8"))
-        dossier = DossierMedical.model_validate(data)
-
-        modified = False
-
-        for idx in indices:
-            ctrl = dossier.controles_cpam[idx]
-            done += 1
-            old_tier = ctrl.quality_tier or "?"
-            logger.info("[%d/%d] OGC %d — %s (ancien tier: %s)",
-                        done, total, ctrl.numero_ogc, ctrl.titre[:60], old_tier)
-
-            t0 = time.time()
-            try:
-                text, response_data, sources = generate_cpam_response(dossier, ctrl)
-                elapsed = time.time() - t0
-
-                ctrl.contre_argumentation = text
-                ctrl.response_data = response_data
-                ctrl.sources_reponse = sources
-
-                new_tier = ctrl.quality_tier or "?"
-                stats[new_tier] = stats.get(new_tier, 0) + 1
-                modified = True
-
-                logger.info("  Résultat : tier %s → %s (%d chars, %.1fs)",
-                            old_tier, new_tier, len(text), elapsed)
-            except Exception:
-                logger.exception("  ERREUR sur OGC %d", ctrl.numero_ogc)
-                stats["errors"] += 1
-
-        if modified:
-            # Backup + sauvegarde
-            backup_path = json_path.with_suffix(".json.bak")
-            shutil.copy2(json_path, backup_path)
-            json_path.write_text(
-                dossier.model_dump_json(indent=2, exclude_none=True),
-                encoding="utf-8",
-            )
-            logger.info("  Sauvegardé : %s (backup: %s)", json_path.name, backup_path.name)
-
-    return stats
-
-
-def main() -> None:
-    dry_run = "--dry-run" in sys.argv
-
-    logger.info("Recherche des contrôles Tier C et sans response_data...")
-    targets = find_targets()
-
-    if not targets:
-        logger.info("Aucun contrôle à régénérer.")
-        return
-
-    logger.info("Trouvé %d contrôle(s) à régénérer :", len(targets))
-    for path, idx in targets:
-        data = json.loads(path.read_text(encoding="utf-8"))
-        ctrl = data["controles_cpam"][idx]
-        tier = ctrl.get("quality_tier", "?")
-        has_resp = "oui" if ctrl.get("response_data") else "NON"
-        logger.info("  %s OGC %d — tier %s, response_data: %s",
-                     path.parent.name, ctrl["numero_ogc"], tier, has_resp)
-
-    if dry_run:
-        logger.info("Mode dry-run — aucune régénération effectuée.")
-        return
-
-    t0 = time.time()
-    stats = regenerate(targets)
-    elapsed = time.time() - t0
-
-    logger.info("=== TERMINÉ en %.1f min ===", elapsed / 60)
-    logger.info("Distribution : A=%d, B=%d, C=%d, erreurs=%d",
-                stats.get("A", 0), stats.get("B", 0), stats.get("C", 0), stats["errors"])
-
-
-if __name__ == "__main__":
-    main()
diff --git a/scripts_t2a_v2/select_validation_dossiers.py b/scripts_t2a_v2/select_validation_dossiers.py
deleted file mode 100644
index 5b70516..0000000
--- a/scripts_t2a_v2/select_validation_dossiers.py
+++ /dev/null
@@ -1,231 +0,0 @@
-#!/usr/bin/env python3
-"""Sélectionne 50 dossiers pour le gold standard de validation DIM.
-
-- 25 dossiers CPAM (cas complexes, déjà contrôlés)
-- 25 dossiers non-CPAM stratifiés par CMD, confiance DP, nombre de DAS
-
-Crée data/gold_standard/_selection.json et initialise les annotations vides.
-"""
-
-from __future__ import annotations
-
-import json
-import random
-import sys
-from pathlib import Path
-
-# Ajouter le répertoire racine au path
-sys.path.insert(0, str(Path(__file__).resolve().parent.parent))
-
-from src.config import STRUCTURED_DIR, BASE_DIR, DossierMedical
-
-GOLD_DIR = BASE_DIR / "data" / "gold_standard"
-TARGET_TOTAL = 50
-TARGET_CPAM = 25
-
-
-def load_all_dossiers() -> list[dict]:
-    """Charge tous les dossiers fusionnés depuis output/structured/."""
-    dossiers = []
-    for subdir in sorted(STRUCTURED_DIR.iterdir()):
-        if not subdir.is_dir():
-            continue
-        # Chercher le fichier fusionné
-        fusionne = None
-        for f in subdir.glob("*fusionne*.json"):
-            fusionne = f
-            break
-        if not fusionne:
-            # Prendre le premier JSON du dossier
-            jsons = sorted(subdir.glob("*.json"))
-            if jsons:
-                fusionne = jsons[0]
-        if not fusionne:
-            continue
-
-        try:
-            data = json.loads(fusionne.read_text(encoding="utf-8"))
-            dossier = DossierMedical.model_validate(data)
-            rel_path = str(fusionne.relative_to(STRUCTURED_DIR))
-            group_name = subdir.name
-            dossiers.append({
-                "dossier_id": f"{group_name}/{fusionne.stem}",
-                "group_name": group_name,
-                "path_rel": rel_path,
-                "dossier": dossier,
-            })
-        except Exception as e:
-            print(f"  Erreur chargement {fusionne.name}: {e}")
-    return dossiers
-
-
-def select_dossiers(all_dossiers: list[dict]) -> list[dict]:
-    """Sélectionne les 50 dossiers selon la stratégie définie."""
-    # Séparer CPAM / non-CPAM
-    cpam = [d for d in all_dossiers if d["dossier"].controles_cpam]
-    non_cpam = [d for d in all_dossiers if not d["dossier"].controles_cpam]
-
-    print(f"Dossiers CPAM disponibles : {len(cpam)}")
-    print(f"Dossiers non-CPAM disponibles : {len(non_cpam)}")
-
-    # Prendre tous les CPAM (ou max TARGET_CPAM)
-    selected_cpam = cpam[:TARGET_CPAM]
-    remaining_target = TARGET_TOTAL - len(selected_cpam)
-
-    # Stratifier les non-CPAM
-    selected_non_cpam = stratified_sample(non_cpam, remaining_target)
-
-    selected = selected_cpam + selected_non_cpam
-    print(f"\nSélection finale : {len(selected)} dossiers")
-    print(f"  - CPAM : {len(selected_cpam)}")
-    print(f"  - Non-CPAM : {len(selected_non_cpam)}")
-
-    return selected
-
-
-def stratified_sample(dossiers: list[dict], n: int) -> list[dict]:
-    """Échantillonnage stratifié par CMD, confiance DP et nombre de DAS."""
-    if len(dossiers) <= n:
-        return dossiers
-
-    # Grouper par CMD
-    by_cmd: dict[str, list[dict]] = {}
-    for d in dossiers:
-        ghm = d["dossier"].ghm_estimation
-        cmd = ghm.cmd if ghm else "inconnu"
-        by_cmd.setdefault(cmd or "inconnu", []).append(d)
-
-    selected = []
-    seen_ids = set()
-
-    # Phase 1 : 1 dossier par CMD (diversité maximale)
-    cmds = sorted(by_cmd.keys())
-    random.seed(42)  # Reproductible
-    for cmd in cmds:
-        if len(selected) >= n:
-            break
-        candidates = by_cmd[cmd]
-        # Préférer un mix de confiances
-        random.shuffle(candidates)
-        d = candidates[0]
-        selected.append(d)
-        seen_ids.add(d["dossier_id"])
-
-    # Phase 2 : compléter avec diversité confiance DP
-    if len(selected) < n:
-        remaining = [d for d in dossiers if d["dossier_id"] not in seen_ids]
-        # Trier par confiance DP (low > medium > high pour surreprésenter les cas difficiles)
-        conf_order = {"low": 0, "medium": 1, "high": 2, None: 3}
-        remaining.sort(key=lambda d: (
-            conf_order.get(
-                d["dossier"].diagnostic_principal.cim10_confidence
-                if d["dossier"].diagnostic_principal else None,
-                3
-            ),
-            -len(d["dossier"].diagnostics_associes),  # beaucoup de DAS d'abord
-        ))
-        for d in remaining:
-            if len(selected) >= n:
-                break
-            selected.append(d)
-
-    return selected[:n]
-
-
-def create_empty_annotation(dossier_id: str, dossier: DossierMedical) -> dict:
-    """Crée une annotation vide pour un dossier."""
-    dp = dossier.diagnostic_principal
-    das_list = []
-    for i, das in enumerate(dossier.diagnostics_associes):
-        das_list.append({
-            "index": i,
-            "texte_original": das.texte,
-            "code_pipeline": das.cim10_suggestion or "",
-            "confidence": das.cim10_confidence or "",
-            "source": das.source or "",
-            "statut": "correct",
-            "code_corrige": None,
-            "commentaire": "",
-        })
-
-    return {
-        "dossier_id": dossier_id,
-        "validateur": "",
-        "date_validation": "",
-        "statut": "non_commence",
-        "dp": {
-            "texte_original": dp.texte if dp else "",
-            "code_pipeline": dp.cim10_suggestion if dp else "",
-            "confidence": dp.cim10_confidence if dp else "",
-            "statut": "correct",
-            "code_corrige": None,
-            "commentaire": "",
-        },
-        "das": das_list,
-        "das_ajoutes": [],
-        "commentaire_general": "",
-    }
-
-
-def main():
-    print("=== Sélection des dossiers pour validation DIM ===\n")
-
-    all_dossiers = load_all_dossiers()
-    print(f"Total dossiers chargés : {len(all_dossiers)}\n")
-
-    if not all_dossiers:
-        print("Aucun dossier trouvé dans output/structured/")
-        sys.exit(1)
-
-    selected = select_dossiers(all_dossiers)
-
-    # Créer le répertoire gold standard
-    GOLD_DIR.mkdir(parents=True, exist_ok=True)
-
-    # Sauvegarder la sélection
-    selection = {
-        "date_selection": __import__("datetime").datetime.now().isoformat(timespec="seconds"),
-        "total": len(selected),
-        "cpam": sum(1 for d in selected if d["dossier"].controles_cpam),
-        "non_cpam": sum(1 for d in selected if not d["dossier"].controles_cpam),
-        "dossiers": [d["dossier_id"] for d in selected],
-    }
-    selection_path = GOLD_DIR / "_selection.json"
-    selection_path.write_text(
-        json.dumps(selection, ensure_ascii=False, indent=2),
-        encoding="utf-8",
-    )
-    print(f"\nSélection sauvegardée : {selection_path}")
-
-    # Initialiser les annotations vides
-    created = 0
-    for d in selected:
-        dossier_id = d["dossier_id"]
-        safe_name = dossier_id.replace("/", "__") + ".json"
-        annot_path = GOLD_DIR / safe_name
-        if not annot_path.exists():
-            annotation = create_empty_annotation(dossier_id, d["dossier"])
-            annot_path.write_text(
-                json.dumps(annotation, ensure_ascii=False, indent=2),
-                encoding="utf-8",
-            )
-            created += 1
-
-    print(f"Annotations vides créées : {created}")
-    print(f"Annotations existantes préservées : {len(selected) - created}")
-
-    # Résumé
-    print(f"\n--- Résumé ---")
-    for i, d in enumerate(selected, 1):
-        dos = d["dossier"]
-        dp_code = dos.diagnostic_principal.cim10_suggestion if dos.diagnostic_principal else "?"
-        dp_conf = (dos.diagnostic_principal.cim10_confidence or "?") if dos.diagnostic_principal else "?"
-        n_das = len(dos.diagnostics_associes)
-        cpam_flag = " [CPAM]" if dos.controles_cpam else ""
-        ghm = dos.ghm_estimation
-        cmd = ghm.cmd if ghm else "?"
-        print(f"  {i:2d}. {d['group_name']:<20s} DP={dp_code:<6s} conf={dp_conf:<7s} DAS={n_das:2d} CMD={cmd}{cpam_flag}")
-
-
-if __name__ == "__main__":
-    main()
diff --git a/src/config.py b/src/config.py
index 30031fb..e8e0a32 100644
--- a/src/config.py
+++ b/src/config.py
@@ -8,11 +8,14 @@ from functools import lru_cache
 from pathlib import Path
 from typing import Optional, Any, Dict
 
+import logging
 import yaml
 
 from dotenv import load_dotenv
 from pydantic import BaseModel, Field, field_validator
 
+_cfg_logger = logging.getLogger(__name__)
+
 load_dotenv()
 
 
@@ -33,6 +36,7 @@ DIAGNOSTIC_CONFLICTS_PATH = CONFIG_DIR / "diagnostic_conflicts.yaml"
 PROCEDURE_DIAGNOSIS_RULES_PATH = CONFIG_DIR / "procedure_diagnosis_rules.yaml"
 TEMPORAL_RULES_PATH = CONFIG_DIR / "temporal_rules.yaml"
 PARCOURS_RULES_PATH = CONFIG_DIR / "parcours_rules.yaml"
+COMPLETUDE_RULES_PATH = CONFIG_DIR / "completude_rules.yaml"
 RULES_DIR = CONFIG_DIR / "rules"
 RULES_BASE_PATH = RULES_DIR / "base.yaml"
 RULES_ENABLED_PATH = RULES_DIR / "enabled.yaml"
@@ -131,14 +135,16 @@ RAG_INDEX_DIR = BASE_DIR / "data" / "rag_index"
 REFERENTIELS_DIR = BASE_DIR / "data" / "referentiels"
 UPLOAD_MAX_SIZE_MB = 50
 ALLOWED_EXTENSIONS = {".pdf", ".csv", ".xlsx", ".xls", ".txt"}
-CIM10_DICT_PATH = BASE_DIR / "data" / "cim10_dict.json"
-CIM10_SUPPLEMENTS_PATH = BASE_DIR / "data" / "cim10_supplements.json"
+_DICTS_DIR = REFERENTIELS_DIR / "dicts"
+_PDFS_DIR = REFERENTIELS_DIR / "pdfs"
+CIM10_DICT_PATH = _DICTS_DIR / "cim10_dict.json"
+CIM10_SUPPLEMENTS_PATH = _DICTS_DIR / "cim10_supplements.json"
 BIO_CONCEPTS_PATH = BASE_DIR / "data" / "bio_concepts.json"
 CMA_LEVELS_PATH = BASE_DIR / "data" / "cma_levels.json"
-CCAM_DICT_PATH = BASE_DIR / "data" / "ccam_dict.json"
-CIM10_PDF = Path(os.environ.get("T2A_CIM10_PDF", "/home/dom/ai/aivanov_CIM/cim-10-fr_2026_a_usage_pmsi_version_provisoire_111225.pdf"))
-GUIDE_METHODO_PDF = Path(os.environ.get("T2A_GUIDE_METHODO_PDF", "/home/dom/ai/aivanov_CIM/guide_methodo_mco_2026_version_provisoire.pdf"))
-CCAM_PDF = Path(os.environ.get("T2A_CCAM_PDF", "/home/dom/ai/aivanov_CIM/actualisation_ccam_descriptive_a_usage_pmsi_v4_2025.pdf"))
+CCAM_DICT_PATH = _DICTS_DIR / "ccam_dict.json"
+CIM10_PDF = Path(os.environ.get("T2A_CIM10_PDF", str(_PDFS_DIR / "cim-10-fr_2026_a_usage_pmsi_version_provisoire_111225.pdf")))
+GUIDE_METHODO_PDF = Path(os.environ.get("T2A_GUIDE_METHODO_PDF", str(_PDFS_DIR / "guide_methodo_mco_2026_version_provisoire.pdf")))
+CCAM_PDF = Path(os.environ.get("T2A_CCAM_PDF", str(_PDFS_DIR / "actualisation_ccam_descriptive_a_usage_pmsi_v4_2025.pdf")))
 
 # --- Modèle d'embedding ---
 
@@ -150,18 +156,37 @@ RERANKER_MODEL = os.environ.get("T2A_RERANKER_MODEL", "cross-encoder/ms-marco-Mi
 
 # --- Références biologiques (fallback) ---
 
+def _load_yaml_config(path: Path, defaults: Dict[str, Any], label: str) -> Dict[str, Any]:
+    """Helper : charge un YAML config avec merge sur defaults et logging explicite.
+
+    - Si le fichier n'existe pas : retourne defaults (info log).
+    - Si le YAML est invalide : retourne defaults + log error.
+    - Sinon : merge YAML sur defaults.
+    """
+    if not path.exists():
+        _cfg_logger.debug("Config %s : fichier absent (%s), defaults utilisés", label, path)
+        return defaults
+    try:
+        data = yaml.safe_load(path.read_text(encoding="utf-8")) or {}
+        if not isinstance(data, dict):
+            _cfg_logger.error("Config %s : contenu invalide (attendu dict, reçu %s) dans %s",
+                              label, type(data).__name__, path)
+            return defaults
+        merged = dict(defaults)
+        for k, v in data.items():
+            merged[k] = v
+        return merged
+    except yaml.YAMLError as e:
+        _cfg_logger.error("Config %s : erreur de syntaxe YAML dans %s — %s", label, path, e)
+        return defaults
+    except Exception as e:
+        _cfg_logger.error("Config %s : erreur lecture %s — %s", label, path, e)
+        return defaults
+
+
 @lru_cache(maxsize=1)
 def load_reference_ranges() -> Dict[str, Any]:
-    """Charge les intervalles de référence biologiques depuis config/reference_ranges.yaml.
-
-    Hiérarchie d'usage recommandée dans les règles :
-    1) Normes présentes dans le document (ex: [N: 135-145])
-    2) Table YAML (par bande d'âge)
-    3) "Safe zones" conservatrices si âge inconnu
-
-    Le YAML est volontairement éditable par des non-informaticiens (future UI).
-    """
-    # Defaults minimalistes (adultes) si YAML absent
+    """Charge les intervalles de référence biologiques depuis config/reference_ranges.yaml."""
     defaults: Dict[str, Any] = {
         "version": 1,
         "age_bands": {"adult_min_years": 18},
@@ -171,8 +196,6 @@ def load_reference_ranges() -> Dict[str, Any]:
                 "sodium": {"low": 135, "high": 145, "unit": "mmol/L"},
                 "potassium": {"low": 3.5, "high": 5.0, "unit": "mmol/L"},
             },
-            # Valeurs pédiatriques: à affiner (par bandes d'âge) si besoin.
-            # Pour les règles "ruled_out" on utilise plutôt les safe_zones_unknown_age
             "child": {
                 "platelets": {"low": 150, "high": 450, "unit": "G/L"},
                 "sodium": {"low": 135, "high": 145, "unit": "mmol/L"},
@@ -186,28 +209,7 @@ def load_reference_ranges() -> Dict[str, Any]:
             "potassium_ruled_out_low": 3.7,
         },
     }
-
-    path = REFERENCE_RANGES_PATH
-    if not path.exists():
-        return defaults
-
-    try:
-        import yaml  # type: ignore
-    except Exception:
-        # PyYAML absent: on garde les valeurs par défaut
-        return defaults
-
-    try:
-        data = yaml.safe_load(path.read_text(encoding="utf-8")) or {}
-        if not isinstance(data, dict):
-            return defaults
-        # Merge léger: defaults comme socle, YAML surcharge
-        merged = dict(defaults)
-        for k, v in data.items():
-            merged[k] = v
-        return merged
-    except Exception:
-        return defaults
+    return _load_yaml_config(REFERENCE_RANGES_PATH, defaults, "reference_ranges")
 
 
 # --- Règles biologiques (pilotées par YAML) ---
@@ -215,14 +217,7 @@ def load_reference_ranges() -> Dict[str, Any]:
 
 @lru_cache(maxsize=1)
 def load_bio_rules() -> Dict[str, Any]:
-    """Charge les règles biologiques depuis config/bio_rules.yaml.
-
-    Objectif: permettre d'activer/désactiver et de paramétrer les règles
-    de type "contradiction bio ⇒ ruled_out" sans modifier le code.
-
-    Le fichier est volontairement simple (future UI).
-    """
-
+    """Charge les règles biologiques depuis config/bio_rules.yaml."""
     defaults: Dict[str, Any] = {
         "version": 1,
         "rules": {
@@ -231,144 +226,55 @@ def load_bio_rules() -> Dict[str, Any]:
             "hypokalemia": {"enabled": True, "codes": ["E87.6"], "analyte": "potassium"},
         },
     }
-
-    path = BIO_RULES_PATH
-    if not path.exists():
-        return defaults
-
-    try:
-        import yaml  # type: ignore
-    except Exception:
-        return defaults
-
-    try:
-        data = yaml.safe_load(path.read_text(encoding="utf-8")) or {}
-        if not isinstance(data, dict):
-            return defaults
-        merged = dict(defaults)
-        for k, v in data.items():
-            merged[k] = v
-        return merged
-    except Exception:
-        return defaults
+    return _load_yaml_config(BIO_RULES_PATH, defaults, "bio_rules")
 
 
 @lru_cache(maxsize=1)
 def load_demographic_rules() -> Dict[str, Any]:
     """Charge les règles démographiques (sexe/âge) depuis config/demographic_rules.yaml."""
-    defaults: Dict[str, Any] = {
-        "version": 1,
-        "sex_rules": {},
-        "age_rules": {},
-    }
-    path = DEMOGRAPHIC_RULES_PATH
-    if not path.exists():
-        return defaults
-    try:
-        import yaml # type: ignore
-        data = yaml.safe_load(path.read_text(encoding="utf-8")) or {}
-        if not isinstance(data, dict):
-            return defaults
-        merged = dict(defaults)
-        for k, v in data.items():
-            merged[k] = v
-        return merged
-    except Exception:
-        return defaults
+    return _load_yaml_config(DEMOGRAPHIC_RULES_PATH, {
+        "version": 1, "sex_rules": {}, "age_rules": {},
+    }, "demographic_rules")
 
 
 @lru_cache(maxsize=1)
 def load_diagnostic_conflicts() -> Dict[str, Any]:
     """Charge les conflits diagnostics depuis config/diagnostic_conflicts.yaml."""
-    defaults: Dict[str, Any] = {
-        "version": 1,
-        "mutual_exclusions": [],
-        "incompatibilities": [],
-    }
-    path = DIAGNOSTIC_CONFLICTS_PATH
-    if not path.exists():
-        return defaults
-    try:
-        import yaml # type: ignore
-        data = yaml.safe_load(path.read_text(encoding="utf-8")) or {}
-        if not isinstance(data, dict):
-            return defaults
-        merged = dict(defaults)
-        for k, v in data.items():
-            merged[k] = v
-        return merged
-    except Exception:
-        return defaults
+    return _load_yaml_config(DIAGNOSTIC_CONFLICTS_PATH, {
+        "version": 1, "mutual_exclusions": [], "incompatibilities": [],
+    }, "diagnostic_conflicts")
 
 
 @lru_cache(maxsize=1)
 def load_procedure_diagnosis_rules() -> Dict[str, Any]:
     """Charge les règles de corrélation actes/diagnostics depuis config/procedure_diagnosis_rules.yaml."""
-    defaults: Dict[str, Any] = {
-        "version": 1,
-        "rules": [],
-    }
-    path = PROCEDURE_DIAGNOSIS_RULES_PATH
-    if not path.exists():
-        return defaults
-    try:
-        import yaml # type: ignore
-        data = yaml.safe_load(path.read_text(encoding="utf-8")) or {}
-        if not isinstance(data, dict):
-            return defaults
-        merged = dict(defaults)
-        for k, v in data.items():
-            merged[k] = v
-        return merged
-    except Exception:
-        return defaults
+    return _load_yaml_config(PROCEDURE_DIAGNOSIS_RULES_PATH, {
+        "version": 1, "rules": [],
+    }, "procedure_diagnosis_rules")
 
 
 @lru_cache(maxsize=1)
 def load_temporal_rules() -> Dict[str, Any]:
     """Charge les règles temporelles depuis config/temporal_rules.yaml."""
-    defaults: Dict[str, Any] = {
-        "version": 1,
-        "rules": [],
-    }
-    path = TEMPORAL_RULES_PATH
-    if not path.exists():
-        return defaults
-    try:
-        import yaml # type: ignore
-        data = yaml.safe_load(path.read_text(encoding="utf-8")) or {}
-        if not isinstance(data, dict):
-            return defaults
-        merged = dict(defaults)
-        for k, v in data.items():
-            merged[k] = v
-        return merged
-    except Exception:
-        return defaults
+    return _load_yaml_config(TEMPORAL_RULES_PATH, {
+        "version": 1, "rules": [],
+    }, "temporal_rules")
 
 
 @lru_cache(maxsize=1)
 def load_parcours_rules() -> Dict[str, Any]:
     """Charge les règles de parcours patient depuis config/parcours_rules.yaml."""
-    defaults: Dict[str, Any] = {
-        "version": 1,
-        "documentary_rules": {},
-        "pathway_rules": {},
-    }
-    path = PARCOURS_RULES_PATH
-    if not path.exists():
-        return defaults
-    try:
-        import yaml # type: ignore
-        data = yaml.safe_load(path.read_text(encoding="utf-8")) or {}
-        if not isinstance(data, dict):
-            return defaults
-        merged = dict(defaults)
-        for k, v in data.items():
-            merged[k] = v
-        return merged
-    except Exception:
-        return defaults
+    return _load_yaml_config(PARCOURS_RULES_PATH, {
+        "version": 1, "documentary_rules": {}, "pathway_rules": {},
+    }, "parcours_rules")
+
+
+@lru_cache(maxsize=1)
+def load_completude_rules() -> Dict[str, Any]:
+    """Charge les règles de complétude documentaire depuis config/completude_rules.yaml."""
+    return _load_yaml_config(COMPLETUDE_RULES_PATH, {
+        "version": 1, "diagnostics": {}, "actes": {},
+    }, "completude_rules")
 
 
 # --- Garde-fous de parsing des valeurs biologiques (anti-OCR) ---
@@ -418,25 +324,7 @@ def load_lab_value_sanity() -> Dict[str, Any]:
         },
     }
 
-    path = LAB_SANITY_PATH
-    if not path.exists():
-        return defaults
-
-    try:
-        import yaml  # type: ignore
-    except Exception:
-        return defaults
-
-    try:
-        data = yaml.safe_load(path.read_text(encoding="utf-8")) or {}
-        if not isinstance(data, dict):
-            return defaults
-        merged = dict(defaults)
-        for k, v in data.items():
-            merged[k] = v
-        return merged
-    except Exception:
-        return defaults
+    return _load_yaml_config(LAB_SANITY_PATH, defaults, "lab_value_sanity")
 
 
 # --- Catalogue de règles (vetos + décisions), piloté par YAML ---
@@ -506,11 +394,6 @@ def load_rules_catalog() -> Dict[str, Dict[str, Any]]:
     (=> ne casse pas le comportement historique)
     """
 
-    try:
-        import yaml  # type: ignore
-    except Exception:
-        return {}
-
     catalog: Dict[str, Dict[str, Any]] = {}
 
     # 1) base
@@ -519,7 +402,8 @@ def load_rules_catalog() -> Dict[str, Dict[str, Any]]:
             base_data = yaml.safe_load(RULES_BASE_PATH.read_text(encoding="utf-8")) or {}
             if isinstance(base_data, dict):
                 catalog = _flatten_rules_yaml(base_data)
-        except Exception:
+        except (yaml.YAMLError, Exception) as e:
+            _cfg_logger.error("Rules catalog : erreur lecture base.yaml — %s", e)
             catalog = {}
 
     # 2) enabled overlays
@@ -537,8 +421,8 @@ def load_rules_catalog() -> Dict[str, Dict[str, Any]]:
                     extra = active.get("extra")
                     if isinstance(extra, list):
                         extra_files = [str(x) for x in extra if str(x).strip()]
-        except Exception:
-            pass
+        except (yaml.YAMLError, Exception) as e:
+            _cfg_logger.error("Rules catalog : erreur lecture enabled.yaml — %s", e)
     else:
         # fallback env
         active_site = os.environ.get("T2A_SITE", "").strip()
@@ -552,8 +436,8 @@ def load_rules_catalog() -> Dict[str, Dict[str, Any]]:
                 data = yaml.safe_load(p.read_text(encoding="utf-8")) or {}
                 if isinstance(data, dict):
                     catalog = _merge_rule_catalog(catalog, _flatten_rules_yaml(data))
-            except Exception:
-                pass
+            except (yaml.YAMLError, Exception) as e:
+                _cfg_logger.error("Rules catalog : erreur overlay spécialité %s — %s", active_specialty, e)
 
     # 4) site overlay
     if active_site:
@@ -563,8 +447,8 @@ def load_rules_catalog() -> Dict[str, Dict[str, Any]]:
                 data = yaml.safe_load(p.read_text(encoding="utf-8")) or {}
                 if isinstance(data, dict):
                     catalog = _merge_rule_catalog(catalog, _flatten_rules_yaml(data))
-            except Exception:
-                pass
+            except (yaml.YAMLError, Exception) as e:
+                _cfg_logger.error("Rules catalog : erreur overlay site %s — %s", active_site, e)
 
     # 5) extra overlays
     for rel in extra_files:
@@ -574,8 +458,8 @@ def load_rules_catalog() -> Dict[str, Dict[str, Any]]:
                 data = yaml.safe_load(p.read_text(encoding="utf-8")) or {}
                 if isinstance(data, dict):
                     catalog = _merge_rule_catalog(catalog, _flatten_rules_yaml(data))
-            except Exception:
-                pass
+            except (yaml.YAMLError, Exception) as e:
+                _cfg_logger.error("Rules catalog : erreur overlay %s — %s", rel, e)
 
     return catalog
 
@@ -611,17 +495,7 @@ def load_rules_router() -> Dict[str, Any]:
         "defaults": {"enabled_packs": ["vetos_core", "decisions_core"]},
         "triggers": [],
     }
-    path = RULES_ROUTER_PATH
-    if not path.exists():
-        return defaults
-    try:
-        data = yaml.safe_load(path.read_text(encoding="utf-8")) or {}
-        # merge conservateur
-        if isinstance(data, dict):
-            defaults.update({k: v for k, v in data.items() if v is not None})
-        return defaults
-    except Exception:
-        return defaults
+    return _load_yaml_config(RULES_ROUTER_PATH, defaults, "rules_router")
 
 
 def rule_enabled(rule_id: str) -> bool:
@@ -877,6 +751,7 @@ class DossierMedical(BaseModel):
     ghm_estimation: Optional[GHMEstimation] = None
     controles_cpam: list[ControleCPAM] = Field(default_factory=list)
     veto_report: Optional["VetoReport"] = None
+    completude: Optional["CompletudeDossier"] = None
     processing_time_s: float | None = None
     metrics: Optional[DossierMetrics] = None
     rules_runtime: Optional[dict] = None
@@ -924,6 +799,14 @@ class GHMEstimation(BaseModel):
     alertes: list[str] = Field(default_factory=list)
 
 
+class FinancialImpact(BaseModel):
+    """Estimation de l'impact financier d'un contrôle UCR."""
+    delta_severite: int = 0          # ex: -2 (perte 2 niveaux)
+    impact_estime_euros: int = 0     # estimation grossière
+    priorite: str = "normale"        # "critique" | "haute" | "normale" | "faible"
+    raison: str = ""
+
+
 class ControleCPAM(BaseModel):
     numero_ogc: int
     titre: str = ""
@@ -933,12 +816,22 @@ class ControleCPAM(BaseModel):
     da_ucr: Optional[str] = None
     dr_ucr: Optional[str] = None
     actes_ucr: Optional[str] = None
+    type_desaccord: Optional[str] = None     # "DP" | "DAS" | "DP+DAS" | "Actes"
+    financial_impact: Optional[FinancialImpact] = None
     contre_argumentation: Optional[str] = None
     response_data: Optional[dict] = None
     sources_reponse: list[RAGSource] = Field(default_factory=list)
     quality_tier: Optional[str] = None       # "A" | "B" | "C"
     requires_review: bool = False
     quality_warnings: list[str] = Field(default_factory=list)
+    # Délais réglementaires
+    date_notification: Optional[str] = None    # JJ/MM/AAAA
+    date_limite_reponse: Optional[str] = None  # calculé : notification + 30j
+    statut_reponse: str = "a_traiter"          # "a_traiter" | "en_cours" | "envoye" | "hors_delai"
+    # Workflow validation DIM
+    validation_dim: str = "non_valide"         # "non_valide" | "en_revision" | "valide" | "rejete"
+    commentaire_dim: Optional[str] = None
+    date_validation: Optional[str] = None
 
 
 # --- Qualité / Vetos (contestabilité) ---
@@ -962,6 +855,43 @@ class VetoReport(BaseModel):
     issues: list[VetoIssue] = Field(default_factory=list)
 
 
+# --- Complétude documentaire DIM ---
+
+
+class ItemCompletude(BaseModel):
+    """Élément requis/recommandé pour justifier un code."""
+
+    categorie: str          # "biologie" | "imagerie" | "document" | "acte" | "clinique"
+    element: str            # "Albumine" | "CRO" | "Scanner abdominal"
+    statut: str             # "present" | "absent" | "present_confirme" | "present_non_confirme" | "present_indirect"
+    valeur: Optional[str] = None  # "28 g/L" si présent
+    importance: str         # "obligatoire" | "recommande"
+    impact_cpam: str = ""   # explication du risque
+    confirmation_detail: Optional[str] = None  # "Albumine 28 g/L < 30 → confirme E43"
+
+
+class CheckCompletude(BaseModel):
+    """Vérification de complétude pour un code diagnostique."""
+
+    code: str               # "E43"
+    libelle: str            # "Dénutrition sévère"
+    type_diag: str          # "DP" | "DAS"
+    items: list[ItemCompletude] = Field(default_factory=list)
+    score: int = 100        # 0-100
+    verdict: str = "defendable"  # "defendable" | "fragile" | "indefendable"
+    resume: str = ""        # "2/3 éléments obligatoires présents"
+
+
+class CompletudeDossier(BaseModel):
+    """Rapport global de complétude documentaire pour un dossier."""
+
+    checks: list[CheckCompletude] = Field(default_factory=list)
+    score_global: int = 100
+    verdict_global: str = "defendable"
+    documents_presents: list[str] = Field(default_factory=list)
+    documents_manquants: list[str] = Field(default_factory=list)
+
+
 class AnonymizationReport(BaseModel):
     source_file: str
     total_replacements: int = 0
diff --git a/src/control/cpam_context.py b/src/control/cpam_context.py
index 4143274..026f7a8 100644
--- a/src/control/cpam_context.py
+++ b/src/control/cpam_context.py
@@ -568,6 +568,39 @@ def _assess_dossier_strength(dossier: DossierMedical) -> dict:
     }
 
 
+def _build_strategie_type(controle: ControleCPAM) -> str:
+    """Construit le bloc de stratégie conditionnel selon le type de désaccord."""
+    td = controle.type_desaccord or "DP"
+    blocs: dict[str, str] = {
+        "DP": (
+            "STRATÉGIE DE CONTESTATION — TYPE : DP (Diagnostic Principal)\n"
+            "Démontrer que le DP retenu par l'UCR ne correspond pas au motif réel "
+            "d'hospitalisation. S'appuyer sur le CRH, les règles D1 (symptôme si cause "
+            "non identifiée) et D2 (cause si identifiée). Le DP doit refléter le diagnostic "
+            "ayant consommé le plus de ressources pendant le séjour."
+        ),
+        "DAS": (
+            "STRATÉGIE DE CONTESTATION — TYPE : DAS (Diagnostics Associés)\n"
+            "Prouver que la comorbidité a bien été prise en charge pendant le séjour : "
+            "prescription active, acte spécifique, surveillance documentée, ou allongement "
+            "de durée. Chaque DAS doit mobiliser des ressources supplémentaires documentées."
+        ),
+        "Actes": (
+            "STRATÉGIE DE CONTESTATION — TYPE : Actes CCAM\n"
+            "Vérifier le code CCAM exact, la date de réalisation, et la concordance avec "
+            "le compte-rendu opératoire. S'appuyer sur la nomenclature CCAM et les notes "
+            "d'inclusion/exclusion des codes concernés."
+        ),
+    }
+    if td == "DP+DAS":
+        return (
+            "STRATÉGIE DE CONTESTATION — TYPE : DP + DAS (contestation combinée)\n"
+            + blocs["DP"].split("\n", 1)[1] + "\n"
+            + blocs["DAS"].split("\n", 1)[1]
+        )
+    return blocs.get(td, blocs["DP"])
+
+
 def _build_cpam_prompt(
     dossier: DossierMedical,
     controle: ControleCPAM,
@@ -844,6 +877,9 @@ def _build_cpam_prompt(
                 + "\n".join(ext_lines)
             )
 
+    # Bloc de stratégie conditionnel selon le type de désaccord
+    strategie_type_str = _build_strategie_type(controle)
+
     tags_disponibles_str = (
         ", ".join(f"[{t}]" for t in sorted(tag_map.keys()))
         if tag_map else "(aucun)"
@@ -863,5 +899,6 @@ def _build_cpam_prompt(
         bio_confrontation_str=bio_confrontation,
         numero_ogc=controle.numero_ogc,
         tags_disponibles_str=tags_disponibles_str,
+        strategie_type_str=strategie_type_str,
     )
     return prompt, tag_map
diff --git a/src/control/cpam_parser.py b/src/control/cpam_parser.py
index 1ed7147..b46eada 100644
--- a/src/control/cpam_parser.py
+++ b/src/control/cpam_parser.py
@@ -6,6 +6,8 @@ import logging
 import re
 from pathlib import Path
 
+from datetime import datetime, timedelta
+
 import openpyxl
 
 from ..config import ControleCPAM
@@ -15,6 +17,9 @@ logger = logging.getLogger(__name__)
 # Colonnes attendues dans le fichier Excel
 _EXPECTED_COLUMNS = ("N° OGC", "Titre", "Arg_UCR", "Décision_UCR", "DP_UCR", "DA_UCR", "DR_UCR", "Actes_UCR")
 
+# Colonnes optionnelles de dates
+_DATE_COLUMNS = ("Date_notification", "Date_limite")
+
 
 def parse_cpam_excel(path: str | Path) -> dict[int, list[ControleCPAM]]:
     """Lit le fichier Excel de contrôle CPAM et retourne un dict OGC -> liste de contrôles.
@@ -76,6 +81,22 @@ def parse_cpam_excel(path: str | Path) -> dict[int, list[ControleCPAM]]:
             dr_ucr=_clean_optional(row, col_map.get("DR_UCR")),
             actes_ucr=_clean_optional(row, col_map.get("Actes_UCR")),
         )
+        controle.type_desaccord = _infer_type_desaccord(controle)
+
+        # Dates réglementaires (optionnelles)
+        date_notif_raw = _clean_optional(row, col_map.get("Date_notification"))
+        date_limite_raw = _clean_optional(row, col_map.get("Date_limite"))
+        if date_notif_raw:
+            controle.date_notification = _parse_date(date_notif_raw)
+            if controle.date_notification and not date_limite_raw:
+                # Calculer la date limite (notification + 30 jours)
+                try:
+                    dt = datetime.strptime(controle.date_notification, "%d/%m/%Y")
+                    controle.date_limite_reponse = (dt + timedelta(days=30)).strftime("%d/%m/%Y")
+                except ValueError:
+                    pass
+        if date_limite_raw:
+            controle.date_limite_reponse = _parse_date(date_limite_raw)
 
         result.setdefault(numero_ogc, []).append(controle)
         count += 1
@@ -84,6 +105,41 @@ def parse_cpam_excel(path: str | Path) -> dict[int, list[ControleCPAM]]:
     return result
 
 
+def _parse_date(raw: str) -> str | None:
+    """Parse une date depuis l'Excel (formats courants) vers JJ/MM/AAAA."""
+    if not raw:
+        return None
+    raw = raw.strip()
+    # Si c'est un objet datetime (openpyxl peut retourner un datetime)
+    if hasattr(raw, "strftime"):
+        return raw.strftime("%d/%m/%Y")
+    for fmt in ("%d/%m/%Y", "%Y-%m-%d", "%d-%m-%Y", "%d.%m.%Y"):
+        try:
+            return datetime.strptime(raw, fmt).strftime("%d/%m/%Y")
+        except ValueError:
+            continue
+    return raw  # retourner tel quel si format inconnu
+
+
+def _infer_type_desaccord(controle: ControleCPAM) -> str | None:
+    """Déduit le type de désaccord depuis les champs UCR renseignés.
+
+    Retourne None si aucun champ UCR n'est renseigné (données incomplètes).
+    """
+    has_dp = bool(controle.dp_ucr)
+    has_das = bool(controle.da_ucr)
+    has_actes = bool(controle.actes_ucr)
+    if has_dp and has_das:
+        return "DP+DAS"
+    if has_dp:
+        return "DP"
+    if has_das:
+        return "DAS"
+    if has_actes:
+        return "Actes"
+    return None
+
+
 def _clean_optional(row: tuple, idx: int | None) -> str | None:
     """Extrait une valeur optionnelle depuis une ligne Excel."""
     if idx is None or idx >= len(row):
@@ -95,21 +151,58 @@ def _clean_optional(row: tuple, idx: int | None) -> str | None:
     return val if val else None
 
 
-def match_dossier_ogc(source_name: str, cpam_data: dict[int, list[ControleCPAM]]) -> list[ControleCPAM]:
+def match_dossier_ogc(
+    source_name: str,
+    cpam_data: dict[int, list[ControleCPAM]],
+    structured_dir: Path | None = None,
+) -> list[ControleCPAM]:
     """Cherche les contrôles CPAM correspondant à un dossier par préfixe OGC.
 
-    Le nom du dossier suit le format "17_23100690" où 17 est le N° OGC.
+    Stratégie de matching (par ordre de priorité) :
+    1. Regex sur le nom du répertoire (format "17_23100690" → OGC 17)
+    2. Fallback : chercher l'OGC dans les métadonnées du JSON fusionné
 
     Args:
         source_name: Nom du sous-dossier (ex: "17_23100690").
         cpam_data: Dict OGC -> contrôles retourné par parse_cpam_excel().
+        structured_dir: Répertoire structured/ pour le fallback JSON (optionnel).
 
     Returns:
         Liste des contrôles CPAM pour cet OGC, ou liste vide.
     """
+    # 1. Match par nom de répertoire (méthode existante)
     match = re.match(r"^(\d+)_", source_name)
-    if not match:
-        return []
+    if match:
+        ogc = int(match.group(1))
+        result = cpam_data.get(ogc, [])
+        if result:
+            return result
 
-    ogc = int(match.group(1))
-    return cpam_data.get(ogc, [])
+    # 2. Fallback : chercher l'OGC dans le JSON fusionné
+    if structured_dir is not None:
+        dossier_dir = structured_dir / source_name
+        if dossier_dir.is_dir():
+            import json
+            for json_file in dossier_dir.glob("*_fusionne_cim10.json"):
+                try:
+                    data = json.loads(json_file.read_text(encoding="utf-8"))
+                    # Chercher dans controles_cpam existants
+                    for ctrl in data.get("controles_cpam", []):
+                        ctrl_ogc = ctrl.get("numero_ogc")
+                        if ctrl_ogc and ctrl_ogc in cpam_data:
+                            logger.info(
+                                "OGC %d trouvé via fallback JSON pour dossier '%s'",
+                                ctrl_ogc, source_name,
+                            )
+                            return cpam_data[ctrl_ogc]
+                except Exception:
+                    pass
+
+    # Log des OGC non matchés
+    if cpam_data:
+        available_ogcs = sorted(cpam_data.keys())
+        logger.warning(
+            "OGC non trouvé pour dossier '%s'. OGC disponibles : %s",
+            source_name, available_ogcs,
+        )
+    return []
diff --git a/src/control/cpam_rag.py b/src/control/cpam_rag.py
index 2c6deb2..c60fe2d 100644
--- a/src/control/cpam_rag.py
+++ b/src/control/cpam_rag.py
@@ -26,15 +26,15 @@ def _search_rag_for_control(controle: ControleCPAM, dossier: DossierMedical) ->
     """
     try:
         from ..medical.rag_search import search_similar_cpam
-    except Exception:
-        logger.warning("Index RAG non disponible pour la contre-argumentation")
+    except ImportError:
+        logger.error("CPAM RAG : module rag_search non disponible (faiss-cpu manquant ?)")
         return []
 
     try:
         return _search_rag_queries(controle, dossier, search_similar_cpam)
     except Exception:
-        logger.warning("Erreur RAG pour la contre-argumentation — génération sans sources",
-                        exc_info=True)
+        logger.error("CPAM RAG : erreur recherche — contre-argumentation sans sources",
+                      exc_info=True)
         return []
 
 
diff --git a/src/control/cpam_response.py b/src/control/cpam_response.py
index 9c67a41..7a6523e 100644
--- a/src/control/cpam_response.py
+++ b/src/control/cpam_response.py
@@ -8,9 +8,13 @@ Orchestrateur principal — délègue aux sous-modules :
 
 from __future__ import annotations
 
+import json
 import logging
+import os
+from datetime import datetime
+from pathlib import Path
 
-from ..config import ControleCPAM, DossierMedical, RAGSource, rule_enabled
+from ..config import ControleCPAM, DossierMedical, RAGSource, STRUCTURED_DIR, rule_enabled
 from ..medical.ollama_client import call_anthropic, call_ollama
 from ..prompts import CPAM_EXTRACTION
 
@@ -50,6 +54,70 @@ from .cpam_validation import _CIM10_CODE_RE, _validate_adversarial as _validate_
 logger = logging.getLogger(__name__)
 
 
+def _save_version(
+    dossier: DossierMedical,
+    controle: ControleCPAM,
+) -> None:
+    """Sauvegarde la version actuelle de l'argumentaire avant régénération.
+
+    Stocke dans output/structured/{dossier}/_cpam_versions/{ogc}_{timestamp}.json
+    """
+    if not controle.contre_argumentation and not controle.response_data:
+        return  # rien à versionner
+
+    # Trouver le dossier structuré (depuis source_files ou source_file)
+    dossier_dir = None
+    if not STRUCTURED_DIR.is_dir():
+        logger.debug("Versioning : STRUCTURED_DIR inexistant, skip")
+        return
+
+    structured_dirs = [d for d in STRUCTURED_DIR.iterdir() if d.is_dir()]
+
+    # Tentative 1 : matcher un source_file contre les noms de sous-dossiers
+    candidates = list(dossier.source_files or [])
+    if dossier.source_file and dossier.source_file not in candidates:
+        candidates.append(dossier.source_file)
+
+    for src in candidates:
+        src_stem = Path(src).stem.replace(" ", "_")
+        for d in structured_dirs:
+            if src_stem in d.name:
+                dossier_dir = d
+                break
+        if dossier_dir:
+            break
+
+    if not dossier_dir:
+        logger.debug("Versioning : pas de dossier structuré trouvé, skip")
+        return
+
+    versions_dir = dossier_dir / "_cpam_versions"
+    versions_dir.mkdir(exist_ok=True)
+
+    # Compter les versions existantes pour cet OGC
+    existing = sorted(versions_dir.glob(f"{controle.numero_ogc}_*.json"))
+    version_num = len(existing) + 1
+
+    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
+    filename = f"{controle.numero_ogc}_{timestamp}_v{version_num}.json"
+
+    version_data = {
+        "numero_ogc": controle.numero_ogc,
+        "version": version_num,
+        "timestamp": timestamp,
+        "contre_argumentation": controle.contre_argumentation,
+        "response_data": controle.response_data,
+        "quality_tier": controle.quality_tier,
+        "validation_dim": controle.validation_dim,
+    }
+
+    (versions_dir / filename).write_text(
+        json.dumps(version_data, ensure_ascii=False, indent=2),
+        encoding="utf-8",
+    )
+    logger.info("  Version %d sauvegardée : %s", version_num, filename)
+
+
 def _extraction_pass(
     dossier: DossierMedical,
     controle: ControleCPAM,
@@ -121,6 +189,9 @@ def generate_cpam_response(
     logger.info("CPAM : génération contre-argumentation pour OGC %d — %s",
                 controle.numero_ogc, controle.titre)
 
+    # 0. Versioning — sauvegarder la version précédente avant d'écraser
+    _save_version(dossier, controle)
+
     # 1. Passe 1 — Extraction structurée (compréhension avant argumentation)
     extraction = _extraction_pass(dossier, controle)
     degraded_pass1 = extraction is None
@@ -137,12 +208,12 @@ def generate_cpam_response(
     prompt, tag_map = _build_cpam_prompt(dossier, controle, sources, extraction)
 
     # 4. Appel LLM — Ollama (rôle cpam) > Haiku fallback
-    result = call_ollama(prompt, temperature=0.1, max_tokens=16000, role="cpam")
+    result = call_ollama(prompt, temperature=0.1, max_tokens=8000, role="cpam")
     if result is not None:
         logger.info("  Contre-argumentation via Ollama")
     else:
         logger.info("  Ollama indisponible → fallback Anthropic Haiku")
-        result = call_anthropic(prompt, temperature=0.1, max_tokens=16000)
+        result = call_anthropic(prompt, temperature=0.1, max_tokens=8000)
         if result is not None:
             logger.info("  Contre-argumentation via Anthropic Haiku")
 
@@ -213,8 +284,8 @@ def generate_cpam_response(
         if adversarial_warnings:
             adversarial_warnings.append(f"Score de confiance : {score}/10")
 
-    # 8b. Boucle de correction (max 2 retries)
-    max_corrections = 2
+    # 8b. Boucle de correction (configurable via T2A_CPAM_MAX_CORRECTIONS, défaut 2)
+    max_corrections = int(os.environ.get("T2A_CPAM_MAX_CORRECTIONS", "2"))
     for attempt in range(max_corrections):
         if not (validation
                 and not validation.get("coherent", True)
diff --git a/src/extraction/__init__.py b/src/extraction/__init__.py
index e69de29..9bbcdf8 100644
--- a/src/extraction/__init__.py
+++ b/src/extraction/__init__.py
@@ -0,0 +1,2 @@
+from .document_router import SUPPORTED_EXTENSIONS, extract_document_with_pages
+from .pdf_extractor import ExtractionMethod, ExtractionStats
diff --git a/src/extraction/document_router.py b/src/extraction/document_router.py
new file mode 100644
index 0000000..83c8d5b
--- /dev/null
+++ b/src/extraction/document_router.py
@@ -0,0 +1,62 @@
+"""Router d'extraction multi-format.
+
+Point d'entrée unique qui dispatch vers le bon extracteur selon l'extension du fichier.
+"""
+
+from __future__ import annotations
+
+import logging
+from pathlib import Path
+
+from .page_tracker import PageTracker
+from .pdf_extractor import ExtractionStats
+
+logger = logging.getLogger(__name__)
+
+SUPPORTED_EXTENSIONS = {".pdf", ".jpg", ".jpeg", ".png", ".tiff", ".tif", ".docx"}
+
+_IMAGE_EXTENSIONS = {".jpg", ".jpeg", ".png", ".tiff", ".tif"}
+
+
+def extract_document_with_pages(
+    file_path: str | Path,
+) -> tuple[str, PageTracker, ExtractionStats]:
+    """Extrait le texte de n'importe quel format supporté.
+
+    Dispatch automatique selon l'extension du fichier :
+    - .pdf → extraction native (pdfplumber/PyMuPDF) avec fallback OCR optionnel
+    - .jpg/.jpeg/.png/.tiff/.tif → OCR via docTR
+    - .docx → extraction via python-docx
+
+    Args:
+        file_path: Chemin vers le document.
+
+    Returns:
+        (texte_complet, page_tracker, extraction_stats)
+
+    Raises:
+        ValueError: Si l'extension n'est pas supportée.
+        FileNotFoundError: Si le fichier n'existe pas.
+    """
+    file_path = Path(file_path)
+    ext = file_path.suffix.lower()
+
+    if ext == ".pdf":
+        from .pdf_extractor import extract_text_with_pages
+
+        return extract_text_with_pages(file_path)
+
+    if ext in _IMAGE_EXTENSIONS:
+        from .image_extractor import extract_text_from_image
+
+        return extract_text_from_image(file_path)
+
+    if ext == ".docx":
+        from .docx_extractor import extract_text_from_docx
+
+        return extract_text_from_docx(file_path)
+
+    raise ValueError(
+        f"Format non supporté : {ext}. "
+        f"Formats acceptés : {', '.join(sorted(SUPPORTED_EXTENSIONS))}"
+    )
diff --git a/src/extraction/docx_extractor.py b/src/extraction/docx_extractor.py
new file mode 100644
index 0000000..4cab17c
--- /dev/null
+++ b/src/extraction/docx_extractor.py
@@ -0,0 +1,106 @@
+"""Extraction de texte depuis des fichiers DOCX via python-docx."""
+
+from __future__ import annotations
+
+import logging
+from pathlib import Path
+
+from .page_tracker import PageTracker
+from .pdf_extractor import ExtractionMethod, ExtractionStats
+
+logger = logging.getLogger(__name__)
+
+
+def extract_text_from_docx(
+    docx_path: str | Path,
+) -> tuple[str, PageTracker, ExtractionStats]:
+    """Extrait le texte d'un fichier DOCX.
+
+    Détecte les sauts de page via les éléments <w:br w:type="page"/> dans les runs.
+    Chaque section entre sauts de page est considérée comme une "page".
+
+    Args:
+        docx_path: Chemin vers le fichier DOCX.
+
+    Returns:
+        (texte_complet, page_tracker, extraction_stats)
+    """
+    from docx import Document
+    from docx.oxml.ns import qn
+
+    docx_path = Path(docx_path)
+    if not docx_path.exists():
+        raise FileNotFoundError(f"DOCX non trouvé : {docx_path}")
+
+    logger.info("Extraction de %s", docx_path.name)
+
+    doc = Document(str(docx_path))
+
+    # Collecter le texte par "page" (séparé par les sauts de page)
+    pages_text: list[str] = []
+    current_page_lines: list[str] = []
+
+    for paragraph in doc.paragraphs:
+        # Vérifier les sauts de page dans les runs
+        has_page_break = False
+        for run in paragraph.runs:
+            for br in run._element.findall(qn("w:br")):
+                if br.get(qn("w:type")) == "page":
+                    has_page_break = True
+                    break
+            if has_page_break:
+                break
+
+        if has_page_break and current_page_lines:
+            pages_text.append("\n".join(current_page_lines))
+            current_page_lines = []
+
+        text = paragraph.text.strip()
+        if text:
+            current_page_lines.append(text)
+
+    # Dernière page
+    if current_page_lines:
+        pages_text.append("\n".join(current_page_lines))
+
+    # Si aucun saut de page détecté, tout est sur une seule "page"
+    if not pages_text:
+        pages_text = [""]
+
+    # Construire le texte complet avec séparateurs
+    separator = "\n\n"
+    page_offsets: list[tuple[int, int]] = []
+    offset = 0
+    for page_text in pages_text:
+        start = offset
+        end = offset + len(page_text)
+        page_offsets.append((start, end))
+        offset = end + len(separator)
+
+    full_text = separator.join(pages_text)
+
+    # Stats
+    total_chars = sum(len(p.strip()) for p in pages_text)
+    chars_per_page = [len(p.strip()) for p in pages_text]
+    empty_pages = [i + 1 for i, n in enumerate(chars_per_page) if n == 0]
+
+    stats = ExtractionStats(
+        total_pages=len(pages_text),
+        empty_pages=empty_pages,
+        chars_per_page=chars_per_page,
+        total_chars=total_chars,
+        methods=[ExtractionMethod.DOCX] * len(pages_text),
+        native_pages=len(pages_text),
+        ocr_pages=0,
+        backend="python-docx",
+        source_format="docx",
+    )
+
+    tracker = PageTracker(page_offsets)
+
+    logger.info(
+        "  DOCX : %d page(s), %d caractères",
+        len(pages_text),
+        total_chars,
+    )
+    return full_text, tracker, stats
diff --git a/src/extraction/image_extractor.py b/src/extraction/image_extractor.py
new file mode 100644
index 0000000..3a2f42a
--- /dev/null
+++ b/src/extraction/image_extractor.py
@@ -0,0 +1,56 @@
+"""Extraction de texte depuis des images (JPEG, PNG, TIFF) via docTR OCR."""
+
+from __future__ import annotations
+
+import logging
+from pathlib import Path
+
+import numpy as np
+from PIL import Image
+
+from .ocr_engine import ocr_image
+from .page_tracker import PageTracker
+from .pdf_extractor import ExtractionMethod, ExtractionStats
+
+logger = logging.getLogger(__name__)
+
+
+def extract_text_from_image(
+    image_path: str | Path,
+) -> tuple[str, PageTracker, ExtractionStats]:
+    """Extrait le texte d'une image via docTR OCR.
+
+    Args:
+        image_path: Chemin vers l'image (JPEG, PNG, TIFF).
+
+    Returns:
+        (texte_complet, page_tracker, extraction_stats)
+    """
+    image_path = Path(image_path)
+    if not image_path.exists():
+        raise FileNotFoundError(f"Image non trouvée : {image_path}")
+
+    logger.info("Extraction OCR de %s", image_path.name)
+
+    img = Image.open(image_path).convert("RGB")
+    img_array = np.array(img)
+    text = ocr_image(img_array)
+
+    n_chars = len(text.strip())
+    stats = ExtractionStats(
+        total_pages=1,
+        empty_pages=[1] if n_chars == 0 else [],
+        chars_per_page=[n_chars],
+        total_chars=n_chars,
+        methods=[ExtractionMethod.IMAGE],
+        native_pages=0,
+        ocr_pages=1,
+        backend="doctr",
+        source_format="image",
+    )
+
+    page_offsets = [(0, len(text))]
+    tracker = PageTracker(page_offsets)
+
+    logger.info("  OCR image : %d caractères extraits", n_chars)
+    return text, tracker, stats
diff --git a/src/extraction/ocr_engine.py b/src/extraction/ocr_engine.py
new file mode 100644
index 0000000..af96b45
--- /dev/null
+++ b/src/extraction/ocr_engine.py
@@ -0,0 +1,54 @@
+"""Moteur OCR partagé basé sur docTR (lazy loading)."""
+
+from __future__ import annotations
+
+import logging
+
+import numpy as np
+
+logger = logging.getLogger(__name__)
+
+_doctr_predictor = None
+
+
+def get_ocr_model():
+    """Charge le modèle docTR une seule fois (lazy).
+
+    Le chargement est coûteux (~1-2s + mémoire), d'où le singleton.
+    """
+    global _doctr_predictor
+    if _doctr_predictor is None:
+        logger.info("Chargement du modèle docTR...")
+        from doctr.models import ocr_predictor
+
+        _doctr_predictor = ocr_predictor(
+            det_arch="db_resnet50",
+            reco_arch="crnn_vgg16_bn",
+            pretrained=True,
+            assume_straight_pages=True,
+        )
+        logger.info("Modèle docTR chargé.")
+    return _doctr_predictor
+
+
+def ocr_image(image: np.ndarray) -> str:
+    """OCR une image numpy (RGB, HxWx3) et retourne le texte extrait.
+
+    Args:
+        image: Array numpy RGB (H, W, 3).
+
+    Returns:
+        Texte extrait, lignes séparées par '\\n'.
+    """
+    predictor = get_ocr_model()
+    result = predictor([image])
+
+    lines: list[str] = []
+    for page in result.pages:
+        for block in page.blocks:
+            for line in block.lines:
+                words = [w.value for w in line.words if w.confidence >= 0.3]
+                if words:
+                    lines.append(" ".join(words))
+
+    return "\n".join(lines)
diff --git a/src/extraction/pdf_extractor.py b/src/extraction/pdf_extractor.py
index 18a407d..a18130d 100644
--- a/src/extraction/pdf_extractor.py
+++ b/src/extraction/pdf_extractor.py
@@ -1,66 +1,281 @@
-"""Extraction de texte et tableaux depuis les PDF via pdfplumber."""
+"""Extraction de texte et tableaux depuis les PDF via pdfplumber / PyMuPDF."""
 
 from __future__ import annotations
 
+import io
+import logging
+import os
+from dataclasses import dataclass, field
+from enum import Enum
 from pathlib import Path
 from typing import Optional
 
-import pdfplumber
-
 from .page_tracker import PageTracker
 from .text_cleaner import clean_extracted_text
 
+logger = logging.getLogger(__name__)
 
-def extract_text(pdf_path: str | Path) -> str:
+# Seuil en caractères : en-dessous, une page est considérée "pauvre"
+_MIN_CHARS_USEFUL = 30
+
+# --- Configuration multi-backend ---
+# Backend PDF : "pdfplumber" (défaut) ou "pymupdf"
+PDF_BACKEND = os.environ.get("T2A_PDF_BACKEND", "pdfplumber")
+# OCR fallback pour pages vides dans les PDF (désactivé par défaut)
+OCR_FALLBACK_ENABLED = os.environ.get("T2A_OCR_FALLBACK", "0") == "1"
+# Seuil min de caractères pour déclencher le fallback OCR
+OCR_FALLBACK_MIN_CHARS = int(os.environ.get("T2A_OCR_MIN_CHARS", "30"))
+
+
+class ExtractionMethod(str, Enum):
+    """Méthode d'extraction utilisée pour une page."""
+
+    NATIVE_PDFPLUMBER = "native_pdfplumber"
+    NATIVE_PYMUPDF = "native_pymupdf"
+    OCR_DOCTR = "ocr_doctr"
+    DOCX = "docx"
+    IMAGE = "image_ocr"
+
+
+@dataclass
+class ExtractionStats:
+    """Statistiques de qualité d'extraction."""
+
+    total_pages: int = 0
+    empty_pages: list[int] = field(default_factory=list)  # 1-indexed
+    low_content_pages: list[int] = field(default_factory=list)  # < _MIN_CHARS_USEFUL
+    chars_per_page: list[int] = field(default_factory=list)
+    total_chars: int = 0
+    methods: list[ExtractionMethod] = field(default_factory=list)  # par page
+    native_pages: int = 0
+    ocr_pages: int = 0
+    backend: str = "pdfplumber"
+    source_format: str = "pdf"
+
+    @property
+    def usable_pages(self) -> int:
+        return self.total_pages - len(self.empty_pages)
+
+    @property
+    def coverage_ratio(self) -> float:
+        """Ratio de pages avec contenu exploitable (0.0 → 1.0)."""
+        if self.total_pages == 0:
+            return 1.0
+        return self.usable_pages / self.total_pages
+
+    def has_quality_issues(self) -> bool:
+        return len(self.empty_pages) > 0
+
+    def to_alert(self) -> str | None:
+        """Génère une alerte lisible si des pages sont vides."""
+        if not self.empty_pages:
+            return None
+        pages_str = ", ".join(str(p) for p in self.empty_pages)
+        pct = round((1 - self.coverage_ratio) * 100)
+        return (
+            f"EXTRACTION : {len(self.empty_pages)}/{self.total_pages} page(s) "
+            f"sans texte extractible (p. {pages_str}) — {pct}% du document ignoré, "
+            f"possibles pages scannées ou images"
+        )
+
+    def to_flags(self) -> dict:
+        """Retourne un dict pour quality_flags."""
+        if not self.empty_pages:
+            return {}
+        return {
+            "extraction_empty_pages": self.empty_pages,
+            "extraction_total_pages": self.total_pages,
+            "extraction_coverage": round(self.coverage_ratio, 2),
+        }
+
+
+def _compute_extraction_stats(
+    pages_text: list[str],
+    methods: list[ExtractionMethod] | None = None,
+    backend: str = "pdfplumber",
+) -> ExtractionStats:
+    """Analyse la qualité d'extraction page par page."""
+    stats = ExtractionStats(
+        total_pages=len(pages_text),
+        backend=backend,
+        source_format="pdf",
+    )
+    if methods:
+        stats.methods = methods
+    for i, text in enumerate(pages_text):
+        n = len(text.strip())
+        stats.chars_per_page.append(n)
+        stats.total_chars += n
+        if n == 0:
+            stats.empty_pages.append(i + 1)  # 1-indexed
+        elif n < _MIN_CHARS_USEFUL:
+            stats.low_content_pages.append(i + 1)
+
+    # Compteurs native/ocr
+    for m in stats.methods:
+        if m == ExtractionMethod.OCR_DOCTR:
+            stats.ocr_pages += 1
+        else:
+            stats.native_pages += 1
+
+    return stats
+
+
+def _open_pdf(pdf_path: str | Path, backend: str):
+    """Ouvre un PDF avec le backend choisi."""
+    if backend == "pymupdf":
+        import fitz
+        return fitz.open(str(pdf_path))
+    import pdfplumber
+    return pdfplumber.open(pdf_path)
+
+
+def _extract_page_native(page, backend: str) -> str:
+    """Extrait le texte natif d'une page selon le backend."""
+    if backend == "pymupdf":
+        return page.get_text() or ""
+    return page.extract_text() or ""
+
+
+def _page_to_image_array(page, backend: str):
+    """Convertit une page PDF en array numpy RGB pour OCR."""
+    import numpy as np
+    from PIL import Image
+
+    if backend == "pymupdf":
+        zoom = 300 / 72  # 300 DPI
+        import fitz
+        mat = fitz.Matrix(zoom, zoom)
+        pix = page.get_pixmap(matrix=mat)
+        img = Image.open(io.BytesIO(pix.tobytes("png"))).convert("RGB")
+    else:
+        # pdfplumber → PIL Image
+        img_obj = page.to_image(resolution=300)
+        img = img_obj.original.convert("RGB")
+    return np.array(img)
+
+
+def _get_pages(pdf, backend: str):
+    """Retourne la liste des pages selon le backend."""
+    if backend == "pymupdf":
+        return [pdf[i] for i in range(len(pdf))]
+    return pdf.pages
+
+
+def extract_text(pdf_path: str | Path, backend: str | None = None) -> str:
     """Extrait le texte de toutes les pages d'un PDF."""
+    backend = backend or PDF_BACKEND
     pages_text: list[str] = []
-    with pdfplumber.open(pdf_path) as pdf:
-        for page in pdf.pages:
-            text = page.extract_text() or ""
+    with _open_pdf(pdf_path, backend) as pdf:
+        for page in _get_pages(pdf, backend):
+            text = _extract_page_native(page, backend)
+            text = clean_extracted_text(text)
             pages_text.append(text)
     return "\n\n".join(pages_text)
 
 
-def extract_text_with_pages(pdf_path: str | Path) -> tuple[str, PageTracker]:
-    """Extrait le texte avec un tracker de pages pour la traçabilité.
+def extract_text_with_pages(
+    pdf_path: str | Path,
+    backend: str | None = None,
+) -> tuple[str, PageTracker, ExtractionStats]:
+    """Extrait le texte avec un tracker de pages et des statistiques de qualité.
+
+    Supporte pdfplumber et PyMuPDF, avec fallback OCR optionnel (T2A_OCR_FALLBACK=1).
 
     Returns:
-        (texte_complet, page_tracker) où page_tracker permet de retrouver
-        la page source de chaque position de caractère.
+        (texte_complet, page_tracker, extraction_stats)
     """
-    pages_text: list[str] = []
-    with pdfplumber.open(pdf_path) as pdf:
-        for page in pdf.pages:
-            text = page.extract_text() or ""
-            text = clean_extracted_text(text)
-            pages_text.append(text)
+    backend = backend or PDF_BACKEND
+    native_method = (
+        ExtractionMethod.NATIVE_PYMUPDF
+        if backend == "pymupdf"
+        else ExtractionMethod.NATIVE_PDFPLUMBER
+    )
 
-    # Construire le texte complet avec "\n\n" comme séparateur (identique à extract_text)
+    pages_text_final: list[str] = []
+    methods_final: list[ExtractionMethod] = []
+
+    with _open_pdf(pdf_path, backend) as pdf:
+        pages = _get_pages(pdf, backend)
+        for i, page in enumerate(pages):
+            text = _extract_page_native(page, backend)
+            text = clean_extracted_text(text)
+            method = native_method
+
+            # OCR fallback si activé et page pauvre
+            if (
+                OCR_FALLBACK_ENABLED
+                and len(text.strip()) < OCR_FALLBACK_MIN_CHARS
+            ):
+                try:
+                    from .ocr_engine import ocr_image
+
+                    img_array = _page_to_image_array(page, backend)
+                    ocr_text = ocr_image(img_array)
+                    if len(ocr_text.strip()) > len(text.strip()):
+                        logger.info(
+                            "  Page %d : fallback OCR (%d → %d chars)",
+                            i + 1,
+                            len(text.strip()),
+                            len(ocr_text.strip()),
+                        )
+                        text = ocr_text
+                        method = ExtractionMethod.OCR_DOCTR
+                except Exception:
+                    logger.warning(
+                        "  Page %d : échec OCR fallback", i + 1, exc_info=True
+                    )
+
+            pages_text_final.append(text)
+            methods_final.append(method)
+
+    stats = _compute_extraction_stats(pages_text_final, methods_final, backend)
+
+    if stats.empty_pages:
+        logger.warning(
+            "  %s : %d/%d pages vides (p. %s) — possibles scans/images",
+            Path(pdf_path).name,
+            len(stats.empty_pages),
+            stats.total_pages,
+            ", ".join(str(p) for p in stats.empty_pages),
+        )
+    if stats.ocr_pages:
+        logger.info(
+            "  %s : %d page(s) via OCR fallback",
+            Path(pdf_path).name,
+            stats.ocr_pages,
+        )
+
+    # Construire le texte complet avec "\n\n" comme séparateur
     separator = "\n\n"
     page_offsets: list[tuple[int, int]] = []
     offset = 0
-    for i, page_text in enumerate(pages_text):
+    for page_text in pages_text_final:
         start = offset
         end = offset + len(page_text)
         page_offsets.append((start, end))
         offset = end + len(separator)
 
-    full_text = separator.join(pages_text)
-    return full_text, PageTracker(page_offsets)
+    full_text = separator.join(pages_text_final)
+    return full_text, PageTracker(page_offsets), stats
 
 
-def extract_pages(pdf_path: str | Path) -> list[str]:
+def extract_pages(pdf_path: str | Path, backend: str | None = None) -> list[str]:
     """Extrait le texte page par page."""
+    backend = backend or PDF_BACKEND
     pages: list[str] = []
-    with pdfplumber.open(pdf_path) as pdf:
-        for page in pdf.pages:
-            pages.append(page.extract_text() or "")
+    with _open_pdf(pdf_path, backend) as pdf:
+        for page in _get_pages(pdf, backend):
+            text = _extract_page_native(page, backend)
+            text = clean_extracted_text(text)
+            pages.append(text)
     return pages
 
 
 def extract_tables(pdf_path: str | Path) -> list[list[list[str | None]]]:
-    """Extrait tous les tableaux détectés dans le PDF."""
+    """Extrait tous les tableaux détectés dans le PDF (pdfplumber uniquement)."""
     all_tables: list[list[list[str | None]]] = []
+    import pdfplumber
     with pdfplumber.open(pdf_path) as pdf:
         for page in pdf.pages:
             tables = page.extract_tables() or []
diff --git a/src/extraction/trackare_parser.py b/src/extraction/trackare_parser.py
index c9b0786..b8a3588 100644
--- a/src/extraction/trackare_parser.py
+++ b/src/extraction/trackare_parser.py
@@ -4,7 +4,7 @@ from __future__ import annotations
 
 import re
 
-from src.medical.das_filter import clean_diagnostic_text, is_valid_diagnostic_text
+from ..medical.das_filter import clean_diagnostic_text, is_valid_diagnostic_text
 
 
 def parse_trackare(text: str) -> dict:
diff --git a/src/main.py b/src/main.py
index bf7b830..6da3d75 100644
--- a/src/main.py
+++ b/src/main.py
@@ -26,12 +26,14 @@ from .config import (
 from .extraction.document_classifier import classify
 from .extraction.crh_parser import parse_crh
 from .extraction.document_splitter import split_documents
+from .extraction.document_router import SUPPORTED_EXTENSIONS, extract_document_with_pages
 from .extraction.pdf_extractor import extract_text, extract_text_with_pages
 from .extraction.trackare_parser import parse_trackare
 from .medical.cim10_extractor import extract_medical_info
 from .medical.ghm import estimate_ghm
 from .quality.veto_engine import apply_vetos
 from .quality.decision_engine import apply_decisions, decision_summaries
+from .quality.completude import build_completude_checklist
 from .quality.rules_router import build_rules_runtime_context
 
 logging.basicConfig(
@@ -141,17 +143,19 @@ _use_edsnlp = True
 _use_rag = True
 
 
-def process_pdf(pdf_path: Path) -> list[tuple[str, DossierMedical, AnonymizationReport]]:
-    """Traite un PDF : extraction → splitting → parsing → anonymisation → extraction CIM-10.
+def process_document(file_path: Path) -> list[tuple[str, DossierMedical, AnonymizationReport]]:
+    """Traite un document : extraction → splitting → parsing → anonymisation → extraction CIM-10.
+
+    Supporte PDF, images (JPEG/PNG/TIFF) et DOCX via le router d'extraction.
 
     Retourne une liste de (texte_anonymisé, dossier, rapport) — un par dossier détecté.
     """
     t0 = time.time()
-    logger.info("Traitement de %s", pdf_path.name)
+    logger.info("Traitement de %s", file_path.name)
 
-    # 1. Extraction texte avec pages
-    raw_text, page_tracker = extract_text_with_pages(pdf_path)
-    logger.info("  Texte extrait : %d caractères", len(raw_text))
+    # 1. Extraction texte avec pages (multi-format)
+    raw_text, page_tracker, extraction_stats = extract_document_with_pages(file_path)
+    logger.info("  Texte extrait : %d caractères (%d pages, format=%s)", len(raw_text), extraction_stats.total_pages, extraction_stats.source_format)
 
     # 2. Classification
     doc_type = classify(raw_text)
@@ -160,7 +164,7 @@ def process_pdf(pdf_path: Path) -> list[tuple[str, DossierMedical, Anonymization
     # 3. Splitting multi-dossiers
     chunks = split_documents(raw_text, doc_type)
     if len(chunks) > 1:
-        logger.info("  Découpage : %d dossiers détectés dans %s", len(chunks), pdf_path.name)
+        logger.info("  Découpage : %d dossiers détectés dans %s", len(chunks), file_path.name)
 
     results: list[tuple[str, DossierMedical, AnonymizationReport]] = []
     for i, chunk_text in enumerate(chunks):
@@ -177,7 +181,7 @@ def process_pdf(pdf_path: Path) -> list[tuple[str, DossierMedical, Anonymization
         anonymizer = Anonymizer(parsed_data=parsed)
         anonymized_text = anonymizer.anonymize(chunk_text)
         report = anonymizer.report
-        report.source_file = pdf_path.name
+        report.source_file = file_path.name
         logger.info(
             "  Anonymisation%s : %d remplacements (regex=%d, ner=%d, sweep=%d)",
             part_label,
@@ -197,10 +201,18 @@ def process_pdf(pdf_path: Path) -> list[tuple[str, DossierMedical, Anonymization
             parsed, anonymized_text, edsnlp_result, use_rag=_use_rag,
             page_tracker=page_tracker, raw_text=raw_text,
         )
-        dossier.source_file = pdf_path.name
+        dossier.source_file = file_path.name
         dossier.document_type = doc_type
         logger.info("  DP%s : %s", part_label, dossier.diagnostic_principal)
 
+        # Injection des stats d'extraction dans quality_flags
+        extraction_flags = extraction_stats.to_flags()
+        if extraction_flags:
+            dossier.quality_flags.update(extraction_flags)
+        extraction_alert = extraction_stats.to_alert()
+        if extraction_alert:
+            dossier.alertes_codage.append(extraction_alert)
+
         # 8. Vetos (contestabilité) + décisions (post-traitement)
         # Routage des règles (packs) : par défaut, on garde le socle vetos/decisions,
         # et on active des packs additionnels selon les signaux du dossier (codes/labs/extraits).
@@ -216,14 +228,17 @@ def process_pdf(pdf_path: Path) -> list[tuple[str, DossierMedical, Anonymization
             if rules_ctx.get("triggers_fired"):
                 logger.info("  Règles%s : triggers=%s", part_label, ",".join(rules_ctx["triggers_fired"]))
         except Exception:
-            logger.warning("  Routage règles : erreur", exc_info=True)
+            logger.error("  Routage règles : erreur", exc_info=True)
+            dossier.quality_flags["rules_routing"] = "error"
 
         veto = None
         try:
             veto = apply_vetos(dossier)
             dossier.veto_report = veto
         except Exception:
-            logger.warning("  Vetos : erreur lors du contrôle", exc_info=True)
+            logger.error("  Vetos : erreur lors du contrôle", exc_info=True)
+            dossier.quality_flags["veto_engine"] = "error"
+            dossier.alertes_codage.append("QUALITE DEGRADEE : moteur de vetos en erreur")
 
         try:
             apply_decisions(dossier)
@@ -231,11 +246,18 @@ def process_pdf(pdf_path: Path) -> list[tuple[str, DossierMedical, Anonymization
             if veto is not None:
                 _inject_veto_alerts(dossier, veto, scope="PDF")
         except Exception:
-            logger.warning("  Décisions : erreur lors du post-traitement", exc_info=True)
+            logger.error("  Décisions : erreur lors du post-traitement", exc_info=True)
+            dossier.quality_flags["decision_engine"] = "error"
         finally:
             if rules_token is not None:
                 reset_rules_runtime(rules_token)
 
+        try:
+            dossier.completude = build_completude_checklist(dossier)
+        except Exception:
+            logger.error("  Complétude : erreur lors du contrôle", exc_info=True)
+            dossier.quality_flags["completude"] = "error"
+
         # 9. Estimation GHM (sur codes finaux) + métriques (actifs vs écartés)
         try:
             metrics = _compute_metrics(dossier)
@@ -260,14 +282,17 @@ def process_pdf(pdf_path: Path) -> list[tuple[str, DossierMedical, Anonymization
                 ghm.ghm_approx or "?",
             )
         except Exception:
-            logger.warning("  Erreur estimation GHM/metrics", exc_info=True)
+            logger.error("  Erreur estimation GHM/metrics", exc_info=True)
+            dossier.quality_flags["ghm_estimation"] = "error"
+            dossier.alertes_codage.append("QUALITE DEGRADEE : estimation GHM en erreur")
 
         # 10. Finalizer DP (arbitrage Trackare vs CRH, traçabilité)
         try:
             from .medical.dp_finalizer import finalize_dp
             finalize_dp(dossier)
         except Exception:
-            logger.warning("  Finalizer DP : erreur", exc_info=True)
+            logger.error("  Finalizer DP : erreur", exc_info=True)
+            dossier.quality_flags["dp_finalizer"] = "error"
 
         dossier.processing_time_s = round(time.time() - t0, 2)
         results.append((anonymized_text, dossier, report))
@@ -276,6 +301,10 @@ def process_pdf(pdf_path: Path) -> list[tuple[str, DossierMedical, Anonymization
     return results
 
 
+# Alias backward-compatible
+process_pdf = process_document
+
+
 def _run_edsnlp(text: str):
     """Exécute l'analyse edsnlp avec fallback gracieux."""
     try:
@@ -351,13 +380,13 @@ def main(input_path: str | None = None) -> None:
     global _use_edsnlp, _use_rag
 
     parser = argparse.ArgumentParser(
-        description="Anonymisation de documents médicaux PDF et extraction CIM-10",
+        description="Anonymisation de documents médicaux et extraction CIM-10 (PDF, images, DOCX)",
     )
     parser.add_argument(
         "input",
         nargs="*",
         default=[input_path or "input/"],
-        help="Chemin(s) vers des PDFs, dossiers patients, ou le dossier racine (défaut: input/)",
+        help="Chemin(s) vers des documents, dossiers patients, ou le dossier racine (défaut: input/)",
     )
     parser.add_argument(
         "--no-ner",
@@ -459,6 +488,24 @@ def main(input_path: str | None = None) -> None:
     if args.no_rag:
         _use_rag = False
 
+    # Vérification FAISS obligatoire si RAG actif
+    if _use_rag:
+        from .medical.rag_index import check_faiss_ready
+        faiss_status = check_faiss_ready()
+        if faiss_status["ok"]:
+            total_vecs = faiss_status["ref"] + faiss_status["proc"] + faiss_status["bio"] + faiss_status["legacy"]
+            logger.info("FAISS OK : %d vecteurs (ref=%d, proc=%d, bio=%d)",
+                        total_vecs, faiss_status["ref"], faiss_status["proc"], faiss_status["bio"])
+        else:
+            for err in faiss_status["errors"]:
+                logger.error("FAISS : %s", err)
+            logger.error("FAISS non fonctionnel — le codage CIM-10 sera dégradé. "
+                         "Lancez : python3 -m src.main --rebuild-index")
+            print("\n*** ATTENTION : Index FAISS absent ou invalide ***")
+            print("*** Le RAG est désactivé — qualité de codage dégradée ***")
+            print("*** Corrigez avec : python3 -m src.main --rebuild-index ***\n")
+            _use_rag = False
+
     export_rum_flag = args.export_rum
 
     # Chargement contrôle CPAM (auto-détection ou flag explicite)
@@ -480,7 +527,14 @@ def main(input_path: str | None = None) -> None:
 
     input_paths = args.input
 
-    # Collecte des groupes (pdfs, subdir) à traiter
+    def _glob_supported(directory: Path) -> list[Path]:
+        """Collecte tous les fichiers supportés dans un dossier."""
+        files: list[Path] = []
+        for ext in sorted(SUPPORTED_EXTENSIONS):
+            files.extend(directory.glob(f"*{ext}"))
+        return sorted(set(files))
+
+    # Collecte des groupes (documents, subdir) à traiter
     groups: list[tuple[list[Path], str | None]] = []
 
     for p in input_paths:
@@ -490,47 +544,47 @@ def main(input_path: str | None = None) -> None:
             subdir = input_p.parent.name if input_p.parent.name != "input" else None
             groups.append(([input_p], subdir))
         elif input_p.is_dir():
-            # Vérifier s'il y a des PDFs directement dans ce dossier
-            root_pdfs = sorted(input_p.glob("*.pdf"))
-            # Vérifier s'il y a des sous-dossiers avec PDFs
-            sub_dirs = [c for c in sorted(input_p.iterdir()) if c.is_dir() and list(c.glob("*.pdf"))]
+            # Vérifier s'il y a des documents directement dans ce dossier
+            root_docs = _glob_supported(input_p)
+            # Vérifier s'il y a des sous-dossiers avec des documents
+            sub_dirs = [c for c in sorted(input_p.iterdir()) if c.is_dir() and _glob_supported(c)]
 
             if sub_dirs:
                 # C'est un dossier racine (comme input/) → traiter chaque sous-dossier
                 for child in sub_dirs:
-                    sub_pdfs = sorted(child.glob("*.pdf"))
-                    groups.append((sub_pdfs, child.name))
-            elif root_pdfs:
+                    sub_docs = _glob_supported(child)
+                    groups.append((sub_docs, child.name))
+            elif root_docs:
                 # C'est un dossier patient directement → utiliser son nom comme subdir
-                groups.append((root_pdfs, input_p.name))
+                groups.append((root_docs, input_p.name))
         else:
             logger.error("Chemin introuvable : %s", input_p)
             sys.exit(1)
 
-    total = sum(len(pdfs) for pdfs, _ in groups)
+    total = sum(len(docs) for docs, _ in groups)
     if total == 0:
-        logger.warning("Aucun PDF trouvé dans %s", input_p)
+        logger.warning("Aucun document supporté trouvé dans %s", input_p)
         sys.exit(0)
 
-    logger.info("Traitement de %d PDF(s)...", total)
+    logger.info("Traitement de %d document(s)...", total)
 
-    def _process_group(pdfs: list[Path], subdir: str | None) -> None:
-        """Traite un groupe de PDFs (un dossier patient)."""
+    def _process_group(docs: list[Path], subdir: str | None) -> None:
+        """Traite un groupe de documents (un dossier patient)."""
         if subdir:
-            logger.info("--- Dossier %s (%d PDFs) ---", subdir, len(pdfs))
+            logger.info("--- Dossier %s (%d documents) ---", subdir, len(docs))
 
         group_dossiers: list[DossierMedical] = []
-        for pdf_path in pdfs:
+        for doc_path in docs:
             try:
-                pdf_results = process_pdf(pdf_path)
-                stem = pdf_path.stem.replace(" ", "_")
-                multi = len(pdf_results) > 1
-                for part_idx, (anonymized_text, dossier, report) in enumerate(pdf_results):
+                doc_results = process_document(doc_path)
+                stem = doc_path.stem.replace(" ", "_")
+                multi = len(doc_results) > 1
+                for part_idx, (anonymized_text, dossier, report) in enumerate(doc_results):
                     part_stem = f"{stem}_part{part_idx + 1}" if multi else stem
                     write_outputs(part_stem, anonymized_text, dossier, report, subdir=subdir, export_rum_flag=export_rum_flag)
                     group_dossiers.append(dossier)
             except Exception:
-                logger.exception("Erreur lors du traitement de %s", pdf_path.name)
+                logger.exception("Erreur lors du traitement de %s", doc_path.name)
 
         # Fusion multi-PDFs si plusieurs documents dans le même groupe
         merged = None
@@ -611,6 +665,11 @@ def main(input_path: str | None = None) -> None:
                     if rules_token is not None:
                         reset_rules_runtime(rules_token)
 
+                try:
+                    merged.completude = build_completude_checklist(merged)
+                except Exception:
+                    logger.warning("  Complétude fusionné : erreur lors du contrôle", exc_info=True)
+
                 # Re-estimer le GHM (sur codes finaux) + métriques (actifs vs écartés)
                 try:
                     metrics = _compute_metrics(merged)
@@ -660,8 +719,8 @@ def main(input_path: str | None = None) -> None:
         logger.info("Mode parallèle : %d workers", args.workers)
         with ThreadPoolExecutor(max_workers=args.workers) as executor:
             futures = {
-                executor.submit(_process_group, pdfs, subdir): subdir
-                for pdfs, subdir in groups
+                executor.submit(_process_group, docs, subdir): subdir
+                for docs, subdir in groups
             }
             for future in as_completed(futures):
                 try:
@@ -669,8 +728,8 @@ def main(input_path: str | None = None) -> None:
                 except Exception:
                     logger.exception("Erreur groupe %s", futures[future])
     else:
-        for pdfs, subdir in groups:
-            _process_group(pdfs, subdir)
+        for docs, subdir in groups:
+            _process_group(docs, subdir)
 
     logger.info("Terminé.")
 
diff --git a/src/medical/bio_extraction.py b/src/medical/bio_extraction.py
index 91fd612..f7a7e6b 100644
--- a/src/medical/bio_extraction.py
+++ b/src/medical/bio_extraction.py
@@ -202,6 +202,9 @@ def _extract_biologie(text: str, dossier: DossierMedical) -> None:
         (r"(?:[Gg]lyc[ée]mie|[Gg]lucose)\s*[=:àa]?\s*(\d+(?:[.,]\d+)?)\s*(?:mmol/L|g/L)?", "Glycémie"),
         (r"\bHbA1c\b\s*[=:àa]?\s*(\d+(?:[.,]\d+)?)\s*(?:%)?", "HbA1c"),
         (r"\bTSH\b\s*[=:àa]?\s*(\d+(?:[.,]\d+)?)\s*(?:mUI/L)?", "TSH"),
+        # Albumine / Préalbumine (critère de sévérité HAS 2021 dénutrition)
+        (r"(?:[Aa]lbumin[ée]?(?:mie)?|[Aa]lb(?:u)?[ée]?(?:mie)?)\s*[=:àa]?\s*(\d+(?:[.,]\d+)?)\s*(?:g/[Ll])?", "Albumine"),
+        (r"(?:[Pp]r[ée]albumine|[Tt]ransthyr[ée]tine)\s*[=:àa]?\s*(\d+(?:[.,]\d+)?)\s*(?:mg/[Ll]|g/[Ll])?", "Préalbumine"),
     ]
 
 
diff --git a/src/medical/cim10_extractor.py b/src/medical/cim10_extractor.py
index 6edd2dc..f960aef 100644
--- a/src/medical/cim10_extractor.py
+++ b/src/medical/cim10_extractor.py
@@ -38,6 +38,7 @@ from .bio_extraction import _extract_biologie
 from .diagnostic_extraction import (
     _extract_diagnostics,
     _extract_actes,
+    _detect_nutrition_has2021,
     CIM10_MAP,
     CCAM_MAP,
 )
@@ -58,6 +59,7 @@ from .bio_normals import BIO_NORMALS, _is_abnormal  # noqa: F401
 from .validation_pipeline import _is_dp_family_redundant  # noqa: F401
 from .diagnostic_extraction import _lookup_cim10  # noqa: F401
 from .diagnostic_extraction import _DAS_PATTERNS  # noqa: F401
+from .diagnostic_extraction import _detect_nutrition_has2021  # noqa: F401
 
 
 def extract_medical_info(
@@ -86,6 +88,7 @@ def extract_medical_info(
     _extract_antecedents(anonymized_text, dossier)
     _extract_traitements(parsed_data, anonymized_text, dossier, edsnlp_result)
     _extract_biologie(anonymized_text, dossier)
+    _detect_nutrition_has2021(dossier)
     _extract_imagerie(anonymized_text, dossier)
     _extract_complications(anonymized_text, dossier, edsnlp_result)
 
@@ -134,7 +137,9 @@ def extract_medical_info(
                     f"NUKE-3 REVIEW: DP ambigu — {selection.reason}"
                 )
         except Exception:
-            logger.warning("NUKE-3: erreur sélection DP", exc_info=True)
+            logger.error("NUKE-3: erreur sélection DP", exc_info=True)
+            dossier.quality_flags["dp_selection_status"] = "error"
+            dossier.alertes_codage.append("QUALITE DEGRADEE : sélection DP (NUKE-3) en erreur")
 
     # Post-processing : validation des codes CCAM contre le dictionnaire
     _validate_ccam(dossier)
@@ -240,7 +245,8 @@ def _extract_das_llm(text: str, dossier: DossierMedical) -> None:
 
         cache.save()
     except Exception:
-        logger.warning("Erreur lors de l'extraction DAS LLM", exc_info=True)
+        logger.error("Erreur lors de l'extraction DAS LLM", exc_info=True)
+        dossier.quality_flags["das_llm_status"] = "error"
 
 
 def _enrich_with_rag(dossier: DossierMedical) -> None:
@@ -249,9 +255,13 @@ def _enrich_with_rag(dossier: DossierMedical) -> None:
         from .rag_search import enrich_dossier
         enrich_dossier(dossier)
     except ImportError:
-        logger.warning("Module RAG non disponible (faiss-cpu ou sentence-transformers manquant)")
+        logger.error("RAG INDISPONIBLE : faiss-cpu ou sentence-transformers manquant")
+        dossier.quality_flags["rag_status"] = "unavailable"
+        dossier.alertes_codage.append("QUALITE DEGRADEE : RAG indisponible — codage sans référentiels")
     except Exception:
-        logger.warning("Erreur lors de l'enrichissement RAG", exc_info=True)
+        logger.error("RAG EN ERREUR : enrichissement échoué", exc_info=True)
+        dossier.quality_flags["rag_status"] = "error"
+        dossier.alertes_codage.append("QUALITE DEGRADEE : erreur RAG — codage sans référentiels")
 
 
 def _extract_sejour(parsed: dict, dossier: DossierMedical) -> None:
diff --git a/src/medical/diagnostic_extraction.py b/src/medical/diagnostic_extraction.py
index c1e3612..4621329 100644
--- a/src/medical/diagnostic_extraction.py
+++ b/src/medical/diagnostic_extraction.py
@@ -104,7 +104,9 @@ _DAS_PATTERNS: list[tuple[str, str, str]] = [
     (r"diabete\s+(?:sucre\s+)?(?:de\s+)?type\s+2|diabete\s+type\s*2", "Diabète de type 2", "E11.9"),
     (r"diabete\s+(?:sucre\s+)?(?:de\s+)?type\s+1|diabete\s+type\s*1", "Diabète de type 1", "E10.9"),
     (r"dyslipidemie|hypercholesterolemie", "Dyslipidémie", "E78.5"),
-    (r"denutrition|malnutrition", "Dénutrition", "E46"),
+    (r"denutrition\s+severe|malnutrition\s+severe|denutrition\s+grade\s+(?:3|iii|III)", "Dénutrition sévère", "E43"),
+    (r"denutrition\s+moderee?|malnutrition\s+moderee?|denutrition\s+grade\s+(?:2|ii|II)", "Dénutrition modérée", "E44.0"),
+    (r"denutrition|malnutrition|hypoalbuminemie\s+severe", "Dénutrition", "E46"),
     # Infectieux
     (r"pneumopathie|pneumonie", "Pneumopathie", "J18.9"),
     (r"infection\s+urinaire|pyelonephrite", "Infection urinaire", "N39.0"),
@@ -271,6 +273,91 @@ def _find_diagnostics_associes(
     return das
 
 
+def _detect_nutrition_has2021(dossier: DossierMedical) -> None:
+    """Détecte la dénutrition selon les critères HAS/FFN novembre 2021.
+
+    Logique déterministe basée sur données structurées (IMC + âge + albumine).
+    - Critère phénotypique : IMC < seuil (âge-dépendant)
+    - Critère de sévérité : albumine < 30 g/L → sévère, 30-35 → modéré
+    - Code final : max(sévérité IMC, sévérité albumine) → E43 ou E44.0
+
+    Ref: HAS/FFN nov 2021 « Diagnostic de la dénutrition chez l'enfant,
+    l'adulte, et la personne de 70 ans et plus »
+    """
+    # 1. Vérifier qu'aucun code E40-E46 n'est déjà codé
+    existing_codes: set[str] = set()
+    if dossier.diagnostic_principal and dossier.diagnostic_principal.cim10_suggestion:
+        existing_codes.add(dossier.diagnostic_principal.cim10_suggestion)
+    for d in dossier.diagnostics_associes:
+        if d.cim10_suggestion:
+            existing_codes.add(d.cim10_suggestion)
+
+    for code in existing_codes:
+        if code.startswith(("E4",)) and code[:3] in ("E40", "E41", "E42", "E43", "E44", "E45", "E46"):
+            return  # Déjà codé
+
+    # 2. Vérifier qu'on a un IMC (critère phénotypique obligatoire)
+    imc = dossier.sejour.imc if dossier.sejour else None
+    if imc is None:
+        return
+
+    age = dossier.sejour.age if dossier.sejour else None
+
+    # 3. Seuils IMC HAS 2021 (âge-dépendants)
+    if age is not None and age >= 70:
+        # Personne âgée ≥ 70 ans
+        if imc >= 22:
+            return  # Au-dessus du seuil
+        imc_severe = imc < 20
+        imc_moderate = not imc_severe  # 20 ≤ IMC < 22
+    else:
+        # Adulte 18-69 ans (ou âge inconnu → seuils adulte par défaut)
+        if imc >= 18.5:
+            return  # Au-dessus du seuil
+        imc_severe = imc <= 17
+        imc_moderate = not imc_severe  # 17 < IMC < 18.5
+
+    # 4. Critère de sévérité : albumine
+    albumine_val = None
+    for bio in dossier.biologie_cle:
+        if bio.test == "Albumine" and bio.valeur_num is not None:
+            if bio.quality != "discarded":
+                albumine_val = bio.valeur_num
+                break
+
+    albumine_severe = albumine_val is not None and albumine_val < 30
+    albumine_moderate = albumine_val is not None and 30 <= albumine_val < 35
+
+    # 5. Code final : max(sévérité IMC, sévérité albumine)
+    is_severe = imc_severe or albumine_severe
+    is_moderate = imc_moderate or albumine_moderate
+
+    if is_severe:
+        code = "E43"
+        label = "Dénutrition sévère"
+    elif is_moderate:
+        code = "E44.0"
+        label = "Dénutrition modérée"
+    else:
+        return  # Ne devrait pas arriver vu les checks précédents
+
+    # 6. Construire l'alerte explicative
+    parts = []
+    if age is not None and age >= 70:
+        parts.append(f"IMC {imc} (seuil ≥70 ans : <22 modéré, <20 sévère)")
+    else:
+        parts.append(f"IMC {imc} (seuil adulte : <18.5 modéré, ≤17 sévère)")
+    if albumine_val is not None:
+        parts.append(f"Albumine {albumine_val} g/L (<30 sévère, 30-35 modéré)")
+    alerte = f"HAS 2021 — {label} ({code}) : {' ; '.join(parts)}"
+
+    dossier.diagnostics_associes.append(
+        Diagnostic(texte=label, cim10_suggestion=code, source="has2021")
+    )
+    dossier.alertes_codage.append(alerte)
+    logger.info("HAS 2021 dénutrition : %s ajouté (%s)", code, alerte)
+
+
 def _extract_actes(text: str, dossier: DossierMedical) -> None:
     """Extrait les actes CCAM."""
     text_lower = text.lower()
diff --git a/src/medical/dp_finalizer.py b/src/medical/dp_finalizer.py
index 13a46ab..e62add6 100644
--- a/src/medical/dp_finalizer.py
+++ b/src/medical/dp_finalizer.py
@@ -11,7 +11,7 @@ Principes :
 
 from __future__ import annotations
 
-from src.config import DossierMedical, DPSelection
+from ..config import DossierMedical, DPSelection
 
 # Whitelist Z-codes admis en DP CONFIRMED (même que dp_selector)
 _Z_CODE_DP_WHITELIST = frozenset({
diff --git a/src/medical/ghm.py b/src/medical/ghm.py
index d845740..21d9db3 100644
--- a/src/medical/ghm.py
+++ b/src/medical/ghm.py
@@ -13,7 +13,7 @@ from __future__ import annotations
 import bisect
 from typing import Optional
 
-from ..config import DossierMedical, GHMEstimation
+from ..config import DossierMedical, FinancialImpact, GHMEstimation
 
 
 # ---------------------------------------------------------------------------
@@ -229,3 +229,99 @@ def estimate_ghm(dossier: DossierMedical) -> GHMEstimation:
         estimation.ghm_approx = f"{estimation.cmd}{estimation.type_ghm}??{estimation.severite}"
 
     return estimation
+
+
+# ---------------------------------------------------------------------------
+# Tarifs moyens par CMD (source ATIH open data 2024, valeurs arrondies)
+# Utilisé pour le tri relatif, pas pour la facturation.
+# Format : cmd -> (tarif_base_euros, supplement_par_niveau_severite)
+# ---------------------------------------------------------------------------
+
+_CMD_TARIFS: dict[str, tuple[int, int]] = {
+    "01": (5500, 1200),   # Neurologie
+    "02": (2800, 600),    # Ophtalmologie
+    "03": (2500, 550),    # ORL
+    "04": (3800, 900),    # Pneumologie
+    "05": (4800, 1100),   # Cardiologie
+    "06": (3500, 800),    # Digestif (tube)
+    "07": (3200, 900),    # Hépatobiliaire
+    "08": (4200, 950),    # Ostéo-articulaire
+    "09": (2400, 500),    # Peau
+    "10": (3000, 700),    # Endocrinologie
+    "11": (3300, 800),    # Rein/urinaire
+    "12": (2800, 650),    # Génital masculin
+    "13": (2600, 600),    # Génital féminin
+    "14": (3100, 700),    # Obstétrique
+    "15": (4500, 1000),   # Néonat/périnat
+    "16": (3400, 800),    # Hémato/tumeurs bénignes
+    "17": (5200, 1100),   # Tumeurs malignes
+    "18": (3600, 850),    # Infectieux
+    "19": (2800, 600),    # Psychiatrie
+    "20": (2200, 500),    # Alcool/toxiques
+    "21": (3500, 800),    # Traumatismes
+    "22": (5800, 1300),   # Brûlures
+    "23": (2000, 400),    # Symptômes/Z
+    "24": (2500, 500),    # Causes externes
+    "25": (4200, 950),    # VIH
+    "26": (3000, 700),    # Catégories spéciales
+}
+
+_DEFAULT_TARIF = (3000, 800)
+
+
+def estimate_financial_impact(
+    ghm_etab: GHMEstimation | None,
+    ghm_ucr: GHMEstimation | None = None,
+) -> FinancialImpact:
+    """Estime l'impact financier entre le GHM établissement et le GHM UCR.
+
+    Si ghm_ucr est None, on estime l'impact de perdre le codage actuel
+    vers une sévérité 1 (scénario conservateur).
+    """
+    if not ghm_etab:
+        return FinancialImpact(raison="GHM établissement non estimé")
+
+    cmd = ghm_etab.cmd or ""
+    base, supplement = _CMD_TARIFS.get(cmd, _DEFAULT_TARIF)
+    sev_etab = ghm_etab.severite or 1
+    type_etab = ghm_etab.type_ghm or "M"
+
+    if ghm_ucr:
+        sev_ucr = ghm_ucr.severite or 1
+        type_ucr = ghm_ucr.type_ghm or "M"
+    else:
+        sev_ucr = 1
+        type_ucr = type_etab
+
+    delta_sev = sev_ucr - sev_etab  # négatif = perte de sévérité
+    impact = abs(delta_sev) * supplement
+
+    # Changement de type (C→M = perte importante)
+    changement_type = type_etab != type_ucr
+    if changement_type and type_etab == "C" and type_ucr == "M":
+        impact += base  # perte du GHS chirurgical
+        raison = f"Changement C→M + delta sévérité {delta_sev}"
+    elif changement_type:
+        impact += supplement
+        raison = f"Changement type {type_etab}→{type_ucr} + delta sévérité {delta_sev}"
+    elif delta_sev == 0:
+        raison = "Pas de différence de sévérité estimée"
+    else:
+        raison = f"Delta sévérité {delta_sev} (CMD {cmd})"
+
+    # Classification priorité
+    if impact >= 2000 or (changement_type and type_etab == "C"):
+        priorite = "critique"
+    elif impact >= 1000 or abs(delta_sev) >= 2:
+        priorite = "haute"
+    elif impact > 0:
+        priorite = "normale"
+    else:
+        priorite = "faible"
+
+    return FinancialImpact(
+        delta_severite=delta_sev,
+        impact_estime_euros=impact,
+        priorite=priorite,
+        raison=raison,
+    )
diff --git a/src/medical/ollama_cache.py b/src/medical/ollama_cache.py
index c4b5ba0..a6ce494 100644
--- a/src/medical/ollama_cache.py
+++ b/src/medical/ollama_cache.py
@@ -5,6 +5,7 @@ from __future__ import annotations
 import json
 import logging
 import threading
+import time
 from pathlib import Path
 
 logger = logging.getLogger(__name__)
@@ -20,9 +21,15 @@ class OllamaCache:
     Migration automatique depuis l'ancien format (model global) au chargement.
     """
 
-    def __init__(self, cache_path: Path, model: str | None = None):
+    # TTL par défaut : 30 jours (en secondes)
+    DEFAULT_TTL = 30 * 24 * 3600
+
+    def __init__(self, cache_path: Path, model: str | None = None, max_entries: int = 5000,
+                 ttl: int | None = None):
         self._path = cache_path
         self._default_model = model
+        self._max_entries = max_entries
+        self._ttl = ttl if ttl is not None else self.DEFAULT_TTL
         self._lock = threading.Lock()
         self._data: dict[str, dict] = {}
         self._dirty = False
@@ -70,7 +77,7 @@ class OllamaCache:
         return f"{diag_type}::{texte.strip().lower()}"
 
     def get(self, texte: str, diag_type: str, model: str | None = None) -> dict | None:
-        """Récupère un résultat caché, ou None si absent ou modèle différent."""
+        """Récupère un résultat caché, ou None si absent, modèle différent ou expiré."""
         key = self._make_key(texte, diag_type)
         use_model = model or self._default_model
         with self._lock:
@@ -79,15 +86,32 @@ class OllamaCache:
                 return None
             if use_model and entry.get("model") != use_model:
                 return None
+            # Vérifier TTL
+            ts = entry.get("ts")
+            if self._ttl and ts and (time.time() - ts) > self._ttl:
+                del self._data[key]
+                self._dirty = True
+                return None
             return entry.get("result")
 
     def put(self, texte: str, diag_type: str, result: dict, model: str | None = None) -> None:
-        """Stocke un résultat dans le cache avec le modèle utilisé."""
+        """Stocke un résultat dans le cache avec le modèle utilisé et un timestamp."""
         key = self._make_key(texte, diag_type)
         use_model = model or self._default_model
         with self._lock:
-            self._data[key] = {"model": use_model, "result": result}
+            self._data[key] = {"model": use_model, "result": result, "ts": time.time()}
             self._dirty = True
+            self._evict_if_needed()
+
+    def _evict_if_needed(self) -> None:
+        """Éviction LRU : supprime les 20% plus anciens si seuil dépassé."""
+        if self._max_entries and len(self._data) > self._max_entries:
+            to_remove = int(len(self._data) * 0.2)
+            keys_to_remove = list(self._data.keys())[:to_remove]
+            for k in keys_to_remove:
+                del self._data[k]
+            logger.info("Cache Ollama : éviction LRU de %d entrées (restant : %d)",
+                        to_remove, len(self._data))
 
     def save(self) -> None:
         """Persiste le cache sur disque si modifié."""
diff --git a/src/medical/ollama_client.py b/src/medical/ollama_client.py
index f2caf38..ee124a4 100644
--- a/src/medical/ollama_client.py
+++ b/src/medical/ollama_client.py
@@ -28,10 +28,14 @@ def _get_anthropic_client():
         return None
     try:
         import anthropic
+    except ImportError:
+        logger.warning("Anthropic SDK non installé (pip install anthropic)")
+        return None
+    try:
         _anthropic_client = anthropic.Anthropic(api_key=api_key)
         return _anthropic_client
     except Exception as e:
-        logger.warning("Anthropic SDK non disponible : %s", e)
+        logger.error("Anthropic SDK erreur d'initialisation (clé API invalide ?) : %s", e)
         return None
 
 
@@ -165,20 +169,25 @@ def call_ollama(
     """
     use_model = model or (get_model(role) if role else OLLAMA_MODEL)
     use_timeout = timeout or OLLAMA_TIMEOUT
+
+    messages: list[dict] = [{"role": "user", "content": prompt}]
+
     for attempt in range(3):
         try:
+            payload: dict = {
+                "model": use_model,
+                "messages": messages,
+                "stream": False,
+                "format": "json",
+                "think": False,
+                "options": {
+                    "temperature": temperature,
+                    "num_predict": max_tokens,
+                },
+            }
             response = requests.post(
                 f"{OLLAMA_URL}/api/chat",
-                json={
-                    "model": use_model,
-                    "messages": [{"role": "user", "content": prompt}],
-                    "stream": False,
-                    "format": "json",
-                    "options": {
-                        "temperature": temperature,
-                        "num_predict": max_tokens,
-                    },
-                },
+                json=payload,
                 timeout=use_timeout,
             )
             # 429 rate limit → retry avec backoff exponentiel
diff --git a/src/medical/rag_index.py b/src/medical/rag_index.py
index 5be451d..f98f303 100644
--- a/src/medical/rag_index.py
+++ b/src/medical/rag_index.py
@@ -30,6 +30,55 @@ _loaded: dict[str, tuple] = {}
 _loaded_lock = threading.Lock()
 
 
+def check_faiss_ready() -> dict:
+    """Vérifie que les index FAISS sont présents et valides.
+
+    Returns:
+        {"ok": bool, "ref": int, "proc": int, "bio": int, "legacy": int, "errors": [str]}
+        Les int = nombre de vecteurs chargés (0 si absent).
+    """
+    result = {"ok": False, "ref": 0, "proc": 0, "bio": 0, "legacy": 0, "errors": []}
+
+    if not RAG_INDEX_DIR.exists():
+        result["errors"].append(f"Répertoire FAISS absent : {RAG_INDEX_DIR}")
+        return result
+
+    try:
+        import faiss
+    except ImportError:
+        result["errors"].append("Module faiss-cpu non installé")
+        return result
+
+    has_any = False
+    for kind in ("ref", "proc", "bio", "all"):
+        idx_path, meta_path = _paths(kind)
+        key = kind if kind != "all" else "legacy"
+        if idx_path.exists() and meta_path.exists():
+            try:
+                idx = faiss.read_index(str(idx_path))
+                meta = json.loads(meta_path.read_text(encoding="utf-8"))
+                n_vectors = idx.ntotal
+                n_meta = len(meta)
+                if n_vectors == 0:
+                    result["errors"].append(f"Index {kind} vide (0 vecteurs)")
+                elif n_vectors != n_meta:
+                    result["errors"].append(
+                        f"Index {kind} désynchronisé : {n_vectors} vecteurs vs {n_meta} métadonnées"
+                    )
+                else:
+                    has_any = True
+                result[key] = n_vectors
+            except Exception as e:
+                result["errors"].append(f"Index {kind} corrompu : {e}")
+
+    if not has_any:
+        result["errors"].append("Aucun index FAISS valide trouvé — lancez build_index()")
+    else:
+        result["ok"] = True
+
+    return result
+
+
 @dataclass
 class Chunk:
     text: str
@@ -593,6 +642,16 @@ def build_index(force: bool = False) -> None:
     # Invalider les singletons
     reset_index()
 
+    # Invalider le cache LLM (les résultats ont été générés avec l'ancien index)
+    try:
+        from ..config import OLLAMA_CACHE_PATH
+        if OLLAMA_CACHE_PATH.exists():
+            backup = OLLAMA_CACHE_PATH.with_suffix(".pre_rebuild.json")
+            OLLAMA_CACHE_PATH.rename(backup)
+            logger.info("Cache LLM invalidé (sauvegardé → %s) — les résultats seront régénérés avec le nouvel index", backup)
+    except Exception:
+        logger.warning("Impossible d'invalider le cache LLM après rebuild", exc_info=True)
+
 
 def get_index(kind: str = "ref") -> tuple | None:
     """Charge un index FAISS et ses métadonnées (singleton lazy-loaded).
diff --git a/src/medical/rag_search.py b/src/medical/rag_search.py
index 22892f6..5f35b70 100644
--- a/src/medical/rag_search.py
+++ b/src/medical/rag_search.py
@@ -3,6 +3,7 @@
 from __future__ import annotations
 
 import logging
+import os
 import threading
 from concurrent.futures import ThreadPoolExecutor, as_completed
 
@@ -56,7 +57,7 @@ def _get_embed_model():
             raise RuntimeError("Modèle d'embedding indisponible (échec précédent)")
         from sentence_transformers import SentenceTransformer
         import torch
-        _device = "cuda" if torch.cuda.is_available() else "cpu"
+        _device = "cpu" if os.environ.get("T2A_EMBED_CPU") else ("cuda" if torch.cuda.is_available() else "cpu")
         _model_kwargs = {"low_cpu_mem_usage": False}
         try:
             logger.info("Chargement du modèle d'embedding (%s)...", _device)
diff --git a/src/medical/severity.py b/src/medical/severity.py
index cfe19d9..310c9b5 100644
--- a/src/medical/severity.py
+++ b/src/medical/severity.py
@@ -50,7 +50,9 @@ _HEURISTIC_CMA_ROOTS: set[str] = {
     # Hématologie / nutrition
     "D64",   # Anémie
     "D65",   # CIVD
-    "E46",   # Dénutrition
+    "E43",   # Dénutrition sévère (CMA niveau 3)
+    "E44",   # Dénutrition modérée
+    "E46",   # Dénutrition sans précision
     "E87",   # Troubles hydro-électrolytiques
     "E86",   # Déshydratation
     # Métabolique
diff --git a/src/prompts/templates.py b/src/prompts/templates.py
index dbd8483..e6d4adb 100644
--- a/src/prompts/templates.py
+++ b/src/prompts/templates.py
@@ -15,7 +15,8 @@ Variables par template :
     CPAM_ARGUMENTATION : dossier_str, asymetrie_str, tagged_str, titre,
                          arg_ucr, decision_ucr, codes_str, definitions_str,
                          codes_autorises_str, sources_text, extraction_str,
-                         bio_confrontation_str, numero_ogc
+                         bio_confrontation_str, numero_ogc,
+                         strategie_type_str
     CPAM_ADVERSARIAL : response_json, factual_section, normes_section,
                        dp_ucr_line, da_ucr_line
     DP_RANKER_CONSTRAINED : candidates_str, ctx_str, n_candidates
@@ -119,6 +120,14 @@ RÈGLES IMPÉRATIVES :
 - Ne propose que des diagnostics CLAIREMENT mentionnés dans le texte
 - ATTENTION aux valeurs biologiques : ne code PAS un diagnostic si les valeurs sont dans les normes indiquées entre crochets [N: min-max]. Exemple : Créatinine 76 [N: 50-120] = NORMAL, pas d'insuffisance rénale.
 
+DÉNUTRITION — CRITÈRES HAS/FFN 2021 :
+- Diagnostic = 1 critère phénotypique + 1 critère étiologique
+- Seuils IMC : adulte <18.5 modéré / ≤17 sévère ; ≥70 ans <22 modéré / <20 sévère
+- Perte de poids : ≥5%/1mois ou ≥10%/6mois modéré ; ≥10%/1mois ou ≥15%/6mois sévère
+- L'albumine est un critère de SÉVÉRITÉ uniquement : 30-35 g/L → E44.0 ; <30 g/L → E43
+- Un patient OBÈSE peut être dénutri
+- Codes : E44.0 (modéré), E43 (sévère), E46 seulement si sévérité non précisable
+
 DIAGNOSTIC PRINCIPAL : {dp_texte}
 
 DAS DÉJÀ CODÉS :
@@ -268,6 +277,8 @@ Objet : {titre}
 Argument UCR : {arg_ucr}
 Décision UCR : {decision_ucr}
 
+{strategie_type_str}
+
 CODES EN JEU : {codes_str}
 {definitions_str}
 {codes_autorises_str}
@@ -293,6 +304,10 @@ PASSE 2 — MOTIF D'HOSPITALISATION RÉEL :
 - Pourquoi CE patient a été hospitalisé CE JOUR (événement déclencheur)
 - Quel acte thérapeutique principal a été réalisé
 - Le DP retenu est-il cohérent avec cet acte et la durée de séjour
+- RÈGLES D1/D2 DU GUIDE MÉTHODOLOGIQUE :
+  D1 : Si seul un symptôme persiste sans cause identifiée dans le dossier, le symptôme reste DP légitime
+  D2 : Si une cause est identifiée (confirmée par examens), la cause doit devenir DP
+  Appliquer D1/D2 dans le raisonnement si le désaccord porte sur le DP
 
 PASSE 3 — CONFRONTATION BIOLOGIE / DIAGNOSTIC (appliquer R1 et R3) :
 Pour CHAQUE diagnostic contesté, comparer aux seuils ci-dessus.
diff --git a/src/quality/completude.py b/src/quality/completude.py
new file mode 100644
index 0000000..4004b94
--- /dev/null
+++ b/src/quality/completude.py
@@ -0,0 +1,529 @@
+"""Checklist de complétude documentaire DIM.
+
+Pour chaque code diagnostique (DP + DAS), vérifie la présence des éléments
+cliniques nécessaires (biologie, imagerie, documents, données cliniques),
+confronte les valeurs aux seuils diagnostiques, croise les preuves cliniques,
+et calcule un score de défendabilité CPAM.
+"""
+
+from __future__ import annotations
+
+import logging
+import re
+import unicodedata
+from typing import Optional
+
+from ..config import (
+    CheckCompletude,
+    CompletudeDossier,
+    Diagnostic,
+    DossierMedical,
+    ItemCompletude,
+    load_completude_rules,
+)
+
+logger = logging.getLogger(__name__)
+
+# Poids par statut pour le scoring pondéré
+_STATUT_WEIGHTS: dict[str, float] = {
+    "present_confirme": 1.0,
+    "present": 1.0,
+    "present_indirect": 0.5,
+    "present_non_confirme": 0.25,
+    "absent": 0.0,
+}
+
+
+def _normalize(text: str) -> str:
+    """Minuscule + suppression accents pour matching souple."""
+    text = text.lower().strip()
+    return unicodedata.normalize("NFKD", text).encode("ascii", "ignore").decode()
+
+
+def _collect_doc_types(dossier: DossierMedical) -> set[str]:
+    """Types de documents présents dans le dossier (même logique que VETO-29)."""
+    doc_types = set()
+    if dossier.document_type:
+        doc_types.add(dossier.document_type.lower())
+    for sf in dossier.source_files or []:
+        sf_up = sf.upper()
+        if "CRO" in sf_up:
+            doc_types.add("cro")
+        if "ANAPATH" in sf_up:
+            doc_types.add("anapath")
+        if "CRH" in sf_up:
+            doc_types.add("crh")
+        if "TRACKARE" in sf_up:
+            doc_types.add("trackare")
+    return doc_types
+
+
+def _collect_codes(dossier: DossierMedical) -> list[tuple[str, str, str, Optional[Diagnostic]]]:
+    """Retourne [(code, libellé, type_diag, diagnostic_obj)] pour DP + DAS actifs."""
+    codes = []
+    dp = dossier.diagnostic_principal
+    if dp:
+        code = dp.cim10_final or dp.cim10_suggestion
+        if code:
+            codes.append((code, dp.texte, "DP", dp))
+
+    for das in dossier.diagnostics_associes:
+        if das.status == "ruled_out":
+            continue
+        code = das.cim10_final or das.cim10_suggestion
+        if code:
+            codes.append((code, das.texte, "DAS", das))
+    return codes
+
+
+def _match_bio(dossier: DossierMedical, match_keys: list[str]) -> tuple[Optional[str], Optional[float]]:
+    """Cherche une valeur bio correspondant aux clés fournies.
+
+    Retourne (valeur_str, valeur_num) si trouvée.
+    """
+    normalized_keys = [_normalize(k) for k in match_keys]
+    for bio in dossier.biologie_cle:
+        bio_norm = _normalize(bio.test)
+        for key in normalized_keys:
+            if key in bio_norm or bio_norm in key:
+                return (bio.valeur or "présent", bio.valeur_num)
+    return None, None
+
+
+def _match_imagerie(dossier: DossierMedical, match_keys: list[str]) -> Optional[str]:
+    """Cherche une imagerie correspondant aux mots-clés."""
+    normalized_keys = [_normalize(k) for k in match_keys]
+    for img in dossier.imagerie:
+        img_norm = _normalize(img.type)
+        for key in normalized_keys:
+            if key in img_norm or img_norm in key:
+                return img.conclusion or "présent"
+    return None
+
+
+def _match_document(doc_types: set[str], match_keys: list[str]) -> bool:
+    """Vérifie si un type de document est présent."""
+    normalized_types = {_normalize(dt) for dt in doc_types}
+    for key in match_keys:
+        key_norm = _normalize(key)
+        if any(key_norm in dt or dt in key_norm for dt in normalized_types):
+            return True
+    return False
+
+
+def _match_clinique(dossier: DossierMedical, field: str) -> tuple[Optional[str], Optional[float]]:
+    """Vérifie la présence d'un champ clinique (imc, poids, taille).
+
+    Retourne (valeur_str, valeur_num).
+    """
+    val = getattr(dossier.sejour, field, None)
+    if val is not None:
+        return str(val), float(val)
+    return None, None
+
+
+def _find_rules_for_code(code: str, rules_diag: dict) -> list[dict]:
+    """Trouve toutes les règles applicables pour un code CIM-10 donné."""
+    matched = []
+    for _family_id, family in rules_diag.items():
+        prefixes = family.get("prefixes", [])
+        for prefix in prefixes:
+            if code.startswith(prefix):
+                matched.append(family)
+                break
+    return matched
+
+
+def _find_acte_rules(dossier: DossierMedical, rules_actes: dict) -> list[dict]:
+    """Trouve les règles CCAM applicables aux actes du dossier."""
+    matched = []
+    for _rule_id, rule in rules_actes.items():
+        prefixes = rule.get("prefixes", [])
+        for acte in dossier.actes_ccam:
+            acte_code = acte.code_ccam_suggestion or ""
+            if any(acte_code.startswith(p) for p in prefixes):
+                matched.append(rule)
+                break
+    return matched
+
+
+def _evaluate_seuil(
+    seuil: dict,
+    valeur_num: Optional[float],
+    sexe: Optional[str] = None,
+) -> tuple[Optional[bool], str]:
+    """Évalue si une valeur numérique satisfait un seuil.
+
+    Returns:
+        (confirme, detail_message)
+        - confirme=True: la valeur confirme le diagnostic
+        - confirme=False: la valeur ne confirme pas
+        - confirme=None: pas de valeur numérique à comparer
+    """
+    if valeur_num is None:
+        return None, ""
+
+    seuil_type = seuil.get("type", "")
+    message_ok = seuil.get("message_ok", "Seuil atteint")
+    message_ko = seuil.get("message_ko", "Seuil non atteint")
+
+    if seuil_type == "below":
+        # Seuil sex-dépendant ?
+        if "value_m" in seuil and "value_f" in seuil:
+            s = (sexe or "").upper()
+            if s in ("M", "MASCULIN", "HOMME"):
+                threshold = float(seuil["value_m"])
+            elif s in ("F", "FEMININ", "FÉMININ", "FEMME"):
+                threshold = float(seuil["value_f"])
+            else:
+                # sexe inconnu → utilise le seuil le plus bas (plus conservateur)
+                threshold = min(float(seuil["value_m"]), float(seuil["value_f"]))
+        else:
+            threshold = float(seuil["value"])
+        return (valeur_num < threshold, message_ok if valeur_num < threshold else message_ko)
+
+    elif seuil_type == "above":
+        if "value_m" in seuil and "value_f" in seuil:
+            s = (sexe or "").upper()
+            if s in ("M", "MASCULIN", "HOMME"):
+                threshold = float(seuil["value_m"])
+            elif s in ("F", "FEMININ", "FÉMININ", "FEMME"):
+                threshold = float(seuil["value_f"])
+            else:
+                threshold = max(float(seuil["value_m"]), float(seuil["value_f"]))
+        else:
+            threshold = float(seuil["value"])
+        return (valeur_num > threshold, message_ok if valeur_num > threshold else message_ko)
+
+    elif seuil_type == "range":
+        rmin = float(seuil.get("range_min", 0))
+        rmax = float(seuil.get("range_max", 999999))
+        in_range = rmin <= valeur_num <= rmax
+        return (in_range, message_ok if in_range else message_ko)
+
+    elif seuil_type == "outside_range":
+        rmin = float(seuil.get("range_min", 0))
+        rmax = float(seuil.get("range_max", 999999))
+        outside = valeur_num < rmin or valeur_num > rmax
+        return (outside, message_ok if outside else message_ko)
+
+    return None, ""
+
+
+def _search_preuves_cliniques(
+    diag: Optional[Diagnostic],
+    categorie: str,
+    element: str,
+) -> Optional[tuple[str, str]]:
+    """Cherche dans les preuves_cliniques du diagnostic une correspondance.
+
+    Returns:
+        (valeur, detail) ou None
+    """
+    if diag is None or not diag.preuves_cliniques:
+        return None
+
+    element_norm = _normalize(element)
+    # Mots-clés à chercher dans les preuves
+    element_words = set(element_norm.split())
+
+    for preuve in diag.preuves_cliniques:
+        preuve_type_norm = _normalize(preuve.type)
+        preuve_elem_norm = _normalize(preuve.element)
+
+        # Vérifier la catégorie
+        cat_match = False
+        if categorie == "biologie" and preuve_type_norm in ("biologie", "biologique", "bio"):
+            cat_match = True
+        elif categorie == "imagerie" and preuve_type_norm in ("imagerie", "radiologie", "radio"):
+            cat_match = True
+        elif categorie == "clinique" and preuve_type_norm in ("clinique", "examen"):
+            cat_match = True
+        elif categorie == "document" and preuve_type_norm in ("document", "compte-rendu", "rapport"):
+            cat_match = True
+
+        if not cat_match:
+            # Fallback: chercher les mots-clés de l'élément dans le texte de la preuve
+            if any(w in preuve_elem_norm for w in element_words if len(w) > 2):
+                cat_match = True
+
+        if cat_match:
+            # Vérifier que l'élément matche
+            if any(w in preuve_elem_norm for w in element_words if len(w) > 2):
+                detail = f"Mentionné dans les preuves cliniques : {preuve.interpretation}"
+                return preuve.element, detail
+
+    return None
+
+
+def _check_item(
+    dossier: DossierMedical,
+    doc_types: set[str],
+    item_def: dict,
+    code: str,
+    diag: Optional[Diagnostic] = None,
+) -> ItemCompletude:
+    """Évalue un item de la checklist avec confrontation seuil et preuves."""
+    categorie = item_def["categorie"]
+    element = item_def["element"]
+    importance = item_def.get("importance", "recommande")
+    impact_cpam = item_def.get("impact_cpam", "")
+    seuil_def = item_def.get("seuil")
+
+    # Vérifier le code_filter si présent sur le seuil
+    seuil_applicable = None
+    if seuil_def:
+        code_filter = seuil_def.get("code_filter")
+        if code_filter is None or code.startswith(code_filter):
+            seuil_applicable = seuil_def
+
+    valeur = None
+    valeur_num = None
+    statut = "absent"
+    confirmation_detail = None
+
+    if categorie == "biologie":
+        val_str, val_num = _match_bio(dossier, item_def.get("match_bio", []))
+        if val_str:
+            statut = "present"
+            valeur = val_str
+            valeur_num = val_num
+
+    elif categorie == "imagerie":
+        val = _match_imagerie(dossier, item_def.get("match_imagerie", []))
+        if val:
+            statut = "present"
+            valeur = val
+
+    elif categorie == "document":
+        if _match_document(doc_types, item_def.get("match_document", [])):
+            statut = "present"
+
+    elif categorie == "clinique":
+        field = item_def.get("match_clinique", "")
+        val_str, val_num = _match_clinique(dossier, field)
+        if val_str:
+            statut = "present"
+            valeur = val_str
+            valeur_num = val_num
+
+    # --- Confrontation seuil (si valeur trouvée et seuil applicable) ---
+    if statut == "present" and seuil_applicable and valeur_num is not None:
+        confirme, detail = _evaluate_seuil(
+            seuil_applicable, valeur_num, dossier.sejour.sexe
+        )
+        if confirme is True:
+            statut = "present_confirme"
+            confirmation_detail = detail
+        elif confirme is False:
+            statut = "present_non_confirme"
+            confirmation_detail = detail
+        # confirme=None → reste "present"
+
+    # --- Croisement preuves_cliniques (si absent) ---
+    if statut == "absent" and diag is not None:
+        result = _search_preuves_cliniques(diag, categorie, element)
+        if result:
+            preuve_val, preuve_detail = result
+            statut = "present_indirect"
+            valeur = preuve_val
+            confirmation_detail = preuve_detail
+
+    return ItemCompletude(
+        categorie=categorie,
+        element=element,
+        statut=statut,
+        valeur=valeur,
+        importance=importance,
+        impact_cpam=impact_cpam,
+        confirmation_detail=confirmation_detail,
+    )
+
+
+def _compute_check_score(items: list[ItemCompletude]) -> tuple[int, str, str]:
+    """Calcule score, verdict et résumé pour un check donné.
+
+    Scoring pondéré par statut :
+    - present_confirme / present (sans seuil) → 1.0
+    - present_indirect → 0.5
+    - present_non_confirme → 0.25
+    - absent → 0.0
+    """
+    obligatoires = [i for i in items if i.importance == "obligatoire"]
+    recommandes = [i for i in items if i.importance == "recommande"]
+
+    def _weight(item: ItemCompletude) -> float:
+        return _STATUT_WEIGHTS.get(item.statut, 0.0)
+
+    oblig_score = sum(_weight(i) for i in obligatoires)
+    oblig_total = len(obligatoires)
+    reco_score = sum(_weight(i) for i in recommandes)
+    reco_total = len(recommandes)
+
+    if oblig_total == 0:
+        if reco_total == 0:
+            return 100, "defendable", "Aucun élément requis"
+        pct = reco_score / reco_total
+        score = int(70 + 30 * pct)
+        verdict = "defendable" if pct >= 0.5 else "fragile"
+        resume = _build_resume(items)
+        return score, verdict, resume
+
+    pct_oblig = oblig_score / oblig_total
+    pct_reco = reco_score / reco_total if reco_total > 0 else 1.0
+
+    # Score : 70% basé sur obligatoires, 30% sur recommandés
+    score = int(70 * pct_oblig + 30 * pct_reco)
+
+    # Verdict
+    oblig_presents = sum(1 for i in obligatoires if i.statut != "absent")
+    if oblig_presents == 0:
+        verdict = "indefendable"
+    elif oblig_presents < oblig_total:
+        verdict = "fragile"
+    elif any(i.statut == "present_non_confirme" for i in obligatoires):
+        verdict = "fragile"
+    else:
+        verdict = "defendable"
+
+    resume = _build_resume(items)
+    return score, verdict, resume
+
+
+def _build_resume(items: list[ItemCompletude]) -> str:
+    """Construit le résumé texte du check."""
+    obligatoires = [i for i in items if i.importance == "obligatoire"]
+    recommandes = [i for i in items if i.importance == "recommande"]
+
+    oblig_ok = sum(1 for i in obligatoires if i.statut not in ("absent",))
+    oblig_confirmed = sum(1 for i in obligatoires if i.statut == "present_confirme")
+    reco_ok = sum(1 for i in recommandes if i.statut not in ("absent",))
+
+    parts = []
+    if obligatoires:
+        txt = f"{oblig_ok}/{len(obligatoires)} obligatoires"
+        if oblig_confirmed:
+            txt += f" ({oblig_confirmed} confirmé{'s' if oblig_confirmed > 1 else ''})"
+        parts.append(txt)
+    if recommandes:
+        parts.append(f"{reco_ok}/{len(recommandes)} recommandés")
+    return ", ".join(parts) if parts else "Aucun élément requis"
+
+
+def build_completude_checklist(dossier: DossierMedical) -> CompletudeDossier:
+    """Construit la checklist de complétude documentaire pour un dossier.
+
+    Pour chaque code (DP + DAS), cherche les règles applicables,
+    vérifie la présence de chaque élément requis, confronte les valeurs
+    aux seuils diagnostiques, et calcule les scores pondérés.
+    """
+    try:
+        rules = load_completude_rules()
+    except Exception:
+        logger.warning("Complétude : impossible de charger les règles", exc_info=True)
+        return CompletudeDossier()
+
+    rules_diag = rules.get("diagnostics", {})
+    rules_actes = rules.get("actes", {})
+    doc_types = _collect_doc_types(dossier)
+    codes = _collect_codes(dossier)
+
+    checks: list[CheckCompletude] = []
+
+    # 1. Vérification par code diagnostique
+    for code, libelle, type_diag, diag_obj in codes:
+        families = _find_rules_for_code(code, rules_diag)
+        if not families:
+            continue
+
+        all_items: list[ItemCompletude] = []
+        seen_elements: set[str] = set()
+
+        for family in families:
+            for item_def in family.get("items", []):
+                # Filtrer par code_filter (seuils spécifiques E43 vs E44)
+                seuil = item_def.get("seuil")
+                if seuil and seuil.get("code_filter"):
+                    if not code.startswith(seuil["code_filter"]):
+                        continue
+
+                elem_key = f"{item_def['categorie']}:{item_def['element']}"
+                if elem_key in seen_elements:
+                    continue
+                seen_elements.add(elem_key)
+
+                item = _check_item(dossier, doc_types, item_def, code, diag_obj)
+                all_items.append(item)
+
+        if not all_items:
+            continue
+
+        score, verdict, resume = _compute_check_score(all_items)
+        checks.append(CheckCompletude(
+            code=code,
+            libelle=libelle,
+            type_diag=type_diag,
+            items=all_items,
+            score=score,
+            verdict=verdict,
+            resume=resume,
+        ))
+
+    # 2. Vérification des actes CCAM (CRO, etc.)
+    acte_families = _find_acte_rules(dossier, rules_actes)
+    for family in acte_families:
+        desc = family.get("description", "Acte")
+        all_items = []
+        for item_def in family.get("items", []):
+            item = _check_item(dossier, doc_types, item_def, "")
+            if not any(existing.element == item.element for existing in all_items):
+                all_items.append(item)
+
+        if all_items:
+            score, verdict, resume = _compute_check_score(all_items)
+            # Un seul check pour l'ensemble des actes chirurgicaux
+            acte_codes = [a.code_ccam_suggestion or "?" for a in dossier.actes_ccam
+                          if a.code_ccam_suggestion and any(a.code_ccam_suggestion.startswith(p) for p in family.get("prefixes", []))]
+            code_label = ", ".join(acte_codes[:3]) or "CCAM"
+            if not any(c.code == code_label for c in checks):
+                checks.append(CheckCompletude(
+                    code=code_label,
+                    libelle=desc,
+                    type_diag="Acte",
+                    items=all_items,
+                    score=score,
+                    verdict=verdict,
+                    resume=resume,
+                ))
+
+    # 3. Score global
+    if not checks:
+        return CompletudeDossier(
+            documents_presents=sorted(doc_types),
+        )
+
+    scores = [c.score for c in checks]
+    score_global = sum(scores) // len(scores)
+
+    verdicts = [c.verdict for c in checks]
+    if "indefendable" in verdicts:
+        verdict_global = "indefendable"
+    elif "fragile" in verdicts:
+        verdict_global = "fragile"
+    else:
+        verdict_global = "defendable"
+
+    # Documents manquants
+    docs_manquants = set()
+    for check in checks:
+        for item in check.items:
+            if item.categorie == "document" and item.statut == "absent" and item.importance == "obligatoire":
+                docs_manquants.add(item.element)
+
+    return CompletudeDossier(
+        checks=checks,
+        score_global=score_global,
+        verdict_global=verdict_global,
+        documents_presents=sorted(doc_types),
+        documents_manquants=sorted(docs_manquants),
+    )
diff --git a/src/quality/veto_engine.py b/src/quality/veto_engine.py
index 8a558ae..68864e0 100644
--- a/src/quality/veto_engine.py
+++ b/src/quality/veto_engine.py
@@ -252,17 +252,17 @@ def apply_vetos(dossier: DossierMedical) -> VetoReport:
             # Trackare = codage établissement, source d'autorité : pas de VETO-02
             logger.debug("VETO-02 skip: DP %s issu de Trackare (source d'autorité)", dp.cim10_suggestion)
         elif not _has_evidence(dp):
-            add("VETO-02", "HARD", "diagnostic_principal", f"DP {dp.cim10_suggestion} sans preuve exploitable")
+            add("VETO-02", "HARD", "diagnostic_principal", f"DP {dp.cim10_suggestion} sans preuve exploitable", citation="Principe de preuve : tout diagnostic/acte doit être étayé par une trace dans le dossier médical (Guide Méthodologique MCO)")
 
     for i, das in enumerate(dossier.diagnostics_associes):
         if _is_ruled_out(das):
             continue
         if das.cim10_suggestion and not _has_evidence(das):
-            add("VETO-02", "MEDIUM", f"diagnostics_associes[{i}]", f"DAS {das.cim10_suggestion} sans preuve exploitable")
+            add("VETO-02", "MEDIUM", f"diagnostics_associes[{i}]", f"DAS {das.cim10_suggestion} sans preuve exploitable", citation="Principe de preuve : tout diagnostic/acte doit être étayé par une trace dans le dossier médical (Guide Méthodologique MCO)")
 
     for i, acte in enumerate(dossier.actes_ccam):
         if acte.code_ccam_suggestion and not _has_evidence(acte):
-            add("VETO-02", "HARD", f"actes_ccam[{i}]", f"Acte {acte.code_ccam_suggestion} sans preuve exploitable")
+            add("VETO-02", "HARD", f"actes_ccam[{i}]", f"Acte {acte.code_ccam_suggestion} sans preuve exploitable", citation="Principe de preuve : tout diagnostic/acte doit être étayé par une trace dans le dossier médical (Guide Méthodologique MCO)")
 
     # -------------------------------------------------
     # VETO-03 : négation / conditionnel DANS LES PREUVES
@@ -272,11 +272,11 @@ def apply_vetos(dossier: DossierMedical) -> VetoReport:
         excerpts = _evidence_excerpts(dp)
         neg, cond, contra, pos = _analyze_neg_cond(excerpts, dp.texte or dp.cim10_suggestion)
         if neg and not pos:
-            add("VETO-03", "HARD", "diagnostic_principal", f"DP {dp.cim10_suggestion} contredit par la preuve (négation)")
+            add("VETO-03", "HARD", "diagnostic_principal", f"DP {dp.cim10_suggestion} contredit par la preuve (négation)", citation="Guide Méthodologique MCO : Un diagnostic ne peut être retenu si le compte-rendu le contredit explicitement")
         elif contra:
-            add("VETO-03", "MEDIUM", "diagnostic_principal", f"DP {dp.cim10_suggestion} preuves contradictoires (positif vs négatif)")
+            add("VETO-03", "MEDIUM", "diagnostic_principal", f"DP {dp.cim10_suggestion} preuves contradictoires (positif vs négatif)", citation="Guide Méthodologique MCO : En cas de preuves contradictoires, le diagnostic doit être confirmé par le médecin")
         elif cond and dp.cim10_confidence == "high":
-            add("VETO-03", "MEDIUM", "diagnostic_principal", f"DP {dp.cim10_suggestion} basé sur du conditionnel")
+            add("VETO-03", "MEDIUM", "diagnostic_principal", f"DP {dp.cim10_suggestion} basé sur du conditionnel", citation="Guide Méthodologique MCO : Un diagnostic conditionnel (suspecté, à éliminer) ne doit pas être codé comme confirmé")
 
     for i, das in enumerate(dossier.diagnostics_associes):
         if _is_ruled_out(das):
@@ -289,11 +289,11 @@ def apply_vetos(dossier: DossierMedical) -> VetoReport:
         if neg and not pos:
             # En contrôle CPAM : une négation explicite = bloquant, surtout si le modèle est « high ».
             severity = "HARD" if das.cim10_confidence == "high" else "MEDIUM"
-            add("VETO-03", severity, where, f"DAS {das.cim10_suggestion} contredit par la preuve (négation)")
+            add("VETO-03", severity, where, f"DAS {das.cim10_suggestion} contredit par la preuve (négation)", citation="Guide Méthodologique MCO : Un diagnostic ne peut être retenu si le compte-rendu le contredit explicitement")
         elif contra:
-            add("VETO-03", "MEDIUM", where, f"DAS {das.cim10_suggestion} preuves contradictoires")
+            add("VETO-03", "MEDIUM", where, f"DAS {das.cim10_suggestion} preuves contradictoires", citation="Guide Méthodologique MCO : En cas de preuves contradictoires, le diagnostic doit être confirmé par le médecin")
         elif cond and das.cim10_confidence == "high":
-            add("VETO-03", "LOW", where, f"DAS {das.cim10_suggestion} potentiellement conditionnel")
+            add("VETO-03", "LOW", where, f"DAS {das.cim10_suggestion} potentiellement conditionnel", citation="Guide Méthodologique MCO : Un diagnostic conditionnel (suspecté, à éliminer) ne doit pas être codé comme confirmé")
 
     # -------------------------------------------------
     # VETO-15 : preuve de type "score/test" (risque élevé de sur-codage)
diff --git a/src/viewer/__main__.py b/src/viewer/__main__.py
index 1f0bbbd..cc28c6e 100644
--- a/src/viewer/__main__.py
+++ b/src/viewer/__main__.py
@@ -1,4 +1,4 @@
-"""Point d'entrée : python -m src.viewer [--host 127.0.0.1] [--port 5000] [--debug]."""
+"""Point d'entrée : python -m src.viewer [--host 127.0.0.1] [--port 7500] [--debug]."""
 
 import argparse
 
@@ -8,7 +8,7 @@ from .app import create_app
 def main():
     parser = argparse.ArgumentParser(description="Viewer CIM-10 T2A")
     parser.add_argument("--host", default="127.0.0.1")
-    parser.add_argument("--port", type=int, default=5000)
+    parser.add_argument("--port", type=int, default=7500)
     parser.add_argument("--debug", action="store_true")
     args = parser.parse_args()
 
diff --git a/src/viewer/app.py b/src/viewer/app.py
index b43373f..c8f30a9 100644
--- a/src/viewer/app.py
+++ b/src/viewer/app.py
@@ -4,11 +4,14 @@ from __future__ import annotations
 
 import json
 import logging
+import os
 import re
+import time
 from pathlib import Path
 
 import requests
 from flask import Flask, Response, abort, render_template, request, jsonify
+from flask_httpauth import HTTPBasicAuth
 from markupsafe import Markup
 
 from werkzeug.utils import secure_filename
@@ -23,6 +26,7 @@ from ..config import (
 )
 from .. import config as cfg
 from ..control.cpam_context import _assess_dossier_strength
+from ..medical.bio_normals import BIO_NORMALS
 from .referentiels import ReferentielManager
 from .validation import ValidationManager
 
@@ -143,32 +147,239 @@ def compute_dashboard_stats(groups: dict[str, list[dict]]) -> dict:
     }
 
 
+def compute_dim_synthesis(groups: dict[str, list[dict]]) -> dict:
+    """Calcule les indicateurs de synthèse pour la vue médecin DIM."""
+    # --- DP Arbitrage ---
+    dp_total = 0
+    dp_confirmed = 0
+    dp_review = 0
+    dp_modified = 0  # finalizer a changé le DP
+    dp_conf_dist: Counter = Counter()  # high/medium/low
+    dp_source_dist: Counter = Counter()  # trackare/crh/override
+
+    # --- DAS Qualité ---
+    das_total = 0
+    das_kept = 0
+    das_downgraded = 0
+    das_removed = 0
+    das_ruled_out = 0
+    das_cma = 0
+    das_no_code = 0
+
+    # --- Contestabilité (Veto) ---
+    veto_dist: Counter = Counter()  # PASS/NEED_INFO/FAIL
+    veto_scores: list[int] = []
+    top_vetos: Counter = Counter()
+
+    # --- Complétude ---
+    completude_dist: Counter = Counter()  # defendable/fragile/indefendable
+    completude_scores: list[int] = []
+
+    # --- CPAM ---
+    cpam_total = 0
+    cpam_impact_total = 0
+    cpam_by_priority: Counter = Counter()
+    cpam_by_status: Counter = Counter()
+
+    # --- Alertes prioritaires ---
+    dossiers_review: list[dict] = []
+    dossiers_fail: list[dict] = []
+    dossiers_indefendable: list[dict] = []
+
+    for group_name, items in groups.items():
+        for item in items:
+            d = item["dossier"]
+            dname = format_dossier_name(group_name)
+            dpath = item["path_rel"]
+
+            # DP
+            dp_final = d.dp_final
+            dp_track = d.dp_trackare
+            if dp_final:
+                dp_total += 1
+                dp_conf_dist[dp_final.confidence or "none"] += 1
+                if dp_final.verdict == "CONFIRMED":
+                    dp_confirmed += 1
+                else:
+                    dp_review += 1
+                    dossiers_review.append({"name": dname, "path": dpath,
+                        "reason": dp_final.reason or "DP à valider",
+                        "code": dp_final.chosen_code or "?"})
+                # Modification DP
+                if dp_track and dp_final.chosen_code and dp_track.chosen_code:
+                    if dp_final.chosen_code != dp_track.chosen_code:
+                        dp_modified += 1
+                # Source
+                flags = d.quality_flags or {}
+                if flags.get("trackare_only_mode"):
+                    dp_source_dist["trackare"] += 1
+                elif flags.get("crh_only_mode"):
+                    dp_source_dist["crh"] += 1
+                elif flags.get("override_trackare_by_crh_confirmed") or flags.get("trackare_symptom_overridden"):
+                    dp_source_dist["override_crh"] += 1
+                elif flags.get("trackare_confirmed_by_crh"):
+                    dp_source_dist["confirmé"] += 1
+                else:
+                    dp_source_dist["autre"] += 1
+            elif d.diagnostic_principal:
+                dp_total += 1
+                dp_conf_dist[d.diagnostic_principal.cim10_confidence or "none"] += 1
+
+            # DAS
+            for das in d.diagnostics_associes:
+                das_total += 1
+                dec = das.cim10_decision
+                if dec:
+                    action = dec.action
+                    if action == "KEEP":
+                        das_kept += 1
+                    elif action == "DOWNGRADE":
+                        das_downgraded += 1
+                    elif action == "REMOVE":
+                        das_removed += 1
+                    elif action == "RULED_OUT":
+                        das_ruled_out += 1
+                    else:
+                        das_kept += 1
+                else:
+                    das_kept += 1
+                if das.est_cma:
+                    das_cma += 1
+                if not das.cim10_final and not das.cim10_suggestion:
+                    das_no_code += 1
+
+            # Veto
+            vr = d.veto_report
+            if vr:
+                veto_dist[vr.verdict] += 1
+                veto_scores.append(vr.score_contestabilite)
+                for issue in (vr.issues or []):
+                    top_vetos[issue.veto] += 1
+                if vr.verdict == "FAIL":
+                    dossiers_fail.append({"name": dname, "path": dpath,
+                        "score": vr.score_contestabilite,
+                        "issues": len(vr.issues or [])})
+
+            # Complétude
+            comp = d.completude
+            if comp:
+                completude_dist[comp.verdict_global] += 1
+                completude_scores.append(comp.score_global)
+                if comp.verdict_global == "indefendable":
+                    dossiers_indefendable.append({"name": dname, "path": dpath,
+                        "score": comp.score_global,
+                        "manquants": len(comp.documents_manquants or [])})
+
+            # CPAM
+            for ctrl in d.controles_cpam:
+                cpam_total += 1
+                fi = ctrl.financial_impact
+                if fi:
+                    cpam_impact_total += fi.impact_estime_euros or 0
+                    cpam_by_priority[fi.priorite or "normale"] += 1
+                cpam_by_status[ctrl.validation_dim or "non_valide"] += 1
+
+    avg_veto = round(sum(veto_scores) / len(veto_scores)) if veto_scores else 0
+    avg_completude = round(sum(completude_scores) / len(completude_scores)) if completude_scores else 0
+
+    return {
+        "dp": {
+            "total": dp_total,
+            "confirmed": dp_confirmed,
+            "review": dp_review,
+            "modified": dp_modified,
+            "confidence": dict(dp_conf_dist),
+            "source": dict(dp_source_dist),
+        },
+        "das": {
+            "total": das_total,
+            "kept": das_kept,
+            "downgraded": das_downgraded,
+            "removed": das_removed,
+            "ruled_out": das_ruled_out,
+            "cma": das_cma,
+            "no_code": das_no_code,
+            "taux_modification": round((das_downgraded + das_removed + das_ruled_out) / das_total * 100, 1) if das_total else 0,
+        },
+        "veto": {
+            "distribution": dict(veto_dist),
+            "avg_score": avg_veto,
+            "top_issues": top_vetos.most_common(10),
+        },
+        "completude": {
+            "distribution": dict(completude_dist),
+            "avg_score": avg_completude,
+        },
+        "cpam": {
+            "total": cpam_total,
+            "impact_total": cpam_impact_total,
+            "by_priority": dict(cpam_by_priority),
+            "by_status": dict(cpam_by_status),
+        },
+        "alertes": {
+            "review": dossiers_review[:20],
+            "fail": dossiers_fail[:20],
+            "indefendable": dossiers_indefendable[:20],
+        },
+    }
+
+
+def _compute_jours_restants(ctrl) -> int | None:
+    """Calcule les jours restants avant la date limite de réponse."""
+    if not ctrl.date_limite_reponse:
+        return None
+    from datetime import datetime
+    try:
+        limite = datetime.strptime(ctrl.date_limite_reponse, "%d/%m/%Y")
+        return (limite - datetime.now()).days
+    except (ValueError, TypeError):
+        return None
+
+
 def collect_cpam_controls(groups: dict[str, list[dict]]) -> list[dict]:
-    """Collecte tous les contrôles CPAM de tous les dossiers."""
+    """Collecte tous les contrôles CPAM de tous les dossiers, avec impact financier."""
+    from ..medical.ghm import estimate_financial_impact
+
+    _PRIORITE_ORDER = {"critique": 0, "haute": 1, "normale": 2, "faible": 3}
+
     controls = []
     for group_name, items in groups.items():
         for item in items:
             d = item["dossier"]
             dp_code = d.diagnostic_principal.cim10_suggestion if d.diagnostic_principal else None
             for ctrl in d.controles_cpam:
+                # Calculer l'impact financier si absent
+                if ctrl.financial_impact is None and d.ghm_estimation:
+                    ctrl.financial_impact = estimate_financial_impact(d.ghm_estimation)
                 controls.append({
                     "group_name": group_name,
                     "filepath": item["path_rel"],
                     "ctrl": ctrl,
                     "dp_code": dp_code,
+                    "jours_restants": _compute_jours_restants(ctrl),
                 })
-    controls.sort(key=lambda c: c["ctrl"].numero_ogc)
+    # Tri : 1) priorité financière, 2) désaccords (confirme) avant accords (retient), 3) OGC
+    controls.sort(key=lambda c: (
+        _PRIORITE_ORDER.get(
+            c["ctrl"].financial_impact.priorite if c["ctrl"].financial_impact else "normale",
+            2,
+        ),
+        0 if "confirme" in (c["ctrl"].decision_ucr or "").lower() else 1,
+        c["ctrl"].numero_ogc,
+    ))
     return controls
 
 
 def get_builtin_referentiels() -> list[dict]:
     """Retourne les infos sur les référentiels intégrés (PDFs + dicts)."""
-    rag_index_meta = Path(STRUCTURED_DIR).parent / "data" / "rag_index" / "metadata.json"
+    from ..config import BASE_DIR
+    rag_index_dir = BASE_DIR / "data" / "rag_index"
+
+    # Charger les chunks depuis TOUS les metadata (ref, proc, bio, legacy)
     chunks_by_doc: dict[str, int] = {}
-    if rag_index_meta.exists():
+    for meta_file in rag_index_dir.glob("metadata*.json"):
         try:
-            import json as _json
-            meta = _json.loads(rag_index_meta.read_text(encoding="utf-8"))
+            meta = json.loads(meta_file.read_text(encoding="utf-8"))
             for m in meta:
                 doc = m.get("document", "")
                 chunks_by_doc[doc] = chunks_by_doc.get(doc, 0) + 1
@@ -176,16 +387,27 @@ def get_builtin_referentiels() -> list[dict]:
             pass
 
     refs = []
+    # (nom, path, ext, doc_keys pour compter les chunks, edition, validité)
     builtin_sources = [
-        ("CIM-10 FR 2026", CIM10_PDF, ".pdf", ["cim10", "cim10_alpha"]),
-        ("Guide Méthodologique MCO 2026", GUIDE_METHODO_PDF, ".pdf", ["guide_methodo"]),
-        ("CCAM 2025", CCAM_PDF, ".pdf", ["ccam"]),
-        ("Dictionnaire CIM-10", CIM10_DICT_PATH, ".json", []),
-        ("Suppléments CIM-10", CIM10_SUPPLEMENTS_PATH, ".json", []),
-        ("Dictionnaire CCAM", CCAM_DICT_PATH, ".json", []),
+        ("CIM-10 FR 2026", CIM10_PDF, ".pdf", ["cim10", "cim10_alpha"],
+         "11/12/2025", "2026 (provisoire)"),
+        ("Guide Méthodologique MCO 2026", GUIDE_METHODO_PDF, ".pdf", ["guide_methodo"],
+         "2025", "2026 (provisoire)"),
+        ("CCAM descriptive PMSI V4", CCAM_PDF, ".pdf", ["ccam"],
+         "2025", "V4 2025"),
+        ("Dictionnaire CIM-10", CIM10_DICT_PATH, ".json", [],
+         "", ""),
+        ("Suppléments CIM-10", CIM10_SUPPLEMENTS_PATH, ".json", [],
+         "", ""),
+        ("Dictionnaire CCAM", CCAM_DICT_PATH, ".json", [],
+         "", ""),
     ]
-    for name, path, ext, doc_keys in builtin_sources:
+    for name, path, ext, doc_keys, edition, validite in builtin_sources:
         size_mb = path.stat().st_size / (1024 * 1024) if path.exists() else 0
+        mtime = ""
+        if path.exists():
+            import datetime as _dt
+            mtime = _dt.datetime.fromtimestamp(path.stat().st_mtime).strftime("%d/%m/%Y")
         chunks = sum(chunks_by_doc.get(k, 0) for k in doc_keys)
         refs.append({
             "name": name,
@@ -194,10 +416,73 @@ def get_builtin_referentiels() -> list[dict]:
             "size_mb": size_mb,
             "chunks": chunks,
             "exists": path.exists(),
+            "edition": edition,
+            "validite": validite,
+            "file_date": mtime,
         })
+
+    # Référentiels supplémentaires indexés (ref:*.pdf dans les metadata)
+    from ..config import REFERENTIELS_DIR
+    pdfs_dir = REFERENTIELS_DIR / "pdfs"
+    for doc_name, count in sorted(chunks_by_doc.items()):
+        if doc_name.startswith("ref:") or doc_name.startswith("proc:"):
+            prefix, fname = doc_name.split(":", 1)
+            pdf_path = pdfs_dir / fname
+            size_mb = pdf_path.stat().st_size / (1024 * 1024) if pdf_path.exists() else 0
+            mtime = ""
+            if pdf_path.exists():
+                import datetime as _dt
+                mtime = _dt.datetime.fromtimestamp(pdf_path.stat().st_mtime).strftime("%d/%m/%Y")
+            refs.append({
+                "name": fname.replace("_", " ").replace(".pdf", ""),
+                "filename": fname,
+                "extension": ".pdf",
+                "size_mb": size_mb,
+                "chunks": count,
+                "exists": pdf_path.exists(),
+                "edition": "",
+                "validite": "",
+                "file_date": mtime,
+                "category": prefix,
+            })
+
     return refs
 
 
+def get_faiss_index_info() -> dict:
+    """Retourne les informations détaillées sur les index FAISS."""
+    from ..config import BASE_DIR
+    from ..medical.rag_index import check_faiss_ready
+    rag_dir = BASE_DIR / "data" / "rag_index"
+
+    info = {"ok": False, "indexes": [], "total_vectors": 0, "last_build": ""}
+
+    status = check_faiss_ready()
+    info["ok"] = status["ok"]
+    info["total_vectors"] = status["ref"] + status["proc"] + status["bio"] + status["legacy"]
+
+    for kind, label in [("ref", "Référentiels CIM-10"), ("proc", "Procédures/Guides"),
+                         ("bio", "Biologie"), ("all", "Legacy (combiné)")]:
+        idx_file = rag_dir / f"faiss_{kind}.index" if kind != "all" else rag_dir / "faiss.index"
+        meta_file = rag_dir / f"metadata_{kind}.json" if kind != "all" else rag_dir / "metadata.json"
+        count = status.get(kind, status.get("legacy", 0)) if kind == "all" else status.get(kind, 0)
+        mtime = ""
+        size_mb = 0
+        if idx_file.exists():
+            import datetime as _dt
+            mtime = _dt.datetime.fromtimestamp(idx_file.stat().st_mtime).strftime("%d/%m/%Y %H:%M")
+            size_mb = idx_file.stat().st_size / (1024 * 1024)
+        info["indexes"].append({
+            "kind": kind, "label": label,
+            "vectors": count, "size_mb": round(size_mb, 1),
+            "last_build": mtime, "exists": idx_file.exists(),
+        })
+        if mtime and (not info["last_build"] or mtime > info["last_build"]):
+            info["last_build"] = mtime
+
+    return info
+
+
 def load_ccam_dict() -> dict[str, dict]:
     """Charge le dictionnaire CCAM pour les regroupements."""
     if CCAM_DICT_PATH.exists():
@@ -209,13 +494,23 @@ def load_ccam_dict() -> dict[str, dict]:
     return {}
 
 
+_scan_cache: dict[str, object] = {"data": None, "ts": 0.0}
+_SCAN_TTL = 30  # secondes
+
+
 def scan_dossiers() -> dict[str, list[dict]]:
     """Scanne output/structured/ et retourne les fichiers groupés par sous-dossier.
 
+    Résultat mis en cache pendant 30s pour éviter de re-scanner le FS à chaque requête.
+
     Returns:
         {"racine": [{name, path_rel, dossier}, ...], "sous-dossier": [...]}
         Chaque groupe contient aussi une clé "stats" avec les compteurs agrégés.
     """
+    now = time.monotonic()
+    if _scan_cache["data"] is not None and (now - _scan_cache["ts"]) < _SCAN_TTL:
+        return _scan_cache["data"]
+
     groups: dict[str, list[dict]] = {}
 
     for json_path in sorted(STRUCTURED_DIR.rglob("*.json")):
@@ -240,6 +535,8 @@ def scan_dossiers() -> dict[str, list[dict]]:
             "dossier": dossier,
         })
 
+    _scan_cache["data"] = groups
+    _scan_cache["ts"] = now
     return groups
 
 
@@ -349,7 +646,7 @@ def cma_level_badge(value: int | None) -> Markup:
     title = {1: "Pas CMA", 2: "CMA niveau 2", 3: "CMA niveau 3", 4: "CMA niveau 4"}.get(level, "")
     return Markup(
         f'<span title="{title}" style="display:inline-block;padding:2px 8px;border-radius:9999px;'
-        f'font-size:0.75rem;font-weight:600;color:{fg};background:{bg}">'
+        f'font-size:0.75rem;font-weight:600;white-space:nowrap;color:{fg};background:{bg}">'
         f'CMA {label}</span>'
     )
 
@@ -452,9 +749,152 @@ def human_where(value: str | None) -> str:
     return value
 
 
+def _date_to_iso(date_fr: str) -> str:
+    """Convertit JJ/MM/AAAA → YYYY-MM-DD pour les inputs HTML date."""
+    try:
+        parts = date_fr.strip().split("/")
+        if len(parts) == 3:
+            return f"{parts[2]}-{parts[1]}-{parts[0]}"
+    except Exception:
+        pass
+    return ""
+
+
+_status_cache: dict[str, object] = {"data": None, "ts": 0.0}
+_STATUS_TTL = 120  # secondes
+
+
+def _get_system_status() -> list[dict]:
+    """Détecte l'état des composants du pipeline T2A (cache 120s)."""
+    now = time.monotonic()
+    if _status_cache["data"] is not None and (now - _status_cache["ts"]) < _STATUS_TTL:
+        return _status_cache["data"]
+
+    from ..config import OLLAMA_URL, OLLAMA_MODELS
+
+    components = []
+
+    # 1. Moteur de règles (VetoEngine)
+    components.append({"name": "Moteur de règles (VetoEngine)", "status": True, "detail": "Actif"})
+
+    # 2. LLM Ollama
+    ollama_ok = False
+    ollama_detail = "Non disponible"
+    try:
+        r = requests.get(f"{OLLAMA_URL}/api/tags", timeout=3)
+        if r.status_code == 200:
+            ollama_ok = True
+            models_info = ", ".join(f"{role}={model}" for role, model in OLLAMA_MODELS.items())
+            ollama_detail = models_info
+    except Exception:
+        pass
+    components.append({"name": "LLM Ollama", "status": ollama_ok, "detail": ollama_detail})
+
+    # 3. Fallback Anthropic
+    api_key = os.environ.get("ANTHROPIC_API_KEY", "")
+    components.append({
+        "name": "Fallback Anthropic (Haiku)",
+        "status": bool(api_key),
+        "detail": "Clé configurée" if api_key else "Clé absente",
+    })
+
+    # 4. Index FAISS (RAG)
+    try:
+        from ..medical.rag_index import check_faiss_ready
+        faiss_check = check_faiss_ready()
+        if faiss_check["ok"]:
+            total = faiss_check["ref"] + faiss_check["proc"] + faiss_check["bio"] + faiss_check["legacy"]
+            parts = []
+            if faiss_check["ref"]:
+                parts.append(f"ref={faiss_check['ref']}")
+            if faiss_check["proc"]:
+                parts.append(f"proc={faiss_check['proc']}")
+            if faiss_check["bio"]:
+                parts.append(f"bio={faiss_check['bio']}")
+            detail = f"{total} vecteurs ({', '.join(parts)})"
+        else:
+            detail = "; ".join(faiss_check["errors"][:2])
+        components.append({
+            "name": "Index FAISS (RAG)",
+            "status": faiss_check["ok"],
+            "detail": detail,
+        })
+    except Exception as e:
+        components.append({
+            "name": "Index FAISS (RAG)",
+            "status": False,
+            "detail": f"Erreur vérification : {e}",
+        })
+
+    # 5. Extraction PDF
+    components.append({"name": "Extraction PDF (pdfplumber)", "status": True, "detail": "Actif"})
+
+    # 6. Anonymisation NER
+    ner_ok = False
+    try:
+        from transformers import AutoTokenizer
+        AutoTokenizer.from_pretrained("Jean-Baptiste/camembert-ner", local_files_only=True)
+        ner_ok = True
+    except Exception:
+        pass
+    components.append({
+        "name": "Anonymisation NER (CamemBERT)",
+        "status": ner_ok,
+        "detail": "Modèle en cache" if ner_ok else "Modèle non trouvé",
+    })
+
+    # 7. Embeddings — vérifier le cache HuggingFace sans charger le modèle
+    emb_ok = False
+    try:
+        from huggingface_hub import try_to_load_from_cache
+        result = try_to_load_from_cache("dangvantuan/sentence-camembert-large", "config.json")
+        emb_ok = result is not None and isinstance(result, str)
+    except Exception:
+        pass
+    components.append({
+        "name": "Embeddings (sentence-camembert-large)",
+        "status": emb_ok,
+        "detail": "Modèle en cache" if emb_ok else "Modèle non trouvé",
+    })
+
+    _status_cache["data"] = components
+    _status_cache["ts"] = now
+    return components
+
+
+def _sort_qc_alerts(alerts: list[str]) -> list[str]:
+    """Trie les alertes QC : DP d'abord, puis critiques, puis le reste."""
+    def _key(a: str) -> tuple[int, int]:
+        text = a.lower()
+        # DP en premier
+        dp = 0 if " dp " in text or text.startswith("dp ") or "diagnostic principal" in text else 1
+        # Critiques ensuite
+        critical = 0 if any(k in text for k in ("high→low", "high → low", "à reconsidérer", "reconsider")) else 1
+        return (dp, critical)
+    return sorted(alerts, key=_key)
+
+
 def create_app() -> Flask:
     app = Flask(__name__)
 
+    # --- Authentification HTTP Basic (optionnelle, activée via env) ---
+    auth = HTTPBasicAuth()
+    demo_user = os.environ.get("T2A_DEMO_USER", "")
+    demo_pass = os.environ.get("T2A_DEMO_PASS", "")
+
+    @auth.verify_password
+    def verify_password(username, password):
+        if not demo_user:
+            return True  # Auth désactivée si pas de user configuré
+        if username == demo_user and password == demo_pass:
+            return True
+        return False
+
+    @app.before_request
+    def require_auth():
+        if demo_user:
+            return auth.login_required(lambda: None)()
+
     app.jinja_env.filters["confidence_badge"] = confidence_badge
     app.jinja_env.filters["confidence_label"] = confidence_label
     app.jinja_env.filters["severity_badge"] = severity_badge
@@ -465,14 +905,46 @@ def create_app() -> Flask:
     app.jinja_env.filters["format_cpam_text"] = format_cpam_text
     app.jinja_env.filters["decision_badge"] = decision_badge
     app.jinja_env.filters["human_where"] = human_where
+    app.jinja_env.filters["date_to_iso"] = _date_to_iso
+    app.jinja_env.filters["sort_qc_alerts"] = _sort_qc_alerts
 
     ccam_dict = load_ccam_dict()
 
+    # Vérification FAISS au démarrage du viewer
+    try:
+        from ..medical.rag_index import check_faiss_ready
+        _faiss_status = check_faiss_ready()
+        if _faiss_status["ok"]:
+            total = _faiss_status["ref"] + _faiss_status["proc"] + _faiss_status["bio"] + _faiss_status["legacy"]
+            logger.info("FAISS OK : %d vecteurs chargés", total)
+        else:
+            for err in _faiss_status["errors"]:
+                logger.error("FAISS : %s", err)
+    except Exception as e:
+        logger.error("Vérification FAISS échouée : %s", e)
+
+    ref_manager = ReferentielManager()
+
+    @app.context_processor
+    def inject_dossier_list():
+        """Injecte la liste des dossiers pour l'autocomplétion sidebar."""
+        groups = scan_dossiers()
+        dossier_list = []
+        for group_name, items in groups.items():
+            rep = items[0]
+            for item in items:
+                if "fusionne" in item["name"]:
+                    rep = item
+                    break
+            dossier_list.append({"name": format_dossier_name(group_name), "path": rep["path_rel"]})
+        return {"dossier_list": dossier_list}
+
     @app.route("/")
     def index():
         groups = scan_dossiers()
         group_stats = {name: compute_group_stats(items) for name, items in groups.items()}
-        return render_template("index.html", groups=groups, group_stats=group_stats)
+        stats = compute_dashboard_stats(groups) if groups else {}
+        return render_template("index.html", groups=groups, group_stats=group_stats, stats=stats)
 
     @app.route("/dossier/<path:filepath>")
     def detail(filepath: str):
@@ -495,13 +967,30 @@ def create_app() -> Flask:
             siblings=siblings,
             current_group=current_group,
             dossier_strength=dossier_strength,
+            groups=groups,
+            bio_normals=BIO_NORMALS,
         )
 
     @app.route("/dashboard")
     def dashboard():
         groups = scan_dossiers()
         stats = compute_dashboard_stats(groups)
-        return render_template("dashboard.html", stats=stats, groups=groups)
+        system_status = _get_system_status()
+        all_refs = get_builtin_referentiels()
+        core_refs = [r for r in all_refs if "category" not in r]
+        ref_refs = [r for r in all_refs if r.get("category") == "ref"]
+        proc_refs = [r for r in all_refs if r.get("category") == "proc"]
+        faiss_info = get_faiss_index_info()
+        return render_template("dashboard.html", stats=stats, groups=groups,
+                               system_status=system_status,
+                               core_refs=core_refs, ref_refs=ref_refs, proc_refs=proc_refs,
+                               total_refs=len(all_refs), faiss_info=faiss_info)
+
+    @app.route("/dim")
+    def dim_synthesis():
+        groups = scan_dossiers()
+        dim = compute_dim_synthesis(groups)
+        return render_template("dim.html", dim=dim)
 
     @app.route("/cpam")
     def cpam_list():
@@ -509,6 +998,116 @@ def create_app() -> Flask:
         controls = collect_cpam_controls(groups)
         return render_template("cpam.html", controls=controls, total=len(controls), groups=groups)
 
+    @app.route("/api/cpam/<path:dossier_id>/<int:ogc>/versions")
+    def cpam_versions(dossier_id: str, ogc: int):
+        """Retourne la liste des versions précédentes d'un argumentaire."""
+        # dossier_id est le path relatif du JSON ; extraire le répertoire parent
+        parts = Path(dossier_id).parts
+        if len(parts) > 1:
+            subdir = str(Path(*parts[:-1]))
+        else:
+            return jsonify({"versions": []})
+
+        versions_dir = STRUCTURED_DIR / subdir / "_cpam_versions"
+        if not versions_dir.is_dir():
+            return jsonify({"versions": []})
+
+        versions = []
+        for f in sorted(versions_dir.glob(f"{ogc}_*.json"), reverse=True):
+            try:
+                data = json.loads(f.read_text(encoding="utf-8"))
+                versions.append({
+                    "filename": f.name,
+                    "version": data.get("version", 0),
+                    "timestamp": data.get("timestamp", ""),
+                    "quality_tier": data.get("quality_tier"),
+                    "validation_dim": data.get("validation_dim"),
+                    "contre_argumentation": data.get("contre_argumentation", "")[:200],
+                })
+            except Exception:
+                pass
+        return jsonify({"versions": versions})
+
+    @app.route("/api/cpam/<path:dossier_id>/<int:ogc>/deadline", methods=["POST"])
+    def cpam_deadline(dossier_id: str, ogc: int):
+        """Saisie manuelle de la date de notification pour un contrôle."""
+        from datetime import datetime as dt, timedelta
+
+        data = request.get_json(silent=True) or {}
+        date_notif = data.get("date_notification", "").strip()
+        if not date_notif:
+            return jsonify({"error": "date_notification requis (JJ/MM/AAAA)"}), 400
+
+        safe_path = (STRUCTURED_DIR / dossier_id).resolve()
+        if not safe_path.is_relative_to(STRUCTURED_DIR.resolve()):
+            abort(403)
+        if not safe_path.exists():
+            abort(404)
+
+        dossier_data = json.loads(safe_path.read_text(encoding="utf-8"))
+        dossier = DossierMedical.model_validate(dossier_data)
+
+        found = False
+        for ctrl in dossier.controles_cpam:
+            if ctrl.numero_ogc == ogc:
+                ctrl.date_notification = date_notif
+                try:
+                    notif_dt = dt.strptime(date_notif, "%d/%m/%Y")
+                    ctrl.date_limite_reponse = (notif_dt + timedelta(days=30)).strftime("%d/%m/%Y")
+                except ValueError:
+                    ctrl.date_limite_reponse = None
+                found = True
+                break
+
+        if not found:
+            return jsonify({"error": f"OGC {ogc} non trouvé"}), 404
+
+        safe_path.write_text(
+            dossier.model_dump_json(indent=2, exclude_none=True),
+            encoding="utf-8",
+        )
+        return jsonify({"ok": True, "date_limite": ctrl.date_limite_reponse})
+
+    @app.route("/api/cpam/<path:dossier_id>/<int:ogc>/validate", methods=["POST"])
+    def cpam_validate(dossier_id: str, ogc: int):
+        """Valide ou rejette un argumentaire CPAM (workflow DIM)."""
+        from datetime import datetime
+
+        data = request.get_json(silent=True) or {}
+        statut = data.get("statut", "")
+        if statut not in ("valide", "rejete", "en_revision", "non_valide"):
+            return jsonify({"error": "Statut invalide"}), 400
+
+        # Charger le JSON du dossier
+        safe_path = (STRUCTURED_DIR / dossier_id).resolve()
+        if not safe_path.is_relative_to(STRUCTURED_DIR.resolve()):
+            abort(403)
+        if not safe_path.exists():
+            abort(404)
+
+        dossier_data = json.loads(safe_path.read_text(encoding="utf-8"))
+        dossier = DossierMedical.model_validate(dossier_data)
+
+        # Trouver le contrôle par OGC
+        found = False
+        for ctrl in dossier.controles_cpam:
+            if ctrl.numero_ogc == ogc:
+                ctrl.validation_dim = statut
+                ctrl.commentaire_dim = data.get("commentaire") or None
+                ctrl.date_validation = datetime.now().strftime("%d/%m/%Y %H:%M")
+                found = True
+                break
+
+        if not found:
+            return jsonify({"error": f"OGC {ogc} non trouvé"}), 404
+
+        # Sauvegarder
+        safe_path.write_text(
+            dossier.model_dump_json(indent=2, exclude_none=True),
+            encoding="utf-8",
+        )
+        return jsonify({"ok": True, "statut": statut})
+
     @app.route("/admin/models", methods=["GET"])
     def list_models():
         models = fetch_ollama_models()
@@ -535,14 +1134,14 @@ def create_app() -> Flask:
         logger.info("Modèle Ollama global changé : %s", new_model)
         return jsonify({"ok": True, "model": cfg.OLLAMA_MODEL})
 
-    @app.route("/reprocess/<path:filepath>", methods=["POST"])
+    @app.route("/admin/reprocess/<path:filepath>", methods=["POST"])
     def reprocess(filepath: str):
         """Relance le pipeline complet : process PDFs + fusion + GHM + CPAM."""
         from ..main import process_pdf, write_outputs
         from ..medical.ghm import estimate_ghm
 
         dossier = load_dossier(filepath)
-        input_dir = Path(__file__).parent.parent.parent / "input"
+        input_dir = INPUT_DIR
 
         # Collecter les PDFs sources (fusionné → source_files, simple → source_file)
         source_names = []
@@ -559,10 +1158,20 @@ def create_app() -> Flask:
         missing = []
         for name in source_names:
             found = None
+            # Essai 1 : nom exact
             for p in input_dir.rglob(name):
                 if p.is_file():
                     found = p
                     break
+            # Essai 2 : retirer le préfixe "{num}_{nip}_" ajouté par la réorg
+            if not found:
+                import re
+                stripped = re.sub(r"^\d+_\d+_", "", name)
+                if stripped != name:
+                    for p in input_dir.rglob(stripped):
+                        if p.is_file():
+                            found = p
+                            break
             if found:
                 pdf_paths.append(found)
             else:
@@ -635,12 +1244,18 @@ def create_app() -> Flask:
                 struct_dir = STRUCTURED_DIR / subdir
                 struct_dir.mkdir(parents=True, exist_ok=True)
                 merged_path = struct_dir / f"{subdir}_fusionne_cim10.json"
-                merged_path.write_text(
-                    merged.model_dump_json(indent=2, exclude_none=True),
-                    encoding="utf-8",
-                )
+                merged_json = merged.model_dump_json(indent=2, exclude_none=True)
+                merged_path.write_text(merged_json, encoding="utf-8")
                 logger.info("Dossier fusionné réécrit : %s", merged_path)
 
+                # Sync vers le répertoire du viewer si différent
+                viewer_dir = STRUCTURED_DIR / Path(filepath).parts[0]
+                if viewer_dir.resolve() != struct_dir.resolve():
+                    viewer_dir.mkdir(parents=True, exist_ok=True)
+                    viewer_fusionne = viewer_dir / Path(filepath).name
+                    viewer_fusionne.write_text(merged_json, encoding="utf-8")
+                    logger.info("Fusionné copié vers viewer : %s", viewer_fusionne)
+
             msg = f"Traitement terminé ({len(group_dossiers)} dossier(s)"
             if merged:
                 msg += ", fusionné"
@@ -654,6 +1269,44 @@ def create_app() -> Flask:
             logger.exception("Erreur lors du retraitement")
             return jsonify({"error": str(e)}), 500
 
+    @app.route("/admin/upload-document/<path:filepath>", methods=["POST"])
+    def upload_document(filepath: str):
+        """Upload un PDF dans input/<sous-dossier>/ puis relance le retraitement."""
+        if "file" not in request.files:
+            return jsonify({"error": "Aucun fichier fourni"}), 400
+        f = request.files["file"]
+        if not f.filename or not f.filename.lower().endswith(".pdf"):
+            return jsonify({"error": "Seuls les fichiers PDF sont acceptés"}), 400
+
+        # Déterminer le sous-dossier input
+        dossier = load_dossier(filepath)
+        input_dir = INPUT_DIR
+        rel_parts = Path(filepath).parts
+        subdir = str(Path(*rel_parts[:-1])) if len(rel_parts) > 1 else None
+        target_dir = input_dir / subdir if subdir else input_dir
+        target_dir.mkdir(parents=True, exist_ok=True)
+
+        # Sauvegarder le PDF
+        safe_name = secure_filename(f.filename)
+        dest = target_dir / safe_name
+        f.save(str(dest))
+        logger.info("Document uploadé : %s", dest)
+
+        # Relancer le retraitement via la route existante
+        try:
+            with app.test_request_context():
+                resp = reprocess(filepath)
+                if hasattr(resp, "get_json"):
+                    data = resp.get_json()
+                elif isinstance(resp, tuple):
+                    data = resp[0].get_json()
+                else:
+                    data = {"ok": True}
+            return jsonify({"ok": True, "message": f"PDF '{safe_name}' ajouté. {data.get('message', '')}"})
+        except Exception as e:
+            logger.exception("Erreur après upload + reprocess")
+            return jsonify({"ok": True, "message": f"PDF '{safe_name}' ajouté mais erreur retraitement : {e}"})
+
     # ------------------------------------------------------------------
     # API texte source anonymisé
     # ------------------------------------------------------------------
@@ -717,13 +1370,14 @@ def create_app() -> Flask:
     # Routes admin référentiels
     # ------------------------------------------------------------------
 
-    ref_manager = ReferentielManager()
-
     @app.route("/admin/referentiels")
     def admin_referentiels():
         refs = ref_manager.list_all()
         builtin = get_builtin_referentiels()
-        return render_template("admin_referentiels.html", referentiels=refs, builtin_refs=builtin, max_size=UPLOAD_MAX_SIZE_MB)
+        faiss_info = get_faiss_index_info()
+        return render_template("admin_referentiels.html",
+                               referentiels=refs, builtin_refs=builtin,
+                               faiss_info=faiss_info, max_size=UPLOAD_MAX_SIZE_MB)
 
     @app.route("/admin/referentiels/upload", methods=["POST"])
     def upload_referentiel():
diff --git a/src/viewer/referentiels.py b/src/viewer/referentiels.py
index 026f24b..2e252cd 100644
--- a/src/viewer/referentiels.py
+++ b/src/viewer/referentiels.py
@@ -22,7 +22,8 @@ class ReferentielManager:
     """
 
     def __init__(self, referentiels_dir: Path | None = None):
-        self._dir = referentiels_dir or REFERENTIELS_DIR
+        self._base = referentiels_dir or REFERENTIELS_DIR
+        self._dir = self._base / "user"
         self._dir.mkdir(parents=True, exist_ok=True)
         self._index_path = self._dir / "index.json"
         self._index: list[dict] = self._load_index()
@@ -75,14 +76,14 @@ class ReferentielManager:
 
         ref_id = uuid.uuid4().hex[:12]
         safe_name = f"{ref_id}_{Path(filename).stem}{ext}"
-        file_path = self._dir / safe_name
+        file_path = self._dir / safe_name  # user/ subdirectory
 
         file_path.write_bytes(file_data)
 
         ref = {
             "id": ref_id,
             "filename": filename,
-            "stored_name": safe_name,
+            "stored_name": f"user/{safe_name}",
             "extension": ext,
             "size_bytes": len(file_data),
             "date_added": datetime.now().isoformat(),
@@ -105,7 +106,7 @@ class ReferentielManager:
         if not ref:
             return False
 
-        file_path = self._dir / ref["stored_name"]
+        file_path = self._base / ref["stored_name"]
         if file_path.exists():
             file_path.unlink()
 
@@ -131,7 +132,7 @@ class ReferentielManager:
         if not ref:
             raise ValueError(f"Référentiel {ref_id} introuvable")
 
-        file_path = self._dir / ref["stored_name"]
+        file_path = self._base / ref["stored_name"]
         if not file_path.exists():
             raise ValueError(f"Fichier {ref['stored_name']} introuvable")
 
diff --git a/src/viewer/templates/admin_referentiels.html b/src/viewer/templates/admin_referentiels.html
index bdbce7c..0a84c04 100644
--- a/src/viewer/templates/admin_referentiels.html
+++ b/src/viewer/templates/admin_referentiels.html
@@ -1,22 +1,212 @@
 {% extends "base.html" %}
 
-{% block title %}Référentiels RAG{% endblock %}
+{% block title %}Referentiels RAG{% endblock %}
 
 {% block sidebar %}
 <div class="group-title">Admin</div>
-<a href="/admin/referentiels" style="color:#60a5fa;font-weight:600;border-left-color:#3b82f6;">Référentiels RAG</a>
+<a href="/admin/referentiels" style="color:#60a5fa;font-weight:600;border-left-color:#3b82f6;">Referentiels RAG</a>
+<a href="/dashboard">Dashboard</a>
 <a href="/">Retour aux dossiers</a>
 {% endblock %}
 
 {% block content %}
-<h2>Référentiels RAG</h2>
-<p style="font-size:0.85rem;color:#64748b;margin-bottom:1.5rem;">
-  Ajoutez des documents de référence (PDF, CSV, Excel, TXT) pour enrichir la base de connaissances du RAG.
-</p>
+<a class="back" href="/dashboard">&larr; Dashboard</a>
+<h2 style="margin-top:1rem;">Referentiels &amp; Index RAG</h2>
 
-<!-- Zone upload -->
+{# ---- Cartes FAISS synthese ---- #}
+<div style="display:grid;grid-template-columns:repeat(4,1fr);gap:0.75rem;margin:1rem 0 1.5rem;">
+  <div class="card" style="text-align:center;padding:1rem;">
+    <div style="font-size:0.7rem;text-transform:uppercase;letter-spacing:0.05em;color:#64748b;font-weight:600;">Statut FAISS</div>
+    <div style="font-size:1.5rem;font-weight:700;margin-top:0.25rem;">
+      {% if faiss_info.ok %}
+        <span style="color:#16a34a;">Actif</span>
+      {% else %}
+        <span style="color:#dc2626;">Inactif</span>
+      {% endif %}
+    </div>
+  </div>
+  <div class="card" style="text-align:center;padding:1rem;">
+    <div style="font-size:0.7rem;text-transform:uppercase;letter-spacing:0.05em;color:#64748b;font-weight:600;">Vecteurs totaux</div>
+    <div style="font-size:1.5rem;font-weight:700;color:#3b82f6;margin-top:0.25rem;">{{ "{:,}".format(faiss_info.total_vectors).replace(",", " ") }}</div>
+  </div>
+  <div class="card" style="text-align:center;padding:1rem;">
+    <div style="font-size:0.7rem;text-transform:uppercase;letter-spacing:0.05em;color:#64748b;font-weight:600;">Derniere indexation</div>
+    <div style="font-size:0.95rem;font-weight:600;color:#0f172a;margin-top:0.35rem;">{{ faiss_info.last_build or '—' }}</div>
+  </div>
+  <div class="card" style="text-align:center;padding:1rem;">
+    <div style="font-size:0.7rem;text-transform:uppercase;letter-spacing:0.05em;color:#64748b;font-weight:600;">Documents indexes</div>
+    <div style="font-size:1.5rem;font-weight:700;color:#6366f1;margin-top:0.25rem;">{{ builtin_refs | length }}</div>
+  </div>
+</div>
+
+{# ---- Detail index FAISS ---- #}
 <div class="card" style="margin-bottom:1.5rem;">
-  <h3>Ajouter un référentiel</h3>
+  <h3>Index FAISS</h3>
+  <p style="font-size:0.8rem;color:#64748b;margin-bottom:0.75rem;">
+    Detail des index vectoriels par type. Chaque index sert un role different dans le pipeline RAG.
+  </p>
+  <table>
+    <thead>
+      <tr>
+        <th>Index</th>
+        <th>Role</th>
+        <th>Vecteurs</th>
+        <th>Taille</th>
+        <th>Derniere MAJ</th>
+        <th>Statut</th>
+      </tr>
+    </thead>
+    <tbody>
+      {% for idx in faiss_info.indexes %}
+      <tr>
+        <td style="font-weight:600;">{{ idx.label }}</td>
+        <td style="font-size:0.8rem;color:#64748b;">
+          {% if idx.kind == 'ref' %}Codage CIM-10, index alphabetique
+          {% elif idx.kind == 'proc' %}Guide methodo, procedures, regles ATIH
+          {% elif idx.kind == 'bio' %}Normes biologiques, seuils
+          {% else %}Index combine (compat)
+          {% endif %}
+        </td>
+        <td><strong>{{ "{:,}".format(idx.vectors).replace(",", " ") }}</strong></td>
+        <td>{{ idx.size_mb }} Mo</td>
+        <td style="font-size:0.8rem;">{{ idx.last_build or '—' }}</td>
+        <td>
+          {% if not idx.exists %}
+            <span class="badge" style="background:#fee2e2;color:#dc2626;">Absent</span>
+          {% elif idx.vectors == 0 %}
+            <span class="badge" style="background:#fef9c3;color:#ca8a04;">Vide</span>
+          {% else %}
+            <span class="badge" style="background:#dcfce7;color:#16a34a;">OK</span>
+          {% endif %}
+        </td>
+      </tr>
+      {% endfor %}
+    </tbody>
+  </table>
+</div>
+
+{# ---- Referentiels integres ---- #}
+<div class="card" style="margin-bottom:1.5rem;">
+  <h3>Referentiels integres</h3>
+  <p style="font-size:0.8rem;color:#64748b;margin-bottom:0.75rem;">
+    Sources officielles ATIH/DGOS integrees automatiquement dans l'index FAISS.
+    Les dates de validite indiquent la campagne tarifaire couverte.
+  </p>
+  <table>
+    <thead>
+      <tr>
+        <th>Nom</th>
+        <th>Fichier</th>
+        <th>Edition</th>
+        <th>Validite</th>
+        <th>Taille</th>
+        <th>Chunks</th>
+        <th>Fichier du</th>
+        <th>Statut</th>
+      </tr>
+    </thead>
+    <tbody>
+      {% for ref in builtin_refs %}
+      {% if not ref.get('category') %}
+      <tr>
+        <td style="font-weight:600;">{{ ref.name }}</td>
+        <td style="font-size:0.75rem;color:#64748b;max-width:200px;overflow:hidden;text-overflow:ellipsis;white-space:nowrap;">
+          <code>{{ ref.filename }}</code>
+        </td>
+        <td style="font-size:0.8rem;">{{ ref.edition or '—' }}</td>
+        <td>
+          {% if ref.validite %}
+            {% if 'provisoire' in ref.validite %}
+              <span class="badge" style="background:#fef9c3;color:#ca8a04;">{{ ref.validite }}</span>
+            {% else %}
+              <span class="badge" style="background:#dcfce7;color:#16a34a;">{{ ref.validite }}</span>
+            {% endif %}
+          {% else %}
+            <span style="color:#94a3b8;">—</span>
+          {% endif %}
+        </td>
+        <td>{{ "%.1f"|format(ref.size_mb) }} Mo</td>
+        <td>
+          {% if ref.chunks %}
+            <strong>{{ ref.chunks }}</strong>
+          {% else %}
+            <span style="color:#94a3b8;">—</span>
+          {% endif %}
+        </td>
+        <td style="font-size:0.8rem;">{{ ref.file_date or '—' }}</td>
+        <td>
+          {% if not ref.exists %}
+            <span class="badge" style="background:#fee2e2;color:#dc2626;">Fichier absent</span>
+          {% elif ref.chunks %}
+            <span class="badge" style="background:#dcfce7;color:#16a34a;">Indexe</span>
+          {% else %}
+            <span class="badge" style="background:#f1f5f9;color:#64748b;">Dictionnaire</span>
+          {% endif %}
+        </td>
+      </tr>
+      {% endif %}
+      {% endfor %}
+    </tbody>
+  </table>
+</div>
+
+{# ---- Referentiels supplementaires (ref:*.pdf indexes) ---- #}
+{% set extra_refs = builtin_refs | selectattr('category', 'defined') | list %}
+{% if extra_refs %}
+<div class="card" style="margin-bottom:1.5rem;">
+  <h3>Referentiels supplementaires indexes</h3>
+  <p style="font-size:0.8rem;color:#64748b;margin-bottom:0.75rem;">
+    Documents de reference supplementaires (annexes CIM-10, consignes ATIH, manuels GHM)
+    automatiquement detectes et indexes dans FAISS.
+  </p>
+  <table>
+    <thead>
+      <tr>
+        <th>Document</th>
+        <th>Type</th>
+        <th>Taille</th>
+        <th>Chunks</th>
+        <th>Fichier du</th>
+        <th>Statut</th>
+      </tr>
+    </thead>
+    <tbody>
+      {% for ref in extra_refs %}
+      <tr>
+        <td style="font-weight:500;">{{ ref.name }}</td>
+        <td>
+          {% if ref.category == 'proc' %}
+            <span class="badge" style="background:#e0e7ff;color:#3730a3;">Procedure</span>
+          {% else %}
+            <span class="badge" style="background:#f1f5f9;color:#334155;">Reference</span>
+          {% endif %}
+        </td>
+        <td>{{ "%.1f"|format(ref.size_mb) }} Mo</td>
+        <td><strong>{{ ref.chunks }}</strong></td>
+        <td style="font-size:0.8rem;">{{ ref.file_date or '—' }}</td>
+        <td>
+          {% if ref.exists %}
+            <span class="badge" style="background:#dcfce7;color:#16a34a;">Indexe</span>
+          {% elif ref.chunks %}
+            <span class="badge" style="background:#dbeafe;color:#2563eb;">Indexe (PDF supprime)</span>
+          {% else %}
+            <span class="badge" style="background:#fee2e2;color:#dc2626;">Non indexe</span>
+          {% endif %}
+        </td>
+      </tr>
+      {% endfor %}
+    </tbody>
+  </table>
+</div>
+{% endif %}
+
+{# ---- Zone upload ---- #}
+<div class="card" style="margin-bottom:1.5rem;">
+  <h3>Ajouter un referentiel</h3>
+  <p style="font-size:0.8rem;color:#64748b;margin-bottom:0.5rem;">
+    Uploadez un document de reference (PDF, CSV, Excel, TXT) pour enrichir la base RAG.
+    Le document sera indexe dans FAISS et utilisable immediatement pour le codage.
+  </p>
   <form id="upload-form" style="display:flex;gap:0.75rem;align-items:end;flex-wrap:wrap;margin-top:0.75rem;">
     <div>
       <label style="display:block;font-size:0.7rem;color:#64748b;text-transform:uppercase;letter-spacing:0.05em;font-weight:600;margin-bottom:0.25rem;">Fichier</label>
@@ -34,59 +224,13 @@
   </p>
 </div>
 
-<!-- Référentiels intégrés (built-in) -->
+{# ---- Referentiels utilisateur ---- #}
 <div class="card" style="margin-bottom:1.5rem;">
-  <h3>Référentiels intégrés</h3>
-  <p style="font-size:0.8rem;color:#64748b;margin-bottom:0.75rem;">
-    Sources intégrées automatiquement dans l'index FAISS au build.
-  </p>
-  <table>
-    <thead>
-      <tr>
-        <th>Nom</th>
-        <th>Fichier</th>
-        <th>Type</th>
-        <th>Taille</th>
-        <th>Chunks</th>
-        <th>Statut</th>
-      </tr>
-    </thead>
-    <tbody>
-      {% for ref in builtin_refs %}
-      <tr>
-        <td style="font-weight:600;">{{ ref.name }}</td>
-        <td style="font-size:0.8rem;color:#64748b;"><code>{{ ref.filename }}</code></td>
-        <td><span class="badge" style="background:#f1f5f9;color:#334155;">{{ ref.extension }}</span></td>
-        <td>{{ "%.1f"|format(ref.size_mb) }} Mo</td>
-        <td>
-          {% if ref.chunks %}
-            <strong>{{ ref.chunks }}</strong>
-          {% else %}
-            <span style="color:#94a3b8;">—</span>
-          {% endif %}
-        </td>
-        <td>
-          {% if not ref.exists %}
-            <span class="badge" style="background:#fee2e2;color:#dc2626;">Fichier absent</span>
-          {% elif ref.chunks %}
-            <span class="badge" style="background:#dcfce7;color:#16a34a;">Indexé</span>
-          {% else %}
-            <span class="badge" style="background:#f1f5f9;color:#64748b;">Dictionnaire</span>
-          {% endif %}
-        </td>
-      </tr>
-      {% endfor %}
-    </tbody>
-  </table>
-</div>
-
-<!-- Tableau référentiels utilisateur -->
-<div class="card">
   <div style="display:flex;justify-content:space-between;align-items:center;margin-bottom:0.75rem;">
-    <h3>Référentiels utilisateur</h3>
+    <h3>Referentiels utilisateur</h3>
     <button id="rebuild-btn"
-      style="padding:0.35rem 0.75rem;border-radius:6px;border:1px solid #e2e8f0;background:#fff;font-size:0.75rem;cursor:pointer;">
-      Rebuild complet
+      style="padding:0.4rem 1rem;border-radius:6px;border:1px solid #e2e8f0;background:#fff;font-size:0.8rem;cursor:pointer;font-weight:600;">
+      Reconstruire l'index FAISS
     </button>
   </div>
 
@@ -96,7 +240,7 @@
         <th>Nom</th>
         <th>Type</th>
         <th>Taille</th>
-        <th>Date</th>
+        <th>Date ajout</th>
         <th>Chunks</th>
         <th>Statut</th>
         <th>Actions</th>
@@ -112,11 +256,11 @@
         <td>{{ ref.chunks_count }}</td>
         <td>
           {% if ref.status == 'indexed' %}
-            <span class="badge" style="background:#dcfce7;color:#16a34a;">Indexé</span>
+            <span class="badge" style="background:#dcfce7;color:#16a34a;">Indexe</span>
           {% elif ref.status == 'empty' %}
             <span class="badge" style="background:#fef9c3;color:#ca8a04;">Vide</span>
           {% else %}
-            <span class="badge" style="background:#f1f5f9;color:#64748b;">Uploadé</span>
+            <span class="badge" style="background:#f1f5f9;color:#64748b;">Uploade</span>
           {% endif %}
         </td>
         <td>
@@ -133,72 +277,127 @@
       {% endfor %}
       {% if not referentiels %}
       <tr id="empty-row">
-        <td colspan="7" style="text-align:center;color:#94a3b8;padding:2rem;">Aucun référentiel</td>
+        <td colspan="7" style="text-align:center;color:#94a3b8;padding:2rem;">Aucun referentiel utilisateur</td>
       </tr>
       {% endif %}
     </tbody>
   </table>
 </div>
 
+{# ---- Aide referentiels ATIH ---- #}
+<div class="card" style="margin-bottom:1.5rem;background:#f8fafc;border:1px dashed #cbd5e1;">
+  <h3 style="color:#475569;">Referentiels ATIH — Mises a jour</h3>
+  <p style="font-size:0.8rem;color:#64748b;margin-bottom:0.75rem;">
+    Les referentiels T2A sont publies par l'ATIH selon le calendrier suivant :
+  </p>
+  <table style="font-size:0.8rem;">
+    <thead>
+      <tr><th>Referentiel</th><th>Frequence</th><th>Publication</th><th>Source</th></tr>
+    </thead>
+    <tbody>
+      <tr>
+        <td>CIM-10 FR a usage PMSI</td>
+        <td>Annuelle</td>
+        <td>Decembre N-1 (provisoire), Mars N (definitif)</td>
+        <td style="font-size:0.75rem;"><code>atih.sante.fr</code></td>
+      </tr>
+      <tr>
+        <td>Guide methodologique MCO</td>
+        <td>Annuelle</td>
+        <td>Decembre N-1 (provisoire), Mars N (definitif)</td>
+        <td style="font-size:0.75rem;"><code>atih.sante.fr</code></td>
+      </tr>
+      <tr>
+        <td>CCAM descriptive a usage PMSI</td>
+        <td>~2/an</td>
+        <td>Mars et Septembre</td>
+        <td style="font-size:0.75rem;"><code>atih.sante.fr</code></td>
+      </tr>
+      <tr>
+        <td>Manuel des GHM</td>
+        <td>Annuelle</td>
+        <td>Mars</td>
+        <td style="font-size:0.75rem;"><code>atih.sante.fr</code></td>
+      </tr>
+      <tr>
+        <td>Consignes de codage (COVID, sepsis...)</td>
+        <td>Variable</td>
+        <td>Au fil des publications ATIH/DGOS</td>
+        <td style="font-size:0.75rem;"><code>atih.sante.fr/consignes</code></td>
+      </tr>
+      <tr>
+        <td>Instructions controle T2A (campagnes)</td>
+        <td>Annuelle</td>
+        <td>Avril-Mai (debut campagne)</td>
+        <td style="font-size:0.75rem;"><code>ameli.fr</code></td>
+      </tr>
+    </tbody>
+  </table>
+  <p style="font-size:0.75rem;color:#94a3b8;margin-top:0.75rem;">
+    Pour mettre a jour : uploadez le nouveau PDF ci-dessus, puis cliquez "Indexer".
+    Reconstruisez l'index FAISS complet apres mise a jour des referentiels principaux (CIM-10, guide methodo).
+  </p>
+</div>
+
 <div id="global-status" style="margin-top:1rem;font-size:0.8rem;"></div>
 {% endblock %}
 
 {% block scripts %}
 <script>
 (function() {
-  const uploadForm = document.getElementById('upload-form');
-  const fileInput = document.getElementById('file-input');
-  const uploadBtn = document.getElementById('upload-btn');
-  const uploadStatus = document.getElementById('upload-status');
-  const globalStatus = document.getElementById('global-status');
-  const rebuildBtn = document.getElementById('rebuild-btn');
+  var uploadForm = document.getElementById('upload-form');
+  var fileInput = document.getElementById('file-input');
+  var uploadBtn = document.getElementById('upload-btn');
+  var uploadStatus = document.getElementById('upload-status');
+  var globalStatus = document.getElementById('global-status');
+  var rebuildBtn = document.getElementById('rebuild-btn');
 
   uploadForm.addEventListener('submit', function(e) {
     e.preventDefault();
-    const file = fileInput.files[0];
-    if (!file) { uploadStatus.textContent = 'Sélectionnez un fichier'; return; }
+    var file = fileInput.files[0];
+    if (!file) { uploadStatus.textContent = 'Selectionnez un fichier'; return; }
 
-    const fd = new FormData();
+    var fd = new FormData();
     fd.append('file', file);
 
     uploadBtn.disabled = true;
-    uploadBtn.innerHTML = '<span class="spinner"></span>';
+    uploadBtn.textContent = 'Upload...';
     uploadStatus.textContent = '';
 
-    fetch('/admin/referentiels/upload', { method: 'POST', body: fd })
-      .then(r => r.json())
-      .then(d => {
+    fetch('/admin/referentiels/upload', { method: 'POST', body: fd, credentials: 'same-origin' })
+      .then(function(r) { return r.json(); })
+      .then(function(d) {
         uploadBtn.disabled = false;
         uploadBtn.textContent = 'Uploader';
         if (d.ok) {
           uploadStatus.style.color = '#16a34a';
-          uploadStatus.textContent = 'Uploadé';
-          setTimeout(() => location.reload(), 800);
+          uploadStatus.textContent = 'Uploade avec succes';
+          setTimeout(function() { location.reload(); }, 800);
         } else {
           uploadStatus.style.color = '#dc2626';
           uploadStatus.textContent = d.error || 'Erreur';
         }
       })
-      .catch(() => {
+      .catch(function() {
         uploadBtn.disabled = false;
         uploadBtn.textContent = 'Uploader';
         uploadStatus.style.color = '#dc2626';
-        uploadStatus.textContent = 'Erreur réseau';
+        uploadStatus.textContent = 'Erreur reseau';
       });
   });
 
   window.indexRef = function(id) {
-    const btn = event.target;
+    var btn = event.target;
     btn.disabled = true;
-    btn.innerHTML = '<span class="spinner" style="border-color:rgba(37,99,235,0.3);border-top-color:#2563eb;width:10px;height:10px;"></span>';
+    btn.textContent = 'Indexation...';
 
-    fetch('/admin/referentiels/' + id + '/index', { method: 'POST' })
-      .then(r => r.json())
-      .then(d => {
+    fetch('/admin/referentiels/' + id + '/index', { method: 'POST', credentials: 'same-origin' })
+      .then(function(r) { return r.json(); })
+      .then(function(d) {
         if (d.ok) {
           globalStatus.style.color = '#16a34a';
-          globalStatus.textContent = d.chunks + ' chunks indexés';
-          setTimeout(() => location.reload(), 800);
+          globalStatus.textContent = d.chunks + ' chunks indexes';
+          setTimeout(function() { location.reload(); }, 800);
         } else {
           btn.disabled = false;
           btn.textContent = 'Indexer';
@@ -206,59 +405,60 @@
           globalStatus.textContent = d.error || 'Erreur';
         }
       })
-      .catch(() => {
+      .catch(function() {
         btn.disabled = false;
         btn.textContent = 'Indexer';
         globalStatus.style.color = '#dc2626';
-        globalStatus.textContent = 'Erreur réseau';
+        globalStatus.textContent = 'Erreur reseau';
       });
   };
 
   window.deleteRef = function(id) {
-    if (!confirm('Supprimer ce référentiel ?')) return;
+    if (!confirm('Supprimer ce referentiel ?')) return;
 
-    fetch('/admin/referentiels/' + id, { method: 'DELETE' })
-      .then(r => r.json())
-      .then(d => {
+    fetch('/admin/referentiels/' + id, { method: 'DELETE', credentials: 'same-origin' })
+      .then(function(r) { return r.json(); })
+      .then(function(d) {
         if (d.ok) {
-          const row = document.getElementById('row-' + id);
+          var row = document.getElementById('row-' + id);
           if (row) row.remove();
           globalStatus.style.color = '#16a34a';
-          globalStatus.textContent = 'Supprimé';
+          globalStatus.textContent = 'Supprime';
         } else {
           globalStatus.style.color = '#dc2626';
           globalStatus.textContent = d.error || 'Erreur';
         }
       })
-      .catch(() => {
+      .catch(function() {
         globalStatus.style.color = '#dc2626';
-        globalStatus.textContent = 'Erreur réseau';
+        globalStatus.textContent = 'Erreur reseau';
       });
   };
 
   rebuildBtn.addEventListener('click', function() {
     if (!confirm('Reconstruire l\'index FAISS complet ? Cela peut prendre plusieurs minutes.')) return;
     rebuildBtn.disabled = true;
-    rebuildBtn.innerHTML = '<span class="spinner" style="border-color:rgba(0,0,0,0.2);border-top-color:#333;width:10px;height:10px;"></span> Rebuild…';
+    rebuildBtn.textContent = 'Reconstruction...';
 
-    fetch('/admin/referentiels/rebuild-index', { method: 'POST' })
-      .then(r => r.json())
-      .then(d => {
+    fetch('/admin/referentiels/rebuild-index', { method: 'POST', credentials: 'same-origin' })
+      .then(function(r) { return r.json(); })
+      .then(function(d) {
         rebuildBtn.disabled = false;
-        rebuildBtn.textContent = 'Rebuild complet';
+        rebuildBtn.textContent = 'Reconstruire l\'index FAISS';
         if (d.ok) {
           globalStatus.style.color = '#16a34a';
-          globalStatus.textContent = 'Index reconstruit (' + d.reindexed + ' référentiels réindexés)';
+          globalStatus.textContent = 'Index reconstruit (' + d.reindexed + ' referentiels reindexes)';
+          setTimeout(function() { location.reload(); }, 1000);
         } else {
           globalStatus.style.color = '#dc2626';
           globalStatus.textContent = d.error || 'Erreur';
         }
       })
-      .catch(() => {
+      .catch(function() {
         rebuildBtn.disabled = false;
-        rebuildBtn.textContent = 'Rebuild complet';
+        rebuildBtn.textContent = 'Reconstruire l\'index FAISS';
         globalStatus.style.color = '#dc2626';
-        globalStatus.textContent = 'Erreur réseau';
+        globalStatus.textContent = 'Erreur reseau';
       });
   });
 })();
diff --git a/src/viewer/templates/base.html b/src/viewer/templates/base.html
index 5b690e2..6ad645b 100644
--- a/src/viewer/templates/base.html
+++ b/src/viewer/templates/base.html
@@ -78,8 +78,26 @@
     font-weight: 700;
   }
 
+  /* Main nav links */
+  .sidebar-link {
+    display: block;
+    padding: 0.4rem 1rem;
+    color: #cbd5e1;
+    text-decoration: none;
+    font-size: 0.8rem;
+    font-weight: 600;
+    border-left: 3px solid transparent;
+    transition: all 0.15s;
+  }
+  .sidebar-link:hover {
+    color: #f8fafc;
+    background: #334155;
+    border-left-color: #3b82f6;
+  }
+
   /* Search */
   .sidebar-search {
+    position: relative;
     padding: 0.75rem 1rem 0.5rem;
     border-bottom: 1px solid #334155;
   }
@@ -162,6 +180,7 @@
     border-radius: 9999px;
     font-size: 0.7rem;
     font-weight: 600;
+    transition: all 0.15s;
   }
   table { width: 100%; border-collapse: collapse; font-size: 0.85rem; }
   th, td { text-align: left; padding: 0.5rem 0.75rem; border-bottom: 1px solid #e2e8f0; }
@@ -206,6 +225,7 @@
     border-radius: 9999px;
     font-size: 0.7rem;
     font-weight: 600;
+    transition: all 0.15s;
   }
   .badge-das { background: #dbeafe; color: #1d4ed8; }
   .badge-actes { background: #e0e7ff; color: #3730a3; }
@@ -335,45 +355,70 @@
   }
   .src-file-btn:hover { background: #e2e8f0; border-color: #3b82f6; }
   .src-file-btn.active { background: #3b82f6; color: #fff; border-color: #3b82f6; }
+
+  /* Tableau dossiers (index) */
+  .table-dossiers { width: 100%; border-collapse: collapse; font-size: 0.85rem; }
+  .table-dossiers th {
+    text-align: left; padding: 0.6rem 0.75rem; border-bottom: 2px solid #e2e8f0;
+    font-weight: 600; color: #475569; font-size: 0.75rem; text-transform: uppercase;
+    letter-spacing: 0.05em; background: #f8fafc;
+  }
+  .table-dossiers td { padding: 0.6rem 0.75rem; border-bottom: 1px solid #f1f5f9; vertical-align: middle; }
+  .row-clickable { cursor: pointer; transition: background 0.15s; }
+  .row-clickable:hover { background: #f0f9ff; }
+
+  /* Hamburger toggle (mobile) */
+  .sidebar-toggle {
+    display: none;
+    position: fixed;
+    top: 0.75rem;
+    left: 0.75rem;
+    z-index: 10001;
+    background: #1e293b;
+    color: #e2e8f0;
+    border: none;
+    border-radius: 6px;
+    padding: 0.5rem 0.65rem;
+    font-size: 1.2rem;
+    cursor: pointer;
+    line-height: 1;
+  }
+
+  /* Responsive */
+  @media (max-width: 768px) {
+    .sidebar-toggle { display: block; }
+    .sidebar {
+      transform: translateX(-100%);
+      transition: transform 0.25s ease;
+      z-index: 10000;
+    }
+    .sidebar.open { transform: translateX(0); }
+    .main { margin-left: 0; padding: 1rem; padding-top: 3.5rem; }
+  }
 </style>
 </head>
 <body>
 
+<!-- Hamburger (mobile) -->
+<button class="sidebar-toggle" id="sidebar-toggle" aria-label="Menu">&#9776;</button>
+
 <!-- Sidebar -->
-<aside class="sidebar">
+<aside class="sidebar" id="sidebar">
   <div class="sidebar-header">
-    <h1>T2A Viewer</h1>
+    <img src="{{ url_for('static', filename='logo_aivanov.png') }}" alt="Aivanov" style="height:32px;margin-bottom:0.5rem;background:#fff;border-radius:6px;padding:2px 8px;">
+    <h1>T2A Viewer <span style="font-size:0.65rem;font-weight:400;color:#94a3b8;">v1.0</span></h1>
     <p>Visualisation CIM-10</p>
   </div>
+  <nav class="sidebar-main-nav" style="padding:0.5rem 0;border-bottom:1px solid #334155;">
+    <a href="/" class="sidebar-link">&#128193; Dossiers</a>
+    <a href="/dashboard" class="sidebar-link">&#128202; Dashboard</a>
+    <a href="/dim" class="sidebar-link">&#127973; Synth&egrave;se DIM</a>
+    <a href="/cpam" class="sidebar-link">&#9888; Contr&ocirc;les UCR</a>
+    <a href="/admin/referentiels" class="sidebar-link">&#128218; R&eacute;f&eacute;rentiels</a>
+  </nav>
   <div class="sidebar-search">
     <input type="text" id="sidebar-search" placeholder="Rechercher un dossier…" autocomplete="off">
-  </div>
-  <nav class="sidebar-nav" id="sidebar-nav">
-    {% block sidebar %}{% endblock %}
-  </nav>
-  <div class="sidebar-admin" style="border-top:1px solid #334155;padding:0.5rem 1rem;">
-    <a href="/dashboard" style="display:block;color:#cbd5e1;text-decoration:none;font-size:0.8rem;font-weight:600;padding:0.35rem 0;transition:color 0.15s;"
-       onmouseover="this.style.color='#f8fafc'" onmouseout="this.style.color='#cbd5e1'">
-      Dashboard
-    </a>
-    <a href="/cpam" style="display:block;color:#cbd5e1;text-decoration:none;font-size:0.8rem;font-weight:600;padding:0.35rem 0;transition:color 0.15s;"
-       onmouseover="this.style.color='#f8fafc'" onmouseout="this.style.color='#cbd5e1'">
-      Contrôles CPAM
-    </a>
-    <a href="/admin/referentiels" style="display:block;color:#cbd5e1;text-decoration:none;font-size:0.8rem;font-weight:600;padding:0.35rem 0;transition:color 0.15s;"
-       onmouseover="this.style.color='#f8fafc'" onmouseout="this.style.color='#cbd5e1'">
-      Référentiels RAG
-    </a>
-    <a href="/validation" style="display:block;color:#fbbf24;text-decoration:none;font-size:0.8rem;font-weight:600;padding:0.35rem 0;transition:color 0.15s;"
-       onmouseover="this.style.color='#fde68a'" onmouseout="this.style.color='#fbbf24'">
-      Validation DIM
-    </a>
-  </div>
-  <div class="sidebar-admin">
-    <label for="model-select">Modèle Ollama</label>
-    <select id="model-select"><option>Chargement…</option></select>
-    <button id="model-apply">Appliquer</button>
-    <div class="status-msg" id="model-status"></div>
+    <div id="sidebar-autocomplete" style="display:none;position:absolute;left:0;right:0;background:#0f172a;border:1px solid #475569;border-radius:0 0 6px 6px;max-height:250px;overflow-y:auto;z-index:100;"></div>
   </div>
 </aside>
 
@@ -383,96 +428,53 @@
 </div>
 
 <script>
+// Sidebar toggle (mobile)
 (function() {
-  const sel = document.getElementById('model-select');
-  const btn = document.getElementById('model-apply');
-  const status = document.getElementById('model-status');
-
-  function loadModels() {
-    fetch('/admin/models')
-      .then(r => r.json())
-      .then(d => {
-        sel.innerHTML = '';
-        if (d.models && d.models.length) {
-          d.models.forEach(m => {
-            const opt = document.createElement('option');
-            opt.value = m;
-            opt.textContent = m;
-            if (m === d.current) opt.selected = true;
-            sel.appendChild(opt);
-          });
-        } else {
-          sel.innerHTML = '<option>Aucun modèle</option>';
-        }
-      })
-      .catch(() => { sel.innerHTML = '<option>Erreur</option>'; });
-  }
-
-  btn.addEventListener('click', function() {
-    const model = sel.value;
-    if (!model || model === 'Aucun modèle' || model === 'Erreur') return;
-    status.textContent = '…';
-    status.style.color = '#94a3b8';
-    fetch('/admin/models', {
-      method: 'POST',
-      headers: {'Content-Type': 'application/json'},
-      body: JSON.stringify({model: model})
-    })
-    .then(r => r.json())
-    .then(d => {
-      if (d.ok) {
-        status.textContent = 'Modèle appliqué';
-        status.style.color = '#16a34a';
-      } else {
-        status.textContent = d.error || 'Erreur';
-        status.style.color = '#dc2626';
-      }
-    })
-    .catch(() => {
-      status.textContent = 'Erreur réseau';
-      status.style.color = '#dc2626';
+  var btn = document.getElementById('sidebar-toggle');
+  var sb = document.getElementById('sidebar');
+  if (btn && sb) {
+    btn.addEventListener('click', function() { sb.classList.toggle('open'); });
+    sb.addEventListener('click', function(e) {
+      if (e.target.tagName === 'A') sb.classList.remove('open');
     });
-  });
-
-  loadModels();
+  }
 })();
 
-// Sidebar search filter
+// Sidebar autocomplete search
 (function() {
-  const input = document.getElementById('sidebar-search');
-  const nav = document.getElementById('sidebar-nav');
-  if (!input || !nav) return;
+  var input = document.getElementById('sidebar-search');
+  var dropdown = document.getElementById('sidebar-autocomplete');
+  if (!input || !dropdown) return;
+
+  var dossiers = {{ dossier_list | tojson }};
 
   input.addEventListener('input', function() {
-    const q = this.value.toLowerCase().trim();
-    const groups = nav.querySelectorAll('.group-title');
-
-    groups.forEach(function(groupEl) {
-      // Collect all sibling links until next group-title
-      const links = [];
-      let next = groupEl.nextElementSibling;
-      while (next && !next.classList.contains('group-title')) {
-        if (next.tagName === 'A') links.push(next);
-        next = next.nextElementSibling;
-      }
-
-      if (!q) {
-        groupEl.style.display = '';
-        links.forEach(function(a) { a.style.display = ''; });
-        return;
-      }
-
-      const groupMatch = groupEl.textContent.toLowerCase().includes(q);
-      let anyLinkMatch = false;
-
-      links.forEach(function(a) {
-        const match = groupMatch || a.textContent.toLowerCase().includes(q);
-        a.style.display = match ? '' : 'none';
-        if (match) anyLinkMatch = true;
-      });
-
-      groupEl.style.display = (groupMatch || anyLinkMatch) ? '' : 'none';
+    var q = this.value.toLowerCase().trim();
+    dropdown.innerHTML = '';
+    if (!q) { dropdown.style.display = 'none'; return; }
+    var matches = dossiers.filter(function(d) { return d.name.toLowerCase().includes(q); }).slice(0, 15);
+    if (!matches.length) { dropdown.style.display = 'none'; return; }
+    matches.forEach(function(d) {
+      var a = document.createElement('a');
+      a.href = '/dossier/' + d.path;
+      a.textContent = d.name;
+      a.style.cssText = 'display:block;padding:0.35rem 0.6rem;color:#e2e8f0;text-decoration:none;font-size:0.8rem;border-bottom:1px solid #1e293b;';
+      a.addEventListener('mouseenter', function() { this.style.background = '#334155'; });
+      a.addEventListener('mouseleave', function() { this.style.background = ''; });
+      dropdown.appendChild(a);
     });
+    dropdown.style.display = 'block';
+  });
+
+  input.addEventListener('keydown', function(e) {
+    if (e.key === 'Enter') {
+      var first = dropdown.querySelector('a');
+      if (first) { window.location = first.href; e.preventDefault(); }
+    }
+  });
+
+  document.addEventListener('click', function(e) {
+    if (!e.target.closest('.sidebar-search')) dropdown.style.display = 'none';
   });
 })();
 </script>
diff --git a/src/viewer/templates/cpam.html b/src/viewer/templates/cpam.html
index 145aa12..e1d3d88 100644
--- a/src/viewer/templates/cpam.html
+++ b/src/viewer/templates/cpam.html
@@ -1,48 +1,52 @@
 {% extends "base.html" %}
-{% block title %}Contrôles CPAM{% endblock %}
-
-{% block sidebar %}
-{% for group_name, items in groups.items() %}
-  <div class="group-title">{{ group_name | format_dossier_name }}</div>
-  {% for item in items %}
-    {% if 'fusionne' in item.name %}
-      <a href="/dossier/{{ item.path_rel }}" class="sidebar-fusionne">&#9733; Fusionné</a>
-    {% else %}
-      <a href="/dossier/{{ item.path_rel }}">{{ item.name | format_doc_name }}</a>
-    {% endif %}
-  {% endfor %}
-{% endfor %}
-{% endblock %}
+{% block title %}Contrôles UCR{% endblock %}
 
 {% block content %}
 <a class="back" href="/">&larr; Retour à la liste</a>
 
 <div style="display:flex;align-items:center;gap:0.75rem;margin-top:1rem;margin-bottom:1rem;">
-  <h2 style="margin:0;">Contrôles CPAM</h2>
+  <h2 style="margin:0;">Contrôles UCR</h2>
   <span class="badge" style="background:#fef3c7;color:#b45309;font-size:0.85rem;padding:4px 12px;">{{ total }}</span>
 </div>
 
 {% if not controls %}
 <div class="card">
-  <p>Aucun contrôle CPAM trouvé dans les dossiers.</p>
+  <p>Aucun contrôle UCR trouvé dans les dossiers.</p>
 </div>
 {% else %}
 <div class="card" style="overflow-x:auto;">
   <table>
     <thead>
       <tr>
+        <th>Priorité</th>
         <th>Dossier</th>
         <th>OGC</th>
         <th>Qualité</th>
         <th>Titre</th>
-        <th>Décision</th>
+        <th>Décision UCR</th>
         <th>Codes contestés</th>
+        <th>Délai</th>
+        <th>Validation</th>
         <th>Contre-argumentation</th>
       </tr>
     </thead>
     <tbody>
       {% for c in controls %}
       <tr>
+        <td style="text-align:center;">
+          {% set fi = c.ctrl.financial_impact %}
+          {% if fi and fi.priorite == 'critique' %}
+            <span class="badge" style="background:#dc2626;color:#fff;font-weight:700;font-size:0.75rem;padding:3px 10px;">Critique</span>
+            <div style="font-size:0.65rem;color:#dc2626;margin-top:2px;">~{{ fi.impact_estime_euros }}€</div>
+          {% elif fi and fi.priorite == 'haute' %}
+            <span class="badge" style="background:#f59e0b;color:#fff;font-weight:700;font-size:0.75rem;padding:3px 10px;">Haute</span>
+            <div style="font-size:0.65rem;color:#b45309;margin-top:2px;">~{{ fi.impact_estime_euros }}€</div>
+          {% elif fi and fi.priorite == 'faible' %}
+            <span class="badge" style="background:#94a3b8;color:#fff;font-size:0.75rem;padding:3px 8px;">Faible</span>
+          {% else %}
+            <span class="badge" style="background:#d1fae5;color:#065f46;font-size:0.75rem;padding:3px 8px;">Normale</span>
+          {% endif %}
+        </td>
         <td>
           <a href="/dossier/{{ c.filepath }}" style="color:#3b82f6;text-decoration:none;font-weight:600;">
             {{ c.group_name | format_dossier_name }}
@@ -79,22 +83,105 @@
             {% if c.ctrl.da_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;font-size:0.65rem;">DA: {{ c.ctrl.da_ucr }}</span>{% endif %}
             {% if c.ctrl.dr_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;font-size:0.65rem;">DR: {{ c.ctrl.dr_ucr }}</span>{% endif %}
             {% if c.ctrl.actes_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;font-size:0.65rem;">Actes: {{ c.ctrl.actes_ucr }}</span>{% endif %}
+            {% if not c.ctrl.dp_ucr and not c.ctrl.da_ucr and not c.ctrl.dr_ucr and not c.ctrl.actes_ucr %}
+              {% if c.ctrl.contre_argumentation %}
+                <button class="btn-toggle-arg" data-row="{{ loop.index }}" style="background:none;border:1px solid #3b82f6;color:#3b82f6;border-radius:4px;padding:2px 8px;font-size:0.7rem;font-weight:600;cursor:pointer;">Voir analyse</button>
+              {% else %}
+                <span style="color:#94a3b8;font-size:0.7rem;">—</span>
+              {% endif %}
+            {% endif %}
           </div>
         </td>
-        <td style="max-width:300px;">
+        <td style="text-align:center;white-space:nowrap;">
+          {% if c.jours_restants is not none %}
+            {% if c.jours_restants < 0 %}
+              <span class="badge" style="background:#dc2626;color:#fff;font-weight:700;font-size:0.75rem;">Hors délai</span>
+            {% elif c.jours_restants < 7 %}
+              <span class="badge" style="background:#dc2626;color:#fff;font-size:0.75rem;">{{ c.jours_restants }}j</span>
+            {% elif c.jours_restants < 15 %}
+              <span class="badge" style="background:#f59e0b;color:#fff;font-size:0.75rem;">{{ c.jours_restants }}j</span>
+            {% else %}
+              <span class="badge" style="background:#d1fae5;color:#065f46;font-size:0.75rem;">{{ c.jours_restants }}j</span>
+            {% endif %}
+            {% if c.ctrl.date_limite_reponse %}
+              <div style="font-size:0.6rem;color:#94a3b8;">{{ c.ctrl.date_limite_reponse }}</div>
+            {% endif %}
+          {% else %}
+            <span style="color:#94a3b8;font-size:0.7rem;">—</span>
+          {% endif %}
+        </td>
+        <td style="text-align:center;">
+          {% if c.ctrl.validation_dim == 'valide' %}
+            <span class="badge" style="background:#d1fae5;color:#065f46;font-weight:700;font-size:0.75rem;">Validé</span>
+          {% elif c.ctrl.validation_dim == 'rejete' %}
+            <span class="badge" style="background:#fee2e2;color:#dc2626;font-weight:700;font-size:0.75rem;">Rejeté</span>
+          {% elif c.ctrl.validation_dim == 'en_revision' %}
+            <span class="badge" style="background:#fef3c7;color:#b45309;font-weight:700;font-size:0.75rem;">En révision</span>
+          {% else %}
+            <span style="color:#94a3b8;font-size:0.7rem;">—</span>
+          {% endif %}
+        </td>
+        <td style="text-align:center;">
           {% if c.ctrl.contre_argumentation %}
-          <details>
-            <summary>{{ c.ctrl.contre_argumentation[:80] }}{% if c.ctrl.contre_argumentation|length > 80 %}…{% endif %}</summary>
-            <pre>{{ c.ctrl.contre_argumentation }}</pre>
-          </details>
+            <button class="btn-toggle-arg" data-row="{{ loop.index }}" style="background:none;border:1px solid #3b82f6;color:#3b82f6;border-radius:4px;padding:2px 8px;font-size:0.7rem;font-weight:600;cursor:pointer;">Voir analyse</button>
           {% else %}
             <span style="color:#94a3b8;font-size:0.8rem;">—</span>
           {% endif %}
         </td>
       </tr>
+      {% if c.ctrl.contre_argumentation %}
+      <tr class="arg-row" id="arg-row-{{ loop.index }}" style="display:none;">
+        <td colspan="10" style="padding:1rem 1.25rem;background:#f8fafc;border-bottom:2px solid #e2e8f0;">
+          <div class="arg-content" data-raw="{{ c.ctrl.contre_argumentation|e }}"></div>
+        </td>
+      </tr>
+      {% endif %}
       {% endfor %}
     </tbody>
   </table>
 </div>
 {% endif %}
 {% endblock %}
+
+{% block scripts %}
+<script>
+(function() {
+  // Parse contre-argumentation: conclusion first, then rest
+  document.querySelectorAll('.arg-content').forEach(function(el) {
+    var raw = el.getAttribute('data-raw');
+    if (!raw) return;
+    // Find CONCLUSION section
+    var conclusionMatch = raw.match(/(?:^|\n)(CONCLUSION[^\n]*\n)([\s\S]*?)(?=\n[A-ZÉÈÊÀÂ]{3,}[^\n]*\n|$)/i);
+    var conclusion = '';
+    var rest = raw;
+    if (conclusionMatch) {
+      conclusion = (conclusionMatch[1] + conclusionMatch[2]).trim();
+      rest = raw.replace(conclusionMatch[0], '').trim();
+    }
+    var html = '';
+    if (conclusion) {
+      html += '<div style="background:#dbeafe;border:1px solid #93c5fd;border-radius:8px;padding:0.75rem 1rem;margin-bottom:1rem;">';
+      html += '<strong style="color:#1d4ed8;font-size:0.85rem;">CONCLUSION</strong>';
+      html += '<div style="font-size:0.85rem;color:#1e3a8a;margin-top:0.25rem;white-space:pre-wrap;">' + conclusion.replace(/^CONCLUSION[^\n]*\n?/i, '').trim() + '</div>';
+      html += '</div>';
+    }
+    if (rest) {
+      html += '<div style="font-size:0.8rem;color:#334155;white-space:pre-wrap;line-height:1.6;">' + rest + '</div>';
+    }
+    el.innerHTML = html;
+  });
+
+  // Toggle arg rows
+  document.querySelectorAll('.btn-toggle-arg').forEach(function(btn) {
+    btn.addEventListener('click', function() {
+      var rowId = 'arg-row-' + this.getAttribute('data-row');
+      var row = document.getElementById(rowId);
+      if (!row) return;
+      var isVisible = row.style.display !== 'none';
+      row.style.display = isVisible ? 'none' : 'table-row';
+      this.textContent = isVisible ? 'Voir analyse' : 'Masquer';
+    });
+  });
+})();
+</script>
+{% endblock %}
diff --git a/src/viewer/templates/dashboard.html b/src/viewer/templates/dashboard.html
index c80c729..f5d3fa0 100644
--- a/src/viewer/templates/dashboard.html
+++ b/src/viewer/templates/dashboard.html
@@ -1,18 +1,6 @@
 {% extends "base.html" %}
 {% block title %}Dashboard{% endblock %}
 
-{% block sidebar %}
-{% for group_name, items in groups.items() %}
-  <div class="group-title">{{ group_name | format_dossier_name }}</div>
-  {% for item in items %}
-    {% if 'fusionne' in item.name %}
-      <a href="/dossier/{{ item.path_rel }}" class="sidebar-fusionne">&#9733; Fusionné</a>
-    {% else %}
-      <a href="/dossier/{{ item.path_rel }}">{{ item.name | format_doc_name }}</a>
-    {% endif %}
-  {% endfor %}
-{% endfor %}
-{% endblock %}
 
 {% block content %}
 <a class="back" href="/">&larr; Retour à la liste</a>
@@ -142,4 +130,106 @@
 </div>
 {% endif %}
 
+{# ---- État du système ---- #}
+{% if system_status %}
+<div class="card section">
+  <h3>État du système</h3>
+  <div style="display:grid;grid-template-columns:repeat(auto-fill,minmax(220px,1fr));gap:0.5rem;margin-top:0.5rem;">
+    {% for comp in system_status %}
+    <div style="display:flex;align-items:center;gap:0.5rem;padding:0.5rem 0.75rem;border-radius:6px;border:1px solid {% if comp.status %}#bbf7d0{% else %}#fecaca{% endif %};background:{% if comp.status %}#f0fdf4{% else %}#fef2f2{% endif %};">
+      <span style="display:inline-block;width:8px;height:8px;border-radius:50%;background:{% if comp.status %}#16a34a{% else %}#dc2626{% endif %};flex-shrink:0;"></span>
+      <div>
+        <div style="font-size:0.8rem;font-weight:600;color:#0f172a;">{{ comp.name }}</div>
+        <div style="font-size:0.65rem;color:#64748b;">{{ comp.detail }}</div>
+      </div>
+    </div>
+    {% endfor %}
+  </div>
+</div>
+{% endif %}
+
+{# ---- Référentiels ---- #}
+{% if core_refs or ref_refs or proc_refs %}
+<div class="card section">
+  <h3>Référentiels ({{ total_refs }} documents)</h3>
+  {% if faiss_info %}
+  <div style="display:flex;flex-wrap:wrap;align-items:center;gap:0.75rem;margin-bottom:0.75rem;padding:0.5rem 0.75rem;background:#f0f9ff;border:1px solid #bae6fd;border-radius:6px;">
+    <span style="font-size:0.8rem;font-weight:600;color:#0369a1;">Index FAISS</span>
+    <span style="font-size:0.75rem;color:#0c4a6e;">{{ faiss_info.total_vectors }} vecteurs</span>
+    {% for idx in faiss_info.indexes %}
+    {% if idx.exists %}
+    <span style="font-size:0.65rem;color:#64748b;">{{ idx.label }}: {{ idx.vectors }} ({{ idx.size_mb }} Mo)</span>
+    {% endif %}
+    {% endfor %}
+    {% if faiss_info.last_build %}
+    <span style="font-size:0.65rem;color:#94a3b8;margin-left:auto;">MAJ : {{ faiss_info.last_build }}</span>
+    {% endif %}
+  </div>
+  {% endif %}
+  <table style="width:100%;border-collapse:collapse;font-size:0.75rem;">
+    <thead>
+      <tr style="border-bottom:2px solid #e2e8f0;text-align:left;">
+        <th style="padding:0.4rem 0.5rem;color:#64748b;font-weight:600;">Document</th>
+        <th style="padding:0.4rem 0.5rem;color:#64748b;font-weight:600;text-align:center;">Date</th>
+        <th style="padding:0.4rem 0.5rem;color:#64748b;font-weight:600;text-align:center;">Validité</th>
+        <th style="padding:0.4rem 0.5rem;color:#64748b;font-weight:600;text-align:right;">Taille</th>
+        <th style="padding:0.4rem 0.5rem;color:#64748b;font-weight:600;text-align:right;">Chunks</th>
+        <th style="padding:0.4rem 0.5rem;color:#64748b;font-weight:600;text-align:center;">Statut</th>
+      </tr>
+    </thead>
+    <tbody>
+      {# --- Groupe : Base de données --- #}
+      <tr><td colspan="6" style="padding:0.5rem 0.5rem 0.25rem;font-size:0.7rem;font-weight:700;color:#3b82f6;text-transform:uppercase;letter-spacing:0.05em;border-bottom:1px solid #dbeafe;">Base de données</td></tr>
+      {% for ref in core_refs %}
+      <tr style="border-bottom:1px solid #f1f5f9;">
+        <td style="padding:0.3rem 0.5rem;font-weight:500;color:#0f172a;">{{ ref.name }}</td>
+        <td style="padding:0.3rem 0.5rem;text-align:center;color:#475569;">{{ ref.edition or ref.file_date or '-' }}</td>
+        <td style="padding:0.3rem 0.5rem;text-align:center;color:#475569;">{{ ref.validite or '-' }}</td>
+        <td style="padding:0.3rem 0.5rem;text-align:right;color:#64748b;">{{ '%.1f Mo' | format(ref.size_mb) if ref.size_mb else '-' }}</td>
+        <td style="padding:0.3rem 0.5rem;text-align:right;color:#64748b;">{{ ref.chunks if ref.chunks else '-' }}</td>
+        <td style="padding:0.3rem 0.5rem;text-align:center;">
+          {% if ref.exists %}<span style="display:inline-block;width:8px;height:8px;border-radius:50%;background:#16a34a;" title="Présent"></span>
+          {% else %}<span style="display:inline-block;width:8px;height:8px;border-radius:50%;background:#dc2626;" title="Absent"></span>{% endif %}
+        </td>
+      </tr>
+      {% endfor %}
+      {# --- Groupe : Fascicules & Consignes CIM-10 --- #}
+      {% if ref_refs %}
+      <tr><td colspan="6" style="padding:0.5rem 0.5rem 0.25rem;font-size:0.7rem;font-weight:700;color:#16a34a;text-transform:uppercase;letter-spacing:0.05em;border-bottom:1px solid #bbf7d0;">Fascicules, consignes & référentiels CIM-10</td></tr>
+      {% for ref in ref_refs %}
+      <tr style="border-bottom:1px solid #f1f5f9;">
+        <td style="padding:0.3rem 0.5rem;font-weight:500;color:#0f172a;">{{ ref.name }}</td>
+        <td style="padding:0.3rem 0.5rem;text-align:center;color:#475569;">{{ ref.file_date or '-' }}</td>
+        <td style="padding:0.3rem 0.5rem;text-align:center;color:#475569;">-</td>
+        <td style="padding:0.3rem 0.5rem;text-align:right;color:#64748b;">{{ '%.1f Mo' | format(ref.size_mb) if ref.size_mb else '-' }}</td>
+        <td style="padding:0.3rem 0.5rem;text-align:right;color:#64748b;">{{ ref.chunks if ref.chunks else '-' }}</td>
+        <td style="padding:0.3rem 0.5rem;text-align:center;">
+          {% if ref.exists %}<span style="display:inline-block;width:8px;height:8px;border-radius:50%;background:#16a34a;" title="Présent"></span>
+          {% else %}<span style="display:inline-block;width:8px;height:8px;border-radius:50%;background:#dc2626;" title="Absent"></span>{% endif %}
+        </td>
+      </tr>
+      {% endfor %}
+      {% endif %}
+      {# --- Groupe : Guides & Procédures --- #}
+      {% if proc_refs %}
+      <tr><td colspan="6" style="padding:0.5rem 0.5rem 0.25rem;font-size:0.7rem;font-weight:700;color:#b45309;text-transform:uppercase;letter-spacing:0.05em;border-bottom:1px solid #fef3c7;">Guides & procédures</td></tr>
+      {% for ref in proc_refs %}
+      <tr style="border-bottom:1px solid #f1f5f9;">
+        <td style="padding:0.3rem 0.5rem;font-weight:500;color:#0f172a;">{{ ref.name }}</td>
+        <td style="padding:0.3rem 0.5rem;text-align:center;color:#475569;">{{ ref.file_date or '-' }}</td>
+        <td style="padding:0.3rem 0.5rem;text-align:center;color:#475569;">-</td>
+        <td style="padding:0.3rem 0.5rem;text-align:right;color:#64748b;">{{ '%.1f Mo' | format(ref.size_mb) if ref.size_mb else '-' }}</td>
+        <td style="padding:0.3rem 0.5rem;text-align:right;color:#64748b;">{{ ref.chunks if ref.chunks else '-' }}</td>
+        <td style="padding:0.3rem 0.5rem;text-align:center;">
+          {% if ref.exists %}<span style="display:inline-block;width:8px;height:8px;border-radius:50%;background:#16a34a;" title="Présent"></span>
+          {% else %}<span style="display:inline-block;width:8px;height:8px;border-radius:50%;background:#dc2626;" title="Absent"></span>{% endif %}
+        </td>
+      </tr>
+      {% endfor %}
+      {% endif %}
+    </tbody>
+  </table>
+</div>
+{% endif %}
+
 {% endblock %}
diff --git a/src/viewer/templates/detail.html b/src/viewer/templates/detail.html
index 9d8de63..41f484a 100644
--- a/src/viewer/templates/detail.html
+++ b/src/viewer/templates/detail.html
@@ -1,459 +1,262 @@
 {% extends "base.html" %}
 {% block title %}{{ dossier.source_file or filepath }}{% endblock %}
 
-{% block sidebar %}
-<div class="group-title">Navigation</div>
-<a href="/">Retour à la liste</a>
-{% if siblings %}
-<div class="group-title" style="margin-top:1rem;">{{ current_group }}</div>
-{% for sib in siblings %}
-  <a href="/dossier/{{ sib.path_rel }}" {% if sib.path_rel == filepath %}style="color:#f8fafc;border-left-color:#3b82f6;background:#334155;"{% endif %}>
-    {{ sib.name }}
-  </a>
-{% endfor %}
-{% endif %}
-<div class="group-title" style="margin-top:1.5rem;">Actions</div>
-<button id="reprocess-btn" style="width:100%;padding:0.6rem;background:#3b82f6;color:white;border:none;border-radius:0.375rem;cursor:pointer;font-size:0.875rem;font-weight:600;margin-bottom:0.5rem;">Relancer l'étude</button>
-<div id="reprocess-status" style="font-size:0.75rem;padding:0.25rem;min-height:1.5rem;"></div>
-{% endblock %}
-
 {% block content %}
 <a class="back" href="/">&larr; Retour à la liste</a>
 
-{# ---- En-tête ---- #}
-<div class="card" style="margin-top:1rem;">
-  <h2>{{ dossier.source_file or filepath }}</h2>
-  <div class="info-grid">
+{# ==================================================================== #}
+{# 1. BANDEAU PATIENT — Identité + Séjour + Codage DP + GHM + Score    #}
+{# ==================================================================== #}
+{% set s = dossier.sejour %}
+{% set dp = dossier.diagnostic_principal %}
+{% set ghm = dossier.ghm_estimation %}
+{% set vr = dossier.veto_report %}
+
+<div class="card" style="margin-top:1rem;padding:1.25rem 1.5rem;">
+  {# Titre patient #}
+  <div style="display:flex;align-items:baseline;gap:0.75rem;margin-bottom:1rem;flex-wrap:wrap;">
+    <h2 style="margin:0;">{{ current_group | format_dossier_name if current_group else (dossier.source_file or filepath) }}</h2>
     {% if dossier.document_type %}
-    <div class="info-item">
-      <label>Type de document</label>
       <span class="badge" style="background:#e0e7ff;color:#3730a3;">{{ dossier.document_type }}</span>
-    </div>
+    {% endif %}
+    {% if dossier.source_files %}
+      <span class="badge" style="background:#ede9fe;color:#5b21b6;">fusionné</span>
     {% endif %}
     {% if dossier.processing_time_s is not none %}
-    <div class="info-item">
-      <label>Temps de traitement</label>
-      <span>{{ dossier.processing_time_s|format_duration }}</span>
-    </div>
+      <span style="font-size:0.75rem;color:#94a3b8;">{{ dossier.processing_time_s|format_duration }}</span>
     {% endif %}
   </div>
-  {% if dossier.source_files %}
-  <div class="source-files" style="margin-top:0.75rem;">
-    <label style="font-size:0.7rem;color:#64748b;text-transform:uppercase;letter-spacing:0.05em;font-weight:600;">Documents sources</label>
-    <div style="margin-top:0.25rem;">
-      {% for sf in dossier.source_files %}
-        <code>{{ sf }}</code>{% if not loop.last %}, {% endif %}
-      {% endfor %}
-    </div>
-  </div>
-  {% endif %}
-</div>
 
-{# ---- Synthèse Expert (Refonte) ---- #}
-<div style="display: grid; grid-template-columns: repeat(auto-fit, minmax(300px, 1fr)); gap: 1rem; margin-top: 1rem; margin-bottom: 1.5rem;">
-  
-  {# 1. Sécurité & Conformité (Vetos) #}
-  <div class="card" style="margin:0; border-top: 4px solid #ef4444; background: #fff1f2;">
-    <h3 style="color:#991b1b; font-size: 1rem; margin-bottom: 0.75rem;">🛡️ Sécurité & Conformité</h3>
-    <div style="font-size: 0.85rem; color: #7f1d1d;">
-      {% if dossier.veto_report and dossier.veto_report.issues %}
-        {% for issue in dossier.veto_report.issues if issue.severity in ['HARD', 'MEDIUM'] %}
-          <div style="margin-bottom: 0.5rem; border-bottom: 1px solid #fecaca; padding-bottom: 0.25rem;">
-            <strong>[{{ issue.severity|replace('HARD', 'Bloquant')|replace('MEDIUM', 'À vérifier') }}]</strong> {{ issue.message }}
-            {% if issue.citation %}<br><em style="font-size:0.75rem; opacity:0.8;">ATIH: {{ issue.citation }}</em>{% endif %}
-          </div>
-        {% endfor %}
-      {% else %}
-        <div style="color: #059669; font-weight: 600;">✅ Aucune anomalie majeure détectée.</div>
-      {% endif %}
-    </div>
-  </div>
-
-  {# 2. Optimisation de la Recette (CMA) #}
-  <div class="card" style="margin:0; border-top: 4px solid #10b981; background: #ecfdf5;">
-    <h3 style="color:#065f46; font-size: 1rem; margin-bottom: 0.75rem;">💰 Valorisation (CMA)</h3>
-    <div style="font-size: 0.85rem; color: #064e3b;">
-      {% set cma_alerts = [] %}
-      {% for alerte in dossier.alertes_codage if alerte.startswith('CMA') %}{% set _ = cma_alerts.append(alerte) %}{% endfor %}
-      {% if cma_alerts %}
-        <ul style="margin:0; padding-left: 1.2rem;">
-          {% for alerte in cma_alerts %}
-            <li style="margin-bottom: 0.25rem;">{{ alerte }}</li>
-          {% endfor %}
-        </ul>
-      {% else %}
-        <div style="opacity: 0.7;">Aucune comorbidité (CMA) détectée.</div>
-      {% endif %}
-    </div>
-  </div>
-
-  {# 3. Audit & Analyse IA (QC) #}
-  <div class="card" style="margin:0; border-top: 4px solid #3b82f6; background: #eff6ff;">
-    <h3 style="color:#1e40af; font-size: 1rem; margin-bottom: 0.75rem;">🔍 Audit de l'Expert IA</h3>
-    <div style="font-size: 0.85rem; color: #1e3a8a;">
-      {% set qc_alerts = [] %}
-      {% for alerte in dossier.alertes_codage if alerte.startswith('QC:') %}{% set _ = qc_alerts.append(alerte) %}{% endfor %}
-      {% if qc_alerts %}
-        {% for alerte in qc_alerts %}
-          <div style="margin-bottom: 0.5rem; border-bottom: 1px solid #bfdbfe; padding-bottom: 0.25rem; font-style: italic;">
-            {{ alerte|replace('QC: ', '') }}
-          </div>
-        {% endfor %}
-      {% else %}
-        <div style="opacity: 0.7;">Aucune recommandation particulière.</div>
-      {% endif %}
-    </div>
-  </div>
-
-</div>
-
-{# ---- Séjour ---- #}
-{% set s = dossier.sejour %}
-{% if s.sexe or s.age or s.date_entree or s.date_sortie or s.duree_sejour is not none or s.imc or s.poids or s.taille %}
-<div class="card section">
-  <h3>Séjour</h3>
-  <div class="info-grid">
-    {% if s.sexe %}<div class="info-item"><label>Sexe</label><span>{{ s.sexe }}</span></div>{% endif %}
-    {% if s.age is not none %}<div class="info-item"><label>Âge</label><span>{{ s.age }} ans</span></div>{% endif %}
-    {% if s.date_entree %}<div class="info-item"><label>Entrée</label><span>{{ s.date_entree }}</span></div>{% endif %}
-    {% if s.date_sortie %}<div class="info-item"><label>Sortie</label><span>{{ s.date_sortie }}</span></div>{% endif %}
-    {% if s.duree_sejour is not none %}<div class="info-item"><label>Durée</label><span>{{ s.duree_sejour }} jour(s)</span></div>{% endif %}
-    {% if s.mode_entree %}<div class="info-item"><label>Mode entrée</label><span>{{ s.mode_entree }}</span></div>{% endif %}
-    {% if s.mode_sortie %}<div class="info-item"><label>Mode sortie</label><span>{{ s.mode_sortie }}</span></div>{% endif %}
-    {% if s.poids %}<div class="info-item"><label>Poids</label><span>{{ s.poids }} kg</span></div>{% endif %}
-    {% if s.taille %}<div class="info-item"><label>Taille</label><span>{{ s.taille }} cm</span></div>{% endif %}
-    {% if s.imc %}<div class="info-item"><label>IMC</label><span>{{ s.imc }}</span></div>{% endif %}
-  </div>
-</div>
-{% endif %}
-
-{# ---- Estimation GHM ---- #}
-{% if dossier.ghm_estimation %}
-{% set ghm = dossier.ghm_estimation %}
-<div class="card section" style="border-left:4px solid #8b5cf6;">
-  <h3 style="color:#6d28d9;">Estimation GHM</h3>
-  <div class="info-grid">
-    {% if ghm.cmd %}
-    <div class="info-item">
-      <label>CMD</label>
-      <span><strong>{{ ghm.cmd }}</strong>{% if ghm.cmd_libelle %} — {{ ghm.cmd_libelle }}{% endif %}</span>
-    </div>
-    {% endif %}
-    <div class="info-item">
-      <label>Type</label>
-      {% if ghm.type_ghm == 'C' %}
-        <span class="badge" style="background:#fee2e2;color:#dc2626;">C — Chirurgical</span>
-      {% elif ghm.type_ghm == 'K' %}
-        <span class="badge" style="background:#fef3c7;color:#92400e;">K — Interventionnel</span>
-      {% elif ghm.type_ghm == 'M' %}
-        <span class="badge" style="background:#dbeafe;color:#1d4ed8;">M — Médical</span>
-      {% endif %}
-    </div>
-    <div class="info-item">
-      <label>Sévérité</label>
-      {% if ghm.severite <= 1 %}
-        <span class="badge" style="background:#d1fae5;color:#065f46;">Niveau {{ ghm.severite }}</span>
-      {% elif ghm.severite == 2 %}
-        <span class="badge" style="background:#fef3c7;color:#92400e;">Niveau {{ ghm.severite }}</span>
-      {% elif ghm.severite == 3 %}
-        <span class="badge" style="background:#fed7aa;color:#9a3412;">Niveau {{ ghm.severite }}</span>
-      {% else %}
-        <span class="badge" style="background:#fee2e2;color:#dc2626;">Niveau {{ ghm.severite }}</span>
-      {% endif %}
-    </div>
-    {% if ghm.ghm_approx %}
-    <div class="info-item">
-      <label>Code GHM approx.</label>
-      <code style="font-size:1.1rem;font-weight:700;letter-spacing:0.05em;">{{ ghm.ghm_approx }}</code>
-    </div>
-    {% endif %}
-    <div class="info-item">
-      <label>CMA / CMS</label>
-      <span>{{ ghm.cma_count }} CMA, {{ ghm.cms_count }} CMS</span>
-    </div>
-  </div>
-  {% if ghm.alertes %}
-  <div style="margin-top:0.75rem;">
-    {% for alerte in ghm.alertes %}
-      <div style="font-size:0.8rem;color:#c2410c;margin-bottom:0.2rem;">{{ alerte }}</div>
-    {% endfor %}
-  </div>
-  {% endif %}
-  <div style="margin-top:0.75rem;font-size:0.7rem;color:#94a3b8;font-style:italic;">
-    Estimation heuristique — le GHM définitif nécessite le groupeur officiel ATIH
-  </div>
-</div>
-{% endif %}
-
-{# ---- Contrôle CPAM ---- #}
-{% if dossier.controles_cpam %}
-<div class="card section" style="border-left:4px solid #f59e0b;">
-  <h3 style="color:#b45309;">Contrôle CPAM ({{ dossier.controles_cpam|length }})</h3>
-  {% if dossier_strength and dossier_strength.is_weak %}
-  <div style="background:#fff7ed;border:1px solid #fed7aa;padding:0.5rem 0.75rem;border-radius:4px;margin-bottom:0.75rem;font-size:0.85rem;color:#9a3412;">
-    Dossier à preuves limitées (score {{ dossier_strength.score }}/10) — manque : {{ dossier_strength.missing|join(', ') }}
-  </div>
-  {% endif %}
-  {% for ctrl in dossier.controles_cpam %}
-  <div style="margin-bottom:1.5rem;{% if not loop.last %}border-bottom:1px solid #e2e8f0;padding-bottom:1rem;{% endif %}">
-    <div style="display:flex;align-items:center;gap:0.5rem;margin-bottom:0.5rem;flex-wrap:wrap;">
-      <strong>OGC {{ ctrl.numero_ogc }} — {{ ctrl.titre }}</strong>
-      {% if 'retient' in ctrl.decision_ucr|lower %}
-        <span class="badge" style="background:#d1fae5;color:#065f46;">{{ ctrl.decision_ucr }}</span>
-      {% elif 'confirme' in ctrl.decision_ucr|lower %}
-        <span class="badge" style="background:#fee2e2;color:#dc2626;">{{ ctrl.decision_ucr }}</span>
-      {% else %}
-        <span class="badge" style="background:#e0e7ff;color:#3730a3;">{{ ctrl.decision_ucr }}</span>
-      {% endif %}
-      {% if ctrl.quality_tier == 'A' %}
-        <span class="badge" style="background:#2ecc71;color:#fff;font-weight:700;">Qualité A</span>
-      {% elif ctrl.quality_tier == 'B' %}
-        <span class="badge" style="background:#f39c12;color:#fff;font-weight:700;">Qualité B</span>
-      {% elif ctrl.quality_tier == 'C' %}
-        <span class="badge" style="background:#e74c3c;color:#fff;font-weight:700;">Qualité C</span>
-      {% endif %}
-    </div>
-
-    {# Argument CPAM #}
-    {% if ctrl.arg_ucr %}
-    <div style="border-left:3px solid #f59e0b;padding:0.5rem 0.75rem;background:#fffbeb;margin-bottom:0.75rem;font-size:0.85rem;color:#78350f;">
-      <div style="font-size:0.7rem;color:#92400e;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Argument CPAM</div>
-      {{ ctrl.arg_ucr }}
-    </div>
-    {% endif %}
-
-    {# Codes contestés #}
-    {% if ctrl.dp_ucr or ctrl.da_ucr or ctrl.dr_ucr or ctrl.actes_ucr %}
-    <div style="margin-bottom:0.75rem;">
-      <div style="font-size:0.7rem;color:#64748b;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Codes contestés</div>
-      <div style="display:flex;gap:0.5rem;flex-wrap:wrap;">
-        {% if ctrl.dp_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">DP: {{ ctrl.dp_ucr }}</span>{% endif %}
-        {% if ctrl.da_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">DA: {{ ctrl.da_ucr }}</span>{% endif %}
-        {% if ctrl.dr_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">DR: {{ ctrl.dr_ucr }}</span>{% endif %}
-        {% if ctrl.actes_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">Actes: {{ ctrl.actes_ucr }}</span>{% endif %}
+  <div style="display:grid;grid-template-columns:1fr 1fr;gap:1.5rem;">
+    {# Colonne gauche — Identité et séjour #}
+    <div>
+      <div style="font-size:0.7rem;color:#64748b;text-transform:uppercase;letter-spacing:0.05em;font-weight:600;margin-bottom:0.5rem;">Patient & Séjour</div>
+      <div class="info-grid" style="grid-template-columns:repeat(auto-fill,minmax(120px,1fr));gap:0.5rem;">
+        {% if s.sexe %}<div class="info-item"><label>Sexe</label><span>{{ s.sexe }}</span></div>{% endif %}
+        {% if s.age is not none %}<div class="info-item"><label>Âge</label><span>{{ s.age }} ans</span></div>{% endif %}
+        {% if s.date_entree %}<div class="info-item"><label>Entrée</label><span>{{ s.date_entree }}</span></div>{% endif %}
+        {% if s.date_sortie %}<div class="info-item"><label>Sortie</label><span>{{ s.date_sortie }}</span></div>{% endif %}
+        {% if s.duree_sejour is not none %}<div class="info-item"><label>Durée</label><span>{{ s.duree_sejour }} j</span></div>{% endif %}
+        {% if s.mode_entree %}<div class="info-item"><label>Mode entrée</label><span>{{ s.mode_entree }}</span></div>{% endif %}
+        {% if s.mode_sortie %}<div class="info-item"><label>Mode sortie</label><span>{{ s.mode_sortie }}</span></div>{% endif %}
+        {% if s.poids %}<div class="info-item"><label>Poids</label><span>{{ s.poids }} kg</span></div>{% endif %}
+        {% if s.taille %}<div class="info-item"><label>Taille</label><span>{{ s.taille }} cm</span></div>{% endif %}
+        {% if s.imc %}<div class="info-item"><label>IMC</label><span>{{ s.imc }}</span></div>{% endif %}
       </div>
     </div>
-    {% endif %}
 
-    {# Bandeau revue manuelle si Tier C #}
-    {% if ctrl.requires_review %}
-    <div style="background:#fee2e2;border:1px solid #fca5a5;padding:0.5rem 0.75rem;border-radius:4px;margin-bottom:0.75rem;font-size:0.85rem;color:#991b1b;">
-      ⚠ Revue manuelle requise — la contre-argumentation contient des incohérences détectées
-    </div>
-    {% endif %}
+    {# Colonne droite — Codage #}
+    <div>
+      <div style="font-size:0.7rem;color:#64748b;text-transform:uppercase;letter-spacing:0.05em;font-weight:600;margin-bottom:0.5rem;">Codage</div>
 
-    {# Contre-argumentation structurée ou fallback texte brut #}
-    {% if ctrl.response_data %}
-    <div style="margin-bottom:0.75rem;">
-      <div style="font-size:0.7rem;color:#1d4ed8;text-transform:uppercase;font-weight:600;margin-bottom:0.5rem;">Contre-argumentation</div>
-
-      {% if ctrl.response_data.analyse_contestation %}
-      <div style="border-left:3px solid #94a3b8;padding:0.5rem 0.75rem;background:#f8fafc;margin-bottom:0.5rem;font-size:0.85rem;">
-        <div style="font-size:0.7rem;color:#64748b;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Analyse de la contestation</div>
-        {{ ctrl.response_data.analyse_contestation | format_cpam_text }}
-      </div>
-      {% endif %}
-
-      {% if ctrl.response_data.points_accord and ctrl.response_data.points_accord|lower not in ['aucun', 'non applicable', 'n/a', ''] %}
-      <div style="border-left:3px solid #22c55e;padding:0.5rem 0.75rem;background:#f0fdf4;margin-bottom:0.5rem;font-size:0.85rem;">
-        <div style="font-size:0.7rem;color:#16a34a;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Points d'accord</div>
-        {{ ctrl.response_data.points_accord | format_cpam_text }}
-      </div>
-      {% endif %}
-
-      {% if ctrl.response_data.contre_arguments_medicaux %}
-      <div style="border-left:3px solid #3b82f6;padding:0.5rem 0.75rem;background:#eff6ff;margin-bottom:0.5rem;font-size:0.85rem;">
-        <div style="font-size:0.7rem;color:#1d4ed8;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Contre-arguments médicaux</div>
-        {{ ctrl.response_data.contre_arguments_medicaux | format_cpam_text }}
-      </div>
-      {% endif %}
-
-      {% if ctrl.response_data.preuves_dossier %}
-      <div style="border-left:3px solid #0ea5e9;padding:0.5rem 0.75rem;background:#f0f9ff;margin-bottom:0.5rem;font-size:0.85rem;">
-        <div style="font-size:0.7rem;color:#0369a1;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Preuves du dossier</div>
-        <ul style="margin:0.3rem 0;padding-left:1.2rem;">
-        {% for p in ctrl.response_data.preuves_dossier %}
-          {% if p is mapping %}
-          <li style="margin-bottom:0.3rem;">
-            <span style="display:inline-block;padding:1px 6px;border-radius:9999px;font-size:0.7rem;font-weight:600;background:#e0f2fe;color:#0369a1;">{{ p.element or p.get('type', '') }}</span>
-            {{ p.valeur or '' }} <span style="color:#64748b;">&rarr; {{ p.signification or '' }}</span>
-          </li>
+      {# DP en gros #}
+      {% if dp %}
+      <div style="margin-bottom:0.75rem;">
+        <div style="font-size:0.7rem;color:#94a3b8;font-weight:600;">DIAGNOSTIC PRINCIPAL</div>
+        <div style="margin-top:0.2rem;display:flex;align-items:center;gap:0.5rem;flex-wrap:wrap;">
+          {% if dp.cim10_suggestion %}
+            {% if dp.cim10_final and dp.cim10_final != dp.cim10_suggestion %}
+              <span style="text-decoration:line-through;color:#94a3b8;font-size:1rem;">{{ dp.cim10_suggestion }}</span>
+              <span style="color:#64748b;">→</span>
+              <span style="font-size:1.3rem;font-weight:700;color:#1d4ed8;">{{ dp.cim10_final }}</span>
+            {% else %}
+              <span style="font-size:1.3rem;font-weight:700;color:#1d4ed8;">{{ dp.cim10_suggestion }}</span>
+            {% endif %}
+            {{ dp.cim10_confidence | confidence_badge }}
           {% endif %}
-        {% endfor %}
-        </ul>
+          {% if dp.niveau_cma and dp.niveau_cma > 1 %}{{ dp.niveau_cma | cma_level_badge }}{% endif %}
+          {{ dp.niveau_severite | severity_badge }}
+        </div>
+        <div style="font-size:0.85rem;color:#334155;margin-top:0.15rem;">
+          {% if dp.status == 'ruled_out' %}<span style="text-decoration:line-through;">{{ dp.texte }}</span>{% else %}{{ dp.texte }}{% endif %}
+          {% if dp.source_page %}<button class="src-btn" data-texte="{{ dp.texte|e }}" data-excerpt="{{ dp.source_excerpt|default('',true)|e }}" data-page="{{ dp.source_page }}">p.{{ dp.source_page }}</button>{% endif %}
+        </div>
       </div>
       {% endif %}
 
-      {% if ctrl.response_data.contre_arguments_asymetrie %}
-      <div style="border-left:3px solid #8b5cf6;padding:0.5rem 0.75rem;background:#f5f3ff;margin-bottom:0.5rem;font-size:0.85rem;">
-        <div style="font-size:0.7rem;color:#7c3aed;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Asymétrie d'information</div>
-        {{ ctrl.response_data.contre_arguments_asymetrie | format_cpam_text }}
-      </div>
-      {% endif %}
-
-      {% if ctrl.response_data.contre_arguments_reglementaires %}
-      <div style="border-left:3px solid #6366f1;padding:0.5rem 0.75rem;background:#eef2ff;margin-bottom:0.5rem;font-size:0.85rem;">
-        <div style="font-size:0.7rem;color:#4f46e5;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Contre-arguments réglementaires</div>
-        {{ ctrl.response_data.contre_arguments_reglementaires | format_cpam_text }}
-      </div>
-      {% endif %}
-
-      {% if ctrl.response_data.references %}
-      <div style="border-left:3px solid #64748b;padding:0.5rem 0.75rem;background:#f8fafc;margin-bottom:0.5rem;font-size:0.85rem;">
-        <div style="font-size:0.7rem;color:#475569;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Références</div>
-        {% for ref in ctrl.response_data.references %}
-          {% if ref is mapping %}
-          <blockquote style="margin:0.3rem 0;padding:0.3rem 0.5rem;border-left:2px solid #cbd5e1;background:#f1f5f9;font-size:0.8rem;color:#334155;">
-            <strong>[{{ ref.document or '' }}{% if ref.page %}, p.{{ ref.page }}{% endif %}]</strong>
-            {{ ref.citation or '' }}
-          </blockquote>
-          {% elif ref is string %}
-          <p style="margin:0.2rem 0;font-size:0.8rem;color:#334155;">{{ ref }}</p>
+      {# GHM estimé #}
+      {% if ghm %}
+      <div style="margin-bottom:0.75rem;">
+        <div style="font-size:0.7rem;color:#94a3b8;font-weight:600;">GHM ESTIMÉ</div>
+        <div style="margin-top:0.2rem;display:flex;align-items:center;gap:0.5rem;flex-wrap:wrap;">
+          {% if ghm.ghm_approx %}
+            <code style="font-size:1.1rem;font-weight:700;letter-spacing:0.05em;">{{ ghm.ghm_approx }}</code>
           {% endif %}
-        {% endfor %}
-      </div>
-      {% endif %}
-
-      {% if ctrl.response_data.conclusion %}
-      <div style="border-left:3px solid #f59e0b;padding:0.5rem 0.75rem;background:#fffbeb;margin-bottom:0.5rem;font-size:0.85rem;border:1px solid #fde68a;border-left:3px solid #f59e0b;border-radius:0.25rem;">
-        <div style="font-size:0.7rem;color:#b45309;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Conclusion</div>
-        {{ ctrl.response_data.conclusion | format_cpam_text }}
-      </div>
-      {% endif %}
-    </div>
-    {% elif ctrl.contre_argumentation %}
-    <div style="border-left:3px solid #3b82f6;padding:0.5rem 0.75rem;background:#eff6ff;margin-bottom:0.75rem;font-size:0.85rem;color:#1e3a5f;">
-      <div style="font-size:0.7rem;color:#1d4ed8;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Contre-argumentation</div>
-      <pre style="white-space:pre-wrap;font-family:inherit;margin:0;">{{ ctrl.contre_argumentation }}</pre>
-    </div>
-    {% endif %}
-
-    {# Sources RAG #}
-    {% if ctrl.sources_reponse %}
-    <details>
-      <summary style="font-size:0.8rem;color:#64748b;">Sources RAG ({{ ctrl.sources_reponse|length }})</summary>
-      {% for src in ctrl.sources_reponse %}
-      <pre style="font-size:0.75rem;">{{ src.document }}{% if src.code %} — {{ src.code }}{% endif %}{% if src.page %} [p.{{ src.page }}]{% endif %}
-{{ src.extrait or '' }}</pre>
-      {% endfor %}
-    </details>
-    {% endif %}
-
-    {# Avertissements qualité #}
-    {% if ctrl.quality_warnings %}
-    <details style="margin-top:0.5rem;">
-      <summary style="font-size:0.8rem;color:#9333ea;">Avertissements qualité ({{ ctrl.quality_warnings|length }})</summary>
-      <ul style="margin:0.25rem 0;padding-left:1.2rem;">
-        {% for w in ctrl.quality_warnings %}
-          {% if w.startswith('[CRITIQUE]') %}
-            <li style="color:#dc2626;font-size:0.8rem;">{{ w }}</li>
+          {% if ghm.type_ghm == 'C' %}
+            <span class="badge" style="background:#fee2e2;color:#dc2626;">C — Chirurgical</span>
+          {% elif ghm.type_ghm == 'K' %}
+            <span class="badge" style="background:#fef3c7;color:#92400e;">K — Interventionnel</span>
+          {% elif ghm.type_ghm == 'M' %}
+            <span class="badge" style="background:#dbeafe;color:#1d4ed8;">M — Médical</span>
+          {% endif %}
+          {% if ghm.severite <= 1 %}
+            <span class="badge" style="background:#d1fae5;color:#065f46;">Niv. {{ ghm.severite }}</span>
+          {% elif ghm.severite == 2 %}
+            <span class="badge" style="background:#fef3c7;color:#92400e;">Niv. {{ ghm.severite }}</span>
+          {% elif ghm.severite == 3 %}
+            <span class="badge" style="background:#fed7aa;color:#9a3412;">Niv. {{ ghm.severite }}</span>
           {% else %}
-            <li style="color:#d97706;font-size:0.8rem;">{{ w }}</li>
+            <span class="badge" style="background:#fee2e2;color:#dc2626;">Niv. {{ ghm.severite }}</span>
           {% endif %}
-        {% endfor %}
-      </ul>
-    </details>
+          <span style="font-size:0.75rem;color:#64748b;">{{ ghm.cma_count }} CMA, {{ ghm.cms_count }} CMS</span>
+        </div>
+      </div>
+      {% endif %}
+
+      {# Score de contestabilité #}
+      {% if vr %}
+      <div>
+        <div style="font-size:0.7rem;color:#94a3b8;font-weight:600;">CONTESTABILITÉ</div>
+        {% if vr.verdict == 'PASS' %}{% set vr_color = '#22c55e' %}
+        {% elif vr.verdict == 'NEED_INFO' %}{% set vr_color = '#f59e0b' %}
+        {% else %}{% set vr_color = '#ef4444' %}{% endif %}
+        <div style="margin-top:0.2rem;display:flex;align-items:center;gap:0.5rem;">
+          {% if vr.verdict == 'PASS' %}
+            <span class="badge" style="background:#d1fae5;color:#065f46;font-weight:700;">CONFORME</span>
+          {% elif vr.verdict == 'NEED_INFO' %}
+            <span class="badge" style="background:#fef3c7;color:#92400e;font-weight:700;">À COMPLÉTER</span>
+          {% else %}
+            <span class="badge" style="background:#fee2e2;color:#dc2626;font-weight:700;">NON CONFORME</span>
+          {% endif %}
+          <div style="flex:1;height:6px;background:#e2e8f0;border-radius:3px;max-width:120px;">
+            <div style="width:{{ vr.score_contestabilite }}%;height:100%;background:{{ vr_color }};border-radius:3px;"></div>
+          </div>
+          <span style="font-size:0.8rem;font-weight:600;">{{ vr.score_contestabilite }}/100</span>
+        </div>
+      </div>
+      {% endif %}
+    </div>
+  </div>
+</div>
+
+{# Actions (compact, sous le bandeau) #}
+<div style="display:flex;gap:0.75rem;align-items:center;flex-wrap:wrap;margin-top:0.5rem;padding:0 0.25rem;">
+  <button id="btn-reprocess" onclick="reprocessDossier()" style="padding:0.3rem 0.75rem;border-radius:6px;border:1px solid #cbd5e1;background:#fff;color:#475569;font-size:0.75rem;font-weight:600;cursor:pointer;transition:all 0.15s;">&#8635; Retraiter</button>
+  <span id="reprocess-status" style="font-size:0.7rem;color:#64748b;"></span>
+  <label style="display:inline-flex;align-items:center;gap:0.35rem;font-size:0.75rem;color:#475569;cursor:pointer;padding:0.3rem 0.75rem;border-radius:6px;border:1px solid #cbd5e1;background:#fff;">
+    &#128206; Ajouter un PDF
+    <input type="file" id="upload-file" accept=".pdf" style="display:none;" onchange="uploadDocument()">
+  </label>
+  <span id="upload-status" style="font-size:0.7rem;color:#64748b;"></span>
+</div>
+
+{# ==================================================================== #}
+{# 1b. COMPLÉTUDE DOCUMENTAIRE DIM                                       #}
+{# ==================================================================== #}
+{% set compl = dossier.completude %}
+{% if compl and compl.checks %}
+<div class="card section" style="margin-top:1rem;">
+  <div style="display:flex;align-items:center;gap:1rem;margin-bottom:1rem;flex-wrap:wrap;">
+    <h3 style="margin:0;">Complétude Documentaire DIM</h3>
+    {% if compl.verdict_global == 'defendable' %}
+      <span class="badge" style="background:#d1fae5;color:#065f46;font-weight:700;">DÉFENDABLE</span>
+      {% set compl_color = '#22c55e' %}
+    {% elif compl.verdict_global == 'fragile' %}
+      <span class="badge" style="background:#fef3c7;color:#92400e;font-weight:700;">FRAGILE</span>
+      {% set compl_color = '#f59e0b' %}
+    {% else %}
+      <span class="badge" style="background:#fee2e2;color:#dc2626;font-weight:700;">INDÉFENDABLE</span>
+      {% set compl_color = '#ef4444' %}
     {% endif %}
+    <div style="display:flex;align-items:center;gap:0.5rem;">
+      <div style="flex:none;width:100px;height:6px;background:#e2e8f0;border-radius:3px;">
+        <div style="width:{{ compl.score_global }}%;height:100%;background:{{ compl_color }};border-radius:3px;"></div>
+      </div>
+      <span style="font-size:0.8rem;font-weight:600;">{{ compl.score_global }}/100</span>
+    </div>
+  </div>
+
+  {% if compl.documents_manquants %}
+  <div style="background:#fef2f2;border:1px solid #fecaca;border-radius:6px;padding:0.5rem 0.75rem;margin-bottom:1rem;font-size:0.8rem;">
+    <strong style="color:#dc2626;">Documents manquants :</strong> {{ compl.documents_manquants | join(', ') }}
+  </div>
+  {% endif %}
+
+  {% for check in compl.checks %}
+  <div style="border:1px solid #e2e8f0;border-radius:8px;padding:0.75rem 1rem;margin-bottom:0.5rem;{% if check.verdict == 'indefendable' %}background:#fef2f2;border-color:#fecaca;{% elif check.verdict == 'fragile' %}background:#fffbeb;border-color:#fed7aa;{% else %}background:#f0fdf4;border-color:#bbf7d0;{% endif %}">
+    <div style="display:flex;align-items:center;gap:0.5rem;margin-bottom:0.5rem;flex-wrap:wrap;">
+      <span class="badge" style="background:#dbeafe;color:#1d4ed8;font-weight:700;">{{ check.code }}</span>
+      <span style="font-size:0.85rem;font-weight:600;color:#334155;">{{ check.libelle | truncate(60) }}</span>
+      <span class="badge" style="background:#f1f5f9;color:#64748b;font-size:0.65rem;">{{ check.type_diag }}</span>
+      {% if check.verdict == 'defendable' %}
+        <span style="font-size:0.75rem;color:#16a34a;font-weight:600;">&#10003; {{ check.resume }}</span>
+      {% elif check.verdict == 'fragile' %}
+        <span style="font-size:0.75rem;color:#d97706;font-weight:600;">&#9888; {{ check.resume }}</span>
+      {% else %}
+        <span style="font-size:0.75rem;color:#dc2626;font-weight:600;">&#10007; {{ check.resume }}</span>
+      {% endif %}
+    </div>
+    <div style="display:flex;flex-wrap:wrap;gap:0.35rem;">
+      {% for item in check.items %}
+        {% if item.statut == 'present_confirme' %}
+          <span style="display:inline-flex;align-items:center;gap:0.25rem;background:#065f46;color:#d1fae5;border-radius:4px;padding:0.15rem 0.5rem;font-size:0.75rem;" title="{{ item.confirmation_detail or item.impact_cpam }}">
+            &#10003; {{ item.element }}{% if item.valeur %} <span style="color:#bbf7d0;font-weight:600;">({{ item.valeur | truncate(20) }})</span>{% endif %}
+            {% if item.confirmation_detail %}<span style="font-size:0.6rem;opacity:0.85;"> — confirmé</span>{% endif %}
+          </span>
+        {% elif item.statut == 'present_non_confirme' %}
+          <span style="display:inline-flex;align-items:center;gap:0.25rem;background:#fff7ed;color:#c2410c;border:1px solid #fed7aa;border-radius:4px;padding:0.15rem 0.5rem;font-size:0.75rem;" title="{{ item.confirmation_detail or item.impact_cpam }}">
+            &#9888; {{ item.element }}{% if item.valeur %} <span style="font-weight:600;">({{ item.valeur | truncate(20) }})</span>{% endif %}
+            {% if item.confirmation_detail %}<span style="font-size:0.6rem;"> — seuil non atteint</span>{% endif %}
+          </span>
+        {% elif item.statut == 'present_indirect' %}
+          <span style="display:inline-flex;align-items:center;gap:0.25rem;background:#dbeafe;color:#1e40af;border:1px solid #93c5fd;border-radius:4px;padding:0.15rem 0.5rem;font-size:0.75rem;" title="{{ item.confirmation_detail or item.impact_cpam }}">
+            &#126; {{ item.element }}{% if item.valeur %} <span style="font-weight:600;">({{ item.valeur | truncate(25) }})</span>{% endif %}
+            <span style="font-size:0.6rem;"> — preuve clinique</span>
+          </span>
+        {% elif item.statut == 'present' %}
+          <span style="display:inline-flex;align-items:center;gap:0.25rem;background:#d1fae5;color:#065f46;border-radius:4px;padding:0.15rem 0.5rem;font-size:0.75rem;" title="{{ item.impact_cpam }}">
+            &#10003; {{ item.element }}{% if item.valeur %} <span style="color:#047857;font-weight:600;">({{ item.valeur | truncate(20) }})</span>{% endif %}
+          </span>
+        {% elif item.importance == 'obligatoire' %}
+          <span style="display:inline-flex;align-items:center;gap:0.25rem;background:#fee2e2;color:#dc2626;border-radius:4px;padding:0.15rem 0.5rem;font-size:0.75rem;" title="{{ item.impact_cpam }}">
+            &#10007; {{ item.element }} <span style="font-size:0.65rem;font-weight:600;">(obligatoire)</span>
+          </span>
+        {% else %}
+          <span style="display:inline-flex;align-items:center;gap:0.25rem;background:#fef3c7;color:#92400e;border-radius:4px;padding:0.15rem 0.5rem;font-size:0.75rem;" title="{{ item.impact_cpam }}">
+            &#8212; {{ item.element }} <span style="font-size:0.65rem;">(recommandé)</span>
+          </span>
+        {% endif %}
+      {% endfor %}
+    </div>
   </div>
   {% endfor %}
-</div>
-{% endif %}
 
-{# ---- Contestabilité (VetoReport) ---- #}
-{% if dossier.veto_report %}
-{% set vr = dossier.veto_report %}
-{% if vr.verdict == 'PASS' %}
-  {% set vr_color = '#22c55e' %}
-{% elif vr.verdict == 'NEED_INFO' %}
-  {% set vr_color = '#f59e0b' %}
-{% else %}
-  {% set vr_color = '#ef4444' %}
-{% endif %}
-<div class="card section" style="border-left:4px solid {{ vr_color }};">
-  <h3>Contestabilité du dossier (Qualité PMSI)</h3>
-  <div style="display:flex;align-items:center;gap:1rem;">
-    {% if vr.verdict == 'PASS' %}
-      <span class="badge" style="background:#d1fae5;color:#065f46;font-weight:700;">CONFORME</span>
-    {% elif vr.verdict == 'NEED_INFO' %}
-      <span class="badge" style="background:#fef3c7;color:#92400e;font-weight:700;">À COMPLÉTER</span>
-    {% else %}
-      <span class="badge" style="background:#fee2e2;color:#dc2626;font-weight:700;">NON CONFORME</span>
-    {% endif %}
-    <div style="flex:1;height:8px;background:#e2e8f0;border-radius:4px;">
-      <div style="width:{{ vr.score_contestabilite }}%;height:100%;background:{{ vr_color }};border-radius:4px;"></div>
-    </div>
-    <span style="font-weight:600;">Score : {{ vr.score_contestabilite }}/100</span>
+  {% if compl.documents_presents %}
+  <div style="margin-top:0.5rem;font-size:0.75rem;color:#64748b;">
+    Documents présents : {{ compl.documents_presents | join(', ') }}
   </div>
-  {% if vr.issues %}
-  <details style="margin-top:0.5rem;">
-    <summary style="font-size:0.8rem;color:#64748b;cursor:pointer;">Détail des anomalies détectées ({{ vr.issues|length }})</summary>
-    <table style="margin-top:0.25rem;">
-      <thead><tr><th>Code Règle</th><th>Sévérité</th><th>Localisation</th><th>Message d'alerte</th><th>Référence ATIH</th></tr></thead>
-      <tbody>
-      {% for issue in vr.issues %}
-      <tr>
-        <td><code style="font-size:0.75rem;">{{ issue.veto }}</code></td>
-        <td>
-          {% if issue.severity == 'HARD' %}<span class="badge" style="background:#fee2e2;color:#dc2626;">Bloquant</span>
-          {% elif issue.severity == 'MEDIUM' %}<span class="badge" style="background:#fef3c7;color:#92400e;">À vérifier</span>
-          {% else %}<span class="badge" style="background:#f0fdf4;color:#166534;">Optimisation</span>{% endif %}
-        </td>
-        <td style="font-size:0.75rem;color:#64748b;">{{ issue.where|human_where }}</td>
-        <td style="font-size:0.8rem;">{{ issue.message }}</td>
-        <td style="font-size:0.75rem;color:#475569;font-style:italic;">{{ issue.citation or '—' }}</td>
-      </tr>
-      {% endfor %}
-      </tbody>
-    </table>
-  </details>
   {% endif %}
 </div>
 {% endif %}
 
-{# ---- Diagnostic principal ---- #}
-{% if dossier.diagnostic_principal %}
-{% set dp = dossier.diagnostic_principal %}
-<div class="card section"{% if dp.status == 'ruled_out' %} style="opacity:0.5;"{% endif %}>
-  <h3>Diagnostic principal</h3>
-  <div style="font-size:0.95rem;margin-bottom:0.5rem;">
-    {% if dp.status == 'ruled_out' %}<span style="text-decoration:line-through;">{{ dp.texte }}</span>{% else %}{{ dp.texte }}{% endif %}
-    {% if dp.source_page %}<button class="src-btn" data-texte="{{ dp.texte|e }}" data-excerpt="{{ dp.source_excerpt|default('',true)|e }}" data-page="{{ dp.source_page }}">p.{{ dp.source_page }}</button>{% endif %}
-  </div>
-  {% if dp.cim10_suggestion %}
-    {% if dp.cim10_final and dp.cim10_final != dp.cim10_suggestion %}
-      <span style="text-decoration:line-through;color:#94a3b8;font-size:0.85rem;">{{ dp.cim10_suggestion }}</span>
-      <span style="color:#64748b;">→</span>
-      <span class="badge" style="background:#dbeafe;color:#1d4ed8;font-size:0.85rem;">{{ dp.cim10_final }}</span>
-    {% elif dp.status == 'ruled_out' %}
-      <span style="text-decoration:line-through;color:#94a3b8;font-size:0.85rem;">{{ dp.cim10_suggestion }}</span>
-    {% else %}
-      <span class="badge" style="background:#dbeafe;color:#1d4ed8;font-size:0.85rem;">{{ dp.cim10_suggestion }}</span>
-    {% endif %}
-    {{ dp.cim10_confidence | confidence_badge }}
-    {% if dp.niveau_cma and dp.niveau_cma > 1 %}
-      {{ dp.niveau_cma | cma_level_badge }}
-    {% elif dp.est_cma %}
-      <span class="badge" style="background:#fee2e2;color:#dc2626;font-size:0.75rem;">CMA</span>
-    {% endif %}
-    {{ dp.niveau_severite | severity_badge }}
-    {% if dp.cim10_decision and dp.cim10_decision.action != 'KEEP' %}
+{# ==================================================================== #}
+{# 2. DAS + ACTES CCAM                                                  #}
+{# ==================================================================== #}
+
+{# ---- Diagnostic principal (détail) ---- #}
+{% set dp_has_detail = dp and (dp.justification or dp.preuves_cliniques or dp.raisonnement or dp.sources_rag or (dp.cim10_decision and dp.cim10_decision.action != 'KEEP') or dp.status == 'ruled_out') %}
+{% if dp_has_detail %}
+<div class="card section" style="margin-top:1rem;{% if dp.status == 'ruled_out' %}opacity:0.5;{% endif %}">
+  <h3>Diagnostic principal — Détail</h3>
+  {% if dp.status == 'ruled_out' and dp.ruled_out_reason %}
+    <div style="font-size:0.75rem;color:#dc2626;margin-bottom:0.25rem;">{{ dp.ruled_out_reason }}</div>
+  {% endif %}
+  {% if dp.cim10_decision and dp.cim10_decision.action != 'KEEP' %}
+    <div style="margin-bottom:0.25rem;">
       {{ dp.cim10_decision | decision_badge }}
       {% for rule in dp.cim10_decision.applied_rules %}
         <span class="badge" style="background:#f1f5f9;color:#64748b;font-size:0.65rem;">{{ rule }}</span>
       {% endfor %}
-    {% endif %}
-  {% endif %}
-  {% if dp.status == 'ruled_out' and dp.ruled_out_reason %}
-    <div style="font-size:0.75rem;color:#dc2626;margin-top:0.25rem;">{{ dp.ruled_out_reason }}</div>
-  {% endif %}
-  {% if dp.cim10_decision and dp.cim10_decision.action != 'KEEP' and dp.cim10_decision.reason %}
-    <div style="font-size:0.75rem;color:#64748b;margin-top:0.25rem;">{{ dp.cim10_decision.reason }}</div>
+      {% if dp.cim10_decision.reason %}
+        <div style="font-size:0.75rem;color:#64748b;margin-top:0.15rem;">{{ dp.cim10_decision.reason }}</div>
+      {% endif %}
+    </div>
   {% endif %}
   {% if dp.justification %}
-    <div style="margin-top:0.5rem;font-size:0.8rem;color:#475569;">{{ dp.justification }}</div>
+    <div style="font-size:0.8rem;color:#475569;margin-bottom:0.5rem;">{{ dp.justification }}</div>
   {% endif %}
   {% if dp.preuves_cliniques %}
-  <details style="margin-top:0.5rem;">
+  <details>
     <summary style="font-size:0.8rem;color:#0369a1;cursor:pointer;font-weight:600;">Preuves cliniques ({{ dp.preuves_cliniques|length }})</summary>
     <ul style="margin:0.25rem 0 0 0;padding-left:1.2rem;font-size:0.8rem;">
     {% for p in dp.preuves_cliniques %}
@@ -478,6 +281,11 @@
   </details>
   {% endif %}
 </div>
+{% elif dp and not dp_has_detail and dp.source == 'trackare' %}
+<div class="card section" style="margin-top:1rem;">
+  <h3>Diagnostic principal — Détail</h3>
+  <div style="font-size:0.8rem;color:#64748b;font-style:italic;">Codage issu de Trackare — pas de détail IA disponible.</div>
+</div>
 {% endif %}
 
 {# ---- Diagnostics associés ---- #}
@@ -485,11 +293,10 @@
 <div class="card section">
   <h3>Diagnostics associés ({{ dossier.diagnostics_associes|length }})</h3>
   <table>
-    <thead><tr><th>Texte</th><th>CIM-10</th><th>Confiance</th><th>CMA</th><th>Source</th><th>Justification</th></tr></thead>
+    <thead><tr><th>Code CIM-10</th><th>Libellé</th><th>CMA</th><th>Confiance</th><th>Source</th></tr></thead>
     <tbody>
     {% for das in dossier.diagnostics_associes %}
       <tr{% if das.status == 'ruled_out' %} style="opacity:0.5;text-decoration:line-through;"{% endif %}>
-        <td>{{ das.texte }}</td>
         <td>
           {% if das.cim10_suggestion %}
             {% if das.cim10_final and das.cim10_final != das.cim10_suggestion %}
@@ -525,26 +332,11 @@
             {% endif %}
           {% endif %}
         </td>
-        <td>{{ das.cim10_confidence | confidence_badge }}</td>
         <td>
-          {% if das.niveau_cma and das.niveau_cma > 1 %}
-            {{ das.niveau_cma | cma_level_badge }}
-          {% elif das.est_cma %}
-            <span class="badge" style="background:#fee2e2;color:#dc2626;font-size:0.7rem;">CMA</span>
-          {% else %}
-            —
+          {{ das.texte }}
+          {% if das.justification %}
+            <div style="font-size:0.75rem;color:#64748b;margin-top:0.15rem;">{{ das.justification }}</div>
           {% endif %}
-        </td>
-        <td>
-          {% if das.source %}
-            <span class="badge" style="background:#e0e7ff;color:#3730a3;font-size:0.7rem;">{{ das.source }}</span>
-          {% endif %}
-          {% if das.source_page %}
-            <button class="src-btn" data-texte="{{ das.texte|e }}" data-excerpt="{{ das.source_excerpt|default('',true)|e }}" data-page="{{ das.source_page }}">p.{{ das.source_page }}</button>
-          {% endif %}
-        </td>
-        <td style="font-size:0.8rem;color:#475569;">
-          {{ das.justification or '' }}
           {% if das.preuves_cliniques %}
           <details style="margin-top:0.3rem;"><summary style="font-size:0.7rem;color:#0369a1;cursor:pointer;">preuves ({{ das.preuves_cliniques|length }})</summary>
             <ul style="margin:0.15rem 0 0 0;padding-left:1rem;font-size:0.75rem;">
@@ -555,43 +347,41 @@
           </details>
           {% endif %}
         </td>
+        <td>
+          {% if das.niveau_cma and das.niveau_cma > 1 %}
+            {{ das.niveau_cma | cma_level_badge }}
+          {% elif das.est_cma %}
+            <span class="badge" style="background:#fee2e2;color:#dc2626;font-size:0.7rem;">CMA</span>
+          {% else %}
+            —
+          {% endif %}
+        </td>
+        <td>{{ das.cim10_confidence | confidence_badge }}</td>
+        <td>
+          {% if das.source %}
+            <span class="badge" style="background:#e0e7ff;color:#3730a3;font-size:0.7rem;">{{ das.source }}</span>
+          {% endif %}
+          {% if das.source_page %}
+            <button class="src-btn" data-texte="{{ das.texte|e }}" data-excerpt="{{ das.source_excerpt|default('',true)|e }}" data-page="{{ das.source_page }}">p.{{ das.source_page }}</button>
+          {% endif %}
+        </td>
       </tr>
       {% if das.status == 'ruled_out' and das.ruled_out_reason %}
-      <tr>
-        <td colspan="6" style="padding:0 0.75rem 0.3rem;">
-          <div style="font-size:0.75rem;color:#dc2626;">{{ das.ruled_out_reason }}</div>
-        </td>
-      </tr>
+      <tr><td colspan="5" style="padding:0 0.75rem 0.3rem;"><div style="font-size:0.75rem;color:#dc2626;">{{ das.ruled_out_reason }}</div></td></tr>
       {% endif %}
       {% if das.cim10_decision and das.cim10_decision.action != 'KEEP' and das.cim10_decision.reason and das.status != 'ruled_out' %}
-      <tr>
-        <td colspan="6" style="padding:0 0.75rem 0.3rem;">
-          <div style="font-size:0.75rem;color:#64748b;">{{ das.cim10_decision.reason }}</div>
-        </td>
-      </tr>
+      <tr><td colspan="5" style="padding:0 0.75rem 0.3rem;"><div style="font-size:0.75rem;color:#64748b;">{{ das.cim10_decision.reason }}</div></td></tr>
       {% endif %}
       {% if das.raisonnement %}
-      <tr>
-        <td colspan="6" style="padding:0 0.75rem 0.5rem;">
-          <details>
-            <summary>Raisonnement LLM</summary>
-            <pre>{{ das.raisonnement }}</pre>
-          </details>
-        </td>
-      </tr>
+      <tr><td colspan="5" style="padding:0 0.75rem 0.5rem;"><details><summary>Raisonnement LLM</summary><pre>{{ das.raisonnement }}</pre></details></td></tr>
       {% endif %}
       {% if das.sources_rag %}
-      <tr>
-        <td colspan="6" style="padding:0 0.75rem 0.5rem;">
-          <details>
-            <summary>Sources RAG ({{ das.sources_rag|length }})</summary>
-            {% for src in das.sources_rag %}
-            <pre>{{ src.document }}{% if src.code %} — {{ src.code }}{% endif %}{% if src.page %} [p.{{ src.page }}]{% endif %}
-{{ src.extrait or '' }}</pre>
-            {% endfor %}
-          </details>
-        </td>
-      </tr>
+      <tr><td colspan="5" style="padding:0 0.75rem 0.5rem;">
+        <details><summary>Sources RAG ({{ das.sources_rag|length }})</summary>
+        {% for src in das.sources_rag %}<pre>{{ src.document }}{% if src.code %} — {{ src.code }}{% endif %}{% if src.page %} [p.{{ src.page }}]{% endif %}
+{{ src.extrait or '' }}</pre>{% endfor %}
+        </details>
+      </td></tr>
       {% endif %}
     {% endfor %}
     </tbody>
@@ -604,27 +394,23 @@
 <div class="card section">
   <h3>Actes CCAM ({{ dossier.actes_ccam|length }})</h3>
   <table>
-    <thead><tr><th>Texte</th><th>Code CCAM</th><th>Regroupement</th><th>Date</th><th>Validité</th><th>Source</th></tr></thead>
+    <thead><tr><th>Code CCAM</th><th>Libellé</th><th>Regroupement</th><th>Date</th><th>Validité</th><th>Source</th></tr></thead>
     <tbody>
     {% for a in dossier.actes_ccam %}
       <tr>
-        <td>{{ a.texte }}</td>
         <td>{% if a.code_ccam_suggestion %}<span class="badge" style="background:#e0e7ff;color:#3730a3;">{{ a.code_ccam_suggestion }}</span>{% endif %}</td>
+        <td>{{ a.texte }}</td>
         <td>
           {% if a.code_ccam_suggestion and ccam_dict.get(a.code_ccam_suggestion, {}).get('regroupement') %}
             <span class="badge badge-regroup">{{ ccam_dict[a.code_ccam_suggestion]['regroupement'] }}</span>
-          {% else %}
-            —
-          {% endif %}
+          {% else %}—{% endif %}
         </td>
         <td>{{ a.date or '' }}</td>
         <td>
           {% if a.validite == 'valide' %}<span class="badge" style="background:#d1fae5;color:#065f46;">Valide</span>
           {% elif a.validite == 'obsolete' %}<span class="badge" style="background:#fee2e2;color:#dc2626;">Obsolète</span>
           {% else %}—{% endif %}
-          {% for alerte in a.alertes %}
-            <div style="font-size:0.7rem;color:#dc2626;">{{ alerte }}</div>
-          {% endfor %}
+          {% for alerte in a.alertes %}<div style="font-size:0.7rem;color:#dc2626;">{{ alerte }}</div>{% endfor %}
         </td>
         <td>{% if a.source_page %}<button class="src-btn" data-texte="{{ a.texte|e }}" data-excerpt="{{ a.source_excerpt|default('',true)|e }}" data-page="{{ a.source_page }}">p.{{ a.source_page }}</button>{% endif %}</td>
       </tr>
@@ -634,10 +420,322 @@
 </div>
 {% endif %}
 
+{# ==================================================================== #}
+{# 3. CONTRÔLE QUALITÉ CODAGE (section repliable)                       #}
+{# ==================================================================== #}
+<details open class="card section" style="margin-top:1rem;">
+  <summary><h3 style="display:inline;">Contrôle Qualité Codage</h3></summary>
+
+  <div style="display:grid;grid-template-columns:repeat(auto-fit,minmax(300px,1fr));gap:1rem;margin-top:0.75rem;">
+
+    {# Anomalies de codage #}
+    <div style="border-top:4px solid #ef4444;background:#fff1f2;border-radius:8px;padding:1rem;">
+      <h3 style="color:#991b1b;font-size:0.9rem;margin-bottom:0.75rem;">Anomalies de codage</h3>
+      <div style="font-size:0.85rem;color:#7f1d1d;">
+        {% if dossier.veto_report and dossier.veto_report.issues %}
+          {% for issue in dossier.veto_report.issues if issue.severity in ['HARD', 'MEDIUM'] %}
+            <div style="margin-bottom:0.5rem;border-bottom:1px solid #fecaca;padding-bottom:0.25rem;">
+              <strong>[{{ issue.severity|replace('HARD', 'Bloquant')|replace('MEDIUM', 'À vérifier') }}]</strong> {{ issue.message }}
+              {% if issue.citation %}<br><em style="font-size:0.75rem;opacity:0.8;">ATIH: {{ issue.citation }}</em>{% endif %}
+            </div>
+          {% endfor %}
+        {% else %}
+          <div style="color:#059669;font-weight:600;">Aucune anomalie majeure détectée.</div>
+        {% endif %}
+      </div>
+    </div>
+
+    {# Valorisation CMA #}
+    <div style="border-top:4px solid #10b981;background:#ecfdf5;border-radius:8px;padding:1rem;">
+      <h3 style="color:#065f46;font-size:0.9rem;margin-bottom:0.75rem;">Valorisation (CMA)</h3>
+      <div style="font-size:0.85rem;color:#064e3b;">
+        {% set cma_alerts = [] %}
+        {% for alerte in dossier.alertes_codage if alerte.startswith('CMA') %}{% set _ = cma_alerts.append(alerte) %}{% endfor %}
+        {% if cma_alerts %}
+          <ul style="margin:0;padding-left:1.2rem;">
+            {% for alerte in cma_alerts %}<li style="margin-bottom:0.25rem;">{{ alerte }}</li>{% endfor %}
+          </ul>
+        {% else %}
+          <div style="opacity:0.7;">Aucune comorbidité (CMA) détectée.</div>
+        {% endif %}
+      </div>
+    </div>
+
+    {# Audit IA (QC) #}
+    <div style="border-top:4px solid #3b82f6;background:#eff6ff;border-radius:8px;padding:1rem;">
+      <h3 style="color:#1e40af;font-size:0.9rem;margin-bottom:0.75rem;">Audit de l'Expert IA</h3>
+      <div style="font-size:0.85rem;color:#1e3a8a;">
+        {% set qc_alerts = [] %}
+        {% for alerte in dossier.alertes_codage if alerte.startswith('QC:') %}{% set _ = qc_alerts.append(alerte) %}{% endfor %}
+        {% if qc_alerts %}
+          {% for alerte in qc_alerts | sort_qc_alerts %}
+            <div style="margin-bottom:0.5rem;border-bottom:1px solid #bfdbfe;padding-bottom:0.25rem;font-style:italic;">
+              {{ alerte|replace('QC: ', '') }}
+            </div>
+          {% endfor %}
+        {% else %}
+          <div style="opacity:0.7;">Aucune recommandation particulière.</div>
+        {% endif %}
+      </div>
+    </div>
+  </div>
+
+  {# Détail Contestabilité (VetoReport) #}
+  {% if vr and vr.issues %}
+  <details style="margin-top:0.75rem;">
+    <summary style="font-size:0.8rem;color:#64748b;cursor:pointer;">Détail des contrôles qualité ({{ vr.issues|length }})</summary>
+    <table style="margin-top:0.25rem;">
+      <thead><tr><th>Règle</th><th>Sévérité</th><th>Localisation</th><th>Message d'alerte</th><th>Source / Référence</th></tr></thead>
+      <tbody>
+      {% for issue in vr.issues %}
+      <tr>
+        <td><code style="font-size:0.75rem;">{{ issue.veto }}</code></td>
+        <td>
+          {% if issue.severity == 'HARD' %}<span class="badge" style="background:#fee2e2;color:#dc2626;">Bloquant</span>
+          {% elif issue.severity == 'MEDIUM' %}<span class="badge" style="background:#fef3c7;color:#92400e;">À vérifier</span>
+          {% else %}<span class="badge" style="background:#f0fdf4;color:#166534;">Optimisation</span>{% endif %}
+        </td>
+        <td style="font-size:0.75rem;color:#64748b;">{{ issue.where|human_where }}</td>
+        <td style="font-size:0.8rem;">{{ issue.message }}</td>
+        <td style="font-size:0.75rem;color:#475569;font-style:italic;">{{ issue.citation or '—' }}</td>
+      </tr>
+      {% endfor %}
+      </tbody>
+    </table>
+  </details>
+  {% endif %}
+
+  {# GHM alertes #}
+  {% if ghm and ghm.alertes %}
+  <div style="margin-top:0.75rem;">
+    {% for alerte in ghm.alertes %}
+      <div style="font-size:0.8rem;color:#c2410c;margin-bottom:0.2rem;">{{ alerte }}</div>
+    {% endfor %}
+  </div>
+  {% endif %}
+
+</details>
+
+{# ==================================================================== #}
+{# 4. CONTRÔLE CPAM (si applicable)                                      #}
+{# ==================================================================== #}
+{% if dossier.controles_cpam %}
+<div class="card section" style="border-left:4px solid #f59e0b;">
+  <h3 style="color:#b45309;">Contrôle UCR ({{ dossier.controles_cpam|length }})</h3>
+  {% if dossier_strength and dossier_strength.is_weak %}
+  <div style="background:#fff7ed;border:1px solid #fed7aa;padding:0.5rem 0.75rem;border-radius:4px;margin-bottom:0.75rem;font-size:0.85rem;color:#9a3412;">
+    Dossier à preuves limitées (score {{ dossier_strength.score }}/10) — manque : {{ dossier_strength.missing|join(', ') }}
+  </div>
+  {% endif %}
+  {% for ctrl in dossier.controles_cpam %}
+  <div style="margin-bottom:1.5rem;{% if not loop.last %}border-bottom:1px solid #e2e8f0;padding-bottom:1rem;{% endif %}">
+    <div style="display:flex;align-items:center;gap:0.5rem;margin-bottom:0.5rem;flex-wrap:wrap;">
+      <strong>OGC {{ ctrl.numero_ogc }} — {{ ctrl.titre }}</strong>
+      {% if 'retient' in ctrl.decision_ucr|lower %}
+        <span class="badge" style="background:#d1fae5;color:#065f46;">{{ ctrl.decision_ucr }}</span>
+      {% elif 'confirme' in ctrl.decision_ucr|lower %}
+        <span class="badge" style="background:#fee2e2;color:#dc2626;">{{ ctrl.decision_ucr }}</span>
+      {% else %}
+        <span class="badge" style="background:#e0e7ff;color:#3730a3;">{{ ctrl.decision_ucr }}</span>
+      {% endif %}
+      {% if ctrl.quality_tier == 'A' %}
+        <span class="badge" style="background:#2ecc71;color:#fff;font-weight:700;">Qualité A</span>
+      {% elif ctrl.quality_tier == 'B' %}
+        <span class="badge" style="background:#f39c12;color:#fff;font-weight:700;">Qualité B</span>
+      {% elif ctrl.quality_tier == 'C' %}
+        <span class="badge" style="background:#e74c3c;color:#fff;font-weight:700;">Qualité C</span>
+      {% endif %}
+    </div>
+
+    {% if ctrl.arg_ucr %}
+    <div style="border-left:3px solid #f59e0b;padding:0.5rem 0.75rem;background:#fffbeb;margin-bottom:0.75rem;font-size:0.85rem;color:#78350f;">
+      <div style="font-size:0.7rem;color:#92400e;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Argument UCR</div>
+      {{ ctrl.arg_ucr }}
+    </div>
+    {% endif %}
+
+    {% if ctrl.dp_ucr or ctrl.da_ucr or ctrl.dr_ucr or ctrl.actes_ucr %}
+    <div style="margin-bottom:0.75rem;">
+      <div style="font-size:0.7rem;color:#64748b;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Codes contestés</div>
+      <div style="display:flex;gap:0.5rem;flex-wrap:wrap;">
+        {% if ctrl.dp_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">DP: {{ ctrl.dp_ucr }}</span>{% endif %}
+        {% if ctrl.da_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">DA: {{ ctrl.da_ucr }}</span>{% endif %}
+        {% if ctrl.dr_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">DR: {{ ctrl.dr_ucr }}</span>{% endif %}
+        {% if ctrl.actes_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">Actes: {{ ctrl.actes_ucr }}</span>{% endif %}
+      </div>
+    </div>
+    {% endif %}
+
+    {% if ctrl.requires_review %}
+    <div style="background:#fee2e2;border:1px solid #fca5a5;padding:0.5rem 0.75rem;border-radius:4px;margin-bottom:0.75rem;font-size:0.85rem;color:#991b1b;">
+      Revue manuelle requise — la contre-argumentation contient des incohérences détectées
+    </div>
+    {% endif %}
+
+    {% if ctrl.response_data %}
+    <div style="margin-bottom:0.75rem;">
+      <div style="font-size:0.7rem;color:#1d4ed8;text-transform:uppercase;font-weight:600;margin-bottom:0.5rem;">Contre-argumentation</div>
+      {% if ctrl.response_data.analyse_contestation %}
+      <div style="border-left:3px solid #94a3b8;padding:0.5rem 0.75rem;background:#f8fafc;margin-bottom:0.5rem;font-size:0.85rem;">
+        <div style="font-size:0.7rem;color:#64748b;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Analyse de la contestation</div>
+        {{ ctrl.response_data.analyse_contestation | format_cpam_text }}
+      </div>
+      {% endif %}
+      {% if ctrl.response_data.points_accord and ctrl.response_data.points_accord|lower not in ['aucun', 'non applicable', 'n/a', ''] %}
+      <div style="border-left:3px solid #22c55e;padding:0.5rem 0.75rem;background:#f0fdf4;margin-bottom:0.5rem;font-size:0.85rem;">
+        <div style="font-size:0.7rem;color:#16a34a;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Points d'accord</div>
+        {{ ctrl.response_data.points_accord | format_cpam_text }}
+      </div>
+      {% endif %}
+      {% if ctrl.response_data.contre_arguments_medicaux %}
+      <div style="border-left:3px solid #3b82f6;padding:0.5rem 0.75rem;background:#eff6ff;margin-bottom:0.5rem;font-size:0.85rem;">
+        <div style="font-size:0.7rem;color:#1d4ed8;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Contre-arguments médicaux</div>
+        {{ ctrl.response_data.contre_arguments_medicaux | format_cpam_text }}
+      </div>
+      {% endif %}
+      {% if ctrl.response_data.preuves_dossier %}
+      <div style="border-left:3px solid #0ea5e9;padding:0.5rem 0.75rem;background:#f0f9ff;margin-bottom:0.5rem;font-size:0.85rem;">
+        <div style="font-size:0.7rem;color:#0369a1;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Preuves du dossier</div>
+        <ul style="margin:0.3rem 0;padding-left:1.2rem;">
+        {% for p in ctrl.response_data.preuves_dossier %}
+          {% if p is mapping %}
+          <li style="margin-bottom:0.3rem;">
+            <span style="display:inline-block;padding:1px 6px;border-radius:9999px;font-size:0.7rem;font-weight:600;background:#e0f2fe;color:#0369a1;">{{ p.element or p.get('type', '') }}</span>
+            {{ p.valeur or '' }} <span style="color:#64748b;">&rarr; {{ p.signification or '' }}</span>
+          </li>
+          {% endif %}
+        {% endfor %}
+        </ul>
+      </div>
+      {% endif %}
+      {% if ctrl.response_data.contre_arguments_asymetrie %}
+      <div style="border-left:3px solid #8b5cf6;padding:0.5rem 0.75rem;background:#f5f3ff;margin-bottom:0.5rem;font-size:0.85rem;">
+        <div style="font-size:0.7rem;color:#7c3aed;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Asymétrie d'information</div>
+        {{ ctrl.response_data.contre_arguments_asymetrie | format_cpam_text }}
+      </div>
+      {% endif %}
+      {% if ctrl.response_data.contre_arguments_reglementaires %}
+      <div style="border-left:3px solid #6366f1;padding:0.5rem 0.75rem;background:#eef2ff;margin-bottom:0.5rem;font-size:0.85rem;">
+        <div style="font-size:0.7rem;color:#4f46e5;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Contre-arguments réglementaires</div>
+        {{ ctrl.response_data.contre_arguments_reglementaires | format_cpam_text }}
+      </div>
+      {% endif %}
+      {% if ctrl.response_data.references %}
+      <div style="border-left:3px solid #64748b;padding:0.5rem 0.75rem;background:#f8fafc;margin-bottom:0.5rem;font-size:0.85rem;">
+        <div style="font-size:0.7rem;color:#475569;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Références</div>
+        {% for ref in ctrl.response_data.references %}
+          {% if ref is mapping %}
+          <blockquote style="margin:0.3rem 0;padding:0.3rem 0.5rem;border-left:2px solid #cbd5e1;background:#f1f5f9;font-size:0.8rem;color:#334155;">
+            <strong>[{{ ref.document or '' }}{% if ref.page %}, p.{{ ref.page }}{% endif %}]</strong>
+            {{ ref.citation or '' }}
+          </blockquote>
+          {% elif ref is string %}
+          <p style="margin:0.2rem 0;font-size:0.8rem;color:#334155;">{{ ref }}</p>
+          {% endif %}
+        {% endfor %}
+      </div>
+      {% endif %}
+      {% if ctrl.response_data.conclusion %}
+      <div style="border-left:3px solid #f59e0b;padding:0.5rem 0.75rem;background:#fffbeb;margin-bottom:0.5rem;font-size:0.85rem;border:1px solid #fde68a;border-left:3px solid #f59e0b;border-radius:0.25rem;">
+        <div style="font-size:0.7rem;color:#b45309;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Conclusion</div>
+        {{ ctrl.response_data.conclusion | format_cpam_text }}
+      </div>
+      {% endif %}
+    </div>
+    {% elif ctrl.contre_argumentation %}
+    <div style="border-left:3px solid #3b82f6;padding:0.5rem 0.75rem;background:#eff6ff;margin-bottom:0.75rem;font-size:0.85rem;color:#1e3a5f;">
+      <div style="font-size:0.7rem;color:#1d4ed8;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Contre-argumentation</div>
+      <pre style="white-space:pre-wrap;font-family:inherit;margin:0;">{{ ctrl.contre_argumentation }}</pre>
+    </div>
+    {% endif %}
+
+    {% if ctrl.sources_reponse %}
+    <details>
+      <summary style="font-size:0.8rem;color:#64748b;">Sources RAG ({{ ctrl.sources_reponse|length }})</summary>
+      {% for src in ctrl.sources_reponse %}
+      <pre style="font-size:0.75rem;">{{ src.document }}{% if src.code %} — {{ src.code }}{% endif %}{% if src.page %} [p.{{ src.page }}]{% endif %}
+{{ src.extrait or '' }}</pre>
+      {% endfor %}
+    </details>
+    {% endif %}
+
+    {% if ctrl.quality_warnings %}
+    <details style="margin-top:0.5rem;">
+      <summary style="font-size:0.8rem;color:#9333ea;">Avertissements qualité ({{ ctrl.quality_warnings|length }})</summary>
+      <ul style="margin:0.25rem 0;padding-left:1.2rem;">
+        {% for w in ctrl.quality_warnings %}
+          {% if w.startswith('[CRITIQUE]') %}
+            <li style="color:#dc2626;font-size:0.8rem;">{{ w }}</li>
+          {% else %}
+            <li style="color:#d97706;font-size:0.8rem;">{{ w }}</li>
+          {% endif %}
+        {% endfor %}
+      </ul>
+    </details>
+    {% endif %}
+
+    <div class="cpam-deadline-block" style="margin-top:0.75rem;padding:0.75rem;background:#f8fafc;border:1px solid #e2e8f0;border-radius:6px;"
+         data-filepath="{{ filepath }}" data-ogc="{{ ctrl.numero_ogc }}">
+      <div style="font-size:0.7rem;color:#64748b;text-transform:uppercase;font-weight:600;margin-bottom:0.5rem;">Délai réglementaire</div>
+      <div style="display:flex;align-items:center;gap:0.75rem;flex-wrap:wrap;">
+        <label style="font-size:0.8rem;color:#475569;font-weight:600;">Date notification :</label>
+        <input type="date" class="cpam-date-notif"
+               value="{{ ctrl.date_notification | date_to_iso if ctrl.date_notification else '' }}"
+               style="padding:0.35rem 0.5rem;border:1px solid #cbd5e1;border-radius:4px;font-size:0.8rem;">
+        <button onclick="setCpamDeadline(this)"
+                style="padding:0.35rem 0.75rem;border-radius:6px;border:none;background:#3b82f6;color:#fff;font-size:0.8rem;font-weight:600;cursor:pointer;">
+          Enregistrer
+        </button>
+        <span class="cpam-deadline-status" style="font-size:0.75rem;color:#64748b;">
+          {% if ctrl.date_limite_reponse %}Limite : {{ ctrl.date_limite_reponse }}{% endif %}
+        </span>
+      </div>
+    </div>
+
+    <div class="cpam-validation" style="margin-top:0.75rem;padding:0.75rem;background:#f8fafc;border:1px solid #e2e8f0;border-radius:6px;" data-filepath="{{ filepath }}" data-ogc="{{ ctrl.numero_ogc }}">
+      <div style="font-size:0.7rem;color:#64748b;text-transform:uppercase;font-weight:600;margin-bottom:0.5rem;">Validation DIM</div>
+      <div style="display:flex;align-items:center;gap:0.5rem;flex-wrap:wrap;margin-bottom:0.5rem;">
+        <span class="cpam-val-status">
+          {% if ctrl.validation_dim == 'valide' %}
+            <span class="badge" style="background:#d1fae5;color:#065f46;font-weight:700;">Validé</span>
+          {% elif ctrl.validation_dim == 'rejete' %}
+            <span class="badge" style="background:#fee2e2;color:#dc2626;font-weight:700;">Rejeté</span>
+          {% elif ctrl.validation_dim == 'en_revision' %}
+            <span class="badge" style="background:#fef3c7;color:#b45309;font-weight:700;">En révision</span>
+          {% else %}
+            <span class="badge" style="background:#f1f5f9;color:#64748b;">Non validé</span>
+          {% endif %}
+        </span>
+        {% if ctrl.date_validation %}
+          <span style="font-size:0.75rem;color:#94a3b8;">{{ ctrl.date_validation }}</span>
+        {% endif %}
+      </div>
+      <div style="display:flex;gap:0.5rem;flex-wrap:wrap;margin-bottom:0.5rem;">
+        <button onclick="validateCpam(this, 'valide')" style="padding:0.35rem 0.75rem;border-radius:6px;border:none;background:#16a34a;color:#fff;font-size:0.8rem;font-weight:600;cursor:pointer;">Valider</button>
+        <button onclick="validateCpam(this, 'en_revision')" style="padding:0.35rem 0.75rem;border-radius:6px;border:none;background:#f59e0b;color:#fff;font-size:0.8rem;font-weight:600;cursor:pointer;">En révision</button>
+        <button onclick="validateCpam(this, 'rejete')" style="padding:0.35rem 0.75rem;border-radius:6px;border:none;background:#dc2626;color:#fff;font-size:0.8rem;font-weight:600;cursor:pointer;">Rejeter</button>
+      </div>
+      <textarea class="cpam-val-comment" rows="2" placeholder="Commentaire DIM (optionnel)" style="width:100%;padding:0.4rem;border:1px solid #cbd5e1;border-radius:4px;font-size:0.8rem;resize:vertical;">{{ ctrl.commentaire_dim or '' }}</textarea>
+      <details style="margin-top:0.5rem;">
+        <summary style="font-size:0.75rem;color:#64748b;cursor:pointer;">Versions précédentes</summary>
+        <div class="cpam-versions-list" data-filepath="{{ filepath }}" data-ogc="{{ ctrl.numero_ogc }}" style="margin-top:0.25rem;font-size:0.8rem;color:#475569;">
+          <em>Chargement...</em>
+        </div>
+      </details>
+    </div>
+  </div>
+  {% endfor %}
+</div>
+{% endif %}
+
+{# ==================================================================== #}
+{# Sections complémentaires (repliables)                                 #}
+{# ==================================================================== #}
+
 {# ---- Biologie clé ---- #}
 {% if dossier.biologie_cle %}
-<div class="card section">
-  <h3>Biologie clé ({{ dossier.biologie_cle|length }})</h3>
+<details class="card section">
+  <summary><h3 style="display:inline;">Biologie clé ({{ dossier.biologie_cle|length }})</h3></summary>
   <table>
     <thead><tr><th>Test</th><th>Valeur</th><th>Anomalie</th><th>Source</th></tr></thead>
     <tbody>
@@ -647,12 +745,21 @@
         <td>{{ b.valeur or '' }}</td>
         <td>
           {% if b.quality == 'suspect' %}
-            <span class="badge" style="background:#fef3c7;color:#92400e;" title="{{ b.discard_reason or '' }}">⚠ Suspect</span>
+            <span class="badge" style="background:#fef3c7;color:#92400e;" title="{{ b.discard_reason or '' }}">Suspect</span>
           {% elif b.anomalie %}
             <span class="badge" style="background:#fee2e2;color:#dc2626;">Oui</span>
-          {% else %}
-            —
-          {% endif %}
+            {% if b.test in bio_normals and b.valeur_num is not none %}
+              {% set lo, hi = bio_normals[b.test] %}
+              {% if b.valeur_num > hi %}
+                <span style="font-size:0.7rem;color:#dc2626;"> &#8593; {{ b.valeur }} &gt; {{ hi }} <span style="color:#64748b;">(N: {{ lo }}–{{ hi }})</span></span>
+              {% elif b.valeur_num < lo %}
+                <span style="font-size:0.7rem;color:#dc2626;"> &#8595; {{ b.valeur }} &lt; {{ lo }} <span style="color:#64748b;">(N: {{ lo }}–{{ hi }})</span></span>
+              {% endif %}
+            {% elif b.test in bio_normals %}
+              {% set lo, hi = bio_normals[b.test] %}
+              <span style="font-size:0.7rem;color:#64748b;"> (N: {{ lo }}–{{ hi }})</span>
+            {% endif %}
+          {% else %}—{% endif %}
         </td>
         <td>{% if b.source_page %}<button class="src-btn" data-texte="{{ b.test|e }}" data-excerpt="{{ b.source_excerpt|default('',true)|e }}" data-page="{{ b.source_page }}">p.{{ b.source_page }}</button>{% endif %}</td>
       </tr>
@@ -672,30 +779,28 @@
     </table>
   </details>
   {% endif %}
-</div>
+</details>
 {% endif %}
 
 {# ---- Imagerie ---- #}
 {% if dossier.imagerie %}
-<div class="card section">
-  <h3>Imagerie ({{ dossier.imagerie|length }})</h3>
+<details class="card section">
+  <summary><h3 style="display:inline;">Imagerie ({{ dossier.imagerie|length }})</h3></summary>
   {% for img in dossier.imagerie %}
   <div style="margin-bottom:0.5rem;">
     <strong>{{ img.type }}</strong>
     {% if img.score %} — Score : {{ img.score }}{% endif %}
     {% if img.source_page %}<button class="src-btn" data-texte="{{ img.type|e }}" data-excerpt="{{ img.source_excerpt|default('',true)|e }}" data-page="{{ img.source_page }}">p.{{ img.source_page }}</button>{% endif %}
-    {% if img.conclusion %}
-      <div style="font-size:0.85rem;color:#475569;">{{ img.conclusion }}</div>
-    {% endif %}
+    {% if img.conclusion %}<div style="font-size:0.85rem;color:#475569;">{{ img.conclusion }}</div>{% endif %}
   </div>
   {% endfor %}
-</div>
+</details>
 {% endif %}
 
 {# ---- Traitements de sortie ---- #}
 {% if dossier.traitements_sortie %}
-<div class="card section">
-  <h3>Traitements de sortie ({{ dossier.traitements_sortie|length }})</h3>
+<details class="card section">
+  <summary><h3 style="display:inline;">Traitements de sortie ({{ dossier.traitements_sortie|length }})</h3></summary>
   <table>
     <thead><tr><th>Médicament</th><th>Posologie</th><th>Code ATC</th><th>Source</th></tr></thead>
     <tbody>
@@ -709,19 +814,19 @@
     {% endfor %}
     </tbody>
   </table>
-</div>
+</details>
 {% endif %}
 
 {# ---- Antécédents ---- #}
 {% if dossier.antecedents %}
-<div class="card section">
-  <h3>Antécédents ({{ dossier.antecedents|length }})</h3>
+<details class="card section">
+  <summary><h3 style="display:inline;">Antécédents ({{ dossier.antecedents|length }})</h3></summary>
   <ul class="bullet">
     {% for a in dossier.antecedents %}
       <li>{{ a.texte }}{% if a.source_page %} <button class="src-btn" data-texte="{{ a.texte|e }}" data-excerpt="{{ a.source_excerpt|default('',true)|e }}" data-page="{{ a.source_page }}">p.{{ a.source_page }}</button>{% endif %}</li>
     {% endfor %}
   </ul>
-</div>
+</details>
 {% endif %}
 
 {# ---- Complications ---- #}
@@ -736,6 +841,36 @@
 </div>
 {% endif %}
 
+{# ==================================================================== #}
+{# 5. DOCUMENTS SOURCES (nouveau — en bas de page)                       #}
+{# ==================================================================== #}
+{% if siblings and siblings|length > 1 %}
+<div class="card section" style="margin-top:1.5rem;">
+  <h3>Documents du dossier</h3>
+  <table class="table-dossiers">
+    <thead><tr><th>Document</th><th>Type</th><th>DAS</th><th>Actes</th></tr></thead>
+    <tbody>
+    {% for sib in siblings %}
+      <tr class="row-clickable" onclick="window.location='/dossier/{{ sib.path_rel }}'">
+        <td>
+          <span style="font-weight:600;">{{ sib.name | format_doc_name }}</span>
+          {% if sib.path_rel == filepath %}
+            <span class="badge" style="background:#dbeafe;color:#1d4ed8;margin-left:0.3rem;">actuel</span>
+          {% endif %}
+          {% if 'fusionne' in sib.name %}
+            <span class="badge" style="background:#ede9fe;color:#5b21b6;margin-left:0.3rem;">fusionné</span>
+          {% endif %}
+        </td>
+        <td>{% if sib.dossier.document_type %}<span class="badge" style="background:#e0e7ff;color:#3730a3;">{{ sib.dossier.document_type }}</span>{% endif %}</td>
+        <td>{{ sib.dossier.diagnostics_associes|length }}</td>
+        <td>{{ sib.dossier.actes_ccam|length }}</td>
+      </tr>
+    {% endfor %}
+    </tbody>
+  </table>
+</div>
+{% endif %}
+
 {# ---- Modal source ---- #}
 <div id="source-modal">
   <div id="source-modal-inner">
@@ -751,6 +886,82 @@
 
 {% block scripts %}
 <script>
+/* --- Validation DIM CPAM --- */
+async function validateCpam(btn, statut) {
+  const container = btn.closest('.cpam-validation');
+  const ogc = container.dataset.ogc;
+  const filepath = container.dataset.filepath;
+  const comment = container.querySelector('.cpam-val-comment').value.trim();
+  try {
+    const resp = await fetch('/api/cpam/' + filepath + '/' + ogc + '/validate', {
+      method: 'POST',
+      headers: {'Content-Type': 'application/json'},
+      body: JSON.stringify({statut: statut, commentaire: comment})
+    });
+    const data = await resp.json();
+    if (data.ok) {
+      const labels = {valide:'Validé',rejete:'Rejeté',en_revision:'En révision',non_valide:'Non validé'};
+      const colors = {valide:'background:#d1fae5;color:#065f46',rejete:'background:#fee2e2;color:#dc2626',en_revision:'background:#fef3c7;color:#b45309',non_valide:'background:#f1f5f9;color:#64748b'};
+      container.querySelector('.cpam-val-status').innerHTML = '<span class="badge" style="'+colors[statut]+';font-weight:700;">'+labels[statut]+'</span>';
+    } else {
+      alert('Erreur : ' + (data.error || 'inconnue'));
+    }
+  } catch(e) { console.error('validateCpam:', e); alert('Erreur réseau'); }
+}
+
+/* --- Deadline CPAM --- */
+async function setCpamDeadline(btn) {
+  const container = btn.closest('.cpam-deadline-block');
+  const ogc = container.dataset.ogc;
+  const filepath = container.dataset.filepath;
+  const dateInput = container.querySelector('.cpam-date-notif');
+  const statusEl = container.querySelector('.cpam-deadline-status');
+  if (!dateInput.value) { alert('Saisissez une date de notification'); return; }
+  const [y, m, d] = dateInput.value.split('-');
+  const dateFr = d + '/' + m + '/' + y;
+  try {
+    const resp = await fetch('/api/cpam/' + encodeURIComponent(filepath) + '/' + ogc + '/deadline', {
+      method: 'POST',
+      headers: {'Content-Type': 'application/json'},
+      body: JSON.stringify({date_notification: dateFr})
+    });
+    const data = await resp.json();
+    if (data.ok) {
+      statusEl.textContent = 'Limite : ' + data.date_limite;
+      statusEl.style.color = '#065f46';
+    } else {
+      alert('Erreur : ' + (data.error || 'inconnue'));
+    }
+  } catch(e) { console.error('setCpamDeadline:', e); alert('Erreur réseau'); }
+}
+
+/* --- Chargement versions CPAM --- */
+document.querySelectorAll('.cpam-versions-list').forEach(function(el) {
+  el.closest('details').addEventListener('toggle', async function() {
+    if (!this.open || el.dataset.loaded) return;
+    el.dataset.loaded = '1';
+    const fp = el.dataset.filepath;
+    const ogc = el.dataset.ogc;
+    try {
+      const resp = await fetch('/api/cpam/' + fp + '/' + ogc + '/versions');
+      const data = await resp.json();
+      if (!data.versions || data.versions.length === 0) {
+        el.innerHTML = '<em>Aucune version précédente</em>';
+        return;
+      }
+      let html = '<ul style="margin:0;padding-left:1.2rem;">';
+      data.versions.forEach(function(v) {
+        const tier = v.quality_tier ? ' [Qualité ' + v.quality_tier + ']' : '';
+        const val = v.validation_dim && v.validation_dim !== 'non_valide' ? ' — ' + v.validation_dim : '';
+        html += '<li>v' + v.version + ' — ' + v.timestamp + tier + val +
+                '<br><small style="color:#94a3b8;">' + (v.contre_argumentation || '').substring(0, 100) + '…</small></li>';
+      });
+      html += '</ul>';
+      el.innerHTML = html;
+    } catch(e) { el.innerHTML = '<em>Erreur de chargement</em>'; }
+  });
+});
+
 /* --- Source modal --- */
 let _sourceCache = null;
 const _dossierId = (function() {
@@ -773,7 +984,6 @@ async function loadSourceTexts() {
   return _sourceCache;
 }
 
-/* Teste si le PDF caviardé est disponible (HEAD request) */
 async function pdfAvailable(dossierId, filename) {
   try {
     const resp = await fetch('/api/pdf/' + dossierId + '/' + encodeURIComponent(filename), {method: 'HEAD'});
@@ -781,7 +991,6 @@ async function pdfAvailable(dossierId, filename) {
   } catch (e) { return false; }
 }
 
-/* Construit l'URL du PDF avec highlight + page */
 function buildPdfUrl(dossierId, filename, page, excerpt) {
   let url = '/api/pdf/' + dossierId + '/' + encodeURIComponent(filename);
   const params = [];
@@ -792,22 +1001,18 @@ function buildPdfUrl(dossierId, filename, page, excerpt) {
   return url;
 }
 
-/* Affiche un PDF dans l'iframe */
 function loadPdf(dossierId, filename, page, excerpt) {
   const content = document.getElementById('source-content');
   const url = buildPdfUrl(dossierId, filename, page, excerpt);
   content.className = 'source-content-pdf';
   content.innerHTML = '<iframe src="' + url + '" style="width:100%;height:100%;border:none;"></iframe>';
-  // Marquer le bouton actif
   document.querySelectorAll('.src-file-btn').forEach(b => b.classList.remove('active'));
   document.querySelectorAll('.src-file-btn').forEach(b => {
     if (b.textContent === filename) b.classList.add('active');
   });
 }
 
-/* Affiche le modal source — PDF caviardé si disponible, sinon fallback texte */
 async function showSource(excerpt, page, texte) {
-  // Pour le surlignage PDF, on utilise le texte du diagnostic (pas l'excerpt brut)
   const highlightText = texte || excerpt;
   const modal = document.getElementById('source-modal');
   const modalInner = document.getElementById('source-modal-inner');
@@ -820,7 +1025,6 @@ async function showSource(excerpt, page, texte) {
   modalInner.className = '';
   modal.style.display = 'block';
 
-  // Essayer le mode PDF
   if (_sourceFiles && _sourceFiles.length > 0 && _dossierId) {
     const firstFile = _sourceFiles[0];
     const available = await pdfAvailable(_dossierId, firstFile);
@@ -829,7 +1033,6 @@ async function showSource(excerpt, page, texte) {
       if (_sourceFiles.length === 1) {
         loadPdf(_dossierId, firstFile, page, highlightText);
       } else {
-        // Multi-PDF : boutons de sélection + iframe
         const safeHighlight = (highlightText || '').replace(/\\/g, '\\\\').replace(/'/g, "\\'");
         let html = '<div style="padding:0.5rem 0.75rem;border-bottom:1px solid #e2e8f0;display:flex;gap:0.5rem;flex-wrap:wrap;">';
         _sourceFiles.forEach(function(f) {
@@ -842,7 +1045,6 @@ async function showSource(excerpt, page, texte) {
         content.style.display = 'flex';
         content.style.flexDirection = 'column';
         content.innerHTML = html;
-        // Charger le premier PDF
         const iframe = content.querySelector('iframe');
         iframe.src = buildPdfUrl(_dossierId, firstFile, page, highlightText);
         content.querySelector('.src-file-btn').classList.add('active');
@@ -851,7 +1053,6 @@ async function showSource(excerpt, page, texte) {
     }
   }
 
-  // Fallback : mode texte (ancien comportement)
   modalInner.className = 'source-modal-text';
   content.className = '';
   content.style.display = '';
@@ -864,13 +1065,11 @@ async function showSource(excerpt, page, texte) {
     return;
   }
 
-  // Nettoyer l'extrait : retirer les "..." ajoutés par extract_excerpt()
   let searchText = (excerpt || '').trim();
   if (searchText.startsWith('...')) searchText = searchText.substring(3);
   if (searchText.endsWith('...')) searchText = searchText.slice(0, -3);
   searchText = searchText.trim();
 
-  // Chercher l'extrait dans le texte et le surligner
   if (searchText.length > 10) {
     let idx = allText.indexOf(searchText);
     if (idx < 0 && searchText.length > 60) {
@@ -902,24 +1101,20 @@ async function showSource(excerpt, page, texte) {
 
 function closeSource() {
   const content = document.getElementById('source-content');
-  // Détruire l'iframe pour stopper le chargement PDF
   content.innerHTML = '';
   content.style.display = '';
   content.className = '';
   document.getElementById('source-modal').style.display = 'none';
 }
 
-// Fermer le modal en cliquant sur le fond
 document.getElementById('source-modal').addEventListener('click', function(e) {
   if (e.target === this) closeSource();
 });
 
-// Fermer avec Escape
 document.addEventListener('keydown', function(e) {
   if (e.key === 'Escape') closeSource();
 });
 
-// Délégation événements pour tous les boutons .src-btn
 document.addEventListener('click', function(e) {
   const btn = e.target.closest('.src-btn');
   if (btn && btn.dataset.page) {
@@ -927,48 +1122,66 @@ document.addEventListener('click', function(e) {
   }
 });
 
-/* --- Reprocess --- */
-document.getElementById('reprocess-btn').addEventListener('click', async () => {
-  const btn = document.getElementById('reprocess-btn');
-  const status = document.getElementById('reprocess-status');
-
+// Reprocess dossier
+function reprocessDossier() {
+  var btn = document.getElementById('btn-reprocess');
+  var status = document.getElementById('reprocess-status');
   btn.disabled = true;
-  btn.style.background = '#64748b';
-  btn.innerHTML = '<span style="display:inline-flex;align-items:center;gap:0.4rem;"><span class="spinner"></span> Traitement en cours...</span>';
-  status.innerHTML = '<span style="color:#3b82f6;">Demande envoyée, traitement lancé. Veuillez patienter...</span>';
-
-  const startTime = Date.now();
-  const timer = setInterval(() => {
-    const elapsed = Math.floor((Date.now() - startTime) / 1000);
-    const min = Math.floor(elapsed / 60);
-    const sec = elapsed % 60;
-    const timeStr = min > 0 ? min + 'min ' + String(sec).padStart(2, '0') + 's' : sec + 's';
-    status.innerHTML = '<span style="color:#3b82f6;">Traitement en cours... ' + timeStr + '</span>';
-  }, 1000);
-
-  try {
-    const response = await fetch('/reprocess/{{ filepath }}', { method: 'POST' });
-    clearInterval(timer);
-    const data = await response.json();
-
-    if (data.ok) {
-      status.innerHTML = '<span style="color:#16a34a;font-weight:600;">Traitement terminé. Rechargement...</span>';
-      btn.style.background = '#16a34a';
-      btn.innerHTML = 'Terminé';
-      setTimeout(() => location.reload(), 1000);
-    } else {
-      status.innerHTML = '<span style="color:#dc2626;">' + (data.error || 'Erreur') + '</span>';
+  btn.innerHTML = '<span class="spinner"></span> Traitement…';
+  status.textContent = '';
+  fetch('/admin/reprocess/{{ filepath }}', { method: 'POST', credentials: 'same-origin' })
+    .then(function(r) {
+      if (!r.ok) throw new Error('HTTP ' + r.status);
+      var ct = r.headers.get('content-type') || '';
+      if (ct.indexOf('json') === -1) throw new Error('Réponse inattendue du serveur');
+      return r.json();
+    })
+    .then(function(data) {
+      if (data.ok) {
+        status.style.color = '#059669';
+        status.textContent = data.message || 'Terminé';
+        setTimeout(function() { window.location.reload(); }, 1500);
+      } else {
+        status.style.color = '#dc2626';
+        status.textContent = data.error || 'Erreur';
+        btn.disabled = false;
+        btn.innerHTML = '&#8635; Retraiter';
+      }
+    })
+    .catch(function(e) {
+      status.style.color = '#dc2626';
+      status.textContent = 'Erreur : ' + e.message;
       btn.disabled = false;
-      btn.style.background = '#3b82f6';
-      btn.innerHTML = 'Relancer l\'étude';
-    }
-  } catch (err) {
-    clearInterval(timer);
-    status.innerHTML = '<span style="color:#dc2626;">Erreur réseau</span>';
-    btn.disabled = false;
-    btn.style.background = '#3b82f6';
-    btn.innerHTML = 'Relancer l\'étude';
-  }
-});
+      btn.innerHTML = '&#8635; Retraiter';
+    });
+}
+
+// Upload document
+function uploadDocument() {
+  var fileInput = document.getElementById('upload-file');
+  var status = document.getElementById('upload-status');
+  if (!fileInput.files.length) return;
+  var formData = new FormData();
+  formData.append('file', fileInput.files[0]);
+  status.style.color = '#64748b';
+  status.textContent = 'Envoi de ' + fileInput.files[0].name + '…';
+  fetch('/admin/upload-document/{{ filepath }}', { method: 'POST', body: formData })
+    .then(function(r) { return r.json(); })
+    .then(function(data) {
+      if (data.ok) {
+        status.style.color = '#059669';
+        status.textContent = data.message || 'Upload terminé';
+        setTimeout(function() { window.location.reload(); }, 2000);
+      } else {
+        status.style.color = '#dc2626';
+        status.textContent = data.error || 'Erreur';
+      }
+    })
+    .catch(function(e) {
+      status.style.color = '#dc2626';
+      status.textContent = 'Erreur : ' + e.message;
+    });
+}
+
 </script>
 {% endblock %}
diff --git a/src/viewer/templates/dim.html b/src/viewer/templates/dim.html
new file mode 100644
index 0000000..f20d0cb
--- /dev/null
+++ b/src/viewer/templates/dim.html
@@ -0,0 +1,243 @@
+{% extends "base.html" %}
+{% block title %}Synthese DIM{% endblock %}
+
+{% block content %}
+<a class="back" href="/">&larr; Retour</a>
+<h2 style="margin-top:1rem;">Synth&egrave;se DIM</h2>
+
+{# ============================================================ #}
+{# SECTION 1 : Vue d'ensemble DP + DAS                          #}
+{# ============================================================ #}
+<div style="display:grid;grid-template-columns:1fr 1fr;gap:1rem;margin-bottom:1.5rem;">
+
+  {# --- Carte DP --- #}
+  <div class="card section">
+    <h3>Diagnostic Principal</h3>
+    <div style="display:grid;grid-template-columns:repeat(3,1fr);gap:0.5rem;margin-bottom:0.75rem;">
+      <div style="text-align:center;padding:0.5rem;background:#f0fdf4;border-radius:6px;">
+        <div style="font-size:1.4rem;font-weight:700;color:#16a34a;">{{ dim.dp.confirmed }}</div>
+        <div style="font-size:0.65rem;color:#64748b;">CONFIRMED</div>
+      </div>
+      <div style="text-align:center;padding:0.5rem;background:#fef3c7;border-radius:6px;">
+        <div style="font-size:1.4rem;font-weight:700;color:#b45309;">{{ dim.dp.review }}</div>
+        <div style="font-size:0.65rem;color:#64748b;">REVIEW</div>
+      </div>
+      <div style="text-align:center;padding:0.5rem;background:#dbeafe;border-radius:6px;">
+        <div style="font-size:1.4rem;font-weight:700;color:#1d4ed8;">{{ dim.dp.modified }}</div>
+        <div style="font-size:0.65rem;color:#64748b;">Modifi&eacute;s</div>
+      </div>
+    </div>
+    {% if dim.dp.total %}
+    <div style="font-size:0.75rem;color:#64748b;margin-bottom:0.5rem;">
+      Taux de modification DP : <strong style="color:#0f172a;">{{ ((dim.dp.modified / dim.dp.total) * 100) | round(1) }}%</strong>
+      ({{ dim.dp.modified }}/{{ dim.dp.total }})
+    </div>
+    {% endif %}
+    {# Confiance DP #}
+    <div style="font-size:0.7rem;font-weight:600;color:#64748b;margin-bottom:0.25rem;">Confiance DP</div>
+    <div style="display:flex;height:20px;border-radius:4px;overflow:hidden;margin-bottom:0.5rem;">
+      {% set dp_tot = dim.dp.total or 1 %}
+      {% if dim.dp.confidence.get('high', 0) %}
+      <div style="width:{{ (dim.dp.confidence.get('high', 0) / dp_tot * 100)|round(1) }}%;background:#16a34a;" title="Haute: {{ dim.dp.confidence.get('high', 0) }}"></div>
+      {% endif %}
+      {% if dim.dp.confidence.get('medium', 0) %}
+      <div style="width:{{ (dim.dp.confidence.get('medium', 0) / dp_tot * 100)|round(1) }}%;background:#ca8a04;" title="Moyenne: {{ dim.dp.confidence.get('medium', 0) }}"></div>
+      {% endif %}
+      {% if dim.dp.confidence.get('low', 0) %}
+      <div style="width:{{ (dim.dp.confidence.get('low', 0) / dp_tot * 100)|round(1) }}%;background:#dc2626;" title="Basse: {{ dim.dp.confidence.get('low', 0) }}"></div>
+      {% endif %}
+      {% if dim.dp.confidence.get('none', 0) %}
+      <div style="width:{{ (dim.dp.confidence.get('none', 0) / dp_tot * 100)|round(1) }}%;background:#94a3b8;" title="Aucune: {{ dim.dp.confidence.get('none', 0) }}"></div>
+      {% endif %}
+    </div>
+    {# Source DP #}
+    <div style="font-size:0.7rem;font-weight:600;color:#64748b;margin-bottom:0.25rem;">Source DP</div>
+    <div style="display:flex;flex-wrap:wrap;gap:0.5rem;font-size:0.7rem;">
+      {% for src, cnt in dim.dp.source.items() %}
+      <span style="padding:2px 8px;border-radius:4px;background:#f1f5f9;color:#334155;">{{ src }}: {{ cnt }}</span>
+      {% endfor %}
+    </div>
+  </div>
+
+  {# --- Carte DAS --- #}
+  <div class="card section">
+    <h3>Diagnostics Associ&eacute;s</h3>
+    <div style="display:grid;grid-template-columns:repeat(4,1fr);gap:0.5rem;margin-bottom:0.75rem;">
+      <div style="text-align:center;padding:0.5rem;background:#f0fdf4;border-radius:6px;">
+        <div style="font-size:1.4rem;font-weight:700;color:#16a34a;">{{ dim.das.kept }}</div>
+        <div style="font-size:0.6rem;color:#64748b;">Conserv&eacute;s</div>
+      </div>
+      <div style="text-align:center;padding:0.5rem;background:#fef3c7;border-radius:6px;">
+        <div style="font-size:1.4rem;font-weight:700;color:#b45309;">{{ dim.das.downgraded }}</div>
+        <div style="font-size:0.6rem;color:#64748b;">D&eacute;grad&eacute;s</div>
+      </div>
+      <div style="text-align:center;padding:0.5rem;background:#fee2e2;border-radius:6px;">
+        <div style="font-size:1.4rem;font-weight:700;color:#dc2626;">{{ dim.das.removed }}</div>
+        <div style="font-size:0.6rem;color:#64748b;">Supprim&eacute;s</div>
+      </div>
+      <div style="text-align:center;padding:0.5rem;background:#f1f5f9;border-radius:6px;">
+        <div style="font-size:1.4rem;font-weight:700;color:#64748b;">{{ dim.das.ruled_out }}</div>
+        <div style="font-size:0.6rem;color:#64748b;">Exclus</div>
+      </div>
+    </div>
+    <div style="font-size:0.75rem;color:#64748b;margin-bottom:0.5rem;">
+      Total : <strong>{{ dim.das.total }}</strong> DAS |
+      Taux de modification : <strong style="color:{% if dim.das.taux_modification > 20 %}#dc2626{% elif dim.das.taux_modification > 10 %}#b45309{% else %}#16a34a{% endif %};">{{ dim.das.taux_modification }}%</strong>
+    </div>
+    {# Barre DAS #}
+    {% set das_tot = dim.das.total or 1 %}
+    <div style="display:flex;height:20px;border-radius:4px;overflow:hidden;margin-bottom:0.5rem;">
+      <div style="width:{{ (dim.das.kept / das_tot * 100)|round(1) }}%;background:#16a34a;" title="Conservés: {{ dim.das.kept }}"></div>
+      {% if dim.das.downgraded %}
+      <div style="width:{{ (dim.das.downgraded / das_tot * 100)|round(1) }}%;background:#ca8a04;" title="Dégradés: {{ dim.das.downgraded }}"></div>
+      {% endif %}
+      {% if dim.das.removed %}
+      <div style="width:{{ (dim.das.removed / das_tot * 100)|round(1) }}%;background:#dc2626;" title="Supprimés: {{ dim.das.removed }}"></div>
+      {% endif %}
+      {% if dim.das.ruled_out %}
+      <div style="width:{{ (dim.das.ruled_out / das_tot * 100)|round(1) }}%;background:#94a3b8;" title="Exclus: {{ dim.das.ruled_out }}"></div>
+      {% endif %}
+    </div>
+    <div style="display:flex;gap:1rem;font-size:0.7rem;">
+      <span style="padding:2px 8px;border-radius:4px;background:#dcfce7;color:#166534;">CMA : {{ dim.das.cma }}</span>
+      {% if dim.das.no_code %}
+      <span style="padding:2px 8px;border-radius:4px;background:#fee2e2;color:#991b1b;">Sans code : {{ dim.das.no_code }}</span>
+      {% endif %}
+    </div>
+  </div>
+</div>
+
+{# ============================================================ #}
+{# SECTION 2 : Qualité & Contestabilité                         #}
+{# ============================================================ #}
+<div style="display:grid;grid-template-columns:1fr 1fr;gap:1rem;margin-bottom:1.5rem;">
+
+  {# --- Contestabilité (Vetos) --- #}
+  <div class="card section">
+    <h3>Contestabilit&eacute; (Veto Engine)</h3>
+    <div style="display:grid;grid-template-columns:repeat(3,1fr);gap:0.5rem;margin-bottom:0.75rem;">
+      <div style="text-align:center;padding:0.5rem;background:#f0fdf4;border-radius:6px;">
+        <div style="font-size:1.4rem;font-weight:700;color:#16a34a;">{{ dim.veto.distribution.get('PASS', 0) }}</div>
+        <div style="font-size:0.65rem;color:#64748b;">PASS</div>
+      </div>
+      <div style="text-align:center;padding:0.5rem;background:#fef3c7;border-radius:6px;">
+        <div style="font-size:1.4rem;font-weight:700;color:#b45309;">{{ dim.veto.distribution.get('NEED_INFO', 0) }}</div>
+        <div style="font-size:0.65rem;color:#64748b;">NEED_INFO</div>
+      </div>
+      <div style="text-align:center;padding:0.5rem;background:#fee2e2;border-radius:6px;">
+        <div style="font-size:1.4rem;font-weight:700;color:#dc2626;">{{ dim.veto.distribution.get('FAIL', 0) }}</div>
+        <div style="font-size:0.65rem;color:#64748b;">FAIL</div>
+      </div>
+    </div>
+    <div style="font-size:0.75rem;color:#64748b;margin-bottom:0.75rem;">
+      Score moyen de d&eacute;fendabilit&eacute; : <strong style="color:{% if dim.veto.avg_score >= 70 %}#16a34a{% elif dim.veto.avg_score >= 40 %}#b45309{% else %}#dc2626{% endif %};">{{ dim.veto.avg_score }}/100</strong>
+    </div>
+    {% if dim.veto.top_issues %}
+    <div style="font-size:0.7rem;font-weight:600;color:#64748b;margin-bottom:0.25rem;">Alertes les plus fr&eacute;quentes</div>
+    {% for veto_id, count in dim.veto.top_issues %}
+    <div style="display:flex;align-items:center;gap:0.5rem;margin-bottom:0.2rem;">
+      <code style="font-size:0.65rem;font-weight:600;min-width:60px;">{{ veto_id }}</code>
+      <div style="flex:1;height:12px;background:#f1f5f9;border-radius:3px;overflow:hidden;">
+        <div style="width:{{ (count / dim.veto.top_issues[0][1] * 100)|round(1) }}%;height:100%;background:#f97316;border-radius:3px;"></div>
+      </div>
+      <span style="font-size:0.65rem;color:#64748b;min-width:25px;text-align:right;">{{ count }}</span>
+    </div>
+    {% endfor %}
+    {% endif %}
+  </div>
+
+  {# --- Complétude documentaire --- #}
+  <div class="card section">
+    <h3>Compl&eacute;tude documentaire</h3>
+    <div style="display:grid;grid-template-columns:repeat(3,1fr);gap:0.5rem;margin-bottom:0.75rem;">
+      <div style="text-align:center;padding:0.5rem;background:#f0fdf4;border-radius:6px;">
+        <div style="font-size:1.4rem;font-weight:700;color:#16a34a;">{{ dim.completude.distribution.get('defendable', 0) }}</div>
+        <div style="font-size:0.6rem;color:#64748b;">D&eacute;fendable</div>
+      </div>
+      <div style="text-align:center;padding:0.5rem;background:#fef3c7;border-radius:6px;">
+        <div style="font-size:1.4rem;font-weight:700;color:#b45309;">{{ dim.completude.distribution.get('fragile', 0) }}</div>
+        <div style="font-size:0.6rem;color:#64748b;">Fragile</div>
+      </div>
+      <div style="text-align:center;padding:0.5rem;background:#fee2e2;border-radius:6px;">
+        <div style="font-size:1.4rem;font-weight:700;color:#dc2626;">{{ dim.completude.distribution.get('indefendable', 0) }}</div>
+        <div style="font-size:0.6rem;color:#64748b;">Ind&eacute;fendable</div>
+      </div>
+    </div>
+    <div style="font-size:0.75rem;color:#64748b;margin-bottom:0.75rem;">
+      Score moyen : <strong style="color:{% if dim.completude.avg_score >= 70 %}#16a34a{% elif dim.completude.avg_score >= 40 %}#b45309{% else %}#dc2626{% endif %};">{{ dim.completude.avg_score }}/100</strong>
+    </div>
+    {# --- Synthèse CPAM --- #}
+    {% if dim.cpam.total %}
+    <div style="border-top:1px solid #e2e8f0;padding-top:0.75rem;margin-top:0.5rem;">
+      <div style="font-size:0.7rem;font-weight:600;color:#64748b;margin-bottom:0.5rem;">Contr&ocirc;les CPAM</div>
+      <div style="display:flex;gap:1rem;font-size:0.75rem;margin-bottom:0.5rem;">
+        <span><strong>{{ dim.cpam.total }}</strong> contr&ocirc;les</span>
+        {% if dim.cpam.impact_total %}
+        <span>Impact estim&eacute; : <strong style="color:#dc2626;">{{ "{:,.0f}".format(dim.cpam.impact_total).replace(",", " ") }} &euro;</strong></span>
+        {% endif %}
+      </div>
+      <div style="display:flex;flex-wrap:wrap;gap:0.4rem;font-size:0.65rem;">
+        {% for prio, cnt in dim.cpam.by_priority.items() %}
+        <span style="padding:1px 6px;border-radius:3px;background:{% if prio == 'critique' %}#fee2e2{% elif prio == 'haute' %}#fef3c7{% else %}#f1f5f9{% endif %};color:{% if prio == 'critique' %}#991b1b{% elif prio == 'haute' %}#92400e{% else %}#475569{% endif %};">{{ prio }}: {{ cnt }}</span>
+        {% endfor %}
+      </div>
+    </div>
+    {% endif %}
+  </div>
+</div>
+
+{# ============================================================ #}
+{# SECTION 3 : Alertes prioritaires DIM                         #}
+{# ============================================================ #}
+{% if dim.alertes.review or dim.alertes.fail or dim.alertes.indefendable %}
+<div class="card section">
+  <h3>Alertes prioritaires</h3>
+
+  {% if dim.alertes.fail %}
+  <div style="margin-bottom:1rem;">
+    <div style="font-size:0.7rem;font-weight:700;color:#dc2626;text-transform:uppercase;letter-spacing:0.05em;margin-bottom:0.35rem;padding-bottom:0.2rem;border-bottom:1px solid #fecaca;">
+      Veto FAIL &mdash; Codage contestable ({{ dim.alertes.fail | length }})
+    </div>
+    {% for d in dim.alertes.fail %}
+    <div style="display:flex;align-items:center;gap:0.5rem;padding:0.25rem 0;font-size:0.75rem;border-bottom:1px solid #f8fafc;">
+      <a href="/dossier/{{ d.path }}" style="color:#1d4ed8;font-weight:500;min-width:180px;">{{ d.name }}</a>
+      <span style="color:#64748b;">Score {{ d.score }}/100</span>
+      <span style="color:#94a3b8;">{{ d.issues }} issues</span>
+    </div>
+    {% endfor %}
+  </div>
+  {% endif %}
+
+  {% if dim.alertes.review %}
+  <div style="margin-bottom:1rem;">
+    <div style="font-size:0.7rem;font-weight:700;color:#b45309;text-transform:uppercase;letter-spacing:0.05em;margin-bottom:0.35rem;padding-bottom:0.2rem;border-bottom:1px solid #fef3c7;">
+      DP en REVIEW &mdash; &Agrave; valider ({{ dim.alertes.review | length }})
+    </div>
+    {% for d in dim.alertes.review %}
+    <div style="display:flex;align-items:center;gap:0.5rem;padding:0.25rem 0;font-size:0.75rem;border-bottom:1px solid #f8fafc;">
+      <a href="/dossier/{{ d.path }}" style="color:#1d4ed8;font-weight:500;min-width:180px;">{{ d.name }}</a>
+      <code style="font-size:0.65rem;background:#f1f5f9;padding:1px 4px;border-radius:3px;">{{ d.code }}</code>
+      <span style="color:#64748b;font-size:0.7rem;">{{ d.reason | truncate(80) }}</span>
+    </div>
+    {% endfor %}
+  </div>
+  {% endif %}
+
+  {% if dim.alertes.indefendable %}
+  <div>
+    <div style="font-size:0.7rem;font-weight:700;color:#dc2626;text-transform:uppercase;letter-spacing:0.05em;margin-bottom:0.35rem;padding-bottom:0.2rem;border-bottom:1px solid #fecaca;">
+      Compl&eacute;tude ind&eacute;fendable ({{ dim.alertes.indefendable | length }})
+    </div>
+    {% for d in dim.alertes.indefendable %}
+    <div style="display:flex;align-items:center;gap:0.5rem;padding:0.25rem 0;font-size:0.75rem;border-bottom:1px solid #f8fafc;">
+      <a href="/dossier/{{ d.path }}" style="color:#1d4ed8;font-weight:500;min-width:180px;">{{ d.name }}</a>
+      <span style="color:#64748b;">Score {{ d.score }}/100</span>
+      <span style="color:#94a3b8;">{{ d.manquants }} docs manquants</span>
+    </div>
+    {% endfor %}
+  </div>
+  {% endif %}
+</div>
+{% endif %}
+
+{% endblock %}
diff --git a/src/viewer/templates/index.html b/src/viewer/templates/index.html
index 16c1364..e0c35e7 100644
--- a/src/viewer/templates/index.html
+++ b/src/viewer/templates/index.html
@@ -1,22 +1,24 @@
 {% extends "base.html" %}
 {% block title %}Accueil{% endblock %}
 
-{% block sidebar %}
-{% for group_name, items in groups.items() %}
-  <div class="group-title">{{ group_name | format_dossier_name }}</div>
-  {% for item in items %}
-    {% if 'fusionne' in item.name %}
-      <a href="/dossier/{{ item.path_rel }}" class="sidebar-fusionne">&#9733; Fusionné</a>
-    {% else %}
-      <a href="/dossier/{{ item.path_rel }}">{{ item.name | format_doc_name }}</a>
-    {% endif %}
-  {% endfor %}
-{% endfor %}
-{% endblock %}
-
 {% block content %}
 <h2>Dossiers médicaux traités</h2>
 
+{% if stats %}
+<div class="card" style="margin-bottom:1.5rem;padding:0.75rem 1.25rem;display:flex;flex-wrap:wrap;gap:1rem;align-items:center;">
+  <span style="font-size:0.8rem;font-weight:700;color:#475569;">Vue globale</span>
+  <span class="badge-count badge-das">{{ stats.total_dossiers }} dossiers</span>
+  <span class="badge-count badge-das">{{ stats.total_das }} DAS</span>
+  <span class="badge-count badge-actes">{{ stats.total_actes }} actes</span>
+  {% if stats.total_alertes %}<span class="badge-count badge-alertes">{{ stats.total_alertes }} alertes</span>{% endif %}
+  {% if stats.total_cma %}<span class="badge-count badge-cma">{{ stats.total_cma }} CMA</span>{% endif %}
+  {% if stats.total_cpam %}<span class="badge-count" style="background:#fef3c7;color:#92400e;">{{ stats.total_cpam }} CPAM</span>{% endif %}
+  {% if stats.processing_time_total %}
+    <span style="font-size:0.75rem;color:#64748b;">Total : {{ stats.processing_time_total|format_duration }}</span>
+  {% endif %}
+</div>
+{% endif %}
+
 {% if not groups %}
   <div class="card">
     <p>Aucun dossier trouvé dans <code>output/structured/</code>.</p>
@@ -24,77 +26,98 @@
       Lancez le pipeline avec <code>python -m src.main</code> pour générer des fichiers.
     </p>
   </div>
-{% endif %}
-
-{% for group_name, items in groups.items() %}
-<div class="section">
-  {% set ns = namespace(total=0.0, count=0) %}
-  {% for item in items %}
-    {% if item.dossier.processing_time_s is not none %}
-      {% set ns.total = ns.total + item.dossier.processing_time_s %}
-      {% set ns.count = ns.count + 1 %}
-    {% endif %}
-  {% endfor %}
-  {% set stats = group_stats.get(group_name, {}) %}
-  <h3 style="display:flex;align-items:baseline;gap:0.75rem;flex-wrap:wrap;">
-    {{ group_name | format_dossier_name }}
-    <span style="font-size:0.75rem;font-weight:400;color:#64748b;">
-      {{ items|length }} fichier(s){% if ns.count %} — total : {{ ns.total|format_duration }}{% endif %}
-    </span>
-    {% if stats %}
-      <span class="badge-count badge-das">{{ stats.das_count }} DAS</span>
-      <span class="badge-count badge-actes">{{ stats.actes_count }} actes</span>
-      {% if stats.alertes_count %}<span class="badge-count badge-alertes">{{ stats.alertes_count }} alertes</span>{% endif %}
-      {% if stats.cma_count %}<span class="badge-count badge-cma">{{ stats.cma_count }} CMA</span>{% endif %}
-    {% endif %}
-  </h3>
-  {% if items|length > 1 %}
-    {% for item in items if 'fusionne' in item.name %}
-      {% if loop.first %}
-      <div style="margin-bottom:0.75rem;">
-        <a href="/dossier/{{ item.path_rel }}" class="badge-count badge-fusion" style="text-decoration:none;font-size:0.8rem;padding:4px 12px;">
-          Vue patient fusionnée
-        </a>
-      </div>
-      {% endif %}
-    {% endfor %}
-  {% endif %}
-  <div style="display:grid;grid-template-columns:repeat(auto-fill,minmax(300px,1fr));gap:1rem;">
-    {% for item in items %}
-    <a href="/dossier/{{ item.path_rel }}" style="text-decoration:none;color:inherit;">
-      <div class="card" style="cursor:pointer;transition:box-shadow 0.15s;">
-        <div style="font-weight:600;font-size:0.9rem;margin-bottom:0.4rem;color:#0f172a;">
-          {{ item.name | format_doc_name }}
-        </div>
-        <div style="display:flex;flex-wrap:wrap;gap:0.3rem;margin-bottom:0.4rem;">
-          {% if item.dossier.document_type %}
-            <span class="badge" style="background:#e0e7ff;color:#3730a3;">{{ item.dossier.document_type }}</span>
-          {% endif %}
-          {% if item.dossier.source_files %}<span class="badge badge-fusion">fusionné</span>{% endif %}
-          {% if item.dossier.diagnostics_associes %}<span class="badge-count badge-das">{{ item.dossier.diagnostics_associes|length }} DAS</span>{% endif %}
-          {% if item.dossier.actes_ccam %}<span class="badge-count badge-actes">{{ item.dossier.actes_ccam|length }} actes</span>{% endif %}
-          {% if item.dossier.alertes_codage %}<span class="badge-count badge-alertes">{{ item.dossier.alertes_codage|length }} alertes</span>{% endif %}
-        </div>
-        {% if item.dossier.diagnostic_principal %}
-          <div style="margin-top:0.5rem;font-size:0.8rem;color:#334155;">
-            <strong>DP :</strong> {{ item.dossier.diagnostic_principal.texte[:80] }}{% if item.dossier.diagnostic_principal.texte|length > 80 %}…{% endif %}
-          </div>
-          {% if item.dossier.diagnostic_principal.cim10_suggestion %}
-            <div style="margin-top:0.25rem;">
-              <span class="badge" style="background:#dbeafe;color:#1d4ed8;">{{ item.dossier.diagnostic_principal.cim10_suggestion }}</span>
-              {{ item.dossier.diagnostic_principal.cim10_confidence | confidence_badge }}
-            </div>
+{% else %}
+<div class="card" style="padding:0;overflow:hidden;">
+  <table class="table-dossiers">
+    <thead>
+      <tr>
+        <th>Patient</th>
+        <th>DP</th>
+        <th>DAS</th>
+        <th>Actes</th>
+        <th>Sévérité</th>
+        <th>Alertes</th>
+        <th>CPAM</th>
+      </tr>
+    </thead>
+    <tbody>
+      {% for group_name, items in groups.items() %}
+        {# Sélection du dossier représentatif : fusionné en priorité, sinon premier #}
+        {% set ns = namespace(rep=none) %}
+        {% for item in items %}
+          {% if 'fusionne' in item.name %}
+            {% set ns.rep = item %}
           {% endif %}
+        {% endfor %}
+        {% if ns.rep is none %}
+          {% set ns.rep = items[0] %}
         {% endif %}
-        {% if item.dossier.processing_time_s is not none %}
-          <div style="margin-top:0.5rem;font-size:0.75rem;color:#64748b;">
-            Traitement : {{ item.dossier.processing_time_s|format_duration }}
-          </div>
-        {% endif %}
-      </div>
-    </a>
-    {% endfor %}
-  </div>
+        {% set d = ns.rep.dossier %}
+        {% set dp = d.diagnostic_principal %}
+        {% set ghm = d.ghm_estimation %}
+        {% set gstats = group_stats.get(group_name, {}) %}
+        <tr class="row-clickable" onclick="window.location='/dossier/{{ ns.rep.path_rel }}'">
+          <td>
+            <span style="font-weight:600;color:#0f172a;">{{ group_name | format_dossier_name }}</span>
+            {% if d.document_type %}
+              <span class="badge" style="background:#e0e7ff;color:#3730a3;margin-left:0.4rem;">{{ d.document_type }}</span>
+            {% endif %}
+            {% if items|length > 1 %}
+              <span style="font-size:0.7rem;color:#94a3b8;margin-left:0.3rem;">{{ items|length }} docs</span>
+            {% endif %}
+          </td>
+          <td>
+            {% if dp and dp.cim10_suggestion %}
+              <span class="badge" style="background:#dbeafe;color:#1d4ed8;font-weight:700;">{{ dp.cim10_suggestion }}</span>
+              {{ dp.cim10_confidence | confidence_badge }}
+              <div style="font-size:0.75rem;color:#475569;margin-top:0.15rem;max-width:250px;overflow:hidden;text-overflow:ellipsis;white-space:nowrap;">
+                {{ dp.texte[:60] }}{% if dp.texte|length > 60 %}…{% endif %}
+              </div>
+            {% elif dp %}
+              <span style="font-size:0.8rem;color:#64748b;">{{ dp.texte[:40] }}…</span>
+            {% else %}
+              <span style="color:#cbd5e1;">—</span>
+            {% endif %}
+          </td>
+          <td>
+            {% if gstats.das_count is defined and gstats.das_count > 0 %}
+              <span class="badge-count badge-das">{{ gstats.das_count }}</span>
+            {% else %}
+              <span style="color:#cbd5e1;">0</span>
+            {% endif %}
+          </td>
+          <td>
+            {% if gstats.actes_count is defined and gstats.actes_count > 0 %}
+              <span class="badge-count badge-actes">{{ gstats.actes_count }}</span>
+            {% else %}
+              <span style="color:#cbd5e1;">0</span>
+            {% endif %}
+          </td>
+          <td>
+            {% if ghm and ghm.severite %}
+              {{ ghm.severite | string | severity_badge }}
+            {% else %}
+              <span style="color:#cbd5e1;">—</span>
+            {% endif %}
+          </td>
+          <td>
+            {% if gstats.alertes_count is defined and gstats.alertes_count > 0 %}
+              <span class="badge-count badge-alertes">{{ gstats.alertes_count }}</span>
+            {% else %}
+              <span style="color:#cbd5e1;">0</span>
+            {% endif %}
+          </td>
+          <td>
+            {% if d.controles_cpam %}
+              <span class="badge-count" style="background:#fef3c7;color:#92400e;">{{ d.controles_cpam|length }}</span>
+            {% else %}
+              <span style="color:#cbd5e1;">—</span>
+            {% endif %}
+          </td>
+        </tr>
+      {% endfor %}
+    </tbody>
+  </table>
 </div>
-{% endfor %}
+{% endif %}
 {% endblock %}
diff --git a/src/viewer/templates/validation_detail.html b/src/viewer/templates/validation_detail.html
index 3063ee3..c4030ce 100644
--- a/src/viewer/templates/validation_detail.html
+++ b/src/viewer/templates/validation_detail.html
@@ -1,18 +1,6 @@
 {% extends "base.html" %}
 {% block title %}Validation — {{ group_name }}{% endblock %}
 
-{% block sidebar %}
-{% for gn, items in groups.items() %}
-  <div class="group-title">{{ gn | format_dossier_name }}</div>
-  {% for item in items %}
-    {% if 'fusionne' in item.name %}
-      <a href="/dossier/{{ item.path_rel }}" class="sidebar-fusionne">&#9733; Fusionné</a>
-    {% else %}
-      <a href="/dossier/{{ item.path_rel }}">{{ item.name | format_doc_name }}</a>
-    {% endif %}
-  {% endfor %}
-{% endfor %}
-{% endblock %}
 
 {% block content %}
 <style>
diff --git a/src/viewer/templates/validation_list.html b/src/viewer/templates/validation_list.html
index 1fd34f5..e893a1d 100644
--- a/src/viewer/templates/validation_list.html
+++ b/src/viewer/templates/validation_list.html
@@ -1,18 +1,6 @@
 {% extends "base.html" %}
 {% block title %}Validation DIM{% endblock %}
 
-{% block sidebar %}
-{% for group_name, items in groups.items() %}
-  <div class="group-title">{{ group_name | format_dossier_name }}</div>
-  {% for item in items %}
-    {% if 'fusionne' in item.name %}
-      <a href="/dossier/{{ item.path_rel }}" class="sidebar-fusionne">&#9733; Fusionné</a>
-    {% else %}
-      <a href="/dossier/{{ item.path_rel }}">{{ item.name | format_doc_name }}</a>
-    {% endif %}
-  {% endfor %}
-{% endfor %}
-{% endblock %}
 
 {% block content %}
 <div style="display:flex;align-items:center;gap:1rem;margin-bottom:1.5rem;">
diff --git a/src/viewer/templates/validation_metrics.html b/src/viewer/templates/validation_metrics.html
index 2c22897..29a1852 100644
--- a/src/viewer/templates/validation_metrics.html
+++ b/src/viewer/templates/validation_metrics.html
@@ -1,18 +1,6 @@
 {% extends "base.html" %}
 {% block title %}Métriques Validation DIM{% endblock %}
 
-{% block sidebar %}
-{% for group_name, items in groups.items() %}
-  <div class="group-title">{{ group_name | format_dossier_name }}</div>
-  {% for item in items %}
-    {% if 'fusionne' in item.name %}
-      <a href="/dossier/{{ item.path_rel }}" class="sidebar-fusionne">&#9733; Fusionné</a>
-    {% else %}
-      <a href="/dossier/{{ item.path_rel }}">{{ item.name | format_doc_name }}</a>
-    {% endif %}
-  {% endfor %}
-{% endfor %}
-{% endblock %}
 
 {% block content %}
 <div style="display:flex;align-items:center;gap:1rem;margin-bottom:1.5rem;">
diff --git a/t2a-viewer.service b/t2a-viewer.service
new file mode 100644
index 0000000..cd616aa
--- /dev/null
+++ b/t2a-viewer.service
@@ -0,0 +1,18 @@
+[Unit]
+Description=T2A Viewer - Codage diagnostique medical
+After=network.target ollama.service
+Wants=ollama.service
+
+[Service]
+Type=simple
+User=dom
+WorkingDirectory=/home/dom/ai/t2a_v2
+EnvironmentFile=/home/dom/ai/t2a_v2/.env
+ExecStart=/home/dom/ai/t2a/.venv/bin/gunicorn -c gunicorn.conf.py "src.viewer.app:create_app()"
+Restart=on-failure
+RestartSec=5
+StandardOutput=journal
+StandardError=journal
+
+[Install]
+WantedBy=multi-user.target
diff --git a/t2a_install_rag_cleanup/.env.example b/t2a_install_rag_cleanup/.env.example
deleted file mode 100644
index bb8101d..0000000
--- a/t2a_install_rag_cleanup/.env.example
+++ /dev/null
@@ -1,22 +0,0 @@
-# === Référentiels PDF (chemins absolus vers les PDFs ATIH) ===
-# T2A_CIM10_PDF=/chemin/vers/cim-10-fr.pdf
-# T2A_GUIDE_METHODO_PDF=/chemin/vers/guide_methodo_mco.pdf
-# T2A_CCAM_PDF=/chemin/vers/ccam_descriptive.pdf
-
-# === Ollama ===
-# OLLAMA_URL=http://localhost:11434
-# OLLAMA_MODEL=gemma3:12b
-# OLLAMA_TIMEOUT=120
-# OLLAMA_MAX_PARALLEL=2
-
-# === Modèles IA ===
-# T2A_EMBEDDING_MODEL=dangvantuan/sentence-camembert-large
-# T2A_NER_MODEL=Jean-Baptiste/camembert-ner
-# T2A_NER_THRESHOLD=0.80
-
-# === Établissement ===
-# T2A_FINESS=000000000
-# T2A_NUM_UM=0000
-
-# === Anonymisation ===
-# T2A_KEEP_ESTABLISHMENT=True
diff --git a/t2a_install_rag_cleanup/.gitignore b/t2a_install_rag_cleanup/.gitignore
deleted file mode 100644
index be505c7..0000000
--- a/t2a_install_rag_cleanup/.gitignore
+++ /dev/null
@@ -1,23 +0,0 @@
-# Python
-.venv/
-__pycache__/
-*.pyc
-*.egg-info/
-.pytest_cache/
-.hypothesis/
-
-# Données générées
-output/
-input/
-data/
-
-# Référentiels (volumineux, non versionnés)
-*.pdf
-*.xls
-*.xlsx
-
-# Configuration locale
-.env
-
-# IDE / outils
-.claude/
diff --git a/t2a_install_rag_cleanup/requirements.txt b/t2a_install_rag_cleanup/requirements.txt
deleted file mode 100644
index 19023de..0000000
--- a/t2a_install_rag_cleanup/requirements.txt
+++ /dev/null
@@ -1,17 +0,0 @@
-pdfplumber>=0.10.0
-transformers>=4.35.0,<5.0.0
-torch>=2.1.0
-protobuf>=3.20.0,<4.0.0
-regex>=2023.0
-pydantic>=2.5.0
-pytest>=7.4.0
-sentencepiece>=0.1.99,<0.2.0
-edsnlp[ml]>=0.17.0
-faiss-cpu>=1.7.0
-sentence-transformers>=2.2.0
-requests>=2.28.0
-flask>=3.0.0
-python-dotenv>=1.0.0
-openpyxl>=3.0.0
-pandas>=2.0.0
-PyMuPDF>=1.24.0
diff --git a/t2a_install_rag_cleanup/run.sh b/t2a_install_rag_cleanup/run.sh
deleted file mode 100644
index f2f420f..0000000
--- a/t2a_install_rag_cleanup/run.sh
+++ /dev/null
@@ -1,45 +0,0 @@
-#!/bin/bash
-
-set -e
-
-cd "$(dirname "$0")"
-
-echo "🚀 Démarrage de l'application T2A..."
-
-# Vérifier si l'environnement virtuel existe
-if [ ! -d ".venv" ]; then
-    echo "📦 Création de l'environnement virtuel..."
-    python3 -m venv .venv
-fi
-
-# Activer l'environnement virtuel
-echo "🔧 Activation de l'environnement virtuel..."
-source .venv/bin/activate
-
-# Installer/mettre à jour les dépendances
-if [ ! -f ".venv/.deps_installed" ] || [ "requirements.txt" -nt ".venv/.deps_installed" ]; then
-    echo "📥 Installation des dépendances..."
-    pip install -q --upgrade pip
-    pip install -q -r requirements.txt
-    touch .venv/.deps_installed
-else
-    echo "✅ Dépendances déjà installées"
-fi
-
-# Créer les répertoires nécessaires
-mkdir -p input output/anonymized output/structured output/reports data/rag_index data/referentiels
-
-echo ""
-echo "✨ Application prête !"
-echo ""
-echo "📂 Répertoires :"
-echo "   - input/          : Placez vos PDFs ici"
-echo "   - output/         : Résultats du traitement"
-echo ""
-echo "🌐 Lancement du viewer sur http://localhost:5000"
-echo ""
-echo "   Appuyez sur Ctrl+C pour arrêter"
-echo ""
-
-# Lancer le viewer
-python3 -m src.viewer
diff --git a/t2a_install_rag_cleanup/scripts/benchmark_models.py b/t2a_install_rag_cleanup/scripts/benchmark_models.py
deleted file mode 100644
index f865ee7..0000000
--- a/t2a_install_rag_cleanup/scripts/benchmark_models.py
+++ /dev/null
@@ -1,313 +0,0 @@
-#!/usr/bin/env python3
-"""Benchmark A/B : gemma3:12b (base) vs pmsi-coder-v2 (fine-tuné).
-
-Compare les codes CIM-10 produits par les deux modèles sur N dossiers.
-Teste DP + DAS (échantillon) pour chaque dossier.
-
-Usage: python scripts/benchmark_models.py [--n 50] [--das-max 5]
-"""
-
-from __future__ import annotations
-
-import json
-import random
-import sys
-import time
-from pathlib import Path
-
-sys.path.insert(0, str(Path(__file__).resolve().parent.parent))
-
-from src.config import STRUCTURED_DIR, OLLAMA_URL, DossierMedical
-from src.medical.cim10_dict import load_dict, normalize_code, validate_code
-
-import requests
-
-MODEL_BASE = "gemma3:12b"
-MODEL_FINETUNED = "pmsi-coder-v2"
-
-PROMPT_TEMPLATE = """Tu es un médecin DIM expert en codage PMSI.
-Code le diagnostic suivant en CIM-10. Choisis le code le plus spécifique possible.
-
-DIAGNOSTIC : "{texte}"
-TYPE : {type_diag}
-
-{contexte}
-
-Réponds UNIQUEMENT avec un objet JSON :
-{{"code": "X99.9", "confidence": "high|medium|low", "justification": "explication courte"}}"""
-
-
-def call_model(prompt: str, model: str, timeout: int = 120) -> tuple[dict | None, float]:
-    """Appelle un modèle Ollama et retourne (résultat, durée_s)."""
-    t0 = time.time()
-    try:
-        resp = requests.post(
-            f"{OLLAMA_URL}/api/generate",
-            json={
-                "model": model,
-                "prompt": prompt,
-                "stream": False,
-                "format": "json",
-                "options": {"temperature": 0.1, "num_predict": 500},
-            },
-            timeout=timeout,
-        )
-        resp.raise_for_status()
-        raw = resp.json().get("response", "")
-        duration = time.time() - t0
-        try:
-            return json.loads(raw), duration
-        except json.JSONDecodeError:
-            return None, duration
-    except Exception as e:
-        return None, time.time() - t0
-
-
-def load_dossiers(n: int) -> list[dict]:
-    """Charge N dossiers fusionnés diversifiés."""
-    dossiers = []
-    for subdir in sorted(STRUCTURED_DIR.iterdir()):
-        if not subdir.is_dir():
-            continue
-        for f in subdir.glob("*fusionne*.json"):
-            if ".gemma_" in f.name or ".bak" in f.name:
-                continue
-            try:
-                data = json.loads(f.read_text(encoding="utf-8"))
-                d = DossierMedical.model_validate(data)
-                if d.diagnostic_principal and d.diagnostic_principal.cim10_suggestion:
-                    dossiers.append({
-                        "name": subdir.name,
-                        "dossier": d,
-                        "path": str(f),
-                    })
-            except Exception:
-                continue
-            break
-    random.seed(42)
-    random.shuffle(dossiers)
-    return dossiers[:n]
-
-
-def build_contexte(d: DossierMedical) -> str:
-    """Construit un contexte clinique résumé."""
-    parts = []
-    s = d.sejour
-    if s.age is not None:
-        parts.append(f"Patient {s.sexe or '?'}, {s.age} ans")
-    if s.duree_sejour is not None:
-        parts.append(f"Durée séjour : {s.duree_sejour}j")
-    if d.diagnostic_principal:
-        parts.append(f"DP : {d.diagnostic_principal.texte}")
-    bio = [f"{b.test}={b.valeur}" for b in d.biologie_cle[:5] if b.valeur]
-    if bio:
-        parts.append(f"Bio : {', '.join(bio)}")
-    return "CONTEXTE : " + " | ".join(parts) if parts else ""
-
-
-def code_match_level(code_a: str, code_b: str) -> str:
-    """Retourne le niveau de correspondance entre deux codes."""
-    if code_a == code_b:
-        return "exact"
-    if code_a[:3] == code_b[:3]:
-        return "categorie"
-    return "diff"
-
-
-def run_benchmark(n: int = 50, das_max: int = 5):
-    print(f"=== Benchmark A/B : {MODEL_BASE} vs {MODEL_FINETUNED} ===")
-    print(f"    Dossiers : {n}, DAS max/dossier : {das_max}\n")
-
-    # Vérifier que les deux modèles sont disponibles
-    for model in [MODEL_BASE, MODEL_FINETUNED]:
-        try:
-            resp = requests.post(
-                f"{OLLAMA_URL}/api/generate",
-                json={"model": model, "prompt": "test", "stream": False,
-                      "options": {"num_predict": 1}},
-                timeout=60,
-            )
-            resp.raise_for_status()
-            print(f"  {model} : OK")
-        except Exception as e:
-            print(f"  {model} : ERREUR — {e}")
-            sys.exit(1)
-
-    dossiers = load_dossiers(n)
-    print(f"\nDossiers chargés : {len(dossiers)}\n")
-
-    cim10 = load_dict()
-    t_global_start = time.time()
-
-    dp_results = []
-    das_results = []
-
-    for i, item in enumerate(dossiers, 1):
-        d = item["dossier"]
-        dp = d.diagnostic_principal
-        name = item["name"]
-        ctx = build_contexte(d)
-
-        # === DP ===
-        prompt_dp = PROMPT_TEMPLATE.format(
-            texte=dp.texte,
-            type_diag="DP (diagnostic principal)",
-            contexte=ctx,
-        )
-        res_base, t_base = call_model(prompt_dp, MODEL_BASE)
-        res_ft, t_ft = call_model(prompt_dp, MODEL_FINETUNED)
-
-        code_base = normalize_code(res_base.get("code", "")) if res_base else "ERREUR"
-        code_ft = normalize_code(res_ft.get("code", "")) if res_ft else "ERREUR"
-        conf_base = res_base.get("confidence", "?") if res_base else "?"
-        conf_ft = res_ft.get("confidence", "?") if res_ft else "?"
-        valid_base = validate_code(code_base)[0] if code_base != "ERREUR" else False
-        valid_ft = validate_code(code_ft)[0] if code_ft != "ERREUR" else False
-
-        pipeline_code = dp.cim10_suggestion
-        match_level = code_match_level(code_base, code_ft)
-
-        dp_result = {
-            "dossier": name,
-            "texte": dp.texte[:80],
-            "pipeline": pipeline_code,
-            "base": code_base,
-            "ft": code_ft,
-            "conf_base": conf_base,
-            "conf_ft": conf_ft,
-            "valid_base": valid_base,
-            "valid_ft": valid_ft,
-            "match": match_level,
-            "t_base": round(t_base, 2),
-            "t_ft": round(t_ft, 2),
-        }
-        dp_results.append(dp_result)
-
-        tag = {"exact": "=", "categorie": "~", "diff": "X"}[match_level]
-        print(f"  [{i:2d}/{len(dossiers)}] {name:<20s} DP=\"{dp.texte[:35]:<35s}\" "
-              f"base={code_base:<7s} ft={code_ft:<7s} [{tag}] "
-              f"({t_base:.1f}s / {t_ft:.1f}s)")
-
-        # === DAS (échantillon) ===
-        das_list = [das for das in d.diagnostics_associes
-                    if das.texte and das.cim10_suggestion]
-        if len(das_list) > das_max:
-            random.seed(hash(name))
-            das_list = random.sample(das_list, das_max)
-
-        for das in das_list:
-            prompt_das = PROMPT_TEMPLATE.format(
-                texte=das.texte,
-                type_diag="DAS (diagnostic associé significatif)",
-                contexte=ctx,
-            )
-            res_b, tb = call_model(prompt_das, MODEL_BASE)
-            res_f, tf = call_model(prompt_das, MODEL_FINETUNED)
-
-            cb = normalize_code(res_b.get("code", "")) if res_b else "ERREUR"
-            cf = normalize_code(res_f.get("code", "")) if res_f else "ERREUR"
-            vb = validate_code(cb)[0] if cb != "ERREUR" else False
-            vf = validate_code(cf)[0] if cf != "ERREUR" else False
-
-            das_results.append({
-                "dossier": name,
-                "texte": das.texte[:80],
-                "pipeline": das.cim10_suggestion,
-                "base": cb,
-                "ft": cf,
-                "conf_base": (res_b or {}).get("confidence", "?"),
-                "conf_ft": (res_f or {}).get("confidence", "?"),
-                "valid_base": vb,
-                "valid_ft": vf,
-                "match": code_match_level(cb, cf),
-                "t_base": round(tb, 2),
-                "t_ft": round(tf, 2),
-            })
-
-    t_global = time.time() - t_global_start
-
-    # === RÉSUMÉ ===
-    print(f"\n{'='*75}")
-    print(f"RÉSUMÉ — {len(dp_results)} dossiers, {len(das_results)} DAS testés")
-    print(f"Durée totale : {t_global/60:.1f} min\n")
-
-    for label, results in [("DP", dp_results), ("DAS", das_results)]:
-        if not results:
-            continue
-        nt = len(results)
-        n_exact = sum(1 for r in results if r["match"] == "exact")
-        n_cat = sum(1 for r in results if r["match"] == "categorie")
-        n_diff = sum(1 for r in results if r["match"] == "diff")
-        n_vb = sum(1 for r in results if r["valid_base"])
-        n_vf = sum(1 for r in results if r["valid_ft"])
-        avg_tb = sum(r["t_base"] for r in results) / nt
-        avg_tf = sum(r["t_ft"] for r in results) / nt
-
-        # Confiance
-        conf_b = {}
-        conf_f = {}
-        for r in results:
-            conf_b[r["conf_base"]] = conf_b.get(r["conf_base"], 0) + 1
-            conf_f[r["conf_ft"]] = conf_f.get(r["conf_ft"], 0) + 1
-
-        # Concordance avec pipeline (gemma run original)
-        n_base_eq_pipe = sum(1 for r in results if r["base"] == r["pipeline"])
-        n_ft_eq_pipe = sum(1 for r in results if r["ft"] == r["pipeline"])
-        n_base_cat_pipe = sum(1 for r in results
-                             if r["base"][:3] == r["pipeline"][:3])
-        n_ft_cat_pipe = sum(1 for r in results
-                           if r["ft"][:3] == r["pipeline"][:3])
-
-        print(f"  --- {label} ({nt} diagnostics) ---")
-        print(f"  Concordance base↔ft :")
-        print(f"    Exact      : {n_exact}/{nt} ({100*n_exact/nt:.0f}%)")
-        print(f"    Catégorie  : {n_exact+n_cat}/{nt} ({100*(n_exact+n_cat)/nt:.0f}%)")
-        print(f"    Différent  : {n_diff}/{nt} ({100*n_diff/nt:.0f}%)")
-        print(f"  Codes valides :")
-        print(f"    base       : {n_vb}/{nt} ({100*n_vb/nt:.0f}%)")
-        print(f"    ft         : {n_vf}/{nt} ({100*n_vf/nt:.0f}%)")
-        print(f"  vs pipeline (gemma original) :")
-        print(f"    base=pipe  : {n_base_eq_pipe}/{nt} exact, {n_base_cat_pipe}/{nt} catégorie")
-        print(f"    ft=pipe    : {n_ft_eq_pipe}/{nt} exact, {n_ft_cat_pipe}/{nt} catégorie")
-        print(f"  Temps moyen  : base={avg_tb:.2f}s  ft={avg_tf:.2f}s  (Δ={100*(avg_tf-avg_tb)/avg_tb:+.0f}%)")
-        print(f"  Confiance base : {conf_b}")
-        print(f"  Confiance ft   : {conf_f}")
-        print()
-
-    # Lister les différences DP
-    diffs_dp = [r for r in dp_results if r["match"] == "diff"]
-    if diffs_dp:
-        print(f"  Différences DP ({len(diffs_dp)}) :")
-        for r in diffs_dp:
-            vb = "✓" if r["valid_base"] else "✗"
-            vf = "✓" if r["valid_ft"] else "✗"
-            print(f"    {r['dossier']:<18s} \"{r['texte'][:40]}\"")
-            print(f"      base={r['base']:<7s}{vb}  ft={r['ft']:<7s}{vf}  pipe={r['pipeline']}")
-
-    # Sauvegarder
-    out = {
-        "meta": {
-            "date": time.strftime("%Y-%m-%dT%H:%M:%S"),
-            "model_base": MODEL_BASE,
-            "model_ft": MODEL_FINETUNED,
-            "n_dossiers": len(dp_results),
-            "n_das": len(das_results),
-            "duration_min": round(t_global / 60, 1),
-        },
-        "dp": dp_results,
-        "das": das_results,
-    }
-    out_path = Path(__file__).parent.parent / "output" / "benchmark_ab.json"
-    out_path.write_text(json.dumps(out, ensure_ascii=False, indent=2), encoding="utf-8")
-    print(f"\nRésultats détaillés : {out_path}")
-
-
-if __name__ == "__main__":
-    import argparse
-    parser = argparse.ArgumentParser()
-    parser.add_argument("--n", type=int, default=50,
-                        help="Nombre de dossiers à tester")
-    parser.add_argument("--das-max", type=int, default=5,
-                        help="Max DAS testés par dossier")
-    args = parser.parse_args()
-    run_benchmark(args.n, args.das_max)
diff --git a/t2a_install_rag_cleanup/scripts/select_validation_dossiers.py b/t2a_install_rag_cleanup/scripts/select_validation_dossiers.py
deleted file mode 100644
index 5b70516..0000000
--- a/t2a_install_rag_cleanup/scripts/select_validation_dossiers.py
+++ /dev/null
@@ -1,231 +0,0 @@
-#!/usr/bin/env python3
-"""Sélectionne 50 dossiers pour le gold standard de validation DIM.
-
-- 25 dossiers CPAM (cas complexes, déjà contrôlés)
-- 25 dossiers non-CPAM stratifiés par CMD, confiance DP, nombre de DAS
-
-Crée data/gold_standard/_selection.json et initialise les annotations vides.
-"""
-
-from __future__ import annotations
-
-import json
-import random
-import sys
-from pathlib import Path
-
-# Ajouter le répertoire racine au path
-sys.path.insert(0, str(Path(__file__).resolve().parent.parent))
-
-from src.config import STRUCTURED_DIR, BASE_DIR, DossierMedical
-
-GOLD_DIR = BASE_DIR / "data" / "gold_standard"
-TARGET_TOTAL = 50
-TARGET_CPAM = 25
-
-
-def load_all_dossiers() -> list[dict]:
-    """Charge tous les dossiers fusionnés depuis output/structured/."""
-    dossiers = []
-    for subdir in sorted(STRUCTURED_DIR.iterdir()):
-        if not subdir.is_dir():
-            continue
-        # Chercher le fichier fusionné
-        fusionne = None
-        for f in subdir.glob("*fusionne*.json"):
-            fusionne = f
-            break
-        if not fusionne:
-            # Prendre le premier JSON du dossier
-            jsons = sorted(subdir.glob("*.json"))
-            if jsons:
-                fusionne = jsons[0]
-        if not fusionne:
-            continue
-
-        try:
-            data = json.loads(fusionne.read_text(encoding="utf-8"))
-            dossier = DossierMedical.model_validate(data)
-            rel_path = str(fusionne.relative_to(STRUCTURED_DIR))
-            group_name = subdir.name
-            dossiers.append({
-                "dossier_id": f"{group_name}/{fusionne.stem}",
-                "group_name": group_name,
-                "path_rel": rel_path,
-                "dossier": dossier,
-            })
-        except Exception as e:
-            print(f"  Erreur chargement {fusionne.name}: {e}")
-    return dossiers
-
-
-def select_dossiers(all_dossiers: list[dict]) -> list[dict]:
-    """Sélectionne les 50 dossiers selon la stratégie définie."""
-    # Séparer CPAM / non-CPAM
-    cpam = [d for d in all_dossiers if d["dossier"].controles_cpam]
-    non_cpam = [d for d in all_dossiers if not d["dossier"].controles_cpam]
-
-    print(f"Dossiers CPAM disponibles : {len(cpam)}")
-    print(f"Dossiers non-CPAM disponibles : {len(non_cpam)}")
-
-    # Prendre tous les CPAM (ou max TARGET_CPAM)
-    selected_cpam = cpam[:TARGET_CPAM]
-    remaining_target = TARGET_TOTAL - len(selected_cpam)
-
-    # Stratifier les non-CPAM
-    selected_non_cpam = stratified_sample(non_cpam, remaining_target)
-
-    selected = selected_cpam + selected_non_cpam
-    print(f"\nSélection finale : {len(selected)} dossiers")
-    print(f"  - CPAM : {len(selected_cpam)}")
-    print(f"  - Non-CPAM : {len(selected_non_cpam)}")
-
-    return selected
-
-
-def stratified_sample(dossiers: list[dict], n: int) -> list[dict]:
-    """Échantillonnage stratifié par CMD, confiance DP et nombre de DAS."""
-    if len(dossiers) <= n:
-        return dossiers
-
-    # Grouper par CMD
-    by_cmd: dict[str, list[dict]] = {}
-    for d in dossiers:
-        ghm = d["dossier"].ghm_estimation
-        cmd = ghm.cmd if ghm else "inconnu"
-        by_cmd.setdefault(cmd or "inconnu", []).append(d)
-
-    selected = []
-    seen_ids = set()
-
-    # Phase 1 : 1 dossier par CMD (diversité maximale)
-    cmds = sorted(by_cmd.keys())
-    random.seed(42)  # Reproductible
-    for cmd in cmds:
-        if len(selected) >= n:
-            break
-        candidates = by_cmd[cmd]
-        # Préférer un mix de confiances
-        random.shuffle(candidates)
-        d = candidates[0]
-        selected.append(d)
-        seen_ids.add(d["dossier_id"])
-
-    # Phase 2 : compléter avec diversité confiance DP
-    if len(selected) < n:
-        remaining = [d for d in dossiers if d["dossier_id"] not in seen_ids]
-        # Trier par confiance DP (low > medium > high pour surreprésenter les cas difficiles)
-        conf_order = {"low": 0, "medium": 1, "high": 2, None: 3}
-        remaining.sort(key=lambda d: (
-            conf_order.get(
-                d["dossier"].diagnostic_principal.cim10_confidence
-                if d["dossier"].diagnostic_principal else None,
-                3
-            ),
-            -len(d["dossier"].diagnostics_associes),  # beaucoup de DAS d'abord
-        ))
-        for d in remaining:
-            if len(selected) >= n:
-                break
-            selected.append(d)
-
-    return selected[:n]
-
-
-def create_empty_annotation(dossier_id: str, dossier: DossierMedical) -> dict:
-    """Crée une annotation vide pour un dossier."""
-    dp = dossier.diagnostic_principal
-    das_list = []
-    for i, das in enumerate(dossier.diagnostics_associes):
-        das_list.append({
-            "index": i,
-            "texte_original": das.texte,
-            "code_pipeline": das.cim10_suggestion or "",
-            "confidence": das.cim10_confidence or "",
-            "source": das.source or "",
-            "statut": "correct",
-            "code_corrige": None,
-            "commentaire": "",
-        })
-
-    return {
-        "dossier_id": dossier_id,
-        "validateur": "",
-        "date_validation": "",
-        "statut": "non_commence",
-        "dp": {
-            "texte_original": dp.texte if dp else "",
-            "code_pipeline": dp.cim10_suggestion if dp else "",
-            "confidence": dp.cim10_confidence if dp else "",
-            "statut": "correct",
-            "code_corrige": None,
-            "commentaire": "",
-        },
-        "das": das_list,
-        "das_ajoutes": [],
-        "commentaire_general": "",
-    }
-
-
-def main():
-    print("=== Sélection des dossiers pour validation DIM ===\n")
-
-    all_dossiers = load_all_dossiers()
-    print(f"Total dossiers chargés : {len(all_dossiers)}\n")
-
-    if not all_dossiers:
-        print("Aucun dossier trouvé dans output/structured/")
-        sys.exit(1)
-
-    selected = select_dossiers(all_dossiers)
-
-    # Créer le répertoire gold standard
-    GOLD_DIR.mkdir(parents=True, exist_ok=True)
-
-    # Sauvegarder la sélection
-    selection = {
-        "date_selection": __import__("datetime").datetime.now().isoformat(timespec="seconds"),
-        "total": len(selected),
-        "cpam": sum(1 for d in selected if d["dossier"].controles_cpam),
-        "non_cpam": sum(1 for d in selected if not d["dossier"].controles_cpam),
-        "dossiers": [d["dossier_id"] for d in selected],
-    }
-    selection_path = GOLD_DIR / "_selection.json"
-    selection_path.write_text(
-        json.dumps(selection, ensure_ascii=False, indent=2),
-        encoding="utf-8",
-    )
-    print(f"\nSélection sauvegardée : {selection_path}")
-
-    # Initialiser les annotations vides
-    created = 0
-    for d in selected:
-        dossier_id = d["dossier_id"]
-        safe_name = dossier_id.replace("/", "__") + ".json"
-        annot_path = GOLD_DIR / safe_name
-        if not annot_path.exists():
-            annotation = create_empty_annotation(dossier_id, d["dossier"])
-            annot_path.write_text(
-                json.dumps(annotation, ensure_ascii=False, indent=2),
-                encoding="utf-8",
-            )
-            created += 1
-
-    print(f"Annotations vides créées : {created}")
-    print(f"Annotations existantes préservées : {len(selected) - created}")
-
-    # Résumé
-    print(f"\n--- Résumé ---")
-    for i, d in enumerate(selected, 1):
-        dos = d["dossier"]
-        dp_code = dos.diagnostic_principal.cim10_suggestion if dos.diagnostic_principal else "?"
-        dp_conf = (dos.diagnostic_principal.cim10_confidence or "?") if dos.diagnostic_principal else "?"
-        n_das = len(dos.diagnostics_associes)
-        cpam_flag = " [CPAM]" if dos.controles_cpam else ""
-        ghm = dos.ghm_estimation
-        cmd = ghm.cmd if ghm else "?"
-        print(f"  {i:2d}. {d['group_name']:<20s} DP={dp_code:<6s} conf={dp_conf:<7s} DAS={n_das:2d} CMD={cmd}{cpam_flag}")
-
-
-if __name__ == "__main__":
-    main()
diff --git a/t2a_install_rag_cleanup/src/__init__.py b/t2a_install_rag_cleanup/src/__init__.py
deleted file mode 100644
index e69de29..0000000
diff --git a/t2a_install_rag_cleanup/src/anonymization/__init__.py b/t2a_install_rag_cleanup/src/anonymization/__init__.py
deleted file mode 100644
index e69de29..0000000
diff --git a/t2a_install_rag_cleanup/src/anonymization/anonymizer.py b/t2a_install_rag_cleanup/src/anonymization/anonymizer.py
deleted file mode 100644
index 18e3e97..0000000
--- a/t2a_install_rag_cleanup/src/anonymization/anonymizer.py
+++ /dev/null
@@ -1,529 +0,0 @@
-"""Pipeline d'anonymisation en 3 phases : regex → NER → balayage final."""
-
-from __future__ import annotations
-
-import logging
-import re
-from typing import Any
-
-import regex as regex_mod
-
-from ..config import KEEP_ESTABLISHMENT_NAME, AnonymizationReport
-from . import regex_patterns as patterns
-from .entity_registry import EntityRegistry
-from .ner_anonymizer import extract_person_entities
-
-logger = logging.getLogger(__name__)
-
-# Termes médicaux à ne pas anonymiser même s'ils ressemblent à des noms
-MEDICAL_TERMS_WHITELIST = {
-    "balthazar", "sris", "ras", "atg", "pca", "bcy", "bcr",
-    "nac", "nacl", "asat", "alat", "ggt", "pal", "crp", "imc",
-    "en", "pa", "fc", "vvp", "ide", "iao", "mco", "urg", "bh",
-    "kt", "vbp", "iv", "ap", "am", "ok", "apres", "sous",
-    "normal", "normaux", "stable", "absent", "absente",
-    "date", "heure", "type", "note", "etat", "code",
-    "orale", "intraveineuse", "signé", "arrêté", "réalisé",
-    # Termes médicaux fréquents à ne jamais anonymiser
-    "cholécystectomie", "cholecystectomie", "cholangiographie",
-    "pancréatite", "pancreatite", "lithiase", "lithiases",
-    "cœlioscopie", "coelioscopie", "cholédoque", "choledoque",
-    "angiocholite", "cholécystite", "cholecystite",
-    "morphine", "paracétamol", "paracetamol", "cétirizine", "cetirizine",
-    "tramadol", "contramal", "acupan", "nefopam",
-    "service", "médecin", "medecin", "docteur", "chirurgie",
-    "gastro", "entérologie", "enterologie", "oncologie",
-    "hépato", "hepato", "digestif", "digestive",
-    "proctologue", "nutritive", "pôle", "pole",
-    "fonct", "fonctionnelle", "fonctionnelles",
-    "praticiens", "hospitaliers", "interne", "clinique",
-    "desc", "chef",
-    "secrétariat", "infirmier", "infirmière",
-    "unité", "hospitalisation", "urgences",
-    "coordonnateur", "fédération", "federation",
-    "navarre", "institut", "cancérologie",
-    "bordeaux", "strasbourg", "reims", "limoges", "clermont", "ferrand",
-    "palais",
-}
-
-# Noms d'établissement à préserver si configuré
-ESTABLISHMENT_NAMES = {
-    "centre hospitalier cote basque",
-    "centre hospitalier côte basque",
-    "ch-cotebasque",
-    "icance",
-}
-
-
-class Anonymizer:
-    """Anonymiseur 3 phases pour documents médicaux."""
-
-    def __init__(self, parsed_data: dict | None = None):
-        self.registry = EntityRegistry(whitelist=MEDICAL_TERMS_WHITELIST)
-        self.report = AnonymizationReport(source_file="")
-        self._parsed = parsed_data or {}
-
-        # Pré-enregistrer les entités connues du parsing
-        self._register_parsed_entities()
-
-    def anonymize(self, text: str) -> str:
-        """Exécute les 3 phases d'anonymisation."""
-        text = self._phase1_regex(text)
-        text = self._phase2_ner(text)
-        text = self._phase3_sweep(text)
-
-        self.report.total_replacements = (
-            self.report.regex_replacements
-            + self.report.ner_replacements
-            + self.report.sweep_replacements
-        )
-        return text
-
-    # --- Phase 1 : Regex ---
-
-    def _phase1_regex(self, text: str) -> str:
-        """Anonymisation par patterns regex."""
-        count = 0
-
-        # CRH footer combiné (IPP + Episode sur la même ligne)
-        text, n = self._replace_crh_footer_ipp_episode(text)
-        count += n
-
-        # Identifiants
-        text, n = self._replace_pattern(
-            text, patterns.IPP_PATTERN, "ipp",
-            group_handler=self._handle_multi_group,
-        )
-        count += n
-
-        text, n = self._replace_pattern(
-            text, patterns.EPISODE_PATTERN, "episode",
-            group_handler=self._handle_multi_group,
-        )
-        count += n
-
-        text, n = self._replace_pattern(text, patterns.NIR_PATTERN, "nir")
-        count += n
-
-        text, n = self._replace_pattern(text, patterns.FINESS_PATTERN, "finess")
-        count += n
-
-        text, n = self._replace_pattern(text, patterns.RPPS_PATTERN, "rpps")
-        count += n
-
-        text, n = self._replace_pattern(text, patterns.BARCODE_PATTERN, "code_barre")
-        count += n
-
-        text, n = self._replace_pattern(text, patterns.BARCODE_REPEAT_PATTERN, "code_barre")
-        count += n
-
-        # Contact
-        text, n = self._replace_phone(text)
-        count += n
-
-        text, n = self._replace_pattern(
-            text, patterns.EMAIL_PATTERN, "email",
-            skip_establishment_check=True,
-        )
-        count += n
-
-        text, n = self._replace_fax(text)
-        count += n
-
-        # Adresses
-        text, n = self._replace_addresses(text)
-        count += n
-
-        # Scanner les patterns d'adresse inline (MAISON xxx, QUARTIER xxx...)
-        text, n = self._replace_inline_addresses(text)
-        count += n
-
-        # Dates de naissance
-        text, n = self._replace_date_naissance(text)
-        count += n
-
-        # Lieu de naissance
-        text, n = self._replace_pattern(
-            text, patterns.LIEU_NAISSANCE_PATTERN, "lieu_naissance",
-        )
-        count += n
-
-        # Noms structurés
-        text, n = self._replace_structured_names(text)
-        count += n
-
-        # Footers (Trackare et CRH)
-        text, n = self._replace_footer(text)
-        count += n
-
-        self.report.regex_replacements = count
-        return text
-
-    # --- Phase 2 : NER ---
-
-    def _phase2_ner(self, text: str) -> str:
-        """Anonymisation par NER CamemBERT."""
-        try:
-            ner_entities = extract_person_entities(text)
-        except Exception as e:
-            logger.warning("NER indisponible (%s), phase 2 ignorée.", e)
-            return text
-
-        count = 0
-        # Trier par position décroissante pour remplacer de la fin au début
-        ner_entities.sort(key=lambda e: e["start"], reverse=True)
-
-        for ent in ner_entities:
-            word = ent["word"]
-            if self._is_whitelisted(word):
-                continue
-            if self._is_establishment(word):
-                continue
-
-            # Vérifier si déjà anonymisé (contient des crochets)
-            if "[" in word and "]" in word:
-                continue
-
-            pseudo = self.registry.get_replacement(word)
-            if pseudo is None:
-                pseudo = self.registry.register(word, "personne")
-
-            text = text[:ent["start"]] + pseudo + text[ent["end"]:]
-            count += 1
-
-            self.report.entities_found.append({
-                "original": word,
-                "replacement": pseudo,
-                "source": "ner",
-                "score": ent["score"],
-            })
-
-        self.report.ner_replacements = count
-        return text
-
-    # --- Phase 3 : Balayage final ---
-
-    def _phase3_sweep(self, text: str) -> str:
-        """Balayage brute-force des entités connues restantes."""
-        count = 0
-        all_entities = self.registry.get_all_entities()
-
-        for original, replacement in sorted(
-            all_entities.items(), key=lambda x: len(x[0]), reverse=True
-        ):
-            if len(original) < 3:
-                continue
-            if self._is_whitelisted(original):
-                continue
-
-            # Recherche insensible à la casse, avec frontières de mots
-            escaped = re.escape(original)
-            pattern = re.compile(r"\b" + escaped + r"\b", re.IGNORECASE)
-            matches = pattern.findall(text)
-            if matches:
-                text = pattern.sub(replacement, text)
-                count += len(matches)
-
-        self.report.sweep_replacements = count
-        return text
-
-    # --- Helpers ---
-
-    def _register_parsed_entities(self) -> None:
-        """Pré-enregistre les entités extraites par les parsers."""
-        patient = self._parsed.get("patient", {})
-
-        # Noms patient
-        for key in ("nom_prenom", "nom_naissance", "nom_complet"):
-            if patient.get(key):
-                self.registry.register(patient[key], "patient")
-
-        # Adresse patient — enregistrer l'adresse complète et chaque mot significatif
-        if patient.get("adresse"):
-            self._register_address(patient["adresse"])
-        if patient.get("ville"):
-            self.registry.register(patient["ville"], "adresse")
-        if patient.get("code_postal"):
-            cp = patient["code_postal"]
-            if patient.get("ville"):
-                self.registry.register(f"{cp} {patient['ville']}", "adresse")
-        if patient.get("lieu_naissance"):
-            self.registry.register(patient["lieu_naissance"], "lieu_naissance")
-
-        # Médecins
-        for med in self._parsed.get("medecins", []):
-            self.registry.register(med, "medecin")
-
-        # Scanner le texte brut pour les lignes d'adresse non captées par le parser
-        raw_text = self._parsed.get("contenu_medical", "")
-        # Pas disponible ici, on le fera via les patterns dans phase 1
-
-        # Contacts
-        for contact in self._parsed.get("contacts", []):
-            # Extraire les noms des contacts
-            names = re.findall(
-                r"([A-ZÉÈÊËÀÂa-zéèêëàâ]{2,}(?:\s+[A-ZÉÈÊËÀÂa-zéèêëàâ]{2,})+)",
-                contact,
-            )
-            for name in names:
-                if not self._is_whitelisted(name):
-                    self.registry.register(name, "contact")
-
-    def _replace_pattern(
-        self,
-        text: str,
-        pattern: regex_mod.Pattern,
-        category: str,
-        group_handler: Any = None,
-        skip_establishment_check: bool = False,
-    ) -> tuple[str, int]:
-        """Remplace les matches d'un pattern."""
-        count = 0
-        for m in reversed(list(pattern.finditer(text))):
-            if group_handler:
-                matched_text = group_handler(m)
-            else:
-                matched_text = m.group(1) if m.lastindex else m.group(0)
-
-            if not matched_text:
-                continue
-
-            if not skip_establishment_check and self._is_establishment(matched_text):
-                continue
-
-            pseudo = self.registry.register(matched_text, category)
-
-            # Trouver le bon span à remplacer
-            if group_handler:
-                # Pour les multi-group, trouver quel groupe a matché
-                for i in range(1, (m.lastindex or 0) + 1):
-                    if m.group(i) == matched_text:
-                        start, end = m.span(i)
-                        break
-                else:
-                    start, end = m.span()
-            elif m.lastindex:
-                start, end = m.span(1)
-            else:
-                start, end = m.span()
-
-            text = text[:start] + pseudo + text[end:]
-            count += 1
-
-            self.report.entities_found.append({
-                "original": matched_text,
-                "replacement": pseudo,
-                "source": "regex",
-                "category": category,
-            })
-
-        return text, count
-
-    def _handle_multi_group(self, m: regex_mod.Match) -> str | None:
-        """Gère les patterns avec plusieurs groupes alternatifs."""
-        for i in range(1, (m.lastindex or 0) + 1):
-            if m.group(i):
-                return m.group(i)
-        return None
-
-    def _replace_crh_footer_ipp_episode(self, text: str) -> tuple[str, int]:
-        """Remplace les IPP/épisode dans les footers CRH (format combiné)."""
-        count = 0
-        for m in reversed(list(patterns.CRH_FOOTER_IPP_EPISODE.finditer(text))):
-            ipp = m.group(1)
-            episode = m.group(2)
-            pseudo_ipp = self.registry.register(ipp, "ipp")
-            pseudo_ep = self.registry.register(episode, "episode")
-            replacement = f"IPP {pseudo_ipp} / N° Episode {pseudo_ep}"
-            text = text[:m.start()] + replacement + text[m.end():]
-            count += 2
-        return text, count
-
-    def _replace_phone(self, text: str) -> tuple[str, int]:
-        """Remplace les numéros de téléphone."""
-        count = 0
-        for m in reversed(list(patterns.PHONE_PATTERN.finditer(text))):
-            phone = m.group(0)
-            # Ne pas anonymiser le standard de l'hôpital si configuré
-            normalized = phone.replace(".", " ").replace("-", " ")
-            if KEEP_ESTABLISHMENT_NAME and "05 59 44 35 35" in normalized:
-                continue
-            pseudo = self.registry.register(phone, "telephone")
-            text = text[:m.start()] + pseudo + text[m.end():]
-            count += 1
-        return text, count
-
-    def _replace_fax(self, text: str) -> tuple[str, int]:
-        """Remplace les numéros de fax."""
-        count = 0
-        for m in reversed(list(patterns.FAX_PATTERN.finditer(text))):
-            fax_num = m.group(1)
-            pseudo = self.registry.register(fax_num, "telephone")
-            text = text[:m.start(1)] + pseudo + text[m.end(1):]
-            count += 1
-        return text, count
-
-    def _replace_addresses(self, text: str) -> tuple[str, int]:
-        """Remplace les adresses."""
-        count = 0
-
-        # Lignes d'adresse
-        for m in reversed(list(patterns.ADDRESS_LINE_PATTERN.finditer(text))):
-            addr = m.group(1).strip()
-            if len(addr) > 5 and not self._is_establishment(addr):
-                pseudo = self.registry.register(addr, "adresse")
-                text = text[:m.start(1)] + pseudo + text[m.end(1):]
-                count += 1
-
-        # Code postal + ville (sauf l'hôpital / Bayonne)
-        for m in reversed(list(patterns.CP_VILLE_PATTERN.finditer(text))):
-            ville = m.group(2).strip()
-            cp = m.group(1)
-            full = f"{cp} {ville}"
-            if self._is_establishment(full) or "BAYONNE" in ville.upper():
-                if not KEEP_ESTABLISHMENT_NAME:
-                    pseudo = self.registry.register(full, "adresse")
-                    text = text[:m.start()] + pseudo + text[m.end():]
-                    count += 1
-            else:
-                pseudo = self.registry.register(full, "adresse")
-                text = text[:m.start()] + pseudo + text[m.end():]
-                count += 1
-
-        return text, count
-
-    def _replace_inline_addresses(self, text: str) -> tuple[str, int]:
-        """Capture les adresses inline (MAISON xxx, QUARTIER xxx, LOTISSEMENT xxx)."""
-        count = 0
-        # Pattern : MAISON/QUARTIER/LOTISSEMENT suivi de mots (noms propres de lieux)
-        inline_addr = re.compile(
-            r"((?:MAISON|QUARTIER|LOTISSEMENT|RESIDENCE|HAMEAU)\s+[A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ][A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\s]+?)(?=\n|$|Dr|\d{5}|Chef|médical|coordonnateur)",
-            re.IGNORECASE,
-        )
-        for m in reversed(list(inline_addr.finditer(text))):
-            addr = m.group(1).strip()
-            if len(addr) > 5:
-                self._register_address(addr)
-                pseudo = self.registry.register(addr, "adresse")
-                text = text[:m.start(1)] + pseudo + text[m.end(1):]
-                count += 1
-        return text, count
-
-    def _replace_date_naissance(self, text: str) -> tuple[str, int]:
-        """Remplace les dates de naissance."""
-        count = 0
-        for m in reversed(list(patterns.DATE_NAISSANCE_PATTERN.finditer(text))):
-            date_str = m.group(1)
-            pseudo = self.registry.register(date_str, "date_naissance")
-            text = text[:m.start(1)] + pseudo + text[m.end(1):]
-            count += 1
-        return text, count
-
-    def _replace_structured_names(self, text: str) -> tuple[str, int]:
-        """Remplace les noms détectés par patterns structurels."""
-        count = 0
-
-        # CRH footer patient : "Patient(e) : NOM PRENOM Né(e)"
-        for m in reversed(list(patterns.CRH_FOOTER_PATIENT_PATTERN.finditer(text))):
-            name = m.group(1).strip()
-            if len(name) >= 3 and not self._is_whitelisted(name):
-                pseudo = self.registry.register(name, "patient")
-                text = text[:m.start(1)] + pseudo + text[m.end(1):]
-                count += 1
-
-        # Patient names
-        for pat in [patterns.PATIENT_NAME_PATTERN, patterns.CIVILITE_NAME_PATTERN]:
-            for m in reversed(list(pat.finditer(text))):
-                name = m.group(1).strip()
-                if len(name) >= 3 and not self._is_whitelisted(name):
-                    pseudo = self.registry.register(name, "patient")
-                    text = text[:m.start(1)] + pseudo + text[m.end(1):]
-                    count += 1
-
-        # Doctor names (tous les patterns)
-        for pat in [patterns.DR_NAME_PATTERN, patterns.MEDECIN_COURANT_PATTERN,
-                     patterns.MEDECIN_TRAITANT_PATTERN, patterns.MEDECIN_PEC_PATTERN]:
-            for m in reversed(list(pat.finditer(text))):
-                name = m.group(1).strip()
-                if len(name) >= 3 and not self._is_whitelisted(name):
-                    pseudo = self.registry.register(name, "medecin")
-                    text = text[:m.start(1)] + pseudo + text[m.end(1):]
-                    count += 1
-
-        # Note authors (with date suffix)
-        for m in reversed(list(patterns.NOTE_AUTHOR_DATE_PATTERN.finditer(text))):
-            name = m.group(1).strip()
-            if len(name) >= 3 and not self._is_whitelisted(name):
-                pseudo = self.registry.register(name, "soignant")
-                text = text[:m.start(1)] + pseudo + text[m.end(1):]
-                count += 1
-
-        # Note authors (Prénom NOM pattern, sans date)
-        for m in reversed(list(patterns.NOTE_AUTHOR_PATTERN.finditer(text))):
-            name = m.group(1).strip()
-            if len(name) >= 3 and not self._is_whitelisted(name):
-                pseudo = self.registry.register(name, "soignant")
-                text = text[:m.start(1)] + pseudo + text[m.end(1):]
-                count += 1
-
-        # IAO
-        for m in reversed(list(patterns.IAO_PATTERN.finditer(text))):
-            name = m.group(1).strip()
-            if len(name) >= 3 and not self._is_whitelisted(name):
-                pseudo = self.registry.register(name, "soignant")
-                text = text[:m.start(1)] + pseudo + text[m.end(1):]
-                count += 1
-
-        # Rédigé par
-        for m in reversed(list(patterns.REDIGE_PAR_PATTERN.finditer(text))):
-            name = m.group(1).strip()
-            if len(name) >= 3 and not self._is_whitelisted(name):
-                pseudo = self.registry.register(name, "soignant")
-                text = text[:m.start(1)] + pseudo + text[m.end(1):]
-                count += 1
-
-        # Staff names from header
-        for m in reversed(list(patterns.STAFF_NAME_PATTERN.finditer(text))):
-            name = m.group(1).strip() if m.group(1) else ""
-            if len(name) >= 3 and not self._is_whitelisted(name):
-                pseudo = self.registry.register(name, "soignant")
-                text = text[:m.start(1)] + pseudo + text[m.end(1):]
-                count += 1
-
-        self.report.regex_replacements += count
-        return text, count
-
-    def _replace_footer(self, text: str) -> tuple[str, int]:
-        """Remplace les infos patient dans les footers (Trackare et CRH)."""
-        count = 0
-        for m in reversed(list(patterns.FOOTER_PATIENT_PATTERN.finditer(text))):
-            name = m.group(1).strip()
-            pseudo = self.registry.register(name, "patient")
-            text = text[:m.start(1)] + pseudo + text[m.end(1):]
-            count += 1
-        return text, count
-
-    def _register_address(self, addr: str) -> None:
-        """Enregistre une adresse et ses mots significatifs."""
-        self.registry.register(addr, "adresse")
-        skip_words = {
-            "maison", "quartier", "lotissement", "rue", "avenue",
-            "boulevard", "chemin", "place", "route", "résidence",
-            "hameau", "lieu", "dit", "impasse", "allée", "batiment",
-            "bp", "cedex",
-        }
-        for word in addr.split():
-            word_clean = word.strip(",.")
-            if len(word_clean) >= 4 and word_clean.lower() not in skip_words:
-                self.registry.register(word_clean, "adresse")
-
-    def _is_whitelisted(self, text: str) -> bool:
-        """Vérifie si un terme est dans la whitelist médicale."""
-        return text.lower().strip() in MEDICAL_TERMS_WHITELIST
-
-    def _is_establishment(self, text: str) -> bool:
-        """Vérifie si le texte fait référence à l'établissement."""
-        if not KEEP_ESTABLISHMENT_NAME:
-            return False
-        text_lower = text.lower().strip()
-        return any(est in text_lower for est in ESTABLISHMENT_NAMES)
diff --git a/t2a_install_rag_cleanup/src/anonymization/entity_registry.py b/t2a_install_rag_cleanup/src/anonymization/entity_registry.py
deleted file mode 100644
index f94407b..0000000
--- a/t2a_install_rag_cleanup/src/anonymization/entity_registry.py
+++ /dev/null
@@ -1,86 +0,0 @@
-"""Registre d'entités pour assurer la cohérence des remplacements."""
-
-from __future__ import annotations
-
-import re
-from collections import defaultdict
-
-
-class EntityRegistry:
-    """Maintient un mapping cohérent entre entités réelles et pseudonymes."""
-
-    def __init__(self, whitelist: set[str] | None = None):
-        self._counters: dict[str, int] = defaultdict(int)
-        self._mappings: dict[str, str] = {}
-        self._category_map: dict[str, str] = {}
-        self._whitelist: set[str] = whitelist or set()
-
-    def register(self, entity: str, category: str) -> str:
-        """Enregistre une entité et retourne son pseudonyme.
-
-        Si l'entité est déjà connue, retourne le même pseudonyme.
-        """
-        key = self._normalize(entity)
-        if not key:
-            return entity
-
-        if key in self._mappings:
-            return self._mappings[key]
-
-        self._counters[category] += 1
-        count = self._counters[category]
-
-        pseudo = self._generate_pseudo(category, count)
-        self._mappings[key] = pseudo
-        self._category_map[key] = category
-
-        # Enregistrer aussi les sous-parties du nom (sauf termes médicaux)
-        parts = key.split()
-        if len(parts) > 1:
-            for part in parts:
-                if len(part) >= 3 and part not in self._whitelist:
-                    part_key = part
-                    if part_key not in self._mappings:
-                        self._mappings[part_key] = f"[{category.upper()}]"
-
-        return pseudo
-
-    def get_replacement(self, entity: str) -> str | None:
-        """Retourne le pseudonyme d'une entité connue, ou None."""
-        key = self._normalize(entity)
-        return self._mappings.get(key)
-
-    def get_all_entities(self) -> dict[str, str]:
-        """Retourne tous les mappings entity → pseudo."""
-        return dict(self._mappings)
-
-    def get_all_original_names(self) -> list[str]:
-        """Retourne toutes les entités originales (noms avant normalisation)."""
-        return list(self._mappings.keys())
-
-    def _normalize(self, text: str) -> str:
-        """Normalise un nom pour lookup : minuscules, espaces simplifiés."""
-        text = text.strip()
-        text = re.sub(r"\s+", " ", text)
-        return text.lower()
-
-    def _generate_pseudo(self, category: str, count: int) -> str:
-        """Génère un pseudonyme selon la catégorie."""
-        labels = {
-            "patient": f"[PATIENT_{count}]",
-            "medecin": f"[MEDECIN_{count}]",
-            "soignant": f"[SOIGNANT_{count}]",
-            "contact": f"[CONTACT_{count}]",
-            "personne": f"[PERSONNE_{count}]",
-            "ipp": f"[IPP_{count}]",
-            "episode": f"[EPISODE_{count}]",
-            "nir": f"[NIR_{count}]",
-            "telephone": f"[TEL_{count}]",
-            "email": f"[EMAIL_{count}]",
-            "adresse": f"[ADRESSE_{count}]",
-            "date_naissance": f"[DATE_NAISS_{count}]",
-            "lieu_naissance": f"[LIEU_NAISS_{count}]",
-            "finess": f"[FINESS]",
-            "code_barre": f"[CODE_BARRE_{count}]",
-        }
-        return labels.get(category, f"[{category.upper()}_{count}]")
diff --git a/t2a_install_rag_cleanup/src/anonymization/ner_anonymizer.py b/t2a_install_rag_cleanup/src/anonymization/ner_anonymizer.py
deleted file mode 100644
index 0cf8793..0000000
--- a/t2a_install_rag_cleanup/src/anonymization/ner_anonymizer.py
+++ /dev/null
@@ -1,95 +0,0 @@
-"""NER via CamemBERT pour détecter les noms en texte libre."""
-
-from __future__ import annotations
-
-import logging
-from typing import TYPE_CHECKING
-
-from ..config import NER_CONFIDENCE_THRESHOLD, NER_MODEL
-
-if TYPE_CHECKING:
-    from transformers import Pipeline
-
-logger = logging.getLogger(__name__)
-
-_pipeline: Pipeline | None = None
-
-
-def _get_pipeline() -> Pipeline:
-    """Charge le modèle NER (lazy loading)."""
-    global _pipeline
-    if _pipeline is None:
-        logger.info("Chargement du modèle NER %s...", NER_MODEL)
-        from transformers import AutoModelForTokenClassification, AutoTokenizer, pipeline
-
-        tokenizer = AutoTokenizer.from_pretrained(NER_MODEL, local_files_only=True)
-        model = AutoModelForTokenClassification.from_pretrained(NER_MODEL, local_files_only=True)
-        _pipeline = pipeline(
-            "ner",
-            model=model,
-            tokenizer=tokenizer,
-            aggregation_strategy="simple",
-        )
-        logger.info("Modèle NER chargé.")
-    return _pipeline
-
-
-def extract_person_entities(text: str) -> list[dict]:
-    """Extrait les entités de type PER (personnes) du texte.
-
-    Retourne une liste de dicts avec 'word', 'start', 'end', 'score'.
-    """
-    pipe = _get_pipeline()
-
-    # CamemBERT a une limite de tokens — découper en chunks
-    chunks = _split_text(text, max_chars=500)
-    entities: list[dict] = []
-    offset = 0
-
-    for chunk in chunks:
-        results = pipe(chunk)
-        for ent in results:
-            if ent["entity_group"] == "PER" and ent["score"] >= NER_CONFIDENCE_THRESHOLD:
-                word = ent["word"].strip()
-                if len(word) >= 2:
-                    entities.append({
-                        "word": word,
-                        "start": ent["start"] + offset,
-                        "end": ent["end"] + offset,
-                        "score": float(ent["score"]),
-                    })
-        offset += len(chunk)
-
-    return _deduplicate(entities)
-
-
-def _split_text(text: str, max_chars: int = 500) -> list[str]:
-    """Découpe le texte en chunks de taille raisonnable aux limites de phrases."""
-    if len(text) <= max_chars:
-        return [text]
-
-    chunks: list[str] = []
-    start = 0
-    while start < len(text):
-        end = start + max_chars
-        if end < len(text):
-            # Chercher la fin de phrase la plus proche
-            for sep in ["\n", ". ", ", ", " "]:
-                pos = text.rfind(sep, start, end)
-                if pos > start:
-                    end = pos + len(sep)
-                    break
-        chunks.append(text[start:end])
-        start = end
-
-    return chunks
-
-
-def _deduplicate(entities: list[dict]) -> list[dict]:
-    """Déduplique les entités par mot (garde le score le plus élevé)."""
-    seen: dict[str, dict] = {}
-    for ent in entities:
-        key = ent["word"].lower()
-        if key not in seen or ent["score"] > seen[key]["score"]:
-            seen[key] = ent
-    return list(seen.values())
diff --git a/t2a_install_rag_cleanup/src/anonymization/regex_patterns.py b/t2a_install_rag_cleanup/src/anonymization/regex_patterns.py
deleted file mode 100644
index 81c3981..0000000
--- a/t2a_install_rag_cleanup/src/anonymization/regex_patterns.py
+++ /dev/null
@@ -1,194 +0,0 @@
-"""Patterns regex pour la détection de données personnelles dans les documents médicaux FR."""
-
-from __future__ import annotations
-
-import regex
-
-# --- Identifiants ---
-
-# IPP : séquence de 6-10 chiffres après "IPP" (avec ou sans :)
-IPP_PATTERN = regex.compile(
-    r"(?:IPP\s*[:=]?\s*)(\d{6,10})"
-    r"|"
-    r"\((\d{8})\s*\)",  # Footer "(01306172 )"
-)
-
-# Numéro d'épisode (toutes les variantes)
-EPISODE_PATTERN = regex.compile(
-    r"(?:Episode\s*(?:No|N°|N\.?)\s*[:=]?\s*)(\d{6,10})"
-    r"|"
-    r"(?:N°\s*Episode\s+)(\d{6,10})",
-)
-
-# NIR / Numéro de sécurité sociale (15 chiffres)
-NIR_PATTERN = regex.compile(r"\b([12]\d{2}(?:0[1-9]|1[0-2])\d{2,3}\d{6}\s?\d{2})\b")
-
-# FINESS (9 chiffres, souvent précédé de "Finess")
-FINESS_PATTERN = regex.compile(r"(?:Finess|FINESS)\s*[:\s]*\*?(\d{9})\*?")
-
-# RPPS (11 chiffres)
-RPPS_PATTERN = regex.compile(r"RPPS\s*[:=]?\s*(\d{11})")
-
-# Code-barres (nombre entre astérisques)
-BARCODE_PATTERN = regex.compile(r"\*(\d{9,15})\*")
-
-# Numéro isolé après code-barres (même numéro répété sans astérisques)
-BARCODE_REPEAT_PATTERN = regex.compile(r"\*\d{9,15}\*\s*\n(\d{9,15})")
-
-# --- Contact ---
-
-# Téléphones FR : 10 chiffres avec séparateurs variés
-PHONE_PATTERN = regex.compile(
-    r"\b(0[1-9])[\s.\-]?(\d{2})[\s.\-]?(\d{2})[\s.\-]?(\d{2})[\s.\-]?(\d{2})\b"
-)
-
-# Emails (y compris @ch-cotebasque.fr qui contiennent des initiales de soignants)
-EMAIL_PATTERN = regex.compile(
-    r"\b[a-zA-Z0-9._%+\-]+@[a-zA-Z0-9.\-]+\.[a-zA-Z]{2,}\b"
-)
-
-# Fax
-FAX_PATTERN = regex.compile(
-    r"Fax\s*:\s*(0[1-9][\s.\-]?\d{2}[\s.\-]?\d{2}[\s.\-]?\d{2}[\s.\-]?\d{2})"
-)
-
-# --- Adresses ---
-
-# Code postal + ville (uniquement les ALL_CAPS après 5 digits)
-CP_VILLE_PATTERN = regex.compile(
-    r"\b(\d{5})\s+([A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ][A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ\s\-]{2,})\b"
-)
-
-# Lignes d'adresse avec mots-clés (y compris noms propres basques/locaux)
-ADDRESS_LINE_PATTERN = regex.compile(
-    r"^((?:(?:\d+\s*,?\s*)?(?:MAISON|LOTISSEMENT|QUARTIER|RUE|AVENUE|BOULEVARD|IMPASSE|CHEMIN|PLACE|ALLEE|ALLÉE|ROUTE|LIEU[\s-]DIT|RESIDENCE|RÉSIDENCE|BATIMENT|BÂTIMENT|HAMEAU)[\s\w\-''ÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ]+))$",
-    regex.MULTILINE | regex.IGNORECASE,
-)
-
-# Adresse complète multi-ligne (après nom patient dans CRH/Trackare)
-ADDRESS_BLOCK_PATTERN = regex.compile(
-    r"(?:Adresse\s*:\s*)(.+?)(?:\s+Ville|\n)",
-)
-
-# --- Dates de naissance ---
-
-# Toutes les variantes : "né(e) le", "née le", "né le", "Né(e) le", "Date de naissance:"
-DATE_NAISSANCE_PATTERN = regex.compile(
-    r"(?:[Nn][ée]+(?:\(e\))?\s+le\s+|Date de naissance\s*[:=]?\s*)(\d{2}/\d{2}/\d{4})"
-)
-
-# --- Noms structurés ---
-
-# Footer CRH : "Patient(e) : NOM PRENOM Né(e) le"
-CRH_FOOTER_PATIENT_PATTERN = regex.compile(
-    r"Patient(?:\(e\))?\s*:\s*([A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ][A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\s\-]+?)\s+(?:Né|né)"
-)
-
-# Footer CRH : "IPP NNNNNNNN / N° Episode NNNNNNNN"
-CRH_FOOTER_IPP_EPISODE = regex.compile(
-    r"IPP\s+(\d{6,10})\s*/\s*N°\s*Episode\s+(\d{6,10})"
-)
-
-# Après "Nom de naissance:", "Nom et Prénom:", "Patient(e):"
-PATIENT_NAME_PATTERN = regex.compile(
-    r"(?:Patient(?:\(e\))?\s*:\s*|Nom de naissance\s*:\s*|Nom et Prénom\s*:\s*)"
-    r"([A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ][A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\s\-]+)",
-)
-
-# "MME/Mme/M./MR/Madame/Monsieur" suivi du nom
-CIVILITE_NAME_PATTERN = regex.compile(
-    r"(?:MME|Mme|Madame|M\.|Mr|MR|Monsieur)\s+([A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ][A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\s\.\-]+?)(?:\s+[Nn]é|\s+Date|\n|,)"
-)
-
-# "DR." / "Dr" / "Docteur" suivi du nom du médecin
-DR_NAME_PATTERN = regex.compile(
-    r"(?:DR\.?|Dr\.?|Docteur)\s+([A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ][A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\.\-]+(?:\s+[A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\.\-]+){0,2})"
-)
-
-# "Rédigé par" en pied de page CRH
-REDIGE_PAR_PATTERN = regex.compile(
-    r"Rédigé par\s*:?\s*(.+?)(?:\n|$)"
-)
-
-# "Liste des destinataires:" suivi de noms
-DESTINATAIRE_PATTERN = regex.compile(
-    r"(?:Madame|Monsieur|DR\.?|Dr\.?)\s+([A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ][A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\s\.\-]+?)(?:\n|$)"
-)
-
-# Noms d'auteurs dans Trackare : "Note d'évolution Prénom NOM DD/MM/YYYY"
-NOTE_AUTHOR_DATE_PATTERN = regex.compile(
-    r"(?:Note d'évolution|Note IDE|Histoire de la maladie|Conclusion Obs\.?\s*médicales?)\s+"
-    r"(?:DR\.?\s+)?"
-    r"([A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\.\-]+(?:\s+[A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\.\-]+)+)"
-    r"\s+\d{2}/\d{2}/\d{4}",
-)
-
-# Noms d'auteurs Trackare sans date immédiate : "Note IDE Prénom NOM texte..."
-# Le nom est toujours un Prénom (Capitalized) suivi d'un NOM (ALL CAPS)
-NOTE_AUTHOR_PATTERN = regex.compile(
-    r"(?:Note d'évolution|Note IDE|Histoire de la maladie|Conclusion Obs\.?\s*médicales?)\s+"
-    r"(?:DR\.?\s+)?"
-    r"([A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ][a-zéèêëàâäùûüôöîïç]+\s+[A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ][A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ\-]{2,})"
-)
-
-# Footer Trackare : "Patient: NOM PRENOM - Date de naissance: ..."
-FOOTER_PATIENT_PATTERN = regex.compile(
-    r"Patient\s*:\s*([A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ][A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\s\-]+?)\s*-\s*Date de naissance"
-)
-
-# "Médecin traitant" block
-MEDECIN_TRAITANT_PATTERN = regex.compile(
-    r"Médecin traitant\s*\n\s*(?:Nom\s+Adresse\s+.*\n)?\s*(?:DR\.?\s+)?(.+?)(?:\s+(?:Lotissement|Rue|Avenue|\d{5}))",
-    regex.IGNORECASE,
-)
-
-# "Médecin courant:"
-MEDECIN_COURANT_PATTERN = regex.compile(
-    r"Médecin courant\s*:\s*(?:DR\.?\s+)?([A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\.\-]+(?:\s+[A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\.\-]+)*)"
-)
-
-# "Médecin de la prise en charge médicale NOM"
-MEDECIN_PEC_PATTERN = regex.compile(
-    r"(?:Médecin de (?:la )?(?:prise en charge|décision)\s+médicale)\s+([A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\.\-]+(?:\s+[A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\.\-]+)*)"
-)
-
-# IAO
-IAO_PATTERN = regex.compile(
-    r"IAO\s+([A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\.\-]+(?:\s+[A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\.\-]+)*)"
-)
-
-# Cadre / personnel nommé dans l'en-tête CRH
-STAFF_NAME_PATTERN = regex.compile(
-    r"(?:Mme|M\.)\s+([A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ][A-Za-zéèêëàâäùûüôöîïç\.\-]+\s+[A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ][A-Za-zéèêëàâäùûüôöîïç\.\-]+)"
-)
-
-# Lieu de naissance
-LIEU_NAISSANCE_PATTERN = regex.compile(
-    r"Lieu de naissance\s*:\s*(.+?)(?:\n|$)"
-)
-
-# Auteurs de prescription dans Trackare
-PRESCRIPTION_AUTHOR_PATTERN = regex.compile(
-    r"(?:Presc\.\s*de\s*Sortie|Normal|Signé|Arrêté|Réalisé)\s+([A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ][a-zéèêëàâäùûüôöîïç]+(?:\s+[A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ][A-Za-zéèêëàâäùûüôöîïç\-]+)+)"
-)
-
-
-def get_all_name_patterns():
-    """Retourne la liste des patterns qui capturent des noms de personnes."""
-    return [
-        PATIENT_NAME_PATTERN,
-        CIVILITE_NAME_PATTERN,
-        DR_NAME_PATTERN,
-        REDIGE_PAR_PATTERN,
-        NOTE_AUTHOR_DATE_PATTERN,
-        NOTE_AUTHOR_PATTERN,
-        FOOTER_PATIENT_PATTERN,
-        CRH_FOOTER_PATIENT_PATTERN,
-        MEDECIN_TRAITANT_PATTERN,
-        MEDECIN_COURANT_PATTERN,
-        MEDECIN_PEC_PATTERN,
-        IAO_PATTERN,
-        STAFF_NAME_PATTERN,
-        DESTINATAIRE_PATTERN,
-        PRESCRIPTION_AUTHOR_PATTERN,
-    ]
diff --git a/t2a_install_rag_cleanup/src/config.py b/t2a_install_rag_cleanup/src/config.py
deleted file mode 100644
index 41073ce..0000000
--- a/t2a_install_rag_cleanup/src/config.py
+++ /dev/null
@@ -1,289 +0,0 @@
-"""Configuration globale et modèles de données pour le pipeline T2A."""
-
-from __future__ import annotations
-
-import os
-from pathlib import Path
-from typing import Optional
-
-from dotenv import load_dotenv
-from pydantic import BaseModel, Field, field_validator
-
-load_dotenv()
-
-
-# --- Chemins ---
-
-BASE_DIR = Path(__file__).resolve().parent.parent
-INPUT_DIR = BASE_DIR / "input"
-OUTPUT_DIR = BASE_DIR / "output"
-ANONYMIZED_DIR = OUTPUT_DIR / "anonymized"
-STRUCTURED_DIR = OUTPUT_DIR / "structured"
-REPORTS_DIR = OUTPUT_DIR / "reports"
-
-for d in (INPUT_DIR, ANONYMIZED_DIR, STRUCTURED_DIR, REPORTS_DIR):
-    d.mkdir(parents=True, exist_ok=True)
-
-
-# --- Configuration anonymisation ---
-
-KEEP_ESTABLISHMENT_NAME = os.environ.get("T2A_KEEP_ESTABLISHMENT", "True").lower() in ("true", "1", "yes")
-NER_MODEL = os.environ.get("T2A_NER_MODEL", "Jean-Baptiste/camembert-ner")
-NER_CONFIDENCE_THRESHOLD = float(os.environ.get("T2A_NER_THRESHOLD", "0.80"))
-
-
-# --- Configuration Ollama ---
-
-OLLAMA_URL = os.environ.get("OLLAMA_URL", "http://localhost:11434")
-OLLAMA_MODEL = os.environ.get("OLLAMA_MODEL", "gemma3:27b-cloud")
-OLLAMA_TIMEOUT = int(os.environ.get("OLLAMA_TIMEOUT", "120"))
-OLLAMA_CACHE_PATH = BASE_DIR / "data" / "ollama_cache.json"
-OLLAMA_MAX_PARALLEL = int(os.environ.get("OLLAMA_MAX_PARALLEL", "2"))
-
-
-# --- Configuration RUM / établissement ---
-
-FINESS = os.environ.get("T2A_FINESS", "000000000")
-NUM_UM = os.environ.get("T2A_NUM_UM", "0000")
-
-
-# --- Configuration RAG ---
-
-RAG_INDEX_DIR = BASE_DIR / "data" / "rag_index"
-REFERENTIELS_DIR = BASE_DIR / "data" / "referentiels"
-UPLOAD_MAX_SIZE_MB = 50
-ALLOWED_EXTENSIONS = {".pdf", ".csv", ".xlsx", ".xls", ".txt"}
-CIM10_DICT_PATH = BASE_DIR / "data" / "cim10_dict.json"
-CIM10_SUPPLEMENTS_PATH = BASE_DIR / "data" / "cim10_supplements.json"
-CMA_LEVELS_PATH = BASE_DIR / "data" / "cma_levels.json"
-CCAM_DICT_PATH = BASE_DIR / "data" / "ccam_dict.json"
-CIM10_PDF = Path(os.environ.get("T2A_CIM10_PDF", "/home/dom/ai/aivanov_CIM/cim-10-fr_2026_a_usage_pmsi_version_provisoire_111225.pdf"))
-GUIDE_METHODO_PDF = Path(os.environ.get("T2A_GUIDE_METHODO_PDF", "/home/dom/ai/aivanov_CIM/guide_methodo_mco_2026_version_provisoire.pdf"))
-CCAM_PDF = Path(os.environ.get("T2A_CCAM_PDF", "/home/dom/ai/aivanov_CIM/actualisation_ccam_descriptive_a_usage_pmsi_v4_2025.pdf"))
-
-# --- Modèle d'embedding ---
-
-EMBEDDING_MODEL = os.environ.get("T2A_EMBEDDING_MODEL", "dangvantuan/sentence-camembert-large")
-
-# --- Modèle de re-ranking (cross-encoder, CPU uniquement) ---
-
-RERANKER_MODEL = os.environ.get("T2A_RERANKER_MODEL", "cross-encoder/ms-marco-MiniLM-L-6-v2")
-
-# --- Modèles de données CIM-10 ---
-
-
-class RAGSource(BaseModel):
-    document: str
-    page: Optional[int] = None
-    code: Optional[str] = None
-    extrait: Optional[str] = None
-
-
-class Sejour(BaseModel):
-    sexe: Optional[str] = None
-    age: Optional[int] = None
-    date_entree: Optional[str] = None
-    date_sortie: Optional[str] = None
-    duree_sejour: Optional[int] = None
-    mode_entree: Optional[str] = None
-    mode_sortie: Optional[str] = None
-    imc: Optional[float] = None
-    poids: Optional[float] = None
-    taille: Optional[float] = None
-
-
-class PreuveClinique(BaseModel):
-    type: str  # "biologie" | "imagerie" | "traitement" | "acte" | "clinique"
-    element: str  # "CRP 180 mg/L"
-    interpretation: str  # "syndrome inflammatoire majeur"
-
-
-class CodeDecision(BaseModel):
-    """Décision finale sur un code (audit-friendly).
-
-    - action=KEEP: on garde la suggestion
-    - action=DOWNGRADE: on remplace par un code moins spécifique (ex: D50→D64.9)
-    - action=REMOVE: on retire le code (ou on le laisse vide)
-    """
-
-    action: str = "KEEP"  # KEEP | DOWNGRADE | REMOVE
-    final_code: Optional[str] = None
-    downgraded_from: Optional[str] = None
-    reason: Optional[str] = None
-    needs_info: list[str] = Field(default_factory=list)
-    applied_rules: list[str] = Field(default_factory=list)
-
-
-class Diagnostic(BaseModel):
-    texte: str
-    cim10_suggestion: Optional[str] = None
-    cim10_confidence: Optional[str] = None
-    # Sortie finale (post-traitement qualité)
-    cim10_final: Optional[str] = None
-    cim10_decision: Optional[CodeDecision] = None
-    justification: Optional[str] = None
-    raisonnement: Optional[str] = None
-    sources_rag: list[RAGSource] = Field(default_factory=list)
-    preuves_cliniques: list[PreuveClinique] = Field(default_factory=list)
-    est_cma: Optional[bool] = None
-    est_cms: Optional[bool] = None
-    niveau_severite: Optional[str] = None  # "leger" | "modere" | "severe" | "non_evalue"
-    niveau_cma: Optional[int] = None  # 1 (pas CMA) | 2 | 3 | 4 (niveau officiel ATIH)
-    source: Optional[str] = None  # "trackare" | "edsnlp" | "regex" | "llm_das"
-    source_page: Optional[int] = None  # numéro de page (1-indexed) dans le PDF source
-    source_excerpt: Optional[str] = None  # extrait du texte source (~200 chars)
-
-
-class ActeCCAM(BaseModel):
-    texte: str
-    code_ccam_suggestion: Optional[str] = None
-    ccam_confidence: Optional[str] = None
-    justification: Optional[str] = None
-    raisonnement: Optional[str] = None
-    sources_rag: list[RAGSource] = Field(default_factory=list)
-    date: Optional[str] = None
-    validite: Optional[str] = None  # "valide" | "obsolete" | "non_verifie"
-    alertes: list[str] = Field(default_factory=list)
-    source_page: Optional[int] = None
-    source_excerpt: Optional[str] = None
-
-
-class Traitement(BaseModel):
-    medicament: str
-    posologie: Optional[str] = None
-    code_atc: Optional[str] = None
-    source_page: Optional[int] = None
-    source_excerpt: Optional[str] = None
-
-
-class BiologieCle(BaseModel):
-    test: str
-    valeur: Optional[str] = None
-    anomalie: Optional[bool] = None
-    source_page: Optional[int] = None
-    source_excerpt: Optional[str] = None
-
-
-class Imagerie(BaseModel):
-    type: str
-    conclusion: Optional[str] = None
-    score: Optional[str] = None
-    source_page: Optional[int] = None
-    source_excerpt: Optional[str] = None
-
-
-class Antecedent(BaseModel):
-    texte: str
-    source_page: Optional[int] = None
-    source_excerpt: Optional[str] = None
-
-
-class Complication(BaseModel):
-    texte: str
-    source_page: Optional[int] = None
-    source_excerpt: Optional[str] = None
-
-
-class DossierMedical(BaseModel):
-    source_file: str = ""
-    document_type: str = ""
-    sejour: Sejour = Field(default_factory=Sejour)
-    diagnostic_principal: Optional[Diagnostic] = None
-    diagnostics_associes: list[Diagnostic] = Field(default_factory=list)
-    actes_ccam: list[ActeCCAM] = Field(default_factory=list)
-    antecedents: list[Antecedent] = Field(default_factory=list)
-    traitements_sortie: list[Traitement] = Field(default_factory=list)
-    biologie_cle: list[BiologieCle] = Field(default_factory=list)
-    imagerie: list[Imagerie] = Field(default_factory=list)
-    complications: list[Complication] = Field(default_factory=list)
-    alertes_codage: list[str] = Field(default_factory=list)
-    source_files: list[str] = Field(default_factory=list)
-    ghm_estimation: Optional[GHMEstimation] = None
-    controles_cpam: list[ControleCPAM] = Field(default_factory=list)
-    veto_report: Optional["VetoReport"] = None
-    processing_time_s: float | None = None
-
-    @field_validator("antecedents", mode="before")
-    @classmethod
-    def _coerce_antecedents(cls, v):
-        """Backward compat : convertit les anciennes list[str] en list[Antecedent]."""
-        if not isinstance(v, list):
-            return v
-        result = []
-        for item in v:
-            if isinstance(item, str):
-                result.append({"texte": item})
-            else:
-                result.append(item)
-        return result
-
-    @field_validator("complications", mode="before")
-    @classmethod
-    def _coerce_complications(cls, v):
-        """Backward compat : convertit les anciennes list[str] en list[Complication]."""
-        if not isinstance(v, list):
-            return v
-        result = []
-        for item in v:
-            if isinstance(item, str):
-                result.append({"texte": item})
-            else:
-                result.append(item)
-        return result
-
-
-# --- Rapport d'anonymisation ---
-
-
-class GHMEstimation(BaseModel):
-    cmd: Optional[str] = None
-    cmd_libelle: Optional[str] = None
-    type_ghm: Optional[str] = None  # "C" / "M" / "K"
-    severite: int = 1  # 1-4
-    ghm_approx: Optional[str] = None  # ex: "07C??2"
-    cma_count: int = 0
-    cms_count: int = 0
-    alertes: list[str] = Field(default_factory=list)
-
-
-class ControleCPAM(BaseModel):
-    numero_ogc: int
-    titre: str = ""
-    arg_ucr: str = ""
-    decision_ucr: str = ""
-    dp_ucr: Optional[str] = None
-    da_ucr: Optional[str] = None
-    dr_ucr: Optional[str] = None
-    actes_ucr: Optional[str] = None
-    contre_argumentation: Optional[str] = None
-    response_data: Optional[dict] = None
-    sources_reponse: list[RAGSource] = Field(default_factory=list)
-
-
-# --- Qualité / Vetos (contestabilité) ---
-
-
-class VetoIssue(BaseModel):
-    """Un problème détecté lors du contrôle de contestabilité."""
-
-    veto: str
-    severity: str  # HARD | MEDIUM | LOW
-    where: str
-    message: str
-
-
-class VetoReport(BaseModel):
-    """Rapport global de vetos pour un dossier."""
-
-    verdict: str  # PASS | NEED_INFO | FAIL
-    score_contestabilite: int = 100  # 0-100
-    issues: list[VetoIssue] = Field(default_factory=list)
-
-
-class AnonymizationReport(BaseModel):
-    source_file: str
-    total_replacements: int = 0
-    regex_replacements: int = 0
-    ner_replacements: int = 0
-    sweep_replacements: int = 0
-    entities_found: list[dict] = Field(default_factory=list)
diff --git a/t2a_install_rag_cleanup/src/control/__init__.py b/t2a_install_rag_cleanup/src/control/__init__.py
deleted file mode 100644
index e69de29..0000000
diff --git a/t2a_install_rag_cleanup/src/control/cpam_parser.py b/t2a_install_rag_cleanup/src/control/cpam_parser.py
deleted file mode 100644
index 1ed7147..0000000
--- a/t2a_install_rag_cleanup/src/control/cpam_parser.py
+++ /dev/null
@@ -1,115 +0,0 @@
-"""Parsing du fichier Excel de contrôle CPAM (UCR) et matching OGC."""
-
-from __future__ import annotations
-
-import logging
-import re
-from pathlib import Path
-
-import openpyxl
-
-from ..config import ControleCPAM
-
-logger = logging.getLogger(__name__)
-
-# Colonnes attendues dans le fichier Excel
-_EXPECTED_COLUMNS = ("N° OGC", "Titre", "Arg_UCR", "Décision_UCR", "DP_UCR", "DA_UCR", "DR_UCR", "Actes_UCR")
-
-
-def parse_cpam_excel(path: str | Path) -> dict[int, list[ControleCPAM]]:
-    """Lit le fichier Excel de contrôle CPAM et retourne un dict OGC -> liste de contrôles.
-
-    Args:
-        path: Chemin vers le fichier .xlsx CPAM.
-
-    Returns:
-        Dict avec le numéro OGC comme clé et la liste des contrôles associés.
-    """
-    path = Path(path)
-    if not path.exists():
-        logger.error("Fichier CPAM introuvable : %s", path)
-        return {}
-
-    wb = openpyxl.load_workbook(path, read_only=True)
-    ws = wb[wb.sheetnames[0]]
-
-    # Lire l'en-tête
-    rows = ws.iter_rows(values_only=True)
-    header = next(rows, None)
-    if header is None:
-        logger.error("Fichier CPAM vide : %s", path)
-        return {}
-
-    # Construire le mapping colonne -> index
-    col_map = {}
-    for i, col_name in enumerate(header):
-        if col_name:
-            col_map[col_name.strip()] = i
-
-    # Vérifier les colonnes requises
-    missing = [c for c in _EXPECTED_COLUMNS[:4] if c not in col_map]
-    if missing:
-        logger.error("Colonnes manquantes dans le fichier CPAM : %s", missing)
-        return {}
-
-    result: dict[int, list[ControleCPAM]] = {}
-    count = 0
-
-    for row in rows:
-        ogc_val = row[col_map["N° OGC"]]
-        if ogc_val is None:
-            continue
-
-        try:
-            numero_ogc = int(ogc_val)
-        except (ValueError, TypeError):
-            logger.warning("N° OGC invalide ignoré : %s", ogc_val)
-            continue
-
-        controle = ControleCPAM(
-            numero_ogc=numero_ogc,
-            titre=str(row[col_map.get("Titre", 1)] or "").strip(),
-            arg_ucr=str(row[col_map.get("Arg_UCR", 2)] or "").strip(),
-            decision_ucr=str(row[col_map.get("Décision_UCR", 3)] or "").strip(),
-            dp_ucr=_clean_optional(row, col_map.get("DP_UCR")),
-            da_ucr=_clean_optional(row, col_map.get("DA_UCR")),
-            dr_ucr=_clean_optional(row, col_map.get("DR_UCR")),
-            actes_ucr=_clean_optional(row, col_map.get("Actes_UCR")),
-        )
-
-        result.setdefault(numero_ogc, []).append(controle)
-        count += 1
-
-    logger.info("CPAM : %d contrôles chargés pour %d OGC distincts", count, len(result))
-    return result
-
-
-def _clean_optional(row: tuple, idx: int | None) -> str | None:
-    """Extrait une valeur optionnelle depuis une ligne Excel."""
-    if idx is None or idx >= len(row):
-        return None
-    val = row[idx]
-    if val is None:
-        return None
-    val = str(val).strip()
-    return val if val else None
-
-
-def match_dossier_ogc(source_name: str, cpam_data: dict[int, list[ControleCPAM]]) -> list[ControleCPAM]:
-    """Cherche les contrôles CPAM correspondant à un dossier par préfixe OGC.
-
-    Le nom du dossier suit le format "17_23100690" où 17 est le N° OGC.
-
-    Args:
-        source_name: Nom du sous-dossier (ex: "17_23100690").
-        cpam_data: Dict OGC -> contrôles retourné par parse_cpam_excel().
-
-    Returns:
-        Liste des contrôles CPAM pour cet OGC, ou liste vide.
-    """
-    match = re.match(r"^(\d+)_", source_name)
-    if not match:
-        return []
-
-    ogc = int(match.group(1))
-    return cpam_data.get(ogc, [])
diff --git a/t2a_install_rag_cleanup/src/control/cpam_response.py b/t2a_install_rag_cleanup/src/control/cpam_response.py
deleted file mode 100644
index 3b47ce2..0000000
--- a/t2a_install_rag_cleanup/src/control/cpam_response.py
+++ /dev/null
@@ -1,1046 +0,0 @@
-"""Génération de contre-argumentation pour les contrôles CPAM via RAG + Ollama."""
-
-from __future__ import annotations
-
-import logging
-import re
-
-from ..config import ControleCPAM, DossierMedical, RAGSource
-from ..medical.cim10_dict import normalize_code, validate_code
-from ..medical.cim10_extractor import BIO_NORMALS
-from ..medical.ollama_client import call_anthropic, call_ollama
-
-logger = logging.getLogger(__name__)
-
-
-def _search_rag_for_control(controle: ControleCPAM, dossier: DossierMedical) -> list[dict]:
-    """Recherche RAG ciblée pour le sujet du désaccord.
-
-    Effectue 2-5 recherches ciblées au lieu d'une requête fourre-tout :
-    1. Codes contestés → règles de codage spécifiques
-    2. Argument CPAM → passages Guide Méthodo contradictoires
-    3. Contexte clinique (optionnel) → définitions CIM-10 des codes en jeu
-    4. Définitions CIM-10 des codes contestés
-    5. Règles explicitement citées dans l'argument CPAM
-
-    Retourne [] si le RAG est indisponible (index absent, modèle embedding
-    inaccessible, etc.) — la contre-argumentation sera générée sans sources.
-    """
-    try:
-        from ..medical.rag_search import search_similar_cpam
-    except Exception:
-        logger.warning("Index RAG non disponible pour la contre-argumentation")
-        return []
-
-    try:
-        return _search_rag_queries(controle, dossier, search_similar_cpam)
-    except Exception:
-        logger.warning("Erreur RAG pour la contre-argumentation — génération sans sources",
-                        exc_info=True)
-        return []
-
-
-def _search_rag_queries(
-    controle: ControleCPAM,
-    dossier: DossierMedical,
-    search_similar_cpam,
-) -> list[dict]:
-    """Exécute les requêtes RAG (séparé pour permettre un try/except global)."""
-    all_results: list[dict] = []
-
-    # Requête 1 — Codes contestés (règles de codage)
-    if controle.dp_ucr or controle.da_ucr:
-        query_parts = []
-        if controle.dp_ucr:
-            query_parts.append(f"règles codage {controle.dp_ucr} diagnostic principal")
-        if controle.da_ucr:
-            query_parts.append(f"diagnostic associé significatif {controle.da_ucr} CMA")
-        query_codes = " ".join(query_parts)
-        results_codes = search_similar_cpam(query_codes, top_k=6)
-        logger.debug("  RAG requête codes : %d résultats", len(results_codes))
-        all_results.extend(results_codes)
-
-    # Requête 2 — Argument CPAM (recherche dans le Guide Méthodo)
-    query_parts_arg = []
-    if controle.titre:
-        query_parts_arg.append(controle.titre)
-    arg_short = controle.arg_ucr[:500] if controle.arg_ucr else ""
-    if arg_short:
-        query_parts_arg.append(arg_short)
-    query_arg = " ".join(query_parts_arg)
-    if query_arg.strip():
-        results_arg = search_similar_cpam(query_arg, top_k=6)
-        logger.debug("  RAG requête argument : %d résultats", len(results_arg))
-        all_results.extend(results_arg)
-
-    # Requête 3 — Contexte clinique (définitions CIM-10 des codes en jeu)
-    if controle.da_ucr and dossier.diagnostic_principal:
-        dp_text = dossier.diagnostic_principal.texte
-        das_texts = [
-            d.texte for d in dossier.diagnostics_associes
-            if d.cim10_suggestion and controle.da_ucr
-            and d.cim10_suggestion in controle.da_ucr
-        ]
-        if das_texts:
-            query_clinique = f"{dp_text} {' '.join(das_texts)}"
-            results_clinique = search_similar_cpam(query_clinique, top_k=4)
-            logger.debug("  RAG requête clinique : %d résultats", len(results_clinique))
-            all_results.extend(results_clinique)
-
-    # Requête 4 — Définitions CIM-10 des codes contestés
-    contested_codes = []
-    for field in (controle.dp_ucr, controle.da_ucr, controle.dr_ucr):
-        if field:
-            contested_codes.extend(re.split(r"[,;\s]+", field.strip()))
-    for raw_code in contested_codes:
-        raw_code = raw_code.strip()
-        if not raw_code:
-            continue
-        norm = normalize_code(raw_code)
-        is_valid, label = validate_code(norm)
-        if is_valid and label:
-            query_def = f"CIM-10 {norm} {label} définition inclusion exclusion"
-        else:
-            query_def = f"CIM-10 {norm} définition codage"
-        results_def = search_similar_cpam(query_def, top_k=3)
-        logger.debug("  RAG requête CIM-10 %s : %d résultats", norm, len(results_def))
-        all_results.extend(results_def)
-
-    # Requête 5 — Règles explicitement citées dans l'argument CPAM
-    if controle.arg_ucr:
-        rule_patterns = [
-            r'(?:R[eè]gle\s*T?\s*\d+)',
-            r'(?:Annexe[\s-]*\d+[A-Za-z]*)',
-            r'(?:Situation de soins?\s+[^.]{5,40})',
-        ]
-        rules_found = []
-        for pattern in rule_patterns:
-            rules_found.extend(re.findall(pattern, controle.arg_ucr, re.IGNORECASE))
-        if rules_found:
-            rules_unique = list(dict.fromkeys(rules_found))
-            query_rules = " ".join(rules_unique) + " guide méthodologique codage PMSI"
-            results_rules = search_similar_cpam(query_rules, top_k=4)
-            logger.debug("  RAG requête règles (%s) : %d résultats",
-                         ", ".join(rules_unique), len(results_rules))
-            all_results.extend(results_rules)
-
-    if not all_results:
-        return []
-
-    # Fusion : dédupliquer par (document, code, page), garder le meilleur score
-    seen: dict[tuple, dict] = {}
-    for r in all_results:
-        key = (r.get("document"), r.get("code"), r.get("page"))
-        if key in seen:
-            if r["score"] > seen[key]["score"]:
-                seen[key] = r
-        else:
-            seen[key] = r
-
-    merged = sorted(seen.values(), key=lambda r: r["score"], reverse=True)
-    return merged[:12]
-
-
-def _get_code_label(code_str: str) -> str:
-    """Résout le libellé CIM-10 pour un ou plusieurs codes."""
-    codes = re.split(r"[,;\s]+", code_str.strip())
-    labels = []
-    for raw in codes:
-        raw = raw.strip()
-        if not raw:
-            continue
-        norm = normalize_code(raw)
-        is_valid, label = validate_code(norm)
-        if is_valid and label:
-            labels.append(f"{norm} — {label}")
-        else:
-            labels.append(norm)
-    if not labels:
-        return ""
-    if len(labels) == 1:
-        parts = labels[0].split(" — ", 1)
-        return f" — {parts[1]}" if len(parts) > 1 else ""
-    return "\n  " + "\n  ".join(labels)
-
-
-def _get_cim10_definitions(
-    dossier: DossierMedical,
-    controle: ControleCPAM,
-) -> str:
-    """Construit une section de définitions CIM-10 déterministes pour tous les codes en jeu.
-
-    Collecte les codes depuis :
-    - Le dossier : DP (cim10_suggestion) + DAS (cim10_suggestion)
-    - L'UCR : dp_ucr, da_ucr, dr_ucr
-
-    Returns:
-        Texte formaté pour injection dans le prompt, ou "" si aucun code résolu.
-    """
-    codes_seen: dict[str, str] = {}  # code normalisé → rôle (pour affichage)
-
-    # Codes du dossier (établissement)
-    if dossier.diagnostic_principal and dossier.diagnostic_principal.cim10_suggestion:
-        code = dossier.diagnostic_principal.cim10_suggestion
-        codes_seen[normalize_code(code)] = "DP établissement"
-    for das in dossier.diagnostics_associes:
-        if das.cim10_suggestion:
-            norm = normalize_code(das.cim10_suggestion)
-            if norm not in codes_seen:
-                codes_seen[norm] = "DAS établissement"
-
-    # Codes de l'UCR (CPAM)
-    for field, role in [
-        (controle.dp_ucr, "DP proposé UCR"),
-        (controle.da_ucr, "DA proposé UCR"),
-        (controle.dr_ucr, "DR proposé UCR"),
-    ]:
-        if not field:
-            continue
-        for raw in re.split(r"[,;\s]+", field.strip()):
-            raw = raw.strip()
-            if not raw:
-                continue
-            norm = normalize_code(raw)
-            if norm not in codes_seen:
-                codes_seen[norm] = role
-
-    if not codes_seen:
-        return ""
-
-    # Résoudre les libellés
-    lines = []
-    for norm_code, role in codes_seen.items():
-        is_valid, label = validate_code(norm_code)
-        if is_valid and label:
-            lines.append(f"  {norm_code} — {label}  [{role}]")
-        else:
-            lines.append(f"  {norm_code} — (code non trouvé dans le dictionnaire)  [{role}]")
-
-    if not lines:
-        return ""
-
-    return (
-        "\nDÉFINITIONS CIM-10 — RÉFÉRENCE (source : dictionnaire officiel) :\n"
-        + "\n".join(lines)
-    )
-
-
-def _build_tagged_context(dossier: DossierMedical) -> tuple[str, dict[str, str]]:
-    """Construit un contexte clinique avec des tags de référence pour le grounding.
-
-    Chaque élément clinique reçoit un tag unique ([BIO-1], [IMG-1], [TRT-1], [ACTE-1])
-    que le LLM doit citer dans ses preuves pour garantir la traçabilité.
-
-    Returns:
-        (texte tagué pour injection dans le prompt, dict tag → contenu original)
-    """
-    tag_map: dict[str, str] = {}
-    lines: list[str] = []
-
-    # Biologie (avec normes de référence pour éviter les hallucinations)
-    for i, b in enumerate(dossier.biologie_cle, 1):
-        if not b.valeur:
-            continue
-        tag = f"BIO-{i}"
-        # Interpréter la valeur par rapport aux normes connues
-        norm_info = ""
-        if b.test in BIO_NORMALS:
-            lo, hi = BIO_NORMALS[b.test]
-            try:
-                val = float(b.valeur.replace(",", ".").split()[0])
-                if val > hi:
-                    norm_info = f" — ÉLEVÉ (norme {lo}-{hi})"
-                elif val < lo:
-                    norm_info = f" — BAS (norme {lo}-{hi})"
-                else:
-                    norm_info = f" — NORMAL (norme {lo}-{hi})"
-            except (ValueError, AttributeError):
-                pass
-        content = f"{b.test}: {b.valeur}{norm_info}"
-        tag_map[tag] = content
-        lines.append(f"  [{tag}] {content}")
-
-    # Imagerie
-    for i, im in enumerate(dossier.imagerie, 1):
-        tag = f"IMG-{i}"
-        conclusion = f" — {im.conclusion}" if im.conclusion else ""
-        content = f"{im.type}{conclusion}"
-        tag_map[tag] = content
-        lines.append(f"  [{tag}] {content}")
-
-    # Traitements
-    for i, t in enumerate(dossier.traitements_sortie[:10], 1):
-        tag = f"TRT-{i}"
-        posologie = f" {t.posologie}" if t.posologie else ""
-        content = f"{t.medicament}{posologie}"
-        tag_map[tag] = content
-        lines.append(f"  [{tag}] {content}")
-
-    # Actes CCAM
-    for i, a in enumerate(dossier.actes_ccam, 1):
-        tag = f"ACTE-{i}"
-        code = f" ({a.code_ccam_suggestion})" if a.code_ccam_suggestion else ""
-        content = f"{a.texte}{code}"
-        tag_map[tag] = content
-        lines.append(f"  [{tag}] {content}")
-
-    if not lines:
-        return "", tag_map
-
-    text = "ÉLÉMENTS CLINIQUES RÉFÉRENCÉS (cite le tag [XX-N] dans tes preuves) :\n" + "\n".join(lines)
-    return text, tag_map
-
-
-def _validate_grounding(response_data: dict, tag_map: dict[str, str]) -> list[str]:
-    """Vérifie que les références dans preuves_dossier correspondent à des tags existants.
-
-    Returns:
-        Liste de warnings pour les références inventées.
-    """
-    if not tag_map:
-        return []
-
-    warnings: list[str] = []
-    preuves = response_data.get("preuves_dossier")
-    if not preuves or not isinstance(preuves, list):
-        return warnings
-
-    for p in preuves:
-        if not isinstance(p, dict):
-            continue
-        ref = p.get("ref", "")
-        if not ref:
-            continue
-        if ref not in tag_map:
-            valeur = p.get("valeur", "?")
-            warnings.append(f"Preuve [{ref}] non traçable (« {valeur} »)")
-            logger.warning("Grounding : preuve [%s] introuvable dans les tags du dossier", ref)
-
-    return warnings
-
-
-def _check_das_bio_coherence(dossier: DossierMedical) -> list[str]:
-    """Vérifie la cohérence entre les textes DAS et les valeurs biologiques.
-
-    Détecte les contradictions comme "leucocytose" dans un DAS alors que
-    les leucocytes sont bas, ou "anémie" alors que l'hémoglobine est normale.
-
-    Returns:
-        Liste de warnings pour les incohérences détectées.
-    """
-    if not dossier.diagnostics_associes or not dossier.biologie_cle:
-        return []
-
-    # Patterns DAS → (test bio attendu, direction attendue)
-    _DAS_BIO_CHECKS: dict[str, tuple[str, str]] = {
-        "leucocytose": ("Leucocytes", "high"),
-        "leucopénie": ("Leucocytes", "low"),
-        "leucopenie": ("Leucocytes", "low"),
-        "thrombocytose": ("Plaquettes", "high"),
-        "thrombocytopénie": ("Plaquettes", "low"),
-        "thrombocytopenie": ("Plaquettes", "low"),
-        "thrombopénie": ("Plaquettes", "low"),
-        "thrombopenie": ("Plaquettes", "low"),
-        "anémie": ("Hémoglobine", "low"),
-        "anemie": ("Hémoglobine", "low"),
-        "polyglobulie": ("Hémoglobine", "high"),
-        "hyperkaliémie": ("Potassium", "high"),
-        "hypokaliémie": ("Potassium", "low"),
-    }
-
-    # Indexer les valeurs bio disponibles
-    bio_values: dict[str, float] = {}
-    for b in dossier.biologie_cle:
-        if b.test and b.valeur:
-            try:
-                bio_values[b.test] = float(b.valeur.replace(",", ".").split()[0])
-            except (ValueError, AttributeError):
-                pass
-
-    warnings: list[str] = []
-    for das in dossier.diagnostics_associes:
-        texte_lower = (das.texte or "").lower()
-        for pattern, (bio_test, direction) in _DAS_BIO_CHECKS.items():
-            if pattern not in texte_lower:
-                continue
-            if bio_test not in bio_values or bio_test not in BIO_NORMALS:
-                continue
-            val = bio_values[bio_test]
-            lo, hi = BIO_NORMALS[bio_test]
-            if direction == "high" and val <= hi:
-                warnings.append(
-                    f"INCOHÉRENCE : DAS « {das.texte} » ({das.cim10_suggestion or '?'}) "
-                    f"mais {bio_test} = {val} est NORMAL (norme {lo}-{hi})"
-                )
-            elif direction == "low" and val >= lo:
-                warnings.append(
-                    f"INCOHÉRENCE : DAS « {das.texte} » ({das.cim10_suggestion or '?'}) "
-                    f"mais {bio_test} = {val} est NORMAL (norme {lo}-{hi})"
-                )
-
-    if warnings:
-        for w in warnings:
-            logger.warning("  DAS/bio : %s", w)
-
-    return warnings
-
-
-def _build_cpam_prompt(
-    dossier: DossierMedical,
-    controle: ControleCPAM,
-    sources: list[dict],
-    extraction: dict | None = None,
-) -> tuple[str, dict[str, str]]:
-    """Construit le prompt pour la contre-argumentation CPAM.
-
-    Args:
-        extraction: Résultat optionnel de la passe 1 (extraction structurée).
-
-    Returns:
-        (prompt texte, tag_map pour validation grounding)
-    """
-    # Résumé du dossier médical
-    dossier_lines = []
-
-    if dossier.diagnostic_principal:
-        dp = dossier.diagnostic_principal
-        dp_code = f" ({dp.cim10_suggestion})" if dp.cim10_suggestion else ""
-        dossier_lines.append(f"- DP : {dp.texte}{dp_code}")
-    elif controle.dp_ucr:
-        dp_label = _get_code_label(controle.dp_ucr)
-        dossier_lines.append(
-            f"- DP : code {controle.dp_ucr}{dp_label} "
-            f"(codé par l'établissement, contesté par la CPAM)"
-        )
-
-    if dossier.diagnostics_associes:
-        das_parts = []
-        for das in dossier.diagnostics_associes:
-            code = f" ({das.cim10_suggestion})" if das.cim10_suggestion else ""
-            das_parts.append(f"{das.texte}{code}")
-        dossier_lines.append(f"- DAS : {', '.join(das_parts)}")
-
-    if dossier.actes_ccam:
-        actes = [f"{a.texte} ({a.code_ccam_suggestion})" if a.code_ccam_suggestion else a.texte
-                 for a in dossier.actes_ccam]
-        dossier_lines.append(f"- Actes CCAM : {', '.join(actes)}")
-
-    sejour = dossier.sejour
-    if sejour.duree_sejour is not None:
-        dossier_lines.append(f"- Durée séjour : {sejour.duree_sejour} jours")
-    if sejour.sexe or sejour.age is not None:
-        patient_info = []
-        if sejour.sexe:
-            patient_info.append(sejour.sexe)
-        if sejour.age is not None:
-            patient_info.append(f"{sejour.age} ans")
-            if sejour.age < 18:
-                patient_info.append("(PÉDIATRIE — codage pédiatrique applicable)")
-            elif sejour.age >= 80:
-                patient_info.append("(patient âgé — comorbidités fréquentes)")
-        dossier_lines.append(f"- Patient : {', '.join(patient_info)}")
-    if sejour.mode_entree:
-        mode_label = sejour.mode_entree
-        if "urgence" in mode_label.lower() or "urgent" in mode_label.lower():
-            dossier_lines.append(f"- Mode d'entrée : {mode_label} (ADMISSION EN URGENCE)")
-        else:
-            dossier_lines.append(f"- Mode d'entrée : {mode_label}")
-    if sejour.mode_sortie:
-        dossier_lines.append(f"- Mode de sortie : {sejour.mode_sortie}")
-    if sejour.imc is not None:
-        dossier_lines.append(f"- IMC : {sejour.imc}")
-
-    if dossier.biologie_cle:
-        bio = [f"{b.test}: {b.valeur}" for b in dossier.biologie_cle[:5] if b.valeur]
-        if bio:
-            dossier_lines.append(f"- Biologie clé : {', '.join(bio)}")
-
-    if dossier.imagerie:
-        img_parts = []
-        for im in dossier.imagerie:
-            conclusion = f" — {im.conclusion}" if im.conclusion else ""
-            img_parts.append(f"{im.type}{conclusion}")
-        dossier_lines.append(f"- Imagerie : {', '.join(img_parts)}")
-
-    if dossier.traitements_sortie:
-        trt_parts = []
-        for t in dossier.traitements_sortie[:10]:
-            posologie = f" {t.posologie}" if t.posologie else ""
-            trt_parts.append(f"{t.medicament}{posologie}")
-        dossier_lines.append(f"- Traitements de sortie : {', '.join(trt_parts)}")
-
-    if dossier.antecedents:
-        dossier_lines.append(f"- Antécédents : {', '.join(a.texte for a in dossier.antecedents[:10])}")
-
-    if dossier.complications:
-        dossier_lines.append(f"- Complications : {', '.join(c.texte for c in dossier.complications)}")
-
-    dossier_str = "\n".join(dossier_lines) if dossier_lines else "Non disponible"
-
-    # Section asymétrie : éléments que la CPAM n'avait pas
-    asymetrie_lines = []
-
-    if dossier.biologie_cle:
-        bio_details = []
-        for b in dossier.biologie_cle if len(dossier.biologie_cle) <= 10 else dossier.biologie_cle[:10]:
-            anomalie = " (anormale)" if b.anomalie else ""
-            if b.valeur:
-                bio_details.append(f"{b.test}: {b.valeur}{anomalie}")
-        if bio_details:
-            asymetrie_lines.append(f"- Biologie : {', '.join(bio_details)}")
-
-    if dossier.imagerie:
-        img_details = []
-        for im in dossier.imagerie:
-            conclusion = f" — {im.conclusion}" if im.conclusion else ""
-            img_details.append(f"{im.type}{conclusion}")
-        if img_details:
-            asymetrie_lines.append(f"- Imagerie : {', '.join(img_details)}")
-
-    if dossier.traitements_sortie:
-        trt_details = []
-        for t in dossier.traitements_sortie[:10]:
-            posologie = f" {t.posologie}" if t.posologie else ""
-            trt_details.append(f"{t.medicament}{posologie}")
-        if trt_details:
-            asymetrie_lines.append(f"- Traitements : {', '.join(trt_details)}")
-
-    if dossier.actes_ccam:
-        actes_details = [
-            f"{a.texte} ({a.code_ccam_suggestion})" if a.code_ccam_suggestion else a.texte
-            for a in dossier.actes_ccam
-        ]
-        if actes_details:
-            asymetrie_lines.append(f"- Actes CCAM : {', '.join(actes_details)}")
-
-    asymetrie_str = ""
-    if asymetrie_lines:
-        asymetrie_str = (
-            "\n\nÉLÉMENTS DU DOSSIER NON TRANSMIS À LA CPAM "
-            "(l'UCR n'a eu que le CRH et les codes) :\n"
-            + "\n".join(asymetrie_lines)
-        )
-
-    # Codes contestés par la CPAM (avec libellés CIM-10 résolus)
-    codes_contestes = []
-    if controle.dp_ucr:
-        codes_contestes.append(f"DP proposé par UCR : {controle.dp_ucr}{_get_code_label(controle.dp_ucr)}")
-    if controle.da_ucr:
-        codes_contestes.append(f"DA proposés par UCR : {controle.da_ucr}{_get_code_label(controle.da_ucr)}")
-    if controle.dr_ucr:
-        codes_contestes.append(f"DR proposé par UCR : {controle.dr_ucr}{_get_code_label(controle.dr_ucr)}")
-    if controle.actes_ucr:
-        codes_contestes.append(f"Actes proposés par UCR : {controle.actes_ucr}")
-    codes_str = "\n".join(codes_contestes) if codes_contestes else "Aucun code spécifique proposé"
-
-    # Définitions CIM-10 déterministes (tous les codes en jeu)
-    definitions_str = _get_cim10_definitions(dossier, controle)
-
-    # Contexte clinique tagué pour le grounding
-    tagged_context, tag_map = _build_tagged_context(dossier)
-    if tagged_context:
-        tagged_str = f"\n\n{tagged_context}"
-    else:
-        tagged_str = (
-            "\n\nATTENTION — DOSSIER PAUVRE EN ÉLÉMENTS CLINIQUES :\n"
-            "Aucune biologie, imagerie, traitement ou acte CCAM disponible.\n"
-            "Ne spécule PAS sur des éléments absents. Signale explicitement "
-            "le manque de données au lieu d'inventer des preuves."
-        )
-
-    # Vérification cohérence DAS / biologie
-    das_bio_warnings = _check_das_bio_coherence(dossier)
-    if das_bio_warnings:
-        tagged_str += (
-            "\n\nALERTES COHÉRENCE DAS / BIOLOGIE (incohérences détectées dans le dossier) :\n"
-            + "\n".join(f"  - {w}" for w in das_bio_warnings)
-            + "\n  Prends en compte ces incohérences dans ton analyse."
-        )
-
-    # Sources RAG
-    sources_text = ""
-    for i, src in enumerate(sources, 1):
-        doc_name = {
-            "cim10": "CIM-10 FR 2026",
-            "cim10_alpha": "CIM-10 Index Alphabétique 2026",
-            "guide_methodo": "Guide Méthodologique MCO 2026",
-            "ccam": "CCAM PMSI V4 2025",
-        }.get(src.get("document", ""), src.get("document", ""))
-
-        code_info = f" (code: {src['code']})" if src.get("code") else ""
-        page_info = f" [page {src['page']}]" if src.get("page") else ""
-
-        sources_text += f"--- Source {i}: {doc_name}{code_info}{page_info} ---\n"
-        sources_text += (src.get("extrait", "")[:800]) + "\n\n"
-
-    # Section pré-analyse (résultat passe 1, si disponible)
-    extraction_str = ""
-    if extraction:
-        ext_lines = []
-        comp = extraction.get("comprehension_contestation")
-        if comp:
-            ext_lines.append(f"Compréhension : {comp}")
-        elems = extraction.get("elements_cliniques_pertinents", [])
-        if elems and isinstance(elems, list):
-            elem_strs = []
-            for e in elems:
-                if isinstance(e, dict):
-                    elem_strs.append(f"  - [{e.get('tag', '?')}] {e.get('pertinence', '')}")
-            if elem_strs:
-                ext_lines.append("Éléments pertinents :\n" + "\n".join(elem_strs))
-        accords = extraction.get("points_accord_potentiels", [])
-        if accords and isinstance(accords, list):
-            ext_lines.append("Points d'accord potentiels : " + " ; ".join(str(a) for a in accords))
-        codes = extraction.get("codes_en_jeu", {})
-        if codes and isinstance(codes, dict):
-            diff = codes.get("difference_cle", "")
-            if diff:
-                ext_lines.append(f"Différence clé entre les codages : {diff}")
-        if ext_lines:
-            extraction_str = (
-                "\nPRÉ-ANALYSE (extraction automatique — à utiliser comme base) :\n"
-                + "\n".join(ext_lines)
-            )
-
-    prompt = f"""Tu es un médecin DIM (Département d'Information Médicale) expert en contentieux T2A.
-Tu dois produire une analyse ÉQUILIBRÉE ET CRÉDIBLE de la contestation CPAM, puis contre-argumenter en mobilisant trois axes : médical, asymétrie d'information, et réglementaire.
-
-IMPORTANT — CRÉDIBILITÉ DE L'ANALYSE :
-Une contre-argumentation crédible reconnaît TOUJOURS au moins un point valide dans le raisonnement adverse.
-Répondre "Aucun point d'accord" décrédibilise l'ensemble de l'argumentation. Tu DOIS identifier au moins un élément où la CPAM a un point légitime (même partiel), puis expliquer pourquoi cela ne suffit pas à invalider le codage.
-
-IMPORTANT — CODES CIM-10 :
-Ne parle JAMAIS de « codage initial » ou « codage contesté » sans citer explicitement le code CIM-10 et son libellé (ex: Z45.80 — Ajustement et entretien d'un dispositif implantable).
-Chaque argument doit désigner précisément quel code est défendu ou contesté, avec son libellé complet.
-
-DOSSIER MÉDICAL DE L'ÉTABLISSEMENT :
-{dossier_str}
-{asymetrie_str}
-{tagged_str}
-
-OBJET DU DÉSACCORD : {controle.titre}
-
-ARGUMENTATION DE LA CPAM (UCR) :
-{controle.arg_ucr}
-
-DÉCISION UCR : {controle.decision_ucr}
-
-CODES CONTESTÉS :
-{codes_str}
-{definitions_str}
-
-SOURCES RÉGLEMENTAIRES (Guide méthodologique, CIM-10) :
-{sources_text}
-{extraction_str}
-
-CONSIGNES :
-
-CONTEXTE CLINIQUE :
-- Prends en compte l'ÂGE du patient (pédiatrie < 18 ans, personne âgée >= 80 ans), le MODE D'ENTRÉE (urgence vs programmé), et la DURÉE DE SÉJOUR pour contextualiser ton analyse
-- En pédiatrie, les normes biologiques et les codages peuvent différer de l'adulte
-- Une admission en urgence implique un contexte clinique aigu qui influence le choix du DP
-
-ÉTAPE 1 — ANALYSE HONNÊTE (avant de contre-argumenter) :
-- Identifie ce que la CPAM a compris correctement dans le dossier
-- Reconnais les points où leur raisonnement est fondé, même partiellement
-- Explique ENSUITE pourquoi ces points ne justifient pas leur conclusion
-
-AXE MÉDICAL :
-- Analyse le bien-fondé médical du codage de l'établissement
-- CITE les éléments cliniques EXACTS du dossier en utilisant les tags [XX-N] fournis (ex: [BIO-1] CRP 180 mg/L)
-- Confronte l'argumentation CPAM aux sources CIM-10 et Guide Méthodologique fournies
-- Ne mentionne AUCUN élément qui ne figure pas dans les éléments référencés ci-dessus
-
-AXE ASYMÉTRIE D'INFORMATION :
-- La CPAM a fondé son analyse uniquement sur le CRH et les codes transmis
-- Pour CHAQUE élément clinique pertinent, cite les VALEURS EXACTES et explique leur signification clinique
-- Démontre en quoi ces éléments complémentaires (biologie, imagerie, traitements, actes) justifient le codage contesté
-- Ne mentionne AUCUN élément qui n'est pas dans le dossier fourni
-
-MISE EN FORME :
-- Structure chaque section avec des tirets pour lister les arguments distincts
-- Un argument par puce, avec la preuve ou la référence associée
-
-AXE RÉGLEMENTAIRE :
-- Identifie si l'UCR fait une interprétation restrictive non fondée d'une règle
-- Confronte le raisonnement CPAM au texte EXACT des sources fournies
-- Format OBLIGATOIRE pour chaque référence : [Document - page N] suivi d'une CITATION VERBATIM du passage pertinent
-- INTERDICTION ABSOLUE de citer une référence qui ne figure pas dans les sources fournies ci-dessus
-- Si aucune source pertinente n'est disponible → écrire explicitement "Pas de source réglementaire disponible"
-- Relève les contradictions entre l'argumentation CPAM et les règles officielles
-
-Réponds UNIQUEMENT avec un objet JSON au format suivant :
-{{
-  "analyse_contestation": "Résumé de ce que conteste la CPAM et sur quelle base",
-  "points_accord": "Points CONCRETS où la CPAM a raison ou partiellement raison (JAMAIS 'Aucun' — il y a toujours au moins un point légitime à reconnaître)",
-  "contre_arguments_medicaux": "Argumentation médicale en faveur du codage, en expliquant pourquoi les points d'accord ne suffisent pas à invalider le codage",
-  "preuves_dossier": [
-    {{"ref": "BIO-1", "element": "biologie|imagerie|traitement|acte|clinique", "valeur": "valeur exacte du dossier", "signification": "explication clinique"}}
-  ],
-  "contre_arguments_asymetrie": "Éléments cliniques que la CPAM n'avait pas et qui justifient le codage",
-  "contre_arguments_reglementaires": "Erreurs d'interprétation réglementaire de la CPAM, avec citations verbatim des sources",
-  "references": [
-    {{"document": "nom du document source", "page": "numéro de page", "citation": "citation verbatim du passage"}}
-  ],
-  "conclusion": "Synthèse en citant EXPLICITEMENT les codes CIM-10 défendus (ex: DP Z45.80 — libellé) : points reconnus à la CPAM, puis pourquoi ce codage précis est néanmoins justifié"
-}}"""
-    return prompt, tag_map
-
-
-def _validate_references(parsed: dict, sources: list[dict]) -> list[str]:
-    """Vérifie que les références citées correspondent aux sources RAG fournies.
-
-    Returns:
-        Liste d'avertissements pour les références non vérifiables.
-    """
-    warnings = []
-    refs = parsed.get("references")
-    if not refs or not isinstance(refs, list):
-        return warnings
-
-    # Construire un set des documents sources disponibles
-    source_docs = set()
-    for src in sources:
-        doc_name = src.get("document", "")
-        source_docs.add(doc_name)
-        # Ajouter les noms lisibles aussi
-        readable = {
-            "cim10": "CIM-10 FR 2026",
-            "cim10_alpha": "CIM-10 Index Alphabétique 2026",
-            "guide_methodo": "Guide Méthodologique MCO 2026",
-            "ccam": "CCAM PMSI V4 2025",
-        }.get(doc_name, "")
-        if readable:
-            source_docs.add(readable)
-            source_docs.add(readable.lower())
-
-    if not source_docs:
-        return warnings
-
-    for ref in refs:
-        if not isinstance(ref, dict):
-            continue
-        doc = ref.get("document", "")
-        if doc and not any(sd in doc.lower() or doc.lower() in sd.lower() for sd in source_docs if sd):
-            warnings.append(f"Référence non vérifiable : {doc}")
-            logger.warning("CPAM : référence non vérifiable « %s »", doc)
-
-    return warnings
-
-
-def _format_response(parsed: dict, ref_warnings: list[str] | None = None) -> str:
-    """Formate la réponse LLM en texte lisible."""
-    sections = []
-
-    analyse = parsed.get("analyse_contestation")
-    if analyse:
-        sections.append(f"ANALYSE DE LA CONTESTATION\n{analyse}")
-
-    accord = parsed.get("points_accord")
-    if accord and accord.lower() not in ("aucun", "non applicable", "n/a", ""):
-        sections.append(f"POINTS D'ACCORD\n{accord}")
-
-    # Nouveaux champs structurés par axe
-    contre_med = parsed.get("contre_arguments_medicaux")
-    if contre_med:
-        sections.append(f"CONTRE-ARGUMENTS MÉDICAUX\n{contre_med}")
-
-    # Preuves du dossier (nouveau champ structuré)
-    preuves = parsed.get("preuves_dossier")
-    if preuves and isinstance(preuves, list):
-        preuves_lines = []
-        for p in preuves:
-            if isinstance(p, dict):
-                ref = p.get("ref", "")
-                elem = p.get("element", "")
-                valeur = p.get("valeur", "")
-                signif = p.get("signification", "")
-                ref_prefix = f"[{ref}] " if ref else ""
-                preuves_lines.append(f"- {ref_prefix}[{elem}] {valeur} → {signif}")
-        if preuves_lines:
-            sections.append(f"PREUVES DU DOSSIER\n" + "\n".join(preuves_lines))
-
-    contre_asym = parsed.get("contre_arguments_asymetrie")
-    if contre_asym:
-        sections.append(f"ASYMÉTRIE D'INFORMATION\n{contre_asym}")
-
-    contre_regl = parsed.get("contre_arguments_reglementaires")
-    if contre_regl:
-        sections.append(f"CONTRE-ARGUMENTS RÉGLEMENTAIRES\n{contre_regl}")
-
-    # Fallback : ancien champ unique (réponses en cache existantes)
-    if not contre_med and not contre_asym and not contre_regl:
-        contre = parsed.get("contre_arguments")
-        if contre:
-            sections.append(f"CONTRE-ARGUMENTS\n{contre}")
-
-    # Références structurées (nouveau format liste) ou ancien format string
-    refs = parsed.get("references")
-    if refs:
-        if isinstance(refs, list):
-            ref_lines = []
-            for r in refs:
-                if isinstance(r, dict):
-                    doc = r.get("document", "")
-                    page = r.get("page", "")
-                    citation = r.get("citation", "")
-                    ref_lines.append(f"- [{doc}, p.{page}] {citation}")
-                else:
-                    ref_lines.append(f"- {r}")
-            if ref_lines:
-                sections.append(f"REFERENCES\n" + "\n".join(ref_lines))
-        else:
-            sections.append(f"REFERENCES\n{refs}")
-
-    conclusion = parsed.get("conclusion")
-    if conclusion:
-        sections.append(f"CONCLUSION\n{conclusion}")
-
-    # Avertissements sur les références non vérifiables
-    if ref_warnings:
-        warning_text = "\n".join(f"- {w}" for w in ref_warnings)
-        sections.append(f"AVERTISSEMENT — REFERENCES NON VÉRIFIÉES\n{warning_text}")
-
-    return "\n\n".join(sections)
-
-
-def _validate_adversarial(
-    response_data: dict,
-    tag_map: dict[str, str],
-    controle: ControleCPAM,
-) -> dict | None:
-    """Validation adversariale — vérifie la cohérence de la contre-argumentation.
-
-    Un appel LLM de relecture critique vérifie :
-    1. Les valeurs cliniques citées correspondent aux éléments tagués du dossier
-    2. La conclusion est cohérente avec l'argumentation
-    3. Les points d'accord ne contredisent pas la contre-argumentation
-    4. Les codes CIM-10 cités sont cohérents
-
-    Returns:
-        dict {"coherent": bool, "erreurs": list[str], "score_confiance": int} ou None si échec.
-    """
-    import json as _json
-
-    # Construire le résumé des éléments factuels disponibles
-    if tag_map:
-        factual_lines = "\n".join(f"  [{tag}] {content}" for tag, content in tag_map.items())
-        factual_section = f"ÉLÉMENTS FACTUELS DU DOSSIER :\n{factual_lines}"
-    else:
-        factual_section = "ÉLÉMENTS FACTUELS DU DOSSIER : aucun élément tagué disponible"
-
-    # Sérialiser la réponse LLM de façon compacte
-    try:
-        response_json = _json.dumps(response_data, ensure_ascii=False, indent=None)
-        # Tronquer si trop long pour le prompt de validation
-        if len(response_json) > 3000:
-            response_json = response_json[:3000] + "..."
-    except (TypeError, ValueError):
-        logger.warning("Validation adversariale : impossible de sérialiser la réponse")
-        return None
-
-    # Normes biologiques pour vérifier les interprétations
-    normes_lines = []
-    for test, (lo, hi) in BIO_NORMALS.items():
-        normes_lines.append(f"  {test}: {lo}-{hi}")
-    normes_section = "NORMES BIOLOGIQUES DE RÉFÉRENCE :\n" + "\n".join(normes_lines)
-
-    prompt = f"""Tu es un relecteur critique. Vérifie la cohérence de cette contre-argumentation CPAM.
-
-RÉPONSE GÉNÉRÉE :
-{response_json}
-
-{factual_section}
-
-{normes_section}
-
-CODES CONTESTÉS :
-{f"DP UCR : {controle.dp_ucr}" if controle.dp_ucr else ""}
-{f"DA UCR : {controle.da_ucr}" if controle.da_ucr else ""}
-
-Vérifie STRICTEMENT :
-1. Chaque valeur bio/imagerie/traitement citée dans les preuves existe dans les éléments factuels
-2. Si une valeur bio est qualifiée de "élevée", "basse" ou "anormale", vérifie qu'elle est RÉELLEMENT hors normes selon les normes ci-dessus (ex: CRP 5 = NORMAL, pas élevé)
-3. La conclusion est cohérente avec l'argumentation développée
-4. Les points d'accord ne contredisent pas les contre-arguments
-5. Les codes CIM-10 mentionnés dans la conclusion sont cohérents avec le reste
-
-Réponds UNIQUEMENT en JSON :
-{{
-  "coherent": true ou false,
-  "erreurs": ["description précise de chaque incohérence trouvée"],
-  "score_confiance": 0 à 10
-}}"""
-
-    logger.debug("  Validation adversariale")
-    result = call_ollama(prompt, temperature=0.0, max_tokens=800)
-    if result is None:
-        result = call_anthropic(prompt, temperature=0.0, max_tokens=800)
-    if result is None:
-        logger.warning("  Validation adversariale échouée — LLM indisponible")
-        return None
-
-    coherent = result.get("coherent", True)
-    erreurs = result.get("erreurs", [])
-    score = result.get("score_confiance", -1)
-
-    if not coherent and erreurs:
-        logger.warning("  Validation adversariale : %d incohérence(s) détectée(s) (score %s/10)",
-                        len(erreurs), score)
-        for e in erreurs:
-            logger.warning("    - %s", e)
-    else:
-        logger.info("  Validation adversariale OK (score %s/10)", score)
-
-    return result
-
-
-def _extraction_pass(
-    dossier: DossierMedical,
-    controle: ControleCPAM,
-) -> dict | None:
-    """Passe 1 — Extraction structurée du contexte avant argumentation.
-
-    Prompt court centré sur la compréhension de la contestation et l'extraction
-    des éléments cliniques pertinents. Pas de rédaction argumentative.
-
-    Returns:
-        dict structuré ou None si le LLM échoue.
-    """
-    # Résumé dossier compact
-    dp_str = ""
-    if dossier.diagnostic_principal:
-        dp = dossier.diagnostic_principal
-        code = f" ({dp.cim10_suggestion})" if dp.cim10_suggestion else ""
-        dp_str = f"{dp.texte}{code}"
-    elif controle.dp_ucr:
-        dp_str = f"code {controle.dp_ucr} (codé par l'établissement)"
-
-    das_str = ", ".join(
-        f"{d.texte} ({d.cim10_suggestion})" if d.cim10_suggestion else d.texte
-        for d in dossier.diagnostics_associes
-    )
-
-    # Contexte tagué (réutilise la même fonction)
-    tagged_text, _ = _build_tagged_context(dossier)
-
-    prompt = f"""Tu es un médecin DIM expert. Analyse cette contestation CPAM sans argumenter.
-
-DOSSIER :
-- DP : {dp_str or "Non extrait"}
-- DAS : {das_str or "Aucun"}
-{tagged_text}
-
-CONTESTATION CPAM :
-Titre : {controle.titre}
-Argument : {controle.arg_ucr}
-Décision : {controle.decision_ucr}
-{f"DP proposé UCR : {controle.dp_ucr}" if controle.dp_ucr else ""}
-{f"DA proposés UCR : {controle.da_ucr}" if controle.da_ucr else ""}
-
-Réponds UNIQUEMENT en JSON :
-{{
-  "comprehension_contestation": "Résumé factuel : que conteste la CPAM et pourquoi",
-  "elements_cliniques_pertinents": [
-    {{"tag": "BIO-1 ou texte libre", "pertinence": "en quoi cet élément est pertinent pour le codage contesté"}}
-  ],
-  "points_accord_potentiels": ["points où la CPAM a partiellement raison"],
-  "codes_en_jeu": {{
-    "dp_etablissement": "code + libellé",
-    "dp_ucr": "code + libellé si proposé",
-    "difference_cle": "explication de la différence entre les deux codages"
-  }}
-}}"""
-
-    logger.debug("  Passe 1 — extraction structurée")
-    result = call_ollama(prompt, temperature=0.0, max_tokens=1500)
-    if result is None:
-        result = call_anthropic(prompt, temperature=0.0, max_tokens=1500)
-    if result is not None:
-        logger.info("  Passe 1 OK : %d éléments cliniques extraits",
-                     len(result.get("elements_cliniques_pertinents", [])))
-    else:
-        logger.warning("  Passe 1 échouée — fallback single-pass")
-    return result
-
-
-def generate_cpam_response(
-    dossier: DossierMedical,
-    controle: ControleCPAM,
-) -> tuple[str, dict | None, list[RAGSource]]:
-    """Génère une contre-argumentation pour un contrôle CPAM.
-
-    Args:
-        dossier: Le dossier médical analysé.
-        controle: Le contrôle CPAM à contester.
-
-    Returns:
-        Tuple (texte de contre-argumentation, dict LLM structuré ou None, sources RAG utilisées).
-    """
-    logger.info("CPAM : génération contre-argumentation pour OGC %d — %s",
-                controle.numero_ogc, controle.titre)
-
-    # 1. Passe 1 — Extraction structurée (compréhension avant argumentation)
-    extraction = _extraction_pass(dossier, controle)
-
-    # 2. Recherche RAG ciblée
-    sources = _search_rag_for_control(controle, dossier)
-    logger.info("  RAG : %d sources trouvées", len(sources))
-
-    # 3. Construction du prompt (passe 2 — argumentation)
-    prompt, tag_map = _build_cpam_prompt(dossier, controle, sources, extraction)
-
-    # 4. Appel LLM — Ollama (modèle par défaut) > Haiku fallback
-    result = call_ollama(prompt, temperature=0.1, max_tokens=4000)
-    if result is not None:
-        logger.info("  Contre-argumentation via Ollama")
-    else:
-        logger.info("  Ollama indisponible → fallback Anthropic Haiku")
-        result = call_anthropic(prompt, temperature=0.1, max_tokens=4000)
-        if result is not None:
-            logger.info("  Contre-argumentation via Anthropic Haiku")
-
-    # 5. Conversion des sources RAG
-    rag_sources = [
-        RAGSource(
-            document=s.get("document", ""),
-            page=s.get("page"),
-            code=s.get("code"),
-            extrait=s.get("extrait", "")[:200],
-        )
-        for s in sources
-    ]
-
-    if result is None:
-        logger.warning("  LLM non disponible — contre-argumentation non générée")
-        return "", None, rag_sources
-
-    # 6. Validation des références RAG
-    ref_warnings = _validate_references(result, sources)
-    if ref_warnings:
-        logger.warning("  CPAM : %d référence(s) non vérifiable(s)", len(ref_warnings))
-
-    # 7. Validation grounding (preuves traçables vers le dossier)
-    grounding_warnings = _validate_grounding(result, tag_map)
-    if grounding_warnings:
-        logger.warning("  CPAM : %d preuve(s) non traçable(s)", len(grounding_warnings))
-
-    # 8. Validation adversariale (cohérence factuelle)
-    adversarial_warnings: list[str] = []
-    validation = _validate_adversarial(result, tag_map, controle)
-    if validation and not validation.get("coherent", True):
-        erreurs = validation.get("erreurs", [])
-        score = validation.get("score_confiance", "?")
-        for e in erreurs:
-            if isinstance(e, str) and e.strip():
-                adversarial_warnings.append(f"Incohérence détectée : {e}")
-        if adversarial_warnings:
-            adversarial_warnings.append(f"Score de confiance : {score}/10")
-
-    all_warnings = ref_warnings + grounding_warnings + adversarial_warnings
-
-    # 9. Formater la réponse
-    text = _format_response(result, all_warnings)
-    logger.info("  Contre-argumentation générée (%d caractères)", len(text))
-
-    return text, result, rag_sources
diff --git a/t2a_install_rag_cleanup/src/export/__init__.py b/t2a_install_rag_cleanup/src/export/__init__.py
deleted file mode 100644
index e69de29..0000000
diff --git a/t2a_install_rag_cleanup/src/export/rum_export.py b/t2a_install_rag_cleanup/src/export/rum_export.py
deleted file mode 100644
index b950c1c..0000000
--- a/t2a_install_rag_cleanup/src/export/rum_export.py
+++ /dev/null
@@ -1,190 +0,0 @@
-"""Export au format RUM (Résumé d'Unité Médicale) V016 pour le groupeur ATIH.
-
-Génère une ligne fixe de 165 caractères suivie de zones variables
-(DAS en 8 chars, actes CCAM en 29 chars chacun).
-"""
-
-from __future__ import annotations
-
-import re
-from dataclasses import dataclass
-from pathlib import Path
-
-from ..config import FINESS, NUM_UM, DossierMedical
-
-
-@dataclass
-class RUMConfig:
-    finess: str = FINESS
-    num_um: str = NUM_UM
-
-
-def _format_cim10(code: str | None) -> str:
-    """Formate un code CIM-10 sur 8 caractères (sans point, padded)."""
-    if not code:
-        return " " * 8
-    clean = code.upper().replace(".", "").strip()
-    return clean.ljust(8)[:8]
-
-
-def _format_date(date_str: str | None) -> str:
-    """Convertit une date DD/MM/YYYY ou YYYY-MM-DD en DDMMYYYY (8 chars)."""
-    if not date_str:
-        return " " * 8
-    date_str = date_str.strip()
-    # Format DD/MM/YYYY
-    m = re.match(r"(\d{2})/(\d{2})/(\d{4})", date_str)
-    if m:
-        return f"{m.group(1)}{m.group(2)}{m.group(3)}"
-    # Format YYYY-MM-DD
-    m = re.match(r"(\d{4})-(\d{2})-(\d{2})", date_str)
-    if m:
-        return f"{m.group(3)}{m.group(2)}{m.group(1)}"
-    return " " * 8
-
-
-def _format_sex(sexe: str | None) -> str:
-    """Convertit le sexe en code RUM (1=M, 2=F)."""
-    if not sexe:
-        return " "
-    s = sexe.strip().upper()
-    if s in ("M", "MASCULIN", "HOMME", "H"):
-        return "1"
-    if s in ("F", "FEMININ", "FÉMININ", "FEMME"):
-        return "2"
-    return " "
-
-
-def _map_mode_entree(text: str | None) -> str:
-    """Convertit le mode d'entrée textuel en code RUM (1 char)."""
-    if not text:
-        return " "
-    t = text.strip().lower()
-    mapping = {
-        "domicile": "8",
-        "mutation": "6",
-        "transfert": "7",
-        "urgences": "8",
-        "urgence": "8",
-    }
-    for key, code in mapping.items():
-        if key in t:
-            return code
-    return " "
-
-
-def _map_mode_sortie(text: str | None) -> str:
-    """Convertit le mode de sortie textuel en code RUM (1 char)."""
-    if not text:
-        return " "
-    t = text.strip().lower()
-    mapping = {
-        "domicile": "8",
-        "mutation": "6",
-        "transfert": "7",
-        "deces": "9",
-        "décès": "9",
-        "décédé": "9",
-        "decede": "9",
-    }
-    for key, code in mapping.items():
-        if key in t:
-            return code
-    return " "
-
-
-def _format_ccam_act(acte) -> str:
-    """Formate un acte CCAM sur 29 caractères.
-
-    Structure : code(7) + phase(1) + activité(1) + date(8) + doc/extension(12)
-    """
-    code = (acte.code_ccam_suggestion or "").upper().replace(" ", "")
-    code = code.ljust(7)[:7]
-    phase = "1"
-    activite = "1"
-    date = _format_date(acte.date)
-    extension = " " * 12
-    return f"{code}{phase}{activite}{date}{extension}"
-
-
-def export_rum(dossier: DossierMedical, config: RUMConfig | None = None) -> str:
-    """Génère le texte RUM complet pour un dossier médical.
-
-    Returns:
-        Chaîne texte au format RUM V016 (165 chars fixes + zones variables).
-    """
-    if config is None:
-        config = RUMConfig()
-
-    sejour = dossier.sejour
-    dp = dossier.diagnostic_principal
-
-    # Compteurs
-    das_list = dossier.diagnostics_associes
-    actes_list = dossier.actes_ccam
-    nb_das = len(das_list)
-    nb_actes = len(actes_list)
-
-    # Numéros générés
-    source = dossier.source_file or "UNKNOWN"
-    num_rss = source.replace(".pdf", "").replace(" ", "_").ljust(20)[:20]
-    num_admin = num_rss
-    num_rum = source[:10].ljust(10)[:10]
-
-    # Construction de la zone fixe (165 caractères)
-    parts = [
-        " " * 2,                                          # 1-2   : Version classification (vide)
-        " " * 6,                                          # 3-8   : GHM (vide, rempli par groupeur)
-        " ",                                              # 9     : Filler
-        "016",                                            # 10-12 : Version format
-        " " * 3,                                          # 13-15 : Code retour
-        config.finess.ljust(9)[:9],                       # 16-24 : FINESS
-        "016",                                            # 25-27 : Version RUM
-        num_rss,                                          # 28-47 : N° RSS
-        num_admin,                                        # 48-67 : N° admin
-        num_rum,                                          # 68-77 : N° RUM
-        _format_date(None),                               # 78-85 : Date naissance (non disponible)
-        _format_sex(sejour.sexe),                         # 86    : Sexe
-        config.num_um.ljust(4)[:4],                       # 87-90 : N° UM
-        " " * 2,                                          # 91-92 : Type autorisation
-        _format_date(sejour.date_entree),                 # 93-100: Date entrée UM
-        _map_mode_entree(sejour.mode_entree),             # 101   : Mode entrée
-        " ",                                              # 102   : Provenance
-        _format_date(sejour.date_sortie),                 # 103-110: Date sortie UM
-        _map_mode_sortie(sejour.mode_sortie),             # 111   : Mode sortie
-        " ",                                              # 112   : Destination
-        " " * 5,                                          # 113-117: CP résidence
-        " " * 4,                                          # 118-121: Poids nné
-        " " * 2,                                          # 122-123: Âge gestationnel
-        "00",                                             # 124-125: Nb séances
-        str(nb_das).zfill(2)[-2:],                        # 126-127: Nb DAS
-        "00",                                             # 128-129: Nb DAD
-        str(nb_actes).zfill(2)[-2:],                      # 130-131: Nb actes
-        _format_cim10(dp.cim10_suggestion if dp else None),  # 132-139: DP
-        " " * 8,                                          # 140-147: DR
-        " " * 3,                                          # 148-150: IGS2
-        " " * 15,                                         # 151-165: Réservé
-    ]
-
-    fixed = "".join(parts)
-    assert len(fixed) == 165, f"Zone fixe RUM: attendu 165, obtenu {len(fixed)}"
-
-    # Zones variables
-    variable_parts: list[str] = []
-
-    # DAS (8 chars chacun)
-    for das in das_list:
-        variable_parts.append(_format_cim10(das.cim10_suggestion))
-
-    # Actes CCAM (29 chars chacun)
-    for acte in actes_list:
-        variable_parts.append(_format_ccam_act(acte))
-
-    return fixed + "".join(variable_parts)
-
-
-def save_rum(dossier: DossierMedical, path: Path, config: RUMConfig | None = None) -> None:
-    """Exporte un dossier au format RUM dans un fichier."""
-    rum_text = export_rum(dossier, config)
-    path.parent.mkdir(parents=True, exist_ok=True)
-    path.write_text(rum_text, encoding="utf-8")
diff --git a/t2a_install_rag_cleanup/src/extraction/__init__.py b/t2a_install_rag_cleanup/src/extraction/__init__.py
deleted file mode 100644
index e69de29..0000000
diff --git a/t2a_install_rag_cleanup/src/extraction/crh_parser.py b/t2a_install_rag_cleanup/src/extraction/crh_parser.py
deleted file mode 100644
index 0445faf..0000000
--- a/t2a_install_rag_cleanup/src/extraction/crh_parser.py
+++ /dev/null
@@ -1,129 +0,0 @@
-"""Parsing des Comptes Rendus d'Hospitalisation (CRH)."""
-
-from __future__ import annotations
-
-import re
-
-
-def parse_crh(text: str) -> dict:
-    """Parse un CRH et retourne les sections structurées."""
-    result: dict = {
-        "type": "crh",
-        "patient": {},
-        "sejour": {},
-        "medecins": [],
-        "contenu_medical": "",
-        "sections": {},
-    }
-
-    _extract_patient_info(text, result)
-    _extract_sejour_info(text, result)
-    _extract_medecins(text, result)
-    _extract_medical_content(text, result)
-
-    return result
-
-
-def _extract_patient_info(text: str, result: dict) -> None:
-    """Extrait les informations patient du CRH."""
-    # "MME NARBAIS AUDREY" ou "M. NOM PRENOM"
-    m = re.search(
-        r"(?:MME|M\.|MR)\s+([A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ][A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇa-zéèêëàâäùûüôöîïç\- ]+)",
-        text[:2000],
-    )
-    if m:
-        result["patient"]["nom_complet"] = m.group(1).strip()
-
-    # Adresse sous le nom patient — capturer les lignes entre le nom et le CP+Ville
-    addr_match = re.search(
-        r"(?:MME|M\.|MR|Madame|Monsieur)\s+[A-ZÉÈÊËÀÂ][A-ZÉÈÊËÀÂa-zéèêëàâ\s\-]+\n((?:.*\n){1,4}?\d{5}\s+[A-Z][A-Z\s\-]+)",
-        text[:3000],
-    )
-    if addr_match:
-        result["patient"]["adresse"] = addr_match.group(1).strip()
-
-    # "née le DD/MM/YYYY" ou "né le DD/MM/YYYY"
-    m = re.search(r"n[ée]+\s+le\s+(\d{2}/\d{2}/\d{4})", text)
-    if m:
-        result["patient"]["date_naissance"] = m.group(1)
-
-    # Sexe depuis le titre
-    if re.search(r"\bMME\b", text[:2000]):
-        result["patient"]["sexe"] = "F"
-    elif re.search(r"\b(?:M\.|MR)\b", text[:2000]):
-        result["patient"]["sexe"] = "M"
-
-    # "Votre patiente" / "Votre patient"
-    if "patiente" in text[:3000].lower():
-        result["patient"]["sexe"] = "F"
-    elif "patient" in text[:3000].lower():
-        result["patient"].setdefault("sexe", "M")
-
-
-def _extract_sejour_info(text: str, result: dict) -> None:
-    """Extrait les dates et motif de séjour."""
-    # "du DD/MM/YYYY au DD/MM/YYYY"
-    m = re.search(
-        r"du\s+(\d{2}/\d{2}/\d{4})\s+au\s+(\d{2}/\d{2}/\d{4})", text
-    )
-    if m:
-        result["sejour"]["date_entree"] = m.group(1)
-        result["sejour"]["date_sortie"] = m.group(2)
-
-    # "pour le motif suivant:" ou "pour le motif suivant :\n..."
-    m = re.search(
-        r"pour\s+le\s+motif\s+suivant\s*[:\s]*\n?(.*?)(?:\n\n|\.\s+[A-Z])",
-        text,
-        re.DOTALL,
-    )
-    if m:
-        result["sejour"]["motif"] = m.group(1).strip()
-
-
-def _extract_medecins(text: str, result: dict) -> None:
-    """Extrait les noms de médecins mentionnés."""
-    # "Dr NOM" ou "DR NOM" ou "Dr. NOM" ou "Docteur NOM" ou "Dr F. NOM"
-    for m in re.finditer(
-        r"(?:Dr\.?|DR\.?|Docteur)\s+(?:[A-Z]\.\s+)?([A-ZÉÈÊËÀÂ][A-ZÉÈÊËÀÂa-zéèêëàâ\-]+(?:\s+[A-ZÉÈÊËÀÂ][A-ZÉÈÊËÀÂa-zéèêëàâ\-]+)?)",
-        text,
-    ):
-        name = m.group(1).strip()
-        if name not in result["medecins"] and len(name) > 2:
-            result["medecins"].append(name)
-
-
-def _extract_medical_content(text: str, result: dict) -> None:
-    """Extrait le contenu médical principal."""
-    # Chercher après "Mon cher confrère," et les infos d'hospitalisation
-    m = re.search(
-        r"(?:motif\s+suivant\s*[:\s]*\n?)(.*?)(?:Rédigé par|Cordialement|Confraternellement|Dr\s+\w+\s*$)",
-        text,
-        re.DOTALL,
-    )
-    if m:
-        result["contenu_medical"] = m.group(1).strip()
-    else:
-        # Fallback : prendre tout après "Mon cher confrère"
-        m = re.search(
-            r"Mon cher confrère,?\s*\n(.*?)(?:Rédigé par|$)",
-            text,
-            re.DOTALL,
-        )
-        if m:
-            result["contenu_medical"] = m.group(1).strip()
-
-    # Sections spécifiques
-    section_patterns = [
-        ("motif_hospitalisation", r"(?:motif\s+(?:d'hospitalisation|suivant))\s*[:\s]*\n?(.*?)(?=\n\s*(?:Antécédents|Histoire|Examen|Au total|Devenir|TTT)|$)"),
-        ("antecedents", r"(?:Antécédents?)\s*[:\s]*\n?(.*?)(?=\n\s*(?:Histoire|Examen|Traitement|Au total|Devenir)|$)"),
-        ("histoire_maladie", r"(?:Histoire de la maladie)\s*[:\s]*\n?(.*?)(?=\n\s*(?:Examen|Biologie|Au total|Devenir)|$)"),
-        ("examen_clinique", r"(?:Examen clinique)\s*[:\s]*\n?(.*?)(?=\n\s*(?:Biologie|Imagerie|Au total|Devenir)|$)"),
-        ("conclusion", r"(?:Au total|Conclusion)\s*[:\s]*\n?(.*?)(?=\n\s*(?:Devenir|TTT|Traitement)|$)"),
-        ("traitement_sortie", r"(?:TTT de sortie|Traitement de sortie)\s*[:\s]*\n?(.*?)(?=\n\s*(?:Devenir|Rédigé|Cordialement)|$)"),
-        ("devenir", r"(?:Devenir)\s*[:\s]*\n?(.*?)(?=\n\s*(?:TTT|Traitement|Rédigé|Cordialement)|$)"),
-    ]
-
-    for key, pattern in section_patterns:
-        m = re.search(pattern, text, re.DOTALL | re.IGNORECASE)
-        if m:
-            result["sections"][key] = m.group(1).strip()
diff --git a/t2a_install_rag_cleanup/src/extraction/document_classifier.py b/t2a_install_rag_cleanup/src/extraction/document_classifier.py
deleted file mode 100644
index 7616188..0000000
--- a/t2a_install_rag_cleanup/src/extraction/document_classifier.py
+++ /dev/null
@@ -1,94 +0,0 @@
-"""Détection du type de document : CRH vs Trackare."""
-
-from __future__ import annotations
-
-from dataclasses import dataclass
-
-
-@dataclass
-class ClassificationResult:
-    """Résultat de classification avec score de confiance."""
-    doc_type: str
-    confidence: float
-    scores: dict[str, float]
-
-
-# Marqueurs pondérés : (texte, poids)
-_TRACKARE_MARKERS: list[tuple[str, int]] = [
-    ("ipp:", 3),
-    ("episode no:", 3),
-    ("dossier patient", 2),
-    ("détails des patients", 2),
-    ("détails épisode", 2),
-    ("liste des contacts", 1),
-    ("notes paramédicales", 1),
-    ("signes vitaux", 1),
-    ("traitements médicamenteux", 1),
-    ("observations médicales", 1),
-    ("constantes", 1),
-    ("prescriptions", 1),
-    ("presc. de sortie", 2),
-    ("type de note", 1),
-]
-
-_CRH_MARKERS: list[tuple[str, int]] = [
-    ("mon cher confrère", 3),
-    ("cher confrère", 3),
-    ("chère consœur", 3),
-    ("compte rendu d'hospitalisation", 3),
-    ("compte-rendu", 2),
-    ("service de gastro", 2),
-    ("service de chirurgie", 2),
-    ("service de médecine", 2),
-    ("pôle spécialités", 1),
-    ("votre patient", 2),
-    ("votre patiente", 2),
-    ("au total", 1),
-    ("ttt de sortie", 1),
-    ("devenir", 1),
-    ("cordialement", 1),
-]
-
-_SCAN_LENGTH = 5000
-
-
-def classify_with_confidence(text: str) -> ClassificationResult:
-    """Classifie un document avec un score de confiance.
-
-    Retourne un ClassificationResult avec le type, la confiance (0.0-1.0),
-    et les scores détaillés.
-    """
-    text_lower = text[:_SCAN_LENGTH].lower()
-
-    trackare_score = sum(weight for marker, weight in _TRACKARE_MARKERS if marker in text_lower)
-    crh_score = sum(weight for marker, weight in _CRH_MARKERS if marker in text_lower)
-
-    total = trackare_score + crh_score
-    if total == 0:
-        return ClassificationResult(doc_type="crh", confidence=0.5, scores={"trackare": 0, "crh": 0})
-
-    if trackare_score > crh_score:
-        confidence = trackare_score / total
-        doc_type = "trackare"
-    elif crh_score > trackare_score:
-        confidence = crh_score / total
-        doc_type = "crh"
-    else:
-        # Égalité — défaut CRH
-        confidence = 0.5
-        doc_type = "crh"
-
-    return ClassificationResult(
-        doc_type=doc_type,
-        confidence=round(confidence, 2),
-        scores={"trackare": trackare_score, "crh": crh_score},
-    )
-
-
-def classify(text: str) -> str:
-    """Classifie un document extrait en CRH ou Trackare.
-
-    Retourne "crh" ou "trackare".
-    Signature inchangée pour rétrocompatibilité.
-    """
-    return classify_with_confidence(text).doc_type
diff --git a/t2a_install_rag_cleanup/src/extraction/document_splitter.py b/t2a_install_rag_cleanup/src/extraction/document_splitter.py
deleted file mode 100644
index fa8e3da..0000000
--- a/t2a_install_rag_cleanup/src/extraction/document_splitter.py
+++ /dev/null
@@ -1,124 +0,0 @@
-"""Découpage de PDFs multi-dossiers en chunks indépendants.
-
-Certains PDFs contiennent plusieurs séjours/épisodes :
-- Trackare : plusieurs Episode No dans un même export
-- CRH : plusieurs lettres de sortie concaténées
-
-Ce module insère une étape de splitting entre l'extraction texte et le parsing.
-Chaque chunk est ensuite traité indépendamment par le pipeline existant.
-"""
-
-from __future__ import annotations
-
-import re
-import logging
-
-logger = logging.getLogger(__name__)
-
-
-def split_documents(text: str, doc_type: str) -> list[str]:
-    """Point d'entrée : découpe un texte en chunks selon le type de document.
-
-    Retourne toujours au moins [text] (pas de split si un seul dossier).
-    """
-    if doc_type == "trackare":
-        return _split_trackare(text)
-    elif doc_type == "crh":
-        return _split_crh(text)
-    return [text]
-
-
-def _split_trackare(text: str) -> list[str]:
-    """Découpe un export Trackare multi-épisodes.
-
-    Stratégie :
-    1. Compter les occurrences de "Episode No:"
-    2. Si une seule → pas de split
-    3. Si plusieurs → couper sur "Détails épisode" (ou second "Episode No:")
-    4. Préfixer le bloc patient à chaque chunk
-    """
-    episodes = list(re.finditer(r"Episode No:\s*\d+", text))
-    if len(episodes) <= 1:
-        return [text]
-
-    logger.info("  Trackare multi-épisodes détecté : %d épisodes", len(episodes))
-
-    # Identifier le bloc patient (avant le premier épisode/détails épisode)
-    # Le bloc patient va du début jusqu'à "Détails épisode" ou le premier "Episode No:"
-    first_episode_start = episodes[0].start()
-
-    # Chercher "Détails épisode" qui précède chaque bloc épisode
-    details_markers = list(re.finditer(r"Détails épisode", text))
-
-    if len(details_markers) >= 2:
-        # Couper sur "Détails épisode"
-        split_points = [m.start() for m in details_markers]
-        # Le bloc patient = tout avant le premier "Détails épisode"
-        patient_block = text[:split_points[0]].rstrip()
-    else:
-        # Fallback : couper sur "Episode No:"
-        split_points = [m.start() for m in episodes]
-        # Le bloc patient = tout avant le premier "Episode No:"
-        # Remonter pour inclure "Détails épisode" s'il existe avant
-        if details_markers:
-            patient_block = text[:details_markers[0].start()].rstrip()
-        else:
-            patient_block = text[:split_points[0]].rstrip()
-
-    chunks: list[str] = []
-    for i, start in enumerate(split_points):
-        end = split_points[i + 1] if i + 1 < len(split_points) else len(text)
-        episode_text = text[start:end].rstrip()
-        # Préfixer le bloc patient pour que le parser ait les infos complètes
-        chunk = patient_block + "\n\n" + episode_text
-        chunks.append(chunk)
-
-    return chunks
-
-
-def _split_crh(text: str) -> list[str]:
-    """Découpe un PDF contenant plusieurs CRH concaténés.
-
-    Stratégie :
-    1. Détecter les frontières par headers patient (MME|M\\.|MR) suivis de
-       patterns CRH (dates séjour, "Mon cher confrère")
-    2. Si une seule occurrence → pas de split
-    3. Si plusieurs → couper sur chaque header patient
-    """
-    # Chercher les headers patient typiques d'un début de CRH
-    # On cherche le pattern complet : titre + nom en majuscules
-    headers = list(re.finditer(
-        r"(?:^|\n)(?=\s*(?:MME|M\.|MR)\s+[A-ZÉÈÊËÀÂ]{2,})",
-        text,
-    ))
-
-    if len(headers) <= 1:
-        return [text]
-
-    # Filtrer : ne garder que les headers qui sont vraiment des débuts de CRH
-    # (suivis dans les 2000 chars par un pattern CRH typique)
-    crh_starts: list[int] = []
-    for h in headers:
-        pos = h.start()
-        # Sauter le \n initial si présent
-        if text[pos:pos + 1] == "\n":
-            pos += 1
-        lookahead = text[pos:pos + 2000].lower()
-        if (re.search(r"du\s+\d{2}/\d{2}/\d{4}\s+au\s+\d{2}/\d{2}/\d{4}", lookahead)
-                or "mon cher confrère" in lookahead
-                or "cher confrère" in lookahead
-                or "chère consœur" in lookahead
-                or "compte rendu" in lookahead):
-            crh_starts.append(pos)
-
-    if len(crh_starts) <= 1:
-        return [text]
-
-    logger.info("  CRH multi-documents détecté : %d CRH", len(crh_starts))
-
-    chunks: list[str] = []
-    for i, start in enumerate(crh_starts):
-        end = crh_starts[i + 1] if i + 1 < len(crh_starts) else len(text)
-        chunks.append(text[start:end].rstrip())
-
-    return chunks
diff --git a/t2a_install_rag_cleanup/src/extraction/page_tracker.py b/t2a_install_rag_cleanup/src/extraction/page_tracker.py
deleted file mode 100644
index dfb2896..0000000
--- a/t2a_install_rag_cleanup/src/extraction/page_tracker.py
+++ /dev/null
@@ -1,91 +0,0 @@
-"""Suivi des pages sources pour la traçabilité des diagnostics.
-
-Permet de retrouver la page d'origine et l'extrait de texte correspondant
-à un diagnostic extrait du PDF.
-"""
-
-from __future__ import annotations
-
-from typing import Optional
-
-
-class PageTracker:
-    """Associe chaque position de caractère au numéro de page source.
-
-    Args:
-        page_offsets: Liste de tuples (start, end) pour chaque page (0-indexed dans la liste).
-    """
-
-    def __init__(self, page_offsets: list[tuple[int, int]]):
-        self._offsets = page_offsets
-
-    def char_to_page(self, char_pos: int) -> int:
-        """Retourne le numéro de page (1-indexed) pour une position de caractère."""
-        for i, (start, end) in enumerate(self._offsets):
-            if start <= char_pos < end:
-                return i + 1
-        # Si au-delà de la dernière page, retourner la dernière
-        if self._offsets:
-            return len(self._offsets)
-        return 1
-
-    def find_page_for_text(self, text: str, full_text: str) -> Optional[int]:
-        """Cherche le texte dans full_text et retourne la page (1-indexed).
-
-        Effectue une recherche case-insensitive si la recherche exacte échoue.
-        """
-        if not text or not full_text:
-            return None
-
-        # Recherche exacte
-        pos = full_text.find(text)
-        if pos >= 0:
-            return self.char_to_page(pos)
-
-        # Recherche case-insensitive
-        pos = full_text.lower().find(text.lower())
-        if pos >= 0:
-            return self.char_to_page(pos)
-
-        # Recherche partielle (premiers 50 chars)
-        short = text[:50].strip()
-        if len(short) >= 10:
-            pos = full_text.lower().find(short.lower())
-            if pos >= 0:
-                return self.char_to_page(pos)
-
-        return None
-
-    def extract_excerpt(
-        self, text: str, full_text: str, context_chars: int = 100,
-    ) -> Optional[str]:
-        """Extrait le contexte autour du texte trouvé (~200 chars).
-
-        Returns:
-            Extrait avec contexte, ou None si le texte n'est pas trouvé.
-        """
-        if not text or not full_text:
-            return None
-
-        # Recherche (exacte puis case-insensitive)
-        pos = full_text.find(text)
-        if pos < 0:
-            pos = full_text.lower().find(text.lower())
-        if pos < 0:
-            short = text[:50].strip()
-            if len(short) >= 10:
-                pos = full_text.lower().find(short.lower())
-        if pos < 0:
-            return None
-
-        start = max(0, pos - context_chars)
-        end = min(len(full_text), pos + len(text) + context_chars)
-
-        excerpt = full_text[start:end].strip()
-        # Ajouter des ellipses
-        if start > 0:
-            excerpt = "..." + excerpt
-        if end < len(full_text):
-            excerpt = excerpt + "..."
-
-        return excerpt
diff --git a/t2a_install_rag_cleanup/src/extraction/pdf_extractor.py b/t2a_install_rag_cleanup/src/extraction/pdf_extractor.py
deleted file mode 100644
index 67f924a..0000000
--- a/t2a_install_rag_cleanup/src/extraction/pdf_extractor.py
+++ /dev/null
@@ -1,66 +0,0 @@
-"""Extraction de texte et tableaux depuis les PDF via pdfplumber."""
-
-from __future__ import annotations
-
-from pathlib import Path
-from typing import Optional
-
-import pdfplumber
-
-from .page_tracker import PageTracker
-
-
-def extract_text(pdf_path: str | Path) -> str:
-    """Extrait le texte de toutes les pages d'un PDF."""
-    pages_text: list[str] = []
-    with pdfplumber.open(pdf_path) as pdf:
-        for page in pdf.pages:
-            text = page.extract_text() or ""
-            pages_text.append(text)
-    return "\n\n".join(pages_text)
-
-
-def extract_text_with_pages(pdf_path: str | Path) -> tuple[str, PageTracker]:
-    """Extrait le texte avec un tracker de pages pour la traçabilité.
-
-    Returns:
-        (texte_complet, page_tracker) où page_tracker permet de retrouver
-        la page source de chaque position de caractère.
-    """
-    pages_text: list[str] = []
-    with pdfplumber.open(pdf_path) as pdf:
-        for page in pdf.pages:
-            text = page.extract_text() or ""
-            pages_text.append(text)
-
-    # Construire le texte complet avec "\n\n" comme séparateur (identique à extract_text)
-    separator = "\n\n"
-    page_offsets: list[tuple[int, int]] = []
-    offset = 0
-    for i, page_text in enumerate(pages_text):
-        start = offset
-        end = offset + len(page_text)
-        page_offsets.append((start, end))
-        offset = end + len(separator)
-
-    full_text = separator.join(pages_text)
-    return full_text, PageTracker(page_offsets)
-
-
-def extract_pages(pdf_path: str | Path) -> list[str]:
-    """Extrait le texte page par page."""
-    pages: list[str] = []
-    with pdfplumber.open(pdf_path) as pdf:
-        for page in pdf.pages:
-            pages.append(page.extract_text() or "")
-    return pages
-
-
-def extract_tables(pdf_path: str | Path) -> list[list[list[str | None]]]:
-    """Extrait tous les tableaux détectés dans le PDF."""
-    all_tables: list[list[list[str | None]]] = []
-    with pdfplumber.open(pdf_path) as pdf:
-        for page in pdf.pages:
-            tables = page.extract_tables() or []
-            all_tables.extend(tables)
-    return all_tables
diff --git a/t2a_install_rag_cleanup/src/extraction/trackare_parser.py b/t2a_install_rag_cleanup/src/extraction/trackare_parser.py
deleted file mode 100644
index c9b0786..0000000
--- a/t2a_install_rag_cleanup/src/extraction/trackare_parser.py
+++ /dev/null
@@ -1,424 +0,0 @@
-"""Parsing des exports Trackare (dossier patient complet)."""
-
-from __future__ import annotations
-
-import re
-
-from src.medical.das_filter import clean_diagnostic_text, is_valid_diagnostic_text
-
-
-def parse_trackare(text: str) -> dict:
-    """Parse un export Trackare et retourne les sections structurées."""
-    result: dict = {
-        "type": "trackare",
-        "patient": {},
-        "sejour": {},
-        "contacts": [],
-        "medecins": [],
-        "urgences": {},
-        "observations_medicales": [],
-        "notes_paramedicales": [],
-        "signes_vitaux": {},
-        "diagnostics": [],
-        "traitements": [],
-        "contenu_medical": "",
-    }
-
-    _extract_patient_info(text, result)
-    _extract_sejour_info(text, result)
-    _extract_contacts(text, result)
-    _extract_medecins(text, result)
-    _extract_urgences(text, result)
-    _extract_observations(text, result)
-    _extract_notes_param(text, result)
-    _extract_diagnostics(text, result)
-    _extract_traitements(text, result)
-    _extract_vitals(text, result)
-    _build_medical_content(result)
-
-    return result
-
-
-def _extract_patient_info(text: str, result: dict) -> None:
-    """Extrait les informations du bloc 'Détails des patients'."""
-    # Nom de naissance
-    m = re.search(r"Nom de naissance:\s*(\S+)", text)
-    if m:
-        result["patient"]["nom_naissance"] = m.group(1).strip()
-
-    # Nom et Prénom
-    m = re.search(r"Nom et Prénom:\s*(.+?)(?:\s+Date de naissance|\n)", text)
-    if m:
-        result["patient"]["nom_prenom"] = m.group(1).strip()
-
-    # IPP
-    m = re.search(r"IPP:\s*(\d+)", text)
-    if m:
-        result["patient"]["ipp"] = m.group(1)
-
-    # Date de naissance
-    m = re.search(r"Date de naissance:\s*(\d{2}/\d{2}/\d{4})", text)
-    if m:
-        result["patient"]["date_naissance"] = m.group(1)
-
-    # Sexe
-    m = re.search(r"Sexe:\s*(\S+)", text)
-    if m:
-        sexe_raw = m.group(1).strip().lower()
-        result["patient"]["sexe"] = "F" if "fém" in sexe_raw else "M"
-
-    # Lieu de naissance
-    m = re.search(r"Lieu de naissance:\s*(.+?)(?:\n|$)", text)
-    if m:
-        result["patient"]["lieu_naissance"] = m.group(1).strip()
-
-    # Adresse
-    m = re.search(r"Adresse:\s*(.+?)(?:\s+Ville de résidence|\n)", text)
-    if m:
-        result["patient"]["adresse"] = m.group(1).strip()
-
-    # Code postal et ville
-    m = re.search(r"Code Postal:\s*(\d{5})", text)
-    if m:
-        result["patient"]["code_postal"] = m.group(1)
-    m = re.search(r"Ville de résidence:\s*(.+?)(?:\n|$)", text)
-    if m:
-        result["patient"]["ville"] = m.group(1).strip()
-
-    # Taille, Poids, IMC (footer)
-    m = re.search(r"Taille:\s*(\d+)\s*cm", text)
-    if m:
-        result["patient"]["taille_cm"] = int(m.group(1))
-    m = re.search(r"Poids:\s*([\d.]+)\s*kg", text)
-    if m:
-        result["patient"]["poids_kg"] = float(m.group(1))
-    m = re.search(r"IMC:\s*([\d.]+)", text)
-    if m:
-        result["patient"]["imc"] = float(m.group(1))
-
-
-def _extract_sejour_info(text: str, result: dict) -> None:
-    """Extrait les détails de l'épisode."""
-    m = re.search(r"Episode No:\s*(\d+)", text)
-    if m:
-        result["sejour"]["episode"] = m.group(1)
-
-    m = re.search(r"Date d'admission:\s*(\d{2}/\d{2}/\d{4})", text)
-    if m:
-        result["sejour"]["date_entree"] = m.group(1)
-
-    m = re.search(r"Heure d'admission:\s*(\d{2}:\d{2})", text)
-    if m:
-        result["sejour"]["heure_entree"] = m.group(1)
-
-    m = re.search(r"Date de sortie:\s*(\d{2}/\d{2}/\d{4})", text)
-    if m:
-        result["sejour"]["date_sortie"] = m.group(1)
-
-    m = re.search(r"Heure de sortie:\s*(\d{2}:\d{2})", text)
-    if m:
-        result["sejour"]["heure_sortie"] = m.group(1)
-
-    m = re.search(r"Localisation:\s*(.+?)(?:\s+Médecin courant|\n)", text)
-    if m:
-        result["sejour"]["service"] = m.group(1).strip()
-
-    m = re.search(r"Médecin courant:\s*(.+?)(?:\n|$)", text)
-    if m:
-        result["sejour"]["medecin_courant"] = m.group(1).strip()
-
-
-def _extract_contacts(text: str, result: dict) -> None:
-    """Extrait la liste des contacts."""
-    # Bloc "Liste des contacts"
-    contact_block = re.search(
-        r"Liste des contacts\n(.*?)(?=Passage aux Urgences|Signes Vitaux|Observations médicales)",
-        text,
-        re.DOTALL,
-    )
-    if not contact_block:
-        return
-
-    block = contact_block.group(1)
-    # Chaque ligne de contact contient relation, nom, prénom, tél
-    for line in block.split("\n"):
-        line = line.strip()
-        if not line or line.startswith("Type de contact") or line.startswith("Tél"):
-            continue
-        # Chercher les noms et téléphones
-        tel_match = re.search(r"(\d{2}[.\-\s]\d{2}[.\-\s]\d{2}[.\-\s]\d{2}[.\-\s]\d{2})", line)
-        if tel_match or re.search(r"(?:Epoux|Époux|Épouse|Conjoint|Père|Mère|Fils|Fille|Frère|Soeur)", line, re.IGNORECASE):
-            result["contacts"].append(line)
-
-
-def _extract_medecins(text: str, result: dict) -> None:
-    """Extrait les noms de médecins/soignants."""
-    seen: set[str] = set()
-
-    def _add(name: str) -> None:
-        name = _clean_person_name(name)
-        if name and len(name) > 2 and name.lower() not in seen:
-            seen.add(name.lower())
-            result["medecins"].append(name)
-
-    # "DR. Prénom NOM" ou "Dr NOM" ou "Docteur NOM Prénom"
-    for m in re.finditer(
-        r"(?:DR\.?|Dr\.?|Docteur)\s+([A-ZÉÈÊËÀÂa-zéèêëàâ\.\-]+(?:\s+[A-ZÉÈÊËÀÂ][A-ZÉÈÊËÀÂa-zéèêëàâ\-]+){0,2})",
-        text,
-    ):
-        _add(m.group(1))
-
-    # Auteurs d'observations : "Note d'évolution NOM Prénom DD/MM/YYYY"
-    # ou multi-ligne "Note IDE Prénom\nNOM DD/MM/YYYY"
-    for m in re.finditer(
-        r"(?:Note d'évolution|Note IDE|Histoire de la maladie|Conclusion Obs\.?\s*médicales?)\s+"
-        r"(?:DR\.?\s+)?"
-        r"([A-ZÉÈÊËÀÂa-zéèêëàâ\.\-]+(?:[\s\n]+[A-ZÉÈÊËÀÂa-zéèêëàâ\.\-]+)*?)"
-        r"\s+\d{2}/\d{2}/\d{4}",
-        text,
-    ):
-        _add(m.group(1))
-
-    # Médecin de prise en charge / décision médicale
-    for m in re.finditer(
-        r"(?:Médecin de (?:la )?(?:prise en charge|décision)\s+médicale)\s+"
-        r"([A-ZÉÈÊËÀÂ][A-ZÉÈÊËÀÂa-zéèêëàâ\.\-]+(?:\s+[A-ZÉÈÊËÀÂa-zéèêëàâ\.\-]+){0,2})",
-        text,
-    ):
-        _add(m.group(1))
-
-    # IAO NOM Prénom
-    for m in re.finditer(
-        r"IAO\s+([A-ZÉÈÊËÀÂ][A-ZÉÈÊËÀÂa-zéèêëàâ\.\-]+(?:\s+[A-ZÉÈÊËÀÂa-zéèêëàâ\.\-]+){0,2})",
-        text,
-    ):
-        _add(m.group(1))
-
-    # Prénom seul sur la ligne avant "DD/MM/YYYY...Note IDE...\nNOM HH:MM"
-    # Ex: "Argitxu 02/03/2023\nNote IDE ...\nHIRIGOYEN 14:05"
-    # ou "Stephanie 27/02/2023 TDM fait et à voir\nNote IDE\nCONSTANTIN 08:54"
-    for m in re.finditer(
-        r"([A-ZÉÈÊËÀÂ][a-zéèêëàâäùûüôöîïç]+)\s+\d{2}/\d{2}/\d{4}[^\n]*\n\s*Note IDE[^\n]*\n\s*([A-ZÉÈÊËÀÂ][A-ZÉÈÊËÀÂa-zéèêëàâ\-]+)\s+\d{2}:\d{2}",
-        text,
-    ):
-        prenom = m.group(1)
-        nom = m.group(2)
-        _add(f"{prenom} {nom}")
-
-
-# Mots qui ne sont pas des noms de personnes
-_NOT_NAMES = {
-    "non", "pas", "une", "des", "les", "par", "sur", "pour", "dans",
-    "avec", "sans", "qui", "que", "est", "sont", "date", "heure",
-    "cholecystectomie", "cholécystectomie", "cholangiographie",
-    "complication", "vasculaire", "nécessaire", "donc", "note",
-    "douleurs", "absence", "douleur", "lotissement", "priorité",
-    "prescriptions", "technique", "alimentaire", "signé", "réalisé",
-    "selles", "covid", "devenir", "algique", "normal", "regime",
-    "reprise", "biprofenid", "orale", "gelule", "comprime",
-    "glyc", "inj", "lipase", "protéines", "ionogramme",
-    "créatinine", "glucose", "num", "crp", "ta", "bilirubine",
-    "tp", "tca", "bh", "bs", "sortie", "transfert",
-}
-
-
-def _clean_person_name(raw: str) -> str:
-    """Nettoie un nom extrait en supprimant le texte parasite."""
-    name = re.sub(r"\n+", " ", raw).strip()
-    parts = name.split()
-    clean: list[str] = []
-    for part in parts:
-        p = part.strip(".-")
-        if not p:
-            continue
-        if p.lower() in _NOT_NAMES:
-            break
-        # Un mot-nom : commence par une majuscule
-        if re.match(r"^[A-ZÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ]", p):
-            clean.append(p)
-        else:
-            break
-    result = " ".join(clean).strip()
-    # Rejeter si un seul mot de 1-2 lettres (initiale)
-    if len(result) <= 2:
-        return ""
-    return result
-
-
-def _extract_urgences(text: str, result: dict) -> None:
-    """Extrait les données du passage aux urgences."""
-    urg_block = re.search(
-        r"Passage aux Urgences\n(.*?)(?=Signes Vitaux|Observations médicales|Antécédents)",
-        text,
-        re.DOTALL,
-    )
-    if not urg_block:
-        return
-
-    block = urg_block.group(1)
-
-    m = re.search(r"Mode de transport.*?:\s*(.+)", block)
-    if m:
-        result["urgences"]["mode_transport"] = m.group(1).strip()
-
-    m = re.search(r"Mode d'entrée\s+(.+)", block)
-    if m:
-        result["urgences"]["mode_entree"] = m.group(1).strip()
-
-    m = re.search(r"Priorité\s+(Priorité \d)", block)
-    if m:
-        result["urgences"]["priorite"] = m.group(1)
-
-    # Motifs de prise en charge
-    motifs = re.findall(
-        r"Motif de prise en charge\s+(.+?)(?=\n(?:Observ\.|Médecin|Date|IAO))",
-        block,
-        re.DOTALL,
-    )
-    if motifs:
-        result["urgences"]["motifs"] = [
-            line.strip()
-            for motif in motifs
-            for line in motif.split("\n")
-            if line.strip()
-        ]
-
-
-def _extract_observations(text: str, result: dict) -> None:
-    """Extrait les observations médicales."""
-    obs_block = re.search(
-        r"Observations médicales\n(.*?)(?=Notes paramédicales|Surveillance Psychiatrie|Traitements médicamenteux|$)",
-        text,
-        re.DOTALL,
-    )
-    if not obs_block:
-        return
-
-    block = obs_block.group(1)
-
-    # Découper par type d'observation
-    entries = re.split(
-        r"(Note d'évolution|Conclusion Obs\.\s*médicales|Histoire de la maladie)",
-        block,
-    )
-
-    i = 1
-    while i < len(entries) - 1:
-        obs_type = entries[i].strip()
-        content = entries[i + 1].strip()
-
-        # Extraire auteur et date
-        m = re.match(
-            r"(?:DR\.?\s+)?([A-ZÉÈÊËÀÂa-zéèêëàâ\.\-]+(?:\s+[A-ZÉÈÊËÀÂa-zéèêëàâ\.\-]+)*)\s+(\d{2}/\d{2}/\d{4})\s+(\d{2}:\d{2})\s*(.*)",
-            content,
-            re.DOTALL,
-        )
-        if m:
-            result["observations_medicales"].append({
-                "type": obs_type,
-                "auteur": m.group(1).strip(),
-                "date": m.group(2),
-                "heure": m.group(3),
-                "contenu": m.group(4).strip(),
-            })
-        else:
-            result["observations_medicales"].append({
-                "type": obs_type,
-                "contenu": content,
-            })
-        i += 2
-
-
-def _extract_notes_param(text: str, result: dict) -> None:
-    """Extrait les notes paramédicales."""
-    notes_block = re.search(
-        r"Notes paramédicales\n(.*?)(?=Traitements médicamenteux|Surveillance|$)",
-        text,
-        re.DOTALL,
-    )
-    if not notes_block:
-        return
-
-    block = notes_block.group(1)
-    for m in re.finditer(
-        r"Note IDE\s+([A-Za-zéèêëàâäùûüôöîïçÉÈÊËÀÂÄÙÛÜÔÖÎÏÇ\.\-\s]+?)\s+(\d{2}/\d{2}/\d{4})\s+(\d{2}:\d{2})\s+(.*?)(?=Note IDE|$)",
-        block,
-        re.DOTALL,
-    ):
-        result["notes_paramedicales"].append({
-            "auteur": m.group(1).strip(),
-            "date": m.group(2),
-            "heure": m.group(3),
-            "contenu": m.group(4).strip(),
-        })
-
-
-def _extract_diagnostics(text: str, result: dict) -> None:
-    """Extrait les diagnostics codés."""
-    # "Principal actif CODE DESCRIPTION"
-    for m in re.finditer(
-        r"(Principal|Associé|Significatif)\s+(actif|inactif)\s+([A-Z]\d{2}(?:\.\d{1,2})?)\s+(.+?)(?:\s+\[.*?\])?\s+\d{2}/\d{2}/\d{4}",
-        text,
-    ):
-        libelle = clean_diagnostic_text(m.group(4).strip())
-        if not is_valid_diagnostic_text(libelle):
-            continue
-        result["diagnostics"].append({
-            "type": m.group(1),
-            "statut": m.group(2),
-            "code_cim10": m.group(3),
-            "libelle": libelle,
-        })
-
-
-def _extract_traitements(text: str, result: dict) -> None:
-    """Extrait les traitements médicamenteux."""
-    ttt_block = re.search(
-        r"Traitements médicamenteux\n(.*?)$",
-        text,
-        re.DOTALL,
-    )
-    if not ttt_block:
-        return
-
-    block = ttt_block.group(1)
-    # Chercher les noms de médicaments (en majuscules)
-    for m in re.finditer(
-        r"([A-ZÉÈÊËÀÂ][A-ZÉÈÊËÀÂ0-9\s\-/%.,'`]+(?:MG|ML|SOL|INJ|CPR|GEL|AMP|POCHE)[A-ZÉÈÊËÀÂ0-9\s\-/%.,'`\(\)\[\]]*)\s+([\d\s]+\s*(?:mg|G|GEL|CPR|AMP|ML)?)\s*[-–]\s*(.+?)(?=\n[A-Z]|\Z)",
-        block,
-        re.DOTALL,
-    ):
-        result["traitements"].append({
-            "medicament": m.group(1).strip(),
-            "dose": m.group(2).strip(),
-            "frequence": m.group(3).strip().split("\n")[0],
-        })
-
-
-def _extract_vitals(text: str, result: dict) -> None:
-    """Extrait les données anthropométriques clés."""
-    m = re.search(r"Taille \[cm\]\s+([\d.]+)", text)
-    if m:
-        result["signes_vitaux"]["taille_cm"] = float(m.group(1))
-    m = re.search(r"Poids \[kg\]\s+([\d.]+)", text)
-    if m:
-        result["signes_vitaux"]["poids_kg"] = float(m.group(1))
-    m = re.search(r"Indice\s*\n?\s*de masse\s+([\d.]+)", text)
-    if m:
-        result["signes_vitaux"]["imc"] = float(m.group(1))
-
-
-def _build_medical_content(result: dict) -> None:
-    """Construit le texte médical complet à partir des observations."""
-    parts: list[str] = []
-
-    if result["urgences"].get("motifs"):
-        parts.append("Motifs: " + ", ".join(result["urgences"]["motifs"]))
-
-    for obs in result["observations_medicales"]:
-        parts.append(obs.get("contenu", ""))
-
-    for note in result["notes_paramedicales"]:
-        parts.append(note.get("contenu", ""))
-
-    result["contenu_medical"] = "\n\n".join(parts)
diff --git a/t2a_install_rag_cleanup/src/main.py b/t2a_install_rag_cleanup/src/main.py
deleted file mode 100644
index 9fb533d..0000000
--- a/t2a_install_rag_cleanup/src/main.py
+++ /dev/null
@@ -1,469 +0,0 @@
-"""CLI + orchestrateur du pipeline d'anonymisation et extraction CIM-10."""
-
-from __future__ import annotations
-
-import argparse
-import json
-import logging
-import sys
-import time
-from pathlib import Path
-
-from .anonymization.anonymizer import Anonymizer
-from .config import ANONYMIZED_DIR, INPUT_DIR, OUTPUT_DIR, REPORTS_DIR, STRUCTURED_DIR, AnonymizationReport, DossierMedical, VetoReport
-from .extraction.document_classifier import classify
-from .extraction.crh_parser import parse_crh
-from .extraction.document_splitter import split_documents
-from .extraction.pdf_extractor import extract_text, extract_text_with_pages
-from .extraction.trackare_parser import parse_trackare
-from .medical.cim10_extractor import extract_medical_info
-from .medical.ghm import estimate_ghm
-from .quality.veto_engine import apply_vetos
-from .quality.decision_engine import apply_decisions, decision_summaries
-
-logging.basicConfig(
-    level=logging.INFO,
-    format="%(asctime)s [%(levelname)s] %(name)s: %(message)s",
-)
-logger = logging.getLogger(__name__)
-
-
-def _inject_veto_alerts(dossier: DossierMedical, veto: VetoReport, scope: str = "FINAL") -> None:
-    """Injecte les alertes liées aux vetos dans alertes_codage en évitant les doublons.
-
-    On *remplace* la section VETO précédente (qu'elle vienne d'un PDF individuel ou d'une passe de fusion),
-    afin que le JSON fusionné reste lisible.
-    """
-    cleaned: list[str] = []
-    for line in (dossier.alertes_codage or []):
-        if isinstance(line, str) and (line.startswith("VETOS:") or line.startswith("VETOS[") or line.startswith("VETO-")):
-            continue
-        cleaned.append(line)
-    dossier.alertes_codage = cleaned
-
-    if veto.verdict != "PASS":
-        dossier.alertes_codage.append(f"VETOS[{scope}]: {veto.verdict} (score={veto.score_contestabilite})")
-        for it in veto.issues[:25]:
-            dossier.alertes_codage.append(f"{it.veto} [{it.severity}] {it.where}: {it.message}")
-
-
-def _inject_decision_alerts(dossier: DossierMedical, scope: str = "FINAL") -> None:
-    """Injecte les décisions (downgrade/suppression) dans alertes_codage.
-
-    On remplace la section DECISION précédente pour garder un JSON lisible.
-    """
-    cleaned: list[str] = []
-    for line in (dossier.alertes_codage or []):
-        if isinstance(line, str) and line.startswith("DECISION:"):
-            continue
-        cleaned.append(line)
-    dossier.alertes_codage = cleaned
-
-    lines = decision_summaries(dossier)
-    if lines:
-        dossier.alertes_codage.append(f"DECISIONS[{scope}]: {len(lines)} ligne(s)")
-        dossier.alertes_codage.extend(lines[:30])
-
-
-# Flags globaux
-_use_edsnlp = True
-_use_rag = True
-
-
-def process_pdf(pdf_path: Path) -> list[tuple[str, DossierMedical, AnonymizationReport]]:
-    """Traite un PDF : extraction → splitting → parsing → anonymisation → extraction CIM-10.
-
-    Retourne une liste de (texte_anonymisé, dossier, rapport) — un par dossier détecté.
-    """
-    t0 = time.time()
-    logger.info("Traitement de %s", pdf_path.name)
-
-    # 1. Extraction texte avec pages
-    raw_text, page_tracker = extract_text_with_pages(pdf_path)
-    logger.info("  Texte extrait : %d caractères", len(raw_text))
-
-    # 2. Classification
-    doc_type = classify(raw_text)
-    logger.info("  Type de document : %s", doc_type)
-
-    # 3. Splitting multi-dossiers
-    chunks = split_documents(raw_text, doc_type)
-    if len(chunks) > 1:
-        logger.info("  Découpage : %d dossiers détectés dans %s", len(chunks), pdf_path.name)
-
-    results: list[tuple[str, DossierMedical, AnonymizationReport]] = []
-    for i, chunk_text in enumerate(chunks):
-        part_label = f" [part {i+1}/{len(chunks)}]" if len(chunks) > 1 else ""
-        logger.info("  Traitement%s...", part_label)
-
-        # 4. Parsing
-        if doc_type == "trackare":
-            parsed = parse_trackare(chunk_text)
-        else:
-            parsed = parse_crh(chunk_text)
-
-        # 5. Anonymisation
-        anonymizer = Anonymizer(parsed_data=parsed)
-        anonymized_text = anonymizer.anonymize(chunk_text)
-        report = anonymizer.report
-        report.source_file = pdf_path.name
-        logger.info(
-            "  Anonymisation%s : %d remplacements (regex=%d, ner=%d, sweep=%d)",
-            part_label,
-            report.total_replacements,
-            report.regex_replacements,
-            report.ner_replacements,
-            report.sweep_replacements,
-        )
-
-        # 6. Analyse edsnlp (optionnelle)
-        edsnlp_result = None
-        if _use_edsnlp:
-            edsnlp_result = _run_edsnlp(anonymized_text)
-
-        # 7. Extraction médicale CIM-10
-        dossier = extract_medical_info(
-            parsed, anonymized_text, edsnlp_result, use_rag=_use_rag,
-            page_tracker=page_tracker, raw_text=raw_text,
-        )
-        dossier.source_file = pdf_path.name
-        dossier.document_type = doc_type
-        logger.info("  DP%s : %s", part_label, dossier.diagnostic_principal)
-        logger.info("  DAS : %d, Actes : %d", len(dossier.diagnostics_associes), len(dossier.actes_ccam))
-
-        # 8. Estimation GHM
-        try:
-            ghm = estimate_ghm(dossier)
-            dossier.ghm_estimation = ghm
-            logger.info("  GHM : CMD=%s, Type=%s, Sévérité=%d → %s",
-                        ghm.cmd or "?", ghm.type_ghm or "?",
-                        ghm.severite, ghm.ghm_approx or "?")
-        except Exception:
-            logger.warning("  Erreur estimation GHM", exc_info=True)
-
-        # 9. Vetos (contestabilité)
-        try:
-            veto = apply_vetos(dossier)
-            dossier.veto_report = veto
-            apply_decisions(dossier)
-            _inject_decision_alerts(dossier, scope="PDF")
-            _inject_veto_alerts(dossier, veto, scope="PDF")
-
-        except Exception:
-            logger.warning("  Vetos : erreur lors du contrôle", exc_info=True)
-
-        dossier.processing_time_s = round(time.time() - t0, 2)
-        results.append((anonymized_text, dossier, report))
-
-    logger.info("  Temps total : %.2fs", time.time() - t0)
-    return results
-
-
-def _run_edsnlp(text: str):
-    """Exécute l'analyse edsnlp avec fallback gracieux."""
-    try:
-        from .medical.edsnlp_pipeline import analyze, is_available
-        if not is_available():
-            logger.info("  edsnlp non disponible, utilisation du mode regex seul")
-            return None
-        result = analyze(text)
-        logger.info(
-            "  edsnlp : %d CIM-10, %d médicaments, %d dates",
-            len(result.cim10_entities),
-            len(result.drug_entities),
-            len(result.date_entities),
-        )
-        return result
-    except Exception:
-        logger.warning("  edsnlp : erreur lors de l'analyse, fallback regex", exc_info=True)
-        return None
-
-
-def write_outputs(
-    stem: str,
-    anonymized_text: str,
-    dossier: DossierMedical,
-    report: AnonymizationReport,
-    subdir: str | None = None,
-    export_rum_flag: bool = False,
-) -> None:
-    """Écrit les fichiers de sortie."""
-    anon_dir = ANONYMIZED_DIR / subdir if subdir else ANONYMIZED_DIR
-    struct_dir = STRUCTURED_DIR / subdir if subdir else STRUCTURED_DIR
-    rep_dir = REPORTS_DIR / subdir if subdir else REPORTS_DIR
-
-    anon_dir.mkdir(parents=True, exist_ok=True)
-    struct_dir.mkdir(parents=True, exist_ok=True)
-    rep_dir.mkdir(parents=True, exist_ok=True)
-
-    # Texte anonymisé
-    anon_path = anon_dir / f"{stem}_anonymized.txt"
-    anon_path.write_text(anonymized_text, encoding="utf-8")
-    logger.info("  → %s", anon_path)
-
-    # JSON structuré
-    json_path = struct_dir / f"{stem}_cim10.json"
-    json_path.write_text(
-        dossier.model_dump_json(indent=2, exclude_none=True),
-        encoding="utf-8",
-    )
-    logger.info("  → %s", json_path)
-
-    # Rapport d'anonymisation
-    report_path = rep_dir / f"{stem}_report.json"
-    report_path.write_text(
-        report.model_dump_json(indent=2),
-        encoding="utf-8",
-    )
-    logger.info("  → %s", report_path)
-
-    # Export RUM
-    if export_rum_flag:
-        from .export.rum_export import save_rum
-        rum_dir = OUTPUT_DIR / "rum"
-        if subdir:
-            rum_dir = rum_dir / subdir
-        rum_dir.mkdir(parents=True, exist_ok=True)
-        rum_path = rum_dir / f"{stem}_rum.txt"
-        save_rum(dossier, rum_path)
-        logger.info("  → %s", rum_path)
-
-
-def main(input_path: str | None = None) -> None:
-    """Point d'entrée principal."""
-    global _use_edsnlp, _use_rag
-
-    parser = argparse.ArgumentParser(
-        description="Anonymisation de documents médicaux PDF et extraction CIM-10",
-    )
-    parser.add_argument(
-        "input",
-        nargs="*",
-        default=[input_path or "input/"],
-        help="Chemin(s) vers des PDFs, dossiers patients, ou le dossier racine (défaut: input/)",
-    )
-    parser.add_argument(
-        "--no-ner",
-        action="store_true",
-        help="Désactiver la phase NER (plus rapide, moins précis)",
-    )
-    parser.add_argument(
-        "--no-edsnlp",
-        action="store_true",
-        help="Désactiver l'analyse edsnlp (mode regex seul)",
-    )
-    parser.add_argument(
-        "--no-rag",
-        action="store_true",
-        help="Désactiver l'enrichissement RAG (FAISS + Ollama)",
-    )
-    parser.add_argument(
-        "--build-dict",
-        action="store_true",
-        help="Générer le dictionnaire CIM-10 depuis metadata.json et quitter",
-    )
-    parser.add_argument(
-        "--build-ccam-dict",
-        nargs="?",
-        const="CCAM_V81.xls",
-        metavar="PATH",
-        help="Générer le dictionnaire CCAM depuis un fichier XLS (défaut: CCAM_V81.xls)",
-    )
-    parser.add_argument(
-        "--rebuild-index",
-        action="store_true",
-        help="Forcer la reconstruction de l'index FAISS",
-    )
-    parser.add_argument(
-        "--export-rum",
-        action="store_true",
-        help="Exporter les dossiers au format RUM V016 (pour groupeur ATIH)",
-    )
-    parser.add_argument(
-        "--control-cpam",
-        metavar="PATH",
-        help="Fichier Excel de contrôle CPAM (enrichit les dossiers avec contre-argumentation)",
-    )
-    args = parser.parse_args()
-
-    if args.build_dict:
-        from .medical.cim10_dict import build_dict
-        build_dict()
-        return
-
-    if args.build_ccam_dict:
-        from .medical.ccam_dict import build_dict as build_ccam
-        result = build_ccam(args.build_ccam_dict)
-        logger.info("Dictionnaire CCAM : %d codes générés", len(result))
-        return
-
-    if args.rebuild_index:
-        from .medical.rag_index import build_index
-        build_index(force=True)
-        return
-
-    if args.no_ner:
-        # Monkey-patch pour désactiver NER
-        from .anonymization import ner_anonymizer
-        ner_anonymizer.extract_person_entities = lambda text: []
-
-    if args.no_edsnlp:
-        _use_edsnlp = False
-
-    if args.no_rag:
-        _use_rag = False
-
-    export_rum_flag = args.export_rum
-
-    # Chargement contrôle CPAM (auto-détection ou flag explicite)
-    cpam_data = None
-    cpam_path = args.control_cpam
-    if not cpam_path:
-        # Auto-détection : chercher un .xlsx dans input/Control_cpam/
-        cpam_dir = INPUT_DIR / "Control_cpam"
-        if cpam_dir.is_dir():
-            xlsx_files = sorted(cpam_dir.glob("*.xlsx"))
-            if xlsx_files:
-                cpam_path = str(xlsx_files[0])
-                logger.info("CPAM : fichier détecté automatiquement → %s", cpam_path)
-    if cpam_path:
-        from .control.cpam_parser import parse_cpam_excel
-        cpam_data = parse_cpam_excel(cpam_path)
-        if not cpam_data:
-            logger.warning("Aucun contrôle CPAM chargé depuis %s", cpam_path)
-
-    input_paths = args.input
-
-    # Collecte des groupes (pdfs, subdir) à traiter
-    groups: list[tuple[list[Path], str | None]] = []
-
-    for p in input_paths:
-        input_p = Path(p)
-        if input_p.is_file():
-            # Fichier unique → subdir = nom du dossier parent (si ce n'est pas input/)
-            subdir = input_p.parent.name if input_p.parent.name != "input" else None
-            groups.append(([input_p], subdir))
-        elif input_p.is_dir():
-            # Vérifier s'il y a des PDFs directement dans ce dossier
-            root_pdfs = sorted(input_p.glob("*.pdf"))
-            # Vérifier s'il y a des sous-dossiers avec PDFs
-            sub_dirs = [c for c in sorted(input_p.iterdir()) if c.is_dir() and list(c.glob("*.pdf"))]
-
-            if sub_dirs:
-                # C'est un dossier racine (comme input/) → traiter chaque sous-dossier
-                for child in sub_dirs:
-                    sub_pdfs = sorted(child.glob("*.pdf"))
-                    groups.append((sub_pdfs, child.name))
-            elif root_pdfs:
-                # C'est un dossier patient directement → utiliser son nom comme subdir
-                groups.append((root_pdfs, input_p.name))
-        else:
-            logger.error("Chemin introuvable : %s", input_p)
-            sys.exit(1)
-
-    total = sum(len(pdfs) for pdfs, _ in groups)
-    if total == 0:
-        logger.warning("Aucun PDF trouvé dans %s", input_p)
-        sys.exit(0)
-
-    logger.info("Traitement de %d PDF(s)...", total)
-
-    for pdfs, subdir in groups:
-        if subdir:
-            logger.info("--- Dossier %s (%d PDFs) ---", subdir, len(pdfs))
-
-        group_dossiers: list[DossierMedical] = []
-        for pdf_path in pdfs:
-            try:
-                pdf_results = process_pdf(pdf_path)
-                stem = pdf_path.stem.replace(" ", "_")
-                multi = len(pdf_results) > 1
-                for part_idx, (anonymized_text, dossier, report) in enumerate(pdf_results):
-                    part_stem = f"{stem}_part{part_idx + 1}" if multi else stem
-                    write_outputs(part_stem, anonymized_text, dossier, report, subdir=subdir, export_rum_flag=export_rum_flag)
-                    group_dossiers.append(dossier)
-            except Exception:
-                logger.exception("Erreur lors du traitement de %s", pdf_path.name)
-
-        # Fusion multi-PDFs si plusieurs documents dans le même groupe
-        merged = None
-        if len(group_dossiers) > 1 and subdir:
-            try:
-                from .medical.fusion import merge_dossiers
-                merged = merge_dossiers(group_dossiers)
-
-                # Re-estimer le GHM sur le dossier fusionné (DP/DAS consolidés)
-                try:
-                    ghm = estimate_ghm(merged)
-                    merged.ghm_estimation = ghm
-                    logger.info("  GHM fusionné : CMD=%s, Type=%s, Sévérité=%d → %s",
-                                ghm.cmd or "?", ghm.type_ghm or "?",
-                                ghm.severite, ghm.ghm_approx or "?")
-                except Exception:
-                    logger.warning("  Erreur estimation GHM fusionné", exc_info=True)
-
-                struct_dir = STRUCTURED_DIR / subdir
-                struct_dir.mkdir(parents=True, exist_ok=True)
-                merged_path = struct_dir / f"{subdir}_fusionne_cim10.json"
-
-                # Export RUM du dossier fusionné
-                if export_rum_flag:
-                    from .export.rum_export import save_rum
-                    rum_dir = OUTPUT_DIR / "rum" / subdir
-                    rum_dir.mkdir(parents=True, exist_ok=True)
-                    rum_path = rum_dir / f"{subdir}_fusionne_rum.txt"
-                    save_rum(merged, rum_path)
-                    logger.info("  → RUM fusionné : %s", rum_path)
-            except Exception:
-                logger.exception("Erreur lors de la fusion du groupe %s", subdir)
-                merged = None
-
-        # Contrôle CPAM : enrichir le dossier principal (fusionné ou dernier)
-        if cpam_data and subdir:
-            try:
-                from .control.cpam_parser import match_dossier_ogc
-                controles = match_dossier_ogc(subdir, cpam_data)
-                if controles:
-                    from .control.cpam_response import generate_cpam_response
-                    target = merged if merged else (group_dossiers[-1] if group_dossiers else None)
-                    if target:
-                        logger.info("  CPAM : %d contrôle(s) pour %s", len(controles), subdir)
-                        for ctrl in controles:
-                            text, response_data, sources = generate_cpam_response(target, ctrl)
-                            ctrl.contre_argumentation = text
-                            ctrl.response_data = response_data
-                            ctrl.sources_reponse = sources
-                        target.controles_cpam = controles
-            except Exception:
-                logger.exception("Erreur CPAM pour %s", subdir)
-
-        # Écrire le dossier fusionné (après enrichissement CPAM éventuel)
-        if merged is not None and subdir:
-            try:
-                # Vetos sur la version finale (fusion + CPAM)
-                try:
-                    veto = apply_vetos(merged)
-                    merged.veto_report = veto
-                    apply_decisions(merged)
-                    _inject_decision_alerts(merged, scope="FINAL")
-                    _inject_veto_alerts(merged, veto, scope="FINAL")
-
-                except Exception:
-                    logger.warning("  Vetos fusionné : erreur lors du contrôle", exc_info=True)
-
-                struct_dir = STRUCTURED_DIR / subdir
-                struct_dir.mkdir(parents=True, exist_ok=True)
-                merged_path = struct_dir / f"{subdir}_fusionne_cim10.json"
-                merged_path.write_text(
-                    merged.model_dump_json(indent=2, exclude_none=True),
-                    encoding="utf-8",
-                )
-                logger.info("  → Dossier fusionné : %s", merged_path)
-            except Exception:
-                logger.exception("Erreur écriture dossier fusionné %s", subdir)
-
-    logger.info("Terminé.")
-
-
-if __name__ == "__main__":
-    main()
diff --git a/t2a_install_rag_cleanup/src/medical/__init__.py b/t2a_install_rag_cleanup/src/medical/__init__.py
deleted file mode 100644
index e69de29..0000000
diff --git a/t2a_install_rag_cleanup/src/medical/ccam_dict.py b/t2a_install_rag_cleanup/src/medical/ccam_dict.py
deleted file mode 100644
index 0200a20..0000000
--- a/t2a_install_rag_cleanup/src/medical/ccam_dict.py
+++ /dev/null
@@ -1,191 +0,0 @@
-"""Dictionnaire CCAM complet extrait depuis le fichier XLS officiel (CNAM).
-
-Fournit un lookup intelligent avec normalisation Unicode pour la recherche
-de codes CCAM à partir de textes d'actes médicaux en français.
-"""
-
-from __future__ import annotations
-
-import json
-import logging
-import re
-import unicodedata
-from pathlib import Path
-from typing import Optional
-
-from ..config import CCAM_DICT_PATH
-
-logger = logging.getLogger(__name__)
-
-# Singleton : dictionnaire chargé une seule fois
-_dict_cache: dict[str, dict] | None = None
-# Cache des labels normalisés pour le substring matching
-_normalized_cache: list[tuple[str, str, str]] | None = None
-
-_CCAM_CODE_RE = re.compile(r"^[A-Z]{4}\d{3}$")
-
-
-def normalize_text(text: str) -> str:
-    """Normalise un texte : accent folding, lowercase, collapse whitespace."""
-    text = text.replace("\u2019", "'").replace("\u2018", "'").replace("\u02BC", "'")
-    nfkd = unicodedata.normalize("NFKD", text)
-    stripped = "".join(c for c in nfkd if unicodedata.category(c) != "Mn")
-    return re.sub(r"\s+", " ", stripped.lower()).strip()
-
-
-def build_dict(source_path: str | Path) -> dict[str, dict]:
-    """Construit le dictionnaire CCAM depuis un fichier XLS et l'écrit en JSON.
-
-    Format JSON : {code: {description, activite, tarif_s1, regroupement}}
-
-    Args:
-        source_path: Chemin vers le fichier XLS CCAM (ex: CCAM_V81.xls).
-
-    Returns:
-        Le dictionnaire code → infos.
-    """
-    import xlrd
-
-    source_path = Path(source_path)
-    if not source_path.exists():
-        logger.error("Fichier XLS non trouvé : %s", source_path)
-        return {}
-
-    wb = xlrd.open_workbook(str(source_path))
-    sheet = wb.sheet_by_index(0)
-
-    result: dict[str, dict] = {}
-
-    for r in range(sheet.nrows):
-        code = str(sheet.cell_value(r, 0)).strip()
-        if not _CCAM_CODE_RE.match(code):
-            continue
-
-        description = str(sheet.cell_value(r, 2)).strip()
-        activite_raw = sheet.cell_value(r, 3)
-        activite = int(activite_raw) if isinstance(activite_raw, float) else None
-
-        tarif_raw = sheet.cell_value(r, 5)
-        tarif_s1 = round(tarif_raw, 2) if isinstance(tarif_raw, (int, float)) else None
-
-        regroupement = str(sheet.cell_value(r, 10)).strip() or None
-
-        result[code] = {
-            "description": description,
-            "activite": activite,
-            "tarif_s1": tarif_s1,
-            "regroupement": regroupement,
-        }
-
-    # Écrire le fichier JSON
-    CCAM_DICT_PATH.parent.mkdir(parents=True, exist_ok=True)
-    with open(CCAM_DICT_PATH, "w", encoding="utf-8") as f:
-        json.dump(result, f, ensure_ascii=False, indent=2)
-
-    logger.info("Dictionnaire CCAM généré : %d codes → %s", len(result), CCAM_DICT_PATH)
-    return result
-
-
-def load_dict() -> dict[str, dict]:
-    """Charge le dictionnaire CCAM (singleton lazy-loaded).
-
-    Si le fichier JSON n'existe pas, retourne un dict vide avec un warning.
-    """
-    global _dict_cache
-    if _dict_cache is not None:
-        return _dict_cache
-
-    if CCAM_DICT_PATH.exists():
-        with open(CCAM_DICT_PATH, encoding="utf-8") as f:
-            _dict_cache = json.load(f)
-    else:
-        logger.warning("Dictionnaire CCAM absent : %s — lancez --build-ccam-dict", CCAM_DICT_PATH)
-        _dict_cache = {}
-
-    return _dict_cache
-
-
-def _get_normalized_entries() -> list[tuple[str, str, str]]:
-    """Retourne une liste de (code, description, description_normalisée) triée par longueur."""
-    global _normalized_cache
-    if _normalized_cache is not None:
-        return _normalized_cache
-
-    d = load_dict()
-    entries = []
-    for code, info in d.items():
-        desc = info.get("description", "") if isinstance(info, dict) else str(info)
-        norm = normalize_text(desc)
-        entries.append((code, desc, norm))
-
-    # Trier par longueur de description décroissante (plus spécifique d'abord)
-    entries.sort(key=lambda e: -len(e[2]))
-    _normalized_cache = entries
-    return _normalized_cache
-
-
-def lookup(
-    text: str,
-    domain_overrides: dict[str, str] | None = None,
-) -> str | None:
-    """Recherche un code CCAM pour un texte donné.
-
-    Stratégie en 3 niveaux :
-    1. Match substring dans domain_overrides (prioritaire, ex: CCAM_MAP existant)
-    2. Match exact normalisé dans le dictionnaire complet
-    3. Match substring normalisé avec scoring par spécificité
-
-    Args:
-        text: Le texte de l'acte médical à rechercher.
-        domain_overrides: Dictionnaire terme→code prioritaire.
-
-    Returns:
-        Le code CCAM trouvé ou None.
-    """
-    if not text:
-        return None
-
-    text_norm = normalize_text(text)
-
-    # Niveau 1 : domain overrides (substring match)
-    if domain_overrides:
-        for terme, code in domain_overrides.items():
-            if normalize_text(terme) in text_norm:
-                return code
-
-    entries = _get_normalized_entries()
-
-    # Niveau 2 : match exact normalisé
-    for code, _desc, norm_desc in entries:
-        if norm_desc == text_norm:
-            return code
-
-    # Niveau 3 : substring match normalisé (plus spécifique d'abord)
-    for code, _desc, norm_desc in entries:
-        if not norm_desc or len(norm_desc) < 4:
-            continue
-        if norm_desc in text_norm or text_norm in norm_desc:
-            return code
-
-    return None
-
-
-def validate_code(code: str) -> tuple[bool, str]:
-    """Vérifie si un code CCAM existe dans le dictionnaire.
-
-    Returns:
-        (is_valid, description) — description vide si invalide.
-    """
-    d = load_dict()
-    if code in d:
-        info = d[code]
-        desc = info.get("description", "") if isinstance(info, dict) else str(info)
-        return True, desc
-    return False, ""
-
-
-def reset_cache() -> None:
-    """Réinitialise les caches (utile pour les tests)."""
-    global _dict_cache, _normalized_cache
-    _dict_cache = None
-    _normalized_cache = None
diff --git a/t2a_install_rag_cleanup/src/medical/ccam_noncumul.py b/t2a_install_rag_cleanup/src/medical/ccam_noncumul.py
deleted file mode 100644
index 0a59df0..0000000
--- a/t2a_install_rag_cleanup/src/medical/ccam_noncumul.py
+++ /dev/null
@@ -1,122 +0,0 @@
-"""Détection des incompatibilités de non-cumul entre actes CCAM.
-
-Implémente 3 règles heuristiques basées sur les principes T2A :
-1. Même code de base (7 caractères) avec activités différentes
-2. Même regroupement chirurgical le même jour
-3. Paires de regroupements incompatibles connues
-"""
-
-from __future__ import annotations
-
-import logging
-from typing import TYPE_CHECKING
-
-if TYPE_CHECKING:
-    from ..config import ActeCCAM
-
-logger = logging.getLogger(__name__)
-
-# Regroupements chirurgicaux soumis à cumul restreint (un seul par jour)
-REGROUPEMENT_UNIQUE_PAR_JOUR: set[str] = {
-    "ADC",  # Actes de chirurgie
-    "ACO",  # Actes de chirurgie orthopédique
-    "ADO",  # Actes de chirurgie ORL
-    "ADA",  # Actes de chirurgie abdominale/digestive
-    "ADE",  # Actes de chirurgie endoscopique
-}
-
-# Paires de regroupements incompatibles
-NONCUMUL_REGROUPEMENT_PAIRS: set[frozenset[str]] = {
-    frozenset({"ADC", "ADE"}),
-    frozenset({"ADC", "ADO"}),
-    frozenset({"ACO", "ADE"}),
-}
-
-
-def _get_regroupement(acte: ActeCCAM) -> str | None:
-    """Récupère le regroupement d'un acte depuis le dictionnaire CCAM."""
-    if not acte.code_ccam_suggestion:
-        return None
-    try:
-        from .ccam_dict import load_dict
-        d = load_dict()
-        info = d.get(acte.code_ccam_suggestion)
-        if info and isinstance(info, dict):
-            return info.get("regroupement")
-    except Exception:
-        pass
-    return None
-
-
-def check_noncumul(actes: list[ActeCCAM]) -> list[str]:
-    """Vérifie les règles de non-cumul entre actes CCAM.
-
-    Args:
-        actes: Liste d'actes CCAM d'un dossier médical.
-
-    Returns:
-        Liste d'alertes de non-cumul détectées.
-    """
-    if len(actes) < 2:
-        return []
-
-    alertes: list[str] = []
-
-    # Enrichir les actes avec leur regroupement
-    actes_info: list[tuple[ActeCCAM, str | None]] = [
-        (acte, _get_regroupement(acte)) for acte in actes
-    ]
-
-    # Règle 1 : même code de base (7 premiers caractères), activités différentes
-    codes_base: dict[str, list[ActeCCAM]] = {}
-    for acte in actes:
-        code = acte.code_ccam_suggestion
-        if code and len(code) >= 7:
-            base = code[:7]
-            codes_base.setdefault(base, []).append(acte)
-
-    for base, group in codes_base.items():
-        if len(group) > 1:
-            codes_full = [a.code_ccam_suggestion for a in group]
-            alertes.append(
-                f"NON-CUMUL: codes de même base {base} avec variantes "
-                f"({', '.join(codes_full)}) — vérifier la facturation"
-            )
-
-    # Règle 2 : même regroupement chirurgical le même jour
-    regroup_par_jour: dict[tuple[str, str | None], list[ActeCCAM]] = {}
-    for acte, regroup in actes_info:
-        if regroup and regroup in REGROUPEMENT_UNIQUE_PAR_JOUR:
-            key = (regroup, acte.date)
-            regroup_par_jour.setdefault(key, []).append(acte)
-
-    for (regroup, date), group in regroup_par_jour.items():
-        if len(group) > 1:
-            codes = [a.code_ccam_suggestion or "?" for a in group]
-            jour = f" le {date}" if date else ""
-            alertes.append(
-                f"NON-CUMUL: {len(group)} actes du regroupement {regroup}{jour} "
-                f"({', '.join(codes)}) — cumul restreint"
-            )
-
-    # Règle 3 : paires de regroupements incompatibles
-    regroups_seen: list[tuple[str, ActeCCAM]] = [
-        (r, a) for a, r in actes_info if r
-    ]
-    checked: set[frozenset[int]] = set()
-    for i, (r1, a1) in enumerate(regroups_seen):
-        for j, (r2, a2) in enumerate(regroups_seen):
-            if i >= j:
-                continue
-            pair_key = frozenset({i, j})
-            if pair_key in checked:
-                continue
-            checked.add(pair_key)
-            pair = frozenset({r1, r2})
-            if pair in NONCUMUL_REGROUPEMENT_PAIRS:
-                alertes.append(
-                    f"NON-CUMUL: regroupements incompatibles {r1}/{r2} "
-                    f"({a1.code_ccam_suggestion or '?'} + {a2.code_ccam_suggestion or '?'})"
-                )
-
-    return alertes
diff --git a/t2a_install_rag_cleanup/src/medical/cim10_dict.py b/t2a_install_rag_cleanup/src/medical/cim10_dict.py
deleted file mode 100644
index 661e71c..0000000
--- a/t2a_install_rag_cleanup/src/medical/cim10_dict.py
+++ /dev/null
@@ -1,243 +0,0 @@
-"""Dictionnaire CIM-10 complet extrait depuis les métadonnées FAISS.
-
-Fournit un lookup intelligent avec normalisation Unicode pour la recherche
-de codes CIM-10 à partir de textes médicaux en français.
-"""
-
-from __future__ import annotations
-
-import json
-import logging
-import re
-import unicodedata
-from pathlib import Path
-from typing import Optional
-
-from ..config import CIM10_DICT_PATH, CIM10_SUPPLEMENTS_PATH, RAG_INDEX_DIR
-
-logger = logging.getLogger(__name__)
-
-# Singleton : dictionnaire chargé une seule fois
-_dict_cache: dict[str, str] | None = None
-# Cache des labels normalisés pour le substring matching
-_normalized_cache: list[tuple[str, str, str]] | None = None
-
-
-def normalize_text(text: str) -> str:
-    """Normalise un texte : accent folding, lowercase, collapse whitespace.
-
-    Utilise unicodedata pour supprimer les accents (NFD → suppression des
-    combining marks), puis met en minuscules et collapse les espaces multiples.
-    """
-    # Normaliser les apostrophes Unicode → ASCII
-    text = text.replace("\u2019", "'").replace("\u2018", "'").replace("\u02BC", "'")
-    # NFD decomposition puis suppression des combining marks (accents)
-    nfkd = unicodedata.normalize("NFKD", text)
-    stripped = "".join(c for c in nfkd if unicodedata.category(c) != "Mn")
-    # Lowercase + collapse whitespace
-    return re.sub(r"\s+", " ", stripped.lower()).strip()
-
-
-def build_dict() -> dict[str, str]:
-    """Construit le dictionnaire CIM-10 depuis les métadonnées RAG.
-
-    Extrait le code et le label (première ligne de l'extrait, sans le préfixe code)
-    depuis chaque entrée CIM-10 du metadata.json existant.
-
-    Returns:
-        Le dictionnaire code → label.
-    """
-    # Nouveau format : metadata_ref.json (fallback legacy : metadata.json)
-    metadata_path = RAG_INDEX_DIR / "metadata_ref.json"
-    if not metadata_path.exists():
-        legacy = RAG_INDEX_DIR / "metadata.json"
-        if legacy.exists():
-            metadata_path = legacy
-        else:
-            logger.error("Métadonnées RAG non trouvées : %s", metadata_path)
-            return {}
-
-    with open(metadata_path, encoding="utf-8") as f:
-        metadata = json.load(f)
-
-    result: dict[str, str] = {}
-    for entry in metadata:
-        if entry.get("document") != "cim10":
-            continue
-        code = entry.get("code")
-        extrait = entry.get("extrait", "")
-        if not code or not extrait:
-            continue
-
-        # Extraire le label : première ligne, sans le préfixe "CODE "
-        first_line = extrait.split("\n")[0].strip()
-        # Retirer le préfixe code (ex: "K85.1 Pancréatite aigüe...")
-        prefix = f"{code} "
-        if first_line.startswith(prefix):
-            label = first_line[len(prefix):]
-        else:
-            label = first_line
-
-        # Garder l'entrée la plus spécifique (avec point > sans point)
-        if code not in result or not label:
-            result[code] = label
-
-    # Écrire le fichier JSON
-    CIM10_DICT_PATH.parent.mkdir(parents=True, exist_ok=True)
-    with open(CIM10_DICT_PATH, "w", encoding="utf-8") as f:
-        json.dump(result, f, ensure_ascii=False, indent=2)
-
-    logger.info("Dictionnaire CIM-10 généré : %d codes → %s", len(result), CIM10_DICT_PATH)
-    return result
-
-
-def load_dict() -> dict[str, str]:
-    """Charge le dictionnaire CIM-10 (singleton lazy-loaded).
-
-    Si le fichier JSON n'existe pas, tente de le construire depuis metadata.json.
-    Fusionne ensuite les suppléments (sous-codes manquants) sans écraser le dict principal.
-    """
-    global _dict_cache
-    if _dict_cache is not None:
-        return _dict_cache
-
-    if CIM10_DICT_PATH.exists():
-        with open(CIM10_DICT_PATH, encoding="utf-8") as f:
-            _dict_cache = json.load(f)
-    else:
-        logger.info("Dictionnaire CIM-10 absent, construction depuis metadata.json...")
-        _dict_cache = build_dict()
-
-    # Fusionner les suppléments (ne remplace pas les entrées existantes)
-    if CIM10_SUPPLEMENTS_PATH.exists():
-        with open(CIM10_SUPPLEMENTS_PATH, encoding="utf-8") as f:
-            supplements = json.load(f)
-        added = 0
-        for code, label in supplements.items():
-            if code not in _dict_cache:
-                _dict_cache[code] = label
-                added += 1
-        if added:
-            logger.info("Suppléments CIM-10 : %d codes ajoutés depuis %s", added, CIM10_SUPPLEMENTS_PATH.name)
-
-    return _dict_cache
-
-
-def _get_normalized_entries() -> list[tuple[str, str, str]]:
-    """Retourne une liste de (code, label_original, label_normalisé) triée par spécificité.
-
-    Les codes avec point (sous-codes, plus spécifiques) sont en premier.
-    """
-    global _normalized_cache
-    if _normalized_cache is not None:
-        return _normalized_cache
-
-    d = load_dict()
-    entries = []
-    for code, label in d.items():
-        norm = normalize_text(label)
-        entries.append((code, label, norm))
-
-    # Trier : sous-codes (avec point) d'abord, puis par longueur de label décroissante
-    # pour préférer les matchs les plus spécifiques
-    entries.sort(key=lambda e: (0 if "." in e[0] else 1, -len(e[2])))
-    _normalized_cache = entries
-    return _normalized_cache
-
-
-def lookup(
-    text: str,
-    domain_overrides: dict[str, str] | None = None,
-) -> str | None:
-    """Recherche un code CIM-10 pour un texte donné.
-
-    Stratégie en 3 niveaux :
-    1. Match substring dans domain_overrides (prioritaire, ex: CIM10_MAP existant)
-    2. Match exact normalisé dans le dictionnaire complet
-    3. Match substring normalisé avec scoring par spécificité (préfère sous-codes)
-
-    Args:
-        text: Le texte médical à rechercher.
-        domain_overrides: Dictionnaire terme→code prioritaire (ex: CIM10_MAP).
-
-    Returns:
-        Le code CIM-10 trouvé ou None.
-    """
-    if not text:
-        return None
-
-    text_norm = normalize_text(text)
-
-    # Niveau 1 : domain overrides (substring match)
-    if domain_overrides:
-        for terme, code in domain_overrides.items():
-            if normalize_text(terme) in text_norm:
-                return code
-
-    # Niveau 2 : match exact normalisé dans le dictionnaire complet
-    d = load_dict()
-    for code, label in d.items():
-        if normalize_text(label) == text_norm:
-            return code
-
-    # Niveau 3 : substring match normalisé (plus spécifique d'abord)
-    entries = _get_normalized_entries()
-    for code, _label, norm_label in entries:
-        if not norm_label or len(norm_label) < 4:
-            continue
-        if norm_label in text_norm:
-            return code
-
-    return None
-
-
-def normalize_code(code: str) -> str:
-    """Normalise un code CIM-10 : K810 → K81.0, k85.1 → K85.1."""
-    code = code.strip().upper()
-    # Insérer le point si absent : K810 → K81.0
-    if len(code) > 3 and "." not in code:
-        code = code[:3] + "." + code[3:]
-    return code
-
-
-def validate_code(code: str) -> tuple[bool, str]:
-    """Vérifie si un code CIM-10 existe dans le dictionnaire.
-
-    Returns:
-        (is_valid, label) — label vide si invalide.
-    """
-    d = load_dict()
-    normalized = normalize_code(code)
-    if normalized in d:
-        return True, d[normalized]
-    # Tenter aussi le code brut (3 caractères sans point)
-    raw = code.upper().strip()
-    if raw in d:
-        return True, d[raw]
-    return False, ""
-
-
-def fallback_parent_code(code: str) -> str | None:
-    """Tente de corriger un code invalide en remontant au code parent.
-
-    Le LLM hallucine souvent des sous-codes (.8, .9) sur des codes
-    standalone à 3 caractères (ex: D71.9 → D71, R69.8 → R69).
-
-    Returns:
-        Le code parent valide, ou None si aucun fallback trouvé.
-    """
-    normalized = normalize_code(code)
-    # Extraire le code parent (3 caractères avant le point)
-    if "." in normalized:
-        parent = normalized.split(".")[0]
-        is_valid, _ = validate_code(parent)
-        if is_valid:
-            return parent
-    return None
-
-
-def reset_cache() -> None:
-    """Réinitialise les caches (utile pour les tests)."""
-    global _dict_cache, _normalized_cache
-    _dict_cache = None
-    _normalized_cache = None
diff --git a/t2a_install_rag_cleanup/src/medical/cim10_extractor.py b/t2a_install_rag_cleanup/src/medical/cim10_extractor.py
deleted file mode 100644
index 1c2136e..0000000
--- a/t2a_install_rag_cleanup/src/medical/cim10_extractor.py
+++ /dev/null
@@ -1,1226 +0,0 @@
-"""Extraction d'informations médicales structurées pour le codage CIM-10."""
-
-from __future__ import annotations
-
-import logging
-import re
-from datetime import datetime
-from typing import Optional
-
-logger = logging.getLogger(__name__)
-
-from .cim10_dict import lookup as dict_lookup, normalize_text, normalize_code, validate_code as cim10_validate
-from .ccam_dict import lookup as ccam_lookup, validate_code as ccam_validate
-from .das_filter import clean_diagnostic_text, is_valid_diagnostic_text, correct_known_miscodes
-from ..config import (
-    ActeCCAM,
-    Antecedent,
-    BiologieCle,
-    Complication,
-    Diagnostic,
-    DossierMedical,
-    Imagerie,
-    Sejour,
-    Traitement,
-)
-
-try:
-    from .edsnlp_pipeline import EdsnlpResult
-except ImportError:
-    EdsnlpResult = None  # type: ignore[assignment,misc]
-
-# Mapping diagnostics fréquents → codes CIM-10
-CIM10_MAP: dict[str, str] = {
-    # Pancréatite
-    "pancréatite aiguë biliaire": "K85.1",
-    "pancréatite aigue biliaire": "K85.1",
-    "pancréatite aiguë lithiasique": "K85.1",
-    "pancréatite aigue lithiasique": "K85.1",
-    "pancréatite aiguë": "K85.9",
-    "pancréatite aigue": "K85.9",
-    "pancréatite": "K85.9",
-    # Lithiases biliaires
-    "lithiase cholédoque": "K80.5",
-    "lithiase du cholédoque": "K80.5",
-    "calcul des canaux biliaires": "K80.5",
-    "lithiase vésiculaire": "K80.2",
-    "lithiases vésiculaires": "K80.2",
-    "vésicule lithiasique": "K80.2",
-    "colique hépatique": "K80.2",
-    # Cholécystite
-    "cholécystite aiguë": "K81.0",
-    "cholecystite aigue": "K81.0",
-    "angiocholite": "K83.0",
-    # Obésité
-    "obésité": "E66.0",
-    "obesite": "E66.0",
-    "surpoids": "E66.0",
-    # Réactions médicamenteuses
-    "éruption médicamenteuse": "L27.0",
-    "eruption medicamenteuse": "L27.0",
-    "éruption cutanée médicamenteuse": "L27.0",
-    "toxidermie": "L27.0",
-    "réaction au tramadol": "L27.0",
-    "allergie médicamenteuse": "T88.7",
-    # Douleur
-    "douleur abdominale": "R10.4",
-    "douleur hypochondre droit": "R10.1",
-    # Ictère
-    "ictère": "R17",
-    "jaunisse": "R17",
-    # HTA
-    "hypertension artérielle": "I10",
-    "hta": "I10",
-    # Diabète
-    "diabète type 2": "E11.9",
-    "diabète de type 2": "E11.9",
-    "diabète type 1": "E10.9",
-}
-
-# Mapping actes → codes CCAM
-CCAM_MAP: dict[str, str] = {
-    "cholécystectomie": "HMFC004",
-    "cholecystectomie": "HMFC004",
-    "cholécystectomie par cœlioscopie": "HMFC004",
-    "cholecystectomie par coelioscopie": "HMFC004",
-    "cholangiographie": "HHHE002",
-    "cholangiographie peropératoire": "HHHE002",
-    "cpre": "HHHE002",
-    "sphinctérotomie endoscopique": "HHHE003",
-    "scanner abdominal": "ZCQK002",
-    "tdm abdominal": "ZCQK002",
-    "échographie abdominale": "ZCQJ001",
-    "echo abdominale": "ZCQJ001",
-    "irm abdominale": "ZCQN001",
-}
-
-
-def extract_medical_info(
-    parsed_data: dict,
-    anonymized_text: str,
-    edsnlp_result: Optional[EdsnlpResult] = None,
-    use_rag: bool = False,
-    page_tracker=None,
-    raw_text: str | None = None,
-) -> DossierMedical:
-    """Extrait les informations médicales structurées depuis les données parsées et le texte.
-
-    Args:
-        page_tracker: PageTracker pour la traçabilité page/extrait (optionnel).
-        raw_text: Texte brut avant anonymisation (pour recherche page source).
-    """
-    dossier = DossierMedical()
-    dossier.document_type = parsed_data.get("type", "")
-
-    # Texte de référence pour la recherche de pages (raw_text préféré, sinon anonymized)
-    search_text = raw_text or anonymized_text
-
-    _extract_sejour(parsed_data, dossier)
-    _extract_diagnostics(parsed_data, anonymized_text, dossier, edsnlp_result)
-    _extract_actes(anonymized_text, dossier)
-    _extract_antecedents(anonymized_text, dossier)
-    _extract_traitements(parsed_data, anonymized_text, dossier, edsnlp_result)
-    _extract_biologie(anonymized_text, dossier)
-    _extract_imagerie(anonymized_text, dossier)
-    _extract_complications(anonymized_text, dossier, edsnlp_result)
-
-    # Phase 4 : pass LLM pour détecter des DAS supplémentaires
-    if use_rag:
-        _extract_das_llm(anonymized_text, dossier)
-
-    if use_rag:
-        _enrich_with_rag(dossier)
-
-    # Post-processing : validation des codes CCAM contre le dictionnaire
-    _validate_ccam(dossier)
-
-    # Post-processing : validation des codes CIM-10 contre le dictionnaire
-    _validate_cim10(dossier)
-
-    # Post-processing : correction des codes systématiquement mal attribués
-    _apply_code_corrections(dossier)
-
-    # Post-processing : exclusions symptôme vs diagnostic précis
-    _apply_exclusion_rules(dossier)
-
-    # Post-processing : enrichissement sévérité (CMA/CMS heuristique)
-    _apply_severity_rules(dossier)
-
-    # Post-processing : détection non-cumul actes CCAM
-    _apply_noncumul_rules(dossier)
-
-    # Post-processing : retirer DAS dont le code est identique au DP
-    _remove_das_equal_dp(dossier)
-
-    # Post-processing : validation justifications (QC batch)
-    if use_rag:
-        _validate_justifications(dossier)
-
-    # Post-processing : traçabilité source (page + extrait)
-    if page_tracker:
-        _apply_source_tracking(dossier, page_tracker, search_text)
-
-    return dossier
-
-
-def _extract_das_llm(text: str, dossier: DossierMedical) -> None:
-    """Extrait des DAS supplémentaires via un pass LLM (avant enrichissement RAG)."""
-    try:
-        from .rag_search import extract_das_llm
-        from .ollama_cache import OllamaCache
-        from ..config import OLLAMA_CACHE_PATH, OLLAMA_MODEL
-    except ImportError:
-        logger.warning("Module RAG non disponible pour l'extraction DAS LLM")
-        return
-
-    try:
-        cache = OllamaCache(OLLAMA_CACHE_PATH, OLLAMA_MODEL)
-
-        # Construire le contexte
-        contexte = {
-            "sexe": dossier.sejour.sexe,
-            "age": dossier.sejour.age,
-            "duree_sejour": dossier.sejour.duree_sejour,
-            "imc": dossier.sejour.imc,
-            "antecedents": [a.texte for a in dossier.antecedents[:5]],
-            "biologie_cle": [(b.test, b.valeur, b.anomalie) for b in dossier.biologie_cle],
-            "imagerie": [(i.type, (i.conclusion or "")[:200]) for i in dossier.imagerie],
-            "complications": [c.texte for c in dossier.complications],
-        }
-
-        # DAS existants (texte + code)
-        existing_das = []
-        existing_codes = set()
-        if dossier.diagnostic_principal and dossier.diagnostic_principal.cim10_suggestion:
-            existing_codes.add(dossier.diagnostic_principal.cim10_suggestion)
-        for d in dossier.diagnostics_associes:
-            label = d.texte
-            if d.cim10_suggestion:
-                label += f" ({d.cim10_suggestion})"
-                existing_codes.add(d.cim10_suggestion)
-            existing_das.append(label)
-
-        dp_texte = dossier.diagnostic_principal.texte if dossier.diagnostic_principal else ""
-
-        das_results = extract_das_llm(text, contexte, existing_das, dp_texte, cache=cache)
-
-        added = 0
-        for das in das_results:
-            texte = clean_diagnostic_text(das.get("texte", ""))
-            if not texte or not is_valid_diagnostic_text(texte):
-                continue
-
-            code = das.get("code_cim10")
-            if code:
-                code = normalize_code(code)
-                is_valid, _ = cim10_validate(code)
-                if not is_valid:
-                    logger.info("DAS LLM : code %s invalide pour « %s », ignoré", code, texte)
-                    continue
-                if code in existing_codes:
-                    continue
-                existing_codes.add(code)
-
-            dossier.diagnostics_associes.append(Diagnostic(
-                texte=texte,
-                cim10_suggestion=code,
-                justification=das.get("justification"),
-                source="llm_das",
-            ))
-            added += 1
-
-        if added:
-            logger.info("DAS LLM : %d diagnostics supplémentaires ajoutés", added)
-
-        cache.save()
-    except Exception:
-        logger.warning("Erreur lors de l'extraction DAS LLM", exc_info=True)
-
-
-def _enrich_with_rag(dossier: DossierMedical) -> None:
-    """Enrichit les diagnostics via le RAG (FAISS + Ollama)."""
-    try:
-        from .rag_search import enrich_dossier
-        enrich_dossier(dossier)
-    except ImportError:
-        logger.warning("Module RAG non disponible (faiss-cpu ou sentence-transformers manquant)")
-    except Exception:
-        logger.warning("Erreur lors de l'enrichissement RAG", exc_info=True)
-
-
-def _extract_sejour(parsed: dict, dossier: DossierMedical) -> None:
-    """Extrait les informations de séjour."""
-    patient = parsed.get("patient", {})
-    sejour_data = parsed.get("sejour", {})
-
-    dossier.sejour = Sejour(
-        sexe=patient.get("sexe"),
-        date_entree=sejour_data.get("date_entree"),
-        date_sortie=sejour_data.get("date_sortie"),
-        mode_entree=parsed.get("urgences", {}).get("mode_entree"),
-    )
-
-    # Calcul de l'âge à partir de la date de naissance et de la date d'entrée
-    dob = patient.get("date_naissance")
-    date_entree = sejour_data.get("date_entree")
-    if dob and date_entree:
-        try:
-            dob_dt = datetime.strptime(dob, "%d/%m/%Y")
-            entree_dt = datetime.strptime(date_entree, "%d/%m/%Y")
-            age = entree_dt.year - dob_dt.year
-            if (entree_dt.month, entree_dt.day) < (dob_dt.month, dob_dt.day):
-                age -= 1
-            dossier.sejour.age = age
-        except ValueError:
-            pass
-
-    # Durée de séjour
-    if sejour_data.get("date_entree") and sejour_data.get("date_sortie"):
-        try:
-            d1 = datetime.strptime(sejour_data["date_entree"], "%d/%m/%Y")
-            d2 = datetime.strptime(sejour_data["date_sortie"], "%d/%m/%Y")
-            dossier.sejour.duree_sejour = (d2 - d1).days
-        except ValueError:
-            pass
-
-    # IMC, poids, taille
-    vitals = parsed.get("signes_vitaux", {})
-    if vitals.get("imc"):
-        dossier.sejour.imc = vitals["imc"]
-    elif patient.get("imc"):
-        dossier.sejour.imc = patient["imc"]
-
-    if vitals.get("poids_kg"):
-        dossier.sejour.poids = vitals["poids_kg"]
-    elif patient.get("poids_kg"):
-        dossier.sejour.poids = patient["poids_kg"]
-
-    if vitals.get("taille_cm"):
-        dossier.sejour.taille = vitals["taille_cm"]
-    elif patient.get("taille_cm"):
-        dossier.sejour.taille = patient["taille_cm"]
-
-
-def _extract_diagnostics(
-    parsed: dict,
-    text: str,
-    dossier: DossierMedical,
-    edsnlp_result: Optional[EdsnlpResult] = None,
-) -> None:
-    """Extrait le diagnostic principal et les diagnostics associés."""
-    text_lower = text.lower()
-
-    # Diagnostics codés depuis Trackare (prioritaires)
-    for diag in parsed.get("diagnostics", []):
-        texte = clean_diagnostic_text(diag.get("libelle", ""))
-        if not is_valid_diagnostic_text(texte):
-            continue
-        d = Diagnostic(
-            texte=texte,
-            cim10_suggestion=diag.get("code_cim10"),
-            source="trackare",
-        )
-        if diag.get("type", "").lower() == "principal":
-            dossier.diagnostic_principal = d
-        else:
-            dossier.diagnostics_associes.append(d)
-
-    # Extraction du texte "Au total:" ou conclusion
-    conclusion = ""
-    m = re.search(
-        r"Au total\s*[:：]?\s*(.*?)(?=\n\s*(?:Devenir|TTT|Sortie|$))",
-        text,
-        re.DOTALL | re.IGNORECASE,
-    )
-    if m:
-        conclusion = m.group(1).strip()
-
-    # Enrichissement via edsnlp (CIM-10)
-    edsnlp_codes: dict[str, str] = {}
-    if edsnlp_result:
-        for ent in edsnlp_result.cim10_entities:
-            if not ent.negation and not ent.hypothese:
-                edsnlp_codes[ent.code] = ent.texte
-
-    # Si pas de DP depuis le codage, chercher dans le texte
-    if not dossier.diagnostic_principal:
-        # D'abord essayer le fallback regex (plus précis pour les patterns spécifiques)
-        dp = _find_diagnostic_principal(text_lower, conclusion)
-        if dp:
-            dossier.diagnostic_principal = dp
-        elif edsnlp_codes:
-            # Utiliser la première entité CIM-10 edsnlp comme DP
-            code, texte = next(iter(edsnlp_codes.items()))
-            texte_clean = texte.capitalize()
-            if is_valid_diagnostic_text(texte_clean):
-                dossier.diagnostic_principal = Diagnostic(
-                    texte=texte_clean, cim10_suggestion=code,
-                    source="edsnlp",
-                )
-
-    # Diagnostics associés depuis le texte (regex)
-    das = _find_diagnostics_associes(text_lower, conclusion, dossier)
-    das = [d for d in das if is_valid_diagnostic_text(d.texte)]
-    dossier.diagnostics_associes.extend(das)
-
-    # Enrichissement DAS depuis edsnlp
-    if edsnlp_result:
-        existing_codes = set()
-        if dossier.diagnostic_principal:
-            existing_codes.add(dossier.diagnostic_principal.cim10_suggestion)
-        for d in dossier.diagnostics_associes:
-            existing_codes.add(d.cim10_suggestion)
-
-        for ent in edsnlp_result.cim10_entities:
-            if ent.negation or ent.hypothese:
-                continue
-            texte = clean_diagnostic_text(ent.texte.capitalize())
-            if not is_valid_diagnostic_text(texte):
-                continue
-            if ent.code not in existing_codes:
-                dossier.diagnostics_associes.append(Diagnostic(
-                    texte=texte,
-                    cim10_suggestion=ent.code,
-                    source="edsnlp",
-                ))
-                existing_codes.add(ent.code)
-
-
-def _find_diagnostic_principal(text_lower: str, conclusion: str) -> Diagnostic | None:
-    """Trouve le diagnostic principal dans le texte.
-
-    Normalise le texte avant matching pour gérer les variations d'accents/casse.
-    """
-    conclusion_norm = normalize_text(conclusion)
-
-    # Chercher dans la conclusion d'abord via CIM10_MAP (domain override)
-    for terme, code in CIM10_MAP.items():
-        if normalize_text(terme) in conclusion_norm:
-            return Diagnostic(texte=terme.capitalize(), cim10_suggestion=code, source="regex")
-
-    text_norm = normalize_text(text_lower)
-
-    # Patterns courants pour le DP (normalisés, sans accents)
-    dp_patterns = [
-        r"pancreatite\s+aigue\s+(?:d'origine\s+)?lithiasique",
-        r"pancreatite\s+aigue\s+biliaire",
-        r"pancreatite\s+aigue",
-    ]
-    for pat in dp_patterns:
-        m = re.search(pat, text_norm)
-        if m:
-            matched = m.group(0)
-            code = _lookup_cim10(matched)
-            return Diagnostic(texte=matched.capitalize(), cim10_suggestion=code, source="regex")
-
-    return None
-
-
-# Patterns DAS : (pattern_normalisé, label, code_fallback)
-# Les patterns sont appliqués sur du texte normalisé (sans accents, lowercase)
-_DAS_PATTERNS: list[tuple[str, str, str]] = [
-    # Lithiases biliaires
-    (r"lithiase\s+(?:du\s+)?(?:bas\s+)?choledoque", "Lithiase du cholédoque", "K80.5"),
-    (r"vesicule\s+lithiasique|lithiases?\s+vesiculaire", "Lithiase vésiculaire", "K80.2"),
-    # Inflammation biliaire
-    (r"cholecystite\s+aigue", "Cholécystite aiguë", "K81.0"),
-    (r"angiocholite|cholangite", "Angiocholite", "K83.0"),
-    # Réactions médicamenteuses
-    (r"eruption\s+cutanee|toxidermie|reaction\s+au\s+tramadol", "Éruption cutanée médicamenteuse", "L27.0"),
-    # Cardiovasculaire
-    (r"hypertension\s+arterielle|\bhta\b", "Hypertension artérielle", "I10"),
-    (r"fibrillation\s+auriculaire|\bfa\b(?:\s+paroxystique)?|\bacfa\b", "Fibrillation auriculaire", "I48.9"),
-    (r"embolie\s+pulmonaire", "Embolie pulmonaire", "I26.9"),
-    (r"thrombose\s+veineuse\s+profonde|\btvp\b", "Thrombose veineuse profonde", "I80.2"),
-    # Métabolique
-    (r"diabete\s+(?:sucre\s+)?(?:de\s+)?type\s+2|diabete\s+type\s*2", "Diabète de type 2", "E11.9"),
-    (r"diabete\s+(?:sucre\s+)?(?:de\s+)?type\s+1|diabete\s+type\s*1", "Diabète de type 1", "E10.9"),
-    (r"dyslipidemie|hypercholesterolemie", "Dyslipidémie", "E78.5"),
-    (r"denutrition|malnutrition", "Dénutrition", "E46"),
-    # Infectieux
-    (r"pneumopathie|pneumonie", "Pneumopathie", "J18.9"),
-    (r"infection\s+urinaire|pyelonephrite", "Infection urinaire", "N39.0"),
-    (r"\bsepsis\b|septicemie|choc\s+septique", "Sepsis", "A41.9"),
-    # Rénal
-    (r"insuffisance\s+renale", "Insuffisance rénale", "N19"),
-    # Hématologique
-    (r"anemie", "Anémie", "D64.9"),
-    # Addictions
-    (r"tabagisme|tabac\s+actif", "Tabagisme", "F17.2"),
-    (r"ethylisme|alcoolisme|intoxication\s+ethylique", "Éthylisme", "F10.1"),
-]
-
-
-def _find_diagnostics_associes(
-    text_lower: str, conclusion: str, dossier: DossierMedical
-) -> list[Diagnostic]:
-    """Trouve les diagnostics associés.
-
-    Utilise des patterns normalisés (sans accents) pour une détection robuste.
-    """
-    das: list[Diagnostic] = []
-    existing_codes = set()
-    if dossier.diagnostic_principal:
-        existing_codes.add(dossier.diagnostic_principal.cim10_suggestion)
-    for d in dossier.diagnostics_associes:
-        existing_codes.add(d.cim10_suggestion)
-
-    text_norm = normalize_text(text_lower)
-
-    # Patterns DAS
-    for pat, label, code in _DAS_PATTERNS:
-        if re.search(pat, text_norm) and code not in existing_codes:
-            das.append(Diagnostic(texte=label, cim10_suggestion=code, source="regex"))
-            existing_codes.add(code)
-
-    # Obésité (IMC >= 30) — pattern spécial avec extraction de valeur
-    m = re.search(r"imc\s*[:=]?\s*(\d{2,3}[.,]\d+)", text_norm)
-    if m:
-        imc_val = float(m.group(1).replace(",", "."))
-        if imc_val >= 30 and "E66.0" not in existing_codes:
-            das.append(Diagnostic(texte=f"Obésité (IMC {imc_val})", cim10_suggestion="E66.0", source="regex"))
-            existing_codes.add("E66.0")
-
-    return das
-
-
-def _extract_actes(text: str, dossier: DossierMedical) -> None:
-    """Extrait les actes CCAM."""
-    text_lower = text.lower()
-
-    # Cholécystectomie par cœlioscopie
-    if re.search(r"chol[ée]cystectomie\s+par\s+c[oœ][ea]lioscopie", text_lower):
-        date = _find_act_date(text, r"chol[ée]cystectomie")
-        dossier.actes_ccam.append(ActeCCAM(
-            texte="Cholécystectomie par cœlioscopie",
-            code_ccam_suggestion="HMFC004",
-            date=date,
-        ))
-    elif re.search(r"chol[ée]cystectomie|cholecystectomie", text_lower):
-        date = _find_act_date(text, r"chol[ée]cystectomie|cholecystectomie")
-        dossier.actes_ccam.append(ActeCCAM(
-            texte="Cholécystectomie",
-            code_ccam_suggestion="HMFC004",
-            date=date,
-        ))
-
-    # Cholangiographie
-    if re.search(r"cholangiographie", text_lower):
-        date = _find_act_date(text, r"cholangiographie")
-        dossier.actes_ccam.append(ActeCCAM(
-            texte="Cholangiographie peropératoire",
-            code_ccam_suggestion="HHHE002",
-            date=date,
-        ))
-
-    # TDM
-    if re.search(r"(?:tdm|scanner|tomodensitométrie)", text_lower):
-        date = _find_act_date(text, r"(?:TDM|scanner)")
-        dossier.actes_ccam.append(ActeCCAM(
-            texte="TDM abdominal",
-            code_ccam_suggestion="ZCQK002",
-            date=date,
-        ))
-
-    # Fallback : tenter le lookup CCAM dict pour les actes sans code
-    for acte in dossier.actes_ccam:
-        if not acte.code_ccam_suggestion:
-            code = ccam_lookup(acte.texte, domain_overrides=CCAM_MAP)
-            if code:
-                acte.code_ccam_suggestion = code
-
-
-_ANTECEDENT_NOISE = (
-    "item de", "surveillance", "température", "signes vitaux",
-    "pouls", "type de note", "aucune donnée", "renseignée",
-    "habitudes de vie", "systolique", "diastolique", "saturation",
-    "texte libre", "mode de vie", "n° rpps", "secrétariat",
-    "aucune aide",
-)
-
-_SURVEILLANCE_SINGLE_WORDS = frozenset({
-    "moyenne", "ventilation", "echelle", "gauche", "droite",
-    "capillaire", "repos", "diurèse", "glycémie", "ambiant",
-})
-
-
-def _is_valid_antecedent(line: str) -> bool:
-    """Filtre les lignes parasites du bloc antécédents (bruit Trackare)."""
-    if not line or len(line) <= 5 or line == "0":
-        return False
-    if re.match(r"^\d", line):
-        return False
-    low = line.lower()
-    # Mots-clés de bruit (sous-chaînes)
-    if any(kw in low for kw in _ANTECEDENT_NOISE):
-        return False
-    words = low.split()
-    # Mots isolés de tableau de surveillance
-    if len(words) == 1 and low in _SURVEILLANCE_SINGLE_WORDS:
-        return False
-    # Noms de service (tout majuscules, court)
-    if line.isupper() and len(line) < 40:
-        return False
-    # Mots concaténés ou répétés avec espaces : "VentilationVentilation Ventilation..."
-    if re.match(r'^([a-zà-ÿ]{3,})(\s*\1)+\s*$', line, re.IGNORECASE):
-        return False
-    # Mots répétés mélangés (≥ 3 occurrences du même mot)
-    if len(words) >= 3:
-        from collections import Counter
-        if Counter(words).most_common(1)[0][1] >= 3:
-            return False
-    # Deux mots identiques
-    if len(words) == 2 and len(set(words)) == 1:
-        return False
-    # Lignes commençant par un tag médecin (artefact colonne gauche CRH)
-    if re.match(r'^\[MEDECIN', line):
-        return False
-    # Lignes commençant par "Dr [MEDECIN" ou "Dr[PERSONNE" (nom de médecin)
-    if re.match(r'^Dr\s*\[', line):
-        return False
-    # Fragment de localisation : "de Bordeaux", "de Lyon", "de Paris"
-    if re.match(r'^de [A-ZÀ-Ú]', line) and len(line) < 25:
-        return False
-    return True
-
-
-def _extract_antecedents(text: str, dossier: DossierMedical) -> None:
-    """Extrait les antécédents."""
-    m = re.search(
-        r"Antécédents?\s*[:：]?\s*\n?(.*?)(?=\n\s*(?:Traitements?\s*[:：]|Allergie|Histoire de la maladie|Examen clinique|Signes\s+[Vv]itaux|Observations?\s+m[eé]dicale|Passage aux|Mode de vie|\n\n))",
-        text,
-        re.DOTALL | re.IGNORECASE,
-    )
-    if m:
-        block = m.group(1).strip()
-        for line in block.split("\n"):
-            line = line.strip().lstrip("- •")
-            if _is_valid_antecedent(line):
-                dossier.antecedents.append(Antecedent(texte=line))
-
-
-def _extract_traitements(
-    parsed: dict,
-    text: str,
-    dossier: DossierMedical,
-    edsnlp_result: Optional[EdsnlpResult] = None,
-) -> None:
-    """Extrait les traitements de sortie."""
-    # Construire un index des médicaments edsnlp avec codes ATC
-    drug_atc: dict[str, str] = {}
-    if edsnlp_result:
-        for drug in edsnlp_result.drug_entities:
-            if not drug.negation and drug.code_atc:
-                drug_atc[drug.texte.lower()] = drug.code_atc
-
-    # Depuis le texte — section "TTT de sortie" (sans limite de lignes)
-    m = re.search(
-        r"(?:TTT|Traitement)\s+de\s+sortie\s*[:：]?\s*\n?(.*?)(?=\n\s*(?:Devenir|Rédigé|Cordialement|Patient:|Episode|Le \d{2}/\d{2}|\n\n)|$)",
-        text,
-        re.DOTALL | re.IGNORECASE,
-    )
-    if m:
-        block = m.group(1).strip()
-        lines = block.split("\n")
-        for line in lines:
-            line = line.strip().lstrip("- •")
-            if not line or len(line) <= 2:
-                continue
-            # Conditions d'arrêt : footers, signatures, metadata
-            if re.match(
-                r"^(Patient|Episode|Le \d|Page\s+\d|V\d|Rédigé|Cordialement|Dr\s|Docteur|Signature|Date|Fait\s+le)",
-                line,
-                re.IGNORECASE,
-            ):
-                break
-            med = line
-            poso = None
-            # Séparer médicament et posologie (pattern élargi)
-            poso_match = re.search(
-                r"\s+(si besoin|matin|soir|midi|"
-                r"\d+\s*(?:mg|cp|gel|sachet|comprim[ée]|g[ée]lule).*|"
-                r"\d+\s*(?:x|fois)\s*/?\s*(?:j(?:our)?|semaine)|"
-                r"pendant\s+\d+\s*jours?)",
-                line,
-                re.IGNORECASE,
-            )
-            if poso_match:
-                med = line[:poso_match.start()].strip()
-                poso = poso_match.group(1).strip()
-            # Chercher le code ATC via edsnlp
-            code_atc = _match_drug_atc(med, drug_atc)
-            dossier.traitements_sortie.append(Traitement(
-                medicament=med,
-                posologie=poso,
-                code_atc=code_atc,
-            ))
-
-    # Si rien trouvé, chercher les prescriptions "Presc. de Sortie"
-    if not dossier.traitements_sortie:
-        for m_presc in re.finditer(
-            r"([A-ZÉÈÊËÀÂ][A-ZÉÈÊËÀÂ0-9\s\-/%.]+?)(?:\s+\d+\s*(?:mg|G|CPR|GEL))?.*?Presc\.\s*de\s*Sortie",
-            text,
-        ):
-            med = m_presc.group(1).strip()
-            if len(med) > 3:
-                code_atc = _match_drug_atc(med, drug_atc)
-                dossier.traitements_sortie.append(Traitement(
-                    medicament=med, code_atc=code_atc,
-                ))
-
-
-def _match_drug_atc(med_name: str, drug_atc: dict[str, str]) -> Optional[str]:
-    """Cherche un code ATC correspondant au médicament dans les résultats edsnlp."""
-    if not drug_atc:
-        return None
-    med_lower = med_name.lower().strip()
-    # Correspondance exacte
-    if med_lower in drug_atc:
-        return drug_atc[med_lower]
-    # Correspondance partielle : le nom edsnlp est contenu dans le nom du médicament
-    for drug_text, atc in drug_atc.items():
-        if drug_text in med_lower or med_lower in drug_text:
-            return atc
-    return None
-
-
-def _extract_biologie(text: str, dossier: DossierMedical) -> None:
-    """Extrait les résultats biologiques clés.
-
-    Supporte les aliases (TGO/TGP, Hb), variantes d'unités (UI/L, µmol/L, g/dL),
-    et des tests additionnels (hémoglobine, plaquettes, leucocytes, créatinine).
-    """
-    bio_patterns = [
-        (r"[Ll]ipas[ée]mie\s*(?:[àa=:])?\s*(\d+)\s*(?:UI/L|U/L)?", "Lipasémie", None),
-        (r"CRP\s*[=:àa]?\s*(\d+(?:[.,]\d+)?)\s*(?:mg/[Ll])?", "CRP", None),
-        (r"(?:ASAT|TGO)\s*[=:àa]?\s*([\d.,]+)\s*(?:N|U(?:I)?/L)?", "ASAT", None),
-        (r"(?:ALAT|TGP)\s*[=:àa]?\s*([\d.,]+)\s*(?:N|U(?:I)?/L)?", "ALAT", None),
-        (r"GGT\s*[=:àa]?\s*(\d+)\s*(?:U(?:I)?/L)?", "GGT", None),
-        (r"PAL\s*[=:àa]?\s*(\d+)\s*(?:U(?:I)?/L)?", "PAL", None),
-        (r"[Bb]ilirubine\s+(?:totale\s+)?[àa=:]\s*(\d+(?:[.,]\d+)?)\s*(?:µmol/L|mg/dL)?", "Bilirubine totale", None),
-        (r"[Tt]roponine\s+(?:us\s+)?(n[ée]gative|positive|normale)", "Troponine", None),
-        (r"(?:[Hh][ée]moglobine|Hb)\s*[=:àa]?\s*(\d+(?:[.,]\d+)?)\s*(?:g/dL|g/L)?", "Hémoglobine", None),
-        (r"[Pp]laquettes?\s*[=:àa]?\s*(\d+(?:\s*000)?)\s*(?:/mm3|G/L)?", "Plaquettes", None),
-        (r"[Ll]eucocytes?\s*[=:àa]?\s*(\d+(?:\s*000)?)\s*(?:/mm3|G/L)?", "Leucocytes", None),
-        (r"[Cc]r[ée]atinine?\s*[=:àa]?\s*(\d+(?:[.,]\d+)?)\s*(?:µmol/L|mg/dL)?", "Créatinine", None),
-    ]
-
-    for pattern, test_name, _ in bio_patterns:
-        m = re.search(pattern, text)
-        if m:
-            value = m.group(1)
-            anomalie = _is_abnormal(test_name, value)
-            dossier.biologie_cle.append(BiologieCle(
-                test=test_name,
-                valeur=value,
-                anomalie=anomalie,
-            ))
-
-
-def _extract_imagerie(text: str, dossier: DossierMedical) -> None:
-    """Extrait les résultats d'imagerie."""
-    # TDM
-    tdm_match = re.search(
-        r"(?:TDM|[Ss]canner|tomodensitométrie).*?(?:retrouve|montre|objective)\s*[:：]?\s*(.*?)(?=\n\s*(?:Cholécystectomie|Au total|Devenir|\n\n))",
-        text,
-        re.DOTALL | re.IGNORECASE,
-    )
-    if tdm_match:
-        conclusion = tdm_match.group(1).strip()
-        # Score de Balthazar
-        score = None
-        m = re.search(r"[Bb]althazar\s*(?:[àa=:])?\s*(\d+|[A-E])", text)
-        if m:
-            score = f"Balthazar {m.group(1)}"
-        dossier.imagerie.append(Imagerie(
-            type="TDM abdominal",
-            conclusion=conclusion[:500],
-            score=score,
-        ))
-
-    # Échographie
-    echo_match = re.search(
-        r"(?:[ée]cho(?:graphie)?)\s*.*?(?:retrouve|montre|objective)\s*[:：]?\s*(.*?)(?=\n\n)",
-        text,
-        re.DOTALL | re.IGNORECASE,
-    )
-    if echo_match:
-        dossier.imagerie.append(Imagerie(
-            type="Échographie",
-            conclusion=echo_match.group(1).strip()[:500],
-        ))
-
-
-def _extract_complications(
-    text: str,
-    dossier: DossierMedical,
-    edsnlp_result: Optional[EdsnlpResult] = None,
-) -> None:
-    """Extrait les complications mentionnées."""
-    text_lower = text.lower()
-
-    # Termes de négation détectés par edsnlp pour chaque entité
-    edsnlp_negated_terms: set[str] = set()
-    if edsnlp_result:
-        for ent in edsnlp_result.cim10_entities:
-            if ent.negation:
-                edsnlp_negated_terms.add(ent.texte.lower())
-
-    complication_terms = [
-        "éruption cutanée",
-        "eruption cutanée",
-        "fièvre",
-        "infection",
-        "hémorragie",
-        "hématome",
-        "abcès",
-        "fistule",
-        "iléus",
-        "occlusion",
-    ]
-
-    for term in complication_terms:
-        if term in text_lower:
-            # Vérifier la négation via edsnlp d'abord
-            if edsnlp_result and _is_negated_by_edsnlp(term, edsnlp_negated_terms):
-                continue
-            # Fallback regex pour la négation
-            pattern = rf"(?:pas de|sans|absence de|aucun[e]?)\s+{re.escape(term)}"
-            if not re.search(pattern, text_lower):
-                dossier.complications.append(Complication(texte=term.capitalize()))
-
-
-def _is_negated_by_edsnlp(term: str, negated_terms: set[str]) -> bool:
-    """Vérifie si un terme est nié selon edsnlp."""
-    term_lower = term.lower()
-    for neg_term in negated_terms:
-        if term_lower in neg_term or neg_term in term_lower:
-            return True
-    return False
-
-
-def _validate_ccam(dossier: DossierMedical) -> None:
-    """Valide les codes CCAM suggérés contre le dictionnaire officiel."""
-    for acte in dossier.actes_ccam:
-        if not acte.code_ccam_suggestion:
-            acte.validite = "non_verifie"
-            continue
-        is_valid, desc = ccam_validate(acte.code_ccam_suggestion)
-        if is_valid:
-            acte.validite = "valide"
-        else:
-            acte.validite = "non_verifie"
-            dossier.alertes_codage.append(
-                f"CCAM {acte.code_ccam_suggestion} ({acte.texte}) : code absent du dictionnaire CCAM V81"
-            )
-
-
-_INVALID_CODE_PATTERNS = {"aucun", "none", "n/a", "non_codable", "aucun_code_valide", "inconnu"}
-
-
-def _fallback_cim10(texte: str) -> str | None:
-    """Tente de trouver un code CIM-10 via le dictionnaire à partir du texte diagnostic."""
-    code = dict_lookup(texte, domain_overrides=CIM10_MAP)
-    if code:
-        is_valid, _ = cim10_validate(code)
-        if is_valid:
-            return code
-    return None
-
-
-def _validate_cim10(dossier: DossierMedical) -> None:
-    """Valide les codes CIM-10 suggérés par Ollama contre le dictionnaire."""
-    diags: list[tuple[str, Diagnostic]] = []
-    if dossier.diagnostic_principal:
-        diags.append(("DP", dossier.diagnostic_principal))
-    for das in dossier.diagnostics_associes:
-        diags.append(("DAS", das))
-
-    for type_diag, diag in diags:
-        if not diag.cim10_suggestion:
-            continue
-
-        # Rejeter les hallucinations
-        if diag.cim10_suggestion.lower().strip() in _INVALID_CODE_PATTERNS:
-            fallback = _fallback_cim10(diag.texte)
-            if fallback:
-                dossier.alertes_codage.append(
-                    f"CIM-10 {type_diag} ({diag.texte}) : code rejeté « {diag.cim10_suggestion} » → fallback {fallback}"
-                )
-                diag.cim10_suggestion = fallback
-                diag.cim10_confidence = "medium"
-            else:
-                dossier.alertes_codage.append(
-                    f"CIM-10 {type_diag} ({diag.texte}) : code rejeté « {diag.cim10_suggestion} »"
-                )
-                diag.cim10_suggestion = None
-                diag.cim10_confidence = None
-            continue
-
-        # Normaliser le format (K810 → K81.0)
-        diag.cim10_suggestion = normalize_code(diag.cim10_suggestion)
-
-        # Valider contre le dictionnaire
-        is_valid, label = cim10_validate(diag.cim10_suggestion)
-        if not is_valid:
-            fallback = _fallback_cim10(diag.texte)
-            if fallback:
-                dossier.alertes_codage.append(
-                    f"CIM-10 {type_diag} {diag.cim10_suggestion} ({diag.texte}) : code invalide → fallback {fallback}"
-                )
-                diag.cim10_suggestion = fallback
-                diag.cim10_confidence = "medium"
-            else:
-                dossier.alertes_codage.append(
-                    f"CIM-10 {type_diag} {diag.cim10_suggestion} ({diag.texte}) : code absent du dictionnaire CIM-10"
-                )
-                diag.cim10_confidence = "low"
-
-
-def _find_act_date(text: str, act_pattern: str) -> str | None:
-    """Trouve la date associée à un acte."""
-    # Chercher "acte le DD/MM" ou "acte le DD/MM/YYYY"
-    m = re.search(
-        rf"{act_pattern}.*?(?:le\s+)?(\d{{2}}/\d{{2}}(?:/\d{{4}})?)",
-        text,
-        re.IGNORECASE,
-    )
-    if m:
-        return m.group(1)
-
-    # Chercher dans la ligne d'observation juste avant
-    m = re.search(
-        rf"(\d{{2}}/\d{{2}}/\d{{4}}).*?{act_pattern}",
-        text,
-        re.IGNORECASE,
-    )
-    if m:
-        return m.group(1)
-    return None
-
-
-def _apply_exclusion_rules(dossier: DossierMedical) -> None:
-    """Applique les règles d'exclusion symptôme vs diagnostic précis."""
-    try:
-        from .exclusion_rules import check_exclusions
-        result = check_exclusions(dossier.diagnostic_principal, dossier.diagnostics_associes)
-        dossier.diagnostics_associes = result.cleaned_das
-        dossier.alertes_codage.extend(result.warnings)
-        if result.excluded:
-            logger.info(
-                "  Exclusions : %d DAS symptomatiques exclus",
-                len(result.excluded),
-            )
-    except Exception:
-        logger.warning("Erreur lors de l'application des règles d'exclusion", exc_info=True)
-
-
-def _apply_severity_rules(dossier: DossierMedical) -> None:
-    """Enrichit les diagnostics avec les informations de sévérité heuristique."""
-    try:
-        from .severity import enrich_dossier_severity
-        alertes, _cma_count, _cms_count = enrich_dossier_severity(
-            dossier.diagnostic_principal, dossier.diagnostics_associes,
-        )
-        dossier.alertes_codage.extend(alertes)
-    except Exception:
-        logger.warning("Erreur lors de l'évaluation de sévérité", exc_info=True)
-
-
-def _apply_code_corrections(dossier: DossierMedical) -> None:
-    """Corrige les codes CIM-10 systématiquement mal attribués par le LLM."""
-    all_diags = []
-    if dossier.diagnostic_principal:
-        all_diags.append(dossier.diagnostic_principal)
-    all_diags.extend(dossier.diagnostics_associes)
-
-    for diag in all_diags:
-        if not diag.cim10_suggestion:
-            continue
-        corrected = correct_known_miscodes(diag.cim10_suggestion, diag.texte)
-        if corrected:
-            logger.info("  Code corrigé : %s → %s pour « %s »", diag.cim10_suggestion, corrected, diag.texte)
-            diag.cim10_suggestion = corrected
-
-
-def _is_dp_family_redundant(das_code: str, dp_code: str) -> bool:
-    """True si le DAS est redondant avec le DP (même code, parent/enfant, ou même famille)."""
-    if das_code == dp_code:
-        return True
-    # Relation parent/enfant → toujours redondant
-    das_norm = das_code.replace(".", "")
-    dp_norm = dp_code.replace(".", "")
-    if das_norm.startswith(dp_norm) or dp_norm.startswith(das_norm):
-        return True
-    # Même famille 3 chars, sauf exceptions
-    dp_family = dp_code[:3]
-    if das_code[:3] == dp_family:
-        # S/T (trauma) : sites différents → garder
-        if dp_family[0] in ("S", "T"):
-            return False
-        # E10-E14 (diabète) : complications différentes → garder
-        if dp_family[0] == "E" and dp_family[1:].isdigit() and 10 <= int(dp_family[1:]) <= 14:
-            return False
-        return True
-    return False
-
-
-def _remove_das_equal_dp(dossier: DossierMedical) -> None:
-    """Retire les DAS redondants avec le DP (même code, famille, ou sémantique)."""
-    from .das_filter import apply_semantic_dedup
-
-    dp_code = dossier.diagnostic_principal.cim10_suggestion if dossier.diagnostic_principal else None
-    if not dp_code:
-        return
-    before = len(dossier.diagnostics_associes)
-    dossier.diagnostics_associes = [
-        d for d in dossier.diagnostics_associes
-        if not d.cim10_suggestion or not _is_dp_family_redundant(d.cim10_suggestion, dp_code)
-    ]
-    removed = before - len(dossier.diagnostics_associes)
-    if removed:
-        logger.info("  DAS≈DP : %d DAS retiré(s) (famille %s du DP)", removed, dp_code[:3])
-
-    # Redondances sémantiques entre DAS
-    dossier.diagnostics_associes = apply_semantic_dedup(dossier.diagnostics_associes)
-
-
-def _apply_noncumul_rules(dossier: DossierMedical) -> None:
-    """Détecte les incompatibilités de non-cumul entre actes CCAM."""
-    try:
-        from .ccam_noncumul import check_noncumul
-        alertes = check_noncumul(dossier.actes_ccam)
-        dossier.alertes_codage.extend(alertes)
-    except Exception:
-        logger.warning("Erreur lors de la vérification du non-cumul CCAM", exc_info=True)
-
-
-def _lookup_cim10(text: str) -> str | None:
-    """Cherche un code CIM-10 pour un texte donné.
-
-    Utilise le dictionnaire complet (10 893 codes) avec CIM10_MAP en override prioritaire.
-    """
-    return dict_lookup(text, domain_overrides=CIM10_MAP)
-
-
-# Plages de référence biologiques (min, max) — utilisées par _is_abnormal()
-# et exportées pour le formatage du contexte LLM dans rag_search.py
-BIO_NORMALS: dict[str, tuple[float, float]] = {
-    "Lipasémie": (0, 60),
-    "CRP": (0, 5),
-    "ASAT": (0, 40),
-    "ALAT": (0, 40),
-    "GGT": (0, 60),
-    "PAL": (0, 150),
-    "Bilirubine totale": (0, 17),
-    "Hémoglobine": (12, 17),
-    "Plaquettes": (150, 400),
-    "Leucocytes": (4, 10),
-    "Créatinine": (50, 120),
-}
-
-
-def _is_abnormal(test: str, value: str) -> bool | None:
-    """Détermine si un résultat biologique est anormal."""
-    try:
-        val = float(value.replace(",", "."))
-    except (ValueError, AttributeError):
-        if value.lower() in ("négative", "negative", "normale", "normal"):
-            return False
-        if value.lower() in ("positive", "positif", "élevée", "elevee"):
-            return True
-        return None
-
-    if test in BIO_NORMALS:
-        lo, hi = BIO_NORMALS[test]
-        return val > hi or val < lo
-    return None
-
-
-def _track_item(item, search_key: str, page_tracker, search_text: str) -> bool:
-    """Cherche la page source et l'extrait pour un item avec source_page/source_excerpt."""
-    if item.source_page is not None:
-        return False
-    if not search_key:
-        return False
-    page = page_tracker.find_page_for_text(search_key, search_text)
-    if page:
-        item.source_page = page
-        item.source_excerpt = page_tracker.extract_excerpt(search_key, search_text)
-        return True
-    return False
-
-
-def _apply_source_tracking(dossier: DossierMedical, page_tracker, search_text: str) -> None:
-    """Ajoute la traçabilité source (page + extrait) à tous les éléments du dossier.
-
-    Cherche le texte de chaque élément dans le texte source pour retrouver
-    la page d'origine et extraire un passage contextualisé.
-    """
-    tracked = 0
-    total = 0
-
-    # Diagnostics (DP + DAS)
-    all_diags: list[Diagnostic] = []
-    if dossier.diagnostic_principal:
-        all_diags.append(dossier.diagnostic_principal)
-    all_diags.extend(dossier.diagnostics_associes)
-
-    for diag in all_diags:
-        total += 1
-        if _track_item(diag, diag.texte, page_tracker, search_text):
-            tracked += 1
-
-    # Biologie
-    for b in dossier.biologie_cle:
-        total += 1
-        search_key = f"{b.test}: {b.valeur}" if b.valeur else b.test
-        if _track_item(b, search_key, page_tracker, search_text):
-            tracked += 1
-        elif b.valeur and _track_item(b, b.test, page_tracker, search_text):
-            tracked += 1
-
-    # Imagerie
-    for img in dossier.imagerie:
-        total += 1
-        search_key = img.type
-        if _track_item(img, search_key, page_tracker, search_text):
-            tracked += 1
-        elif img.conclusion and _track_item(img, img.conclusion[:50], page_tracker, search_text):
-            tracked += 1
-
-    # Traitements
-    for t in dossier.traitements_sortie:
-        total += 1
-        if _track_item(t, t.medicament, page_tracker, search_text):
-            tracked += 1
-
-    # Actes CCAM
-    for a in dossier.actes_ccam:
-        total += 1
-        if _track_item(a, a.texte, page_tracker, search_text):
-            tracked += 1
-
-    # Antécédents
-    for ant in dossier.antecedents:
-        total += 1
-        if _track_item(ant, ant.texte, page_tracker, search_text):
-            tracked += 1
-
-    # Complications
-    for comp in dossier.complications:
-        total += 1
-        if _track_item(comp, comp.texte, page_tracker, search_text):
-            tracked += 1
-
-    if tracked:
-        logger.info("  Traçabilité source : %d/%d éléments localisés", tracked, total)
-
-
-def _validate_justifications(dossier: DossierMedical) -> None:
-    """Validation croisée de tous les diagnostics via un appel LLM unique.
-
-    Vérifie la cohérence, les preuves cliniques et la spécificité des codes.
-    Ajuste la confiance si la justification est faible et ajoute des alertes QC.
-    """
-    try:
-        from .ollama_client import call_ollama
-        from .clinical_context import build_enriched_context, format_enriched_context
-    except ImportError:
-        logger.warning("Module clinical_context non disponible pour la validation QC")
-        return
-
-    all_diags: list[tuple[str, Diagnostic]] = []
-    if dossier.diagnostic_principal:
-        all_diags.append(("DP", dossier.diagnostic_principal))
-    for das in dossier.diagnostics_associes:
-        all_diags.append(("DAS", das))
-
-    if not all_diags:
-        return
-
-    # Construire le résumé des codes à valider
-    codes_section = ""
-    for i, (type_diag, diag) in enumerate(all_diags, 1):
-        code = diag.cim10_suggestion or "?"
-        justif = (diag.justification or "")[:150]
-        preuves = ", ".join(p.element for p in diag.preuves_cliniques[:3]) or "aucune"
-        codes_section += f"{i}. [{type_diag}] {code} — {diag.texte}\n"
-        codes_section += f"   Justification: {justif}\n"
-        codes_section += f"   Preuves: {preuves}\n\n"
-
-    ctx = build_enriched_context(dossier)
-    ctx_str = format_enriched_context(ctx)
-
-    prompt = f"""Tu es un médecin DIM contrôleur qualité PMSI.
-Vérifie la cohérence et la justification de ce codage complet.
-
-DOSSIER CLINIQUE :
-{ctx_str}
-
-CODAGE À VALIDER :
-{codes_section}
-
-Pour CHAQUE code, vérifie :
-1. Existe-t-il une preuve clinique concrète dans le dossier ?
-2. Le code est-il le plus spécifique possible ?
-3. Y a-t-il des conflits ou redondances avec d'autres codes ?
-
-Réponds avec un JSON :
-{{
-  "validations": [
-    {{
-      "numero": 1,
-      "code": "X99.9",
-      "verdict": "maintenir|reclasser|supprimer",
-      "confidence_recommandee": "high|medium|low",
-      "commentaire": "explication courte"
-    }}
-  ],
-  "alertes_globales": ["..."]
-}}"""
-
-    try:
-        result = call_ollama(prompt, temperature=0.1, max_tokens=2500)
-    except Exception:
-        logger.warning("Erreur lors de l'appel Ollama pour validation QC", exc_info=True)
-        return
-
-    if result is None:
-        return
-
-    # Appliquer les ajustements
-    validations = result.get("validations", [])
-    for v in validations:
-        if not isinstance(v, dict):
-            continue
-        num = v.get("numero")
-        if not isinstance(num, int) or num < 1 or num > len(all_diags):
-            continue
-        type_diag, diag = all_diags[num - 1]
-        conf = v.get("confidence_recommandee")
-        verdict = v.get("verdict")
-        commentaire = v.get("commentaire", "")
-
-        if conf in ("high", "medium", "low") and conf != diag.cim10_confidence:
-            old = diag.cim10_confidence
-            diag.cim10_confidence = conf
-            if old and conf != old:
-                dossier.alertes_codage.append(
-                    f"QC: {type_diag} {diag.cim10_suggestion} confiance {old}\u2192{conf} \u2014 {commentaire}"
-                )
-
-        if verdict == "supprimer" and type_diag == "DAS":
-            dossier.alertes_codage.append(
-                f"QC: DAS {diag.cim10_suggestion} ({diag.texte}) à reconsidérer \u2014 {commentaire}"
-            )
-
-    alertes_globales = result.get("alertes_globales", [])
-    if isinstance(alertes_globales, str):
-        alertes_globales = [alertes_globales]
-    for a in alertes_globales:
-        if isinstance(a, str) and a.strip():
-            dossier.alertes_codage.append(f"QC: {a}")
-
-    logger.info("  QC batch : %d validations, %d alertes globales",
-                len(validations), len(alertes_globales))
diff --git a/t2a_install_rag_cleanup/src/medical/clinical_context.py b/t2a_install_rag_cleanup/src/medical/clinical_context.py
deleted file mode 100644
index 5ba8bde..0000000
--- a/t2a_install_rag_cleanup/src/medical/clinical_context.py
+++ /dev/null
@@ -1,315 +0,0 @@
-"""Enrichissement du contexte clinique pour les prompts LLM.
-
-Interprète les données brutes (biologie, traitements, séjour) en informations
-cliniques structurées pour améliorer la qualité du codage CIM-10.
-"""
-
-from __future__ import annotations
-
-from ..config import DossierMedical
-from .cim10_extractor import BIO_NORMALS
-
-# Seuils d'interprétation biologique (test → liste de (seuil, direction, interprétation))
-# Ordre décroissant : le premier seuil franchi donne l'interprétation
-BIO_INTERPRETATIONS: dict[str, list[tuple[float, str, str]]] = {
-    "CRP": [
-        (100, "high", "syndrome inflammatoire majeur"),
-        (20, "high", "syndrome inflammatoire modéré"),
-        (5, "high", "syndrome inflammatoire mineur"),
-    ],
-    "Lipasémie": [
-        (180, "high", "pancréatite biologique (>3N)"),
-        (60, "high", "élévation modérée de la lipase"),
-    ],
-    "ASAT": [
-        (200, "high", "cytolyse hépatique majeure (>5N)"),
-        (80, "high", "cytolyse hépatique modérée (>2N)"),
-    ],
-    "ALAT": [
-        (200, "high", "cytolyse hépatique majeure (>5N)"),
-        (80, "high", "cytolyse hépatique modérée (>2N)"),
-    ],
-    "Bilirubine totale": [
-        (50, "high", "ictère franc"),
-        (17, "high", "hyperbilirubinémie modérée"),
-    ],
-    "Hémoglobine": [
-        (7, "low", "anémie sévère (transfusion probable)"),
-        (10, "low", "anémie modérée"),
-    ],
-    "Créatinine": [
-        (300, "high", "insuffisance rénale sévère"),
-        (150, "high", "insuffisance rénale modérée"),
-    ],
-    "Plaquettes": [
-        (50, "low", "thrombopénie sévère"),
-        (100, "low", "thrombopénie modérée"),
-    ],
-    "Leucocytes": [
-        (20, "high", "hyperleucocytose majeure (infection, inflammation)"),
-        (2, "low", "leucopénie sévère (aplasie, immunodépression)"),
-    ],
-}
-
-# Médicaments → condition implicite (clé en lowercase)
-TREATMENT_INDICATORS: dict[str, str] = {
-    "insuline": "diabète insulino-traité",
-    "metformine": "diabète type 2",
-    "héparine": "anticoagulation (risque thromboembolique)",
-    "enoxaparine": "anticoagulation (HBPM)",
-    "lovenox": "anticoagulation (HBPM)",
-    "warfarine": "anticoagulation au long cours (AVK)",
-    "fluindione": "anticoagulation au long cours (AVK)",
-    "amoxicilline": "antibiothérapie",
-    "ceftriaxone": "antibiothérapie IV",
-    "tazocilline": "antibiothérapie large spectre IV",
-    "morphine": "analgésie palier 3 (douleur sévère)",
-    "oxycodone": "analgésie palier 3 (douleur sévère)",
-    "oxygène": "oxygénothérapie (insuffisance respiratoire)",
-    "furosémide": "insuffisance cardiaque / rétention hydrique",
-    "lasilix": "insuffisance cardiaque / rétention hydrique",
-}
-
-
-def interpret_bio_value(test: str, value_str: str, is_abnormal: bool | None) -> str | None:
-    """Retourne l'interprétation clinique d'une valeur bio, ou None si normale."""
-    if test not in BIO_INTERPRETATIONS:
-        return None
-
-    try:
-        val = float(value_str.replace(",", ".").replace(" ", ""))
-    except (ValueError, AttributeError):
-        return None
-
-    # Si la valeur est normale (pas anormale), pas d'interprétation
-    if is_abnormal is False:
-        return None
-
-    thresholds = BIO_INTERPRETATIONS[test]
-    for seuil, direction, interpretation in thresholds:
-        if direction == "high" and val >= seuil:
-            return interpretation
-        if direction == "low" and val <= seuil:
-            return interpretation
-
-    return None
-
-
-def detect_treatment_indicators(traitements: list) -> list[dict]:
-    """Retourne les conditions implicites détectées via les traitements.
-
-    Args:
-        traitements: Liste d'objets Traitement ou de dicts avec clé 'medicament'.
-
-    Returns:
-        Liste de dicts {medicament, condition}.
-    """
-    results = []
-    seen_conditions: set[str] = set()
-
-    for t in traitements:
-        med = t.medicament if hasattr(t, "medicament") else t.get("medicament", "")
-        med_lower = med.lower().strip()
-
-        for keyword, condition in TREATMENT_INDICATORS.items():
-            if keyword in med_lower and condition not in seen_conditions:
-                results.append({"medicament": med, "condition": condition})
-                seen_conditions.add(condition)
-                break
-
-    return results
-
-
-def detect_severity_markers(dossier: DossierMedical) -> list[str]:
-    """Détecte les marqueurs de sévérité globaux."""
-    markers = []
-
-    duree = dossier.sejour.duree_sejour
-    if duree is not None:
-        if duree > 14:
-            markers.append(f"séjour prolongé ({duree} jours)")
-        elif duree > 7:
-            markers.append(f"séjour >7 jours ({duree} jours)")
-
-    age = dossier.sejour.age
-    if age is not None:
-        if age >= 80:
-            markers.append(f"patient très âgé ({age} ans)")
-        elif age >= 70:
-            markers.append(f"patient âgé ({age} ans)")
-
-    imc = dossier.sejour.imc
-    if imc is not None:
-        if imc >= 40:
-            markers.append(f"obésité morbide (IMC {imc})")
-        elif imc >= 30:
-            markers.append(f"obésité (IMC {imc})")
-
-    if dossier.complications:
-        markers.append(f"{len(dossier.complications)} complication(s)")
-
-    return markers
-
-
-def build_enriched_context(dossier: DossierMedical) -> dict:
-    """Construit le contexte clinique enrichi (appel unique par dossier).
-
-    Returns:
-        Dict avec les clés : patient, duree_sejour, antecedents,
-        biologie (avec interprétations), imagerie, complications,
-        dp_texte, das_codes_existants, interpretations_bio,
-        conditions_traitements, marqueurs_severite.
-    """
-    # Données de base (compatibles avec l'ancien format)
-    ctx: dict = {
-        "sexe": dossier.sejour.sexe,
-        "age": dossier.sejour.age,
-        "duree_sejour": dossier.sejour.duree_sejour,
-        "imc": dossier.sejour.imc,
-        "antecedents": [a.texte for a in dossier.antecedents[:5]],
-        "biologie_cle": [(b.test, b.valeur, b.anomalie) for b in dossier.biologie_cle],
-        "imagerie": [(i.type, (i.conclusion or "")[:200]) for i in dossier.imagerie],
-        "complications": [c.texte for c in dossier.complications],
-    }
-
-    # Interprétations biologiques
-    interpretations = []
-    for b in dossier.biologie_cle:
-        interp = interpret_bio_value(b.test, b.valeur or "", b.anomalie)
-        if interp:
-            # Ajouter l'unité si connue
-            unit = ""
-            if b.test in ("CRP",):
-                unit = " mg/L"
-            elif b.test in ("Lipasémie", "ASAT", "ALAT", "GGT", "PAL"):
-                unit = " UI/L"
-            elif b.test in ("Bilirubine totale", "Créatinine"):
-                unit = " µmol/L"
-            elif b.test in ("Hémoglobine",):
-                unit = " g/dL"
-            elif b.test in ("Plaquettes", "Leucocytes"):
-                unit = " G/L"
-            interpretations.append({
-                "test": b.test,
-                "valeur": f"{b.valeur}{unit}",
-                "interpretation": interp,
-            })
-    ctx["interpretations_bio"] = interpretations
-
-    # Conditions implicites via traitements
-    ctx["conditions_traitements"] = detect_treatment_indicators(dossier.traitements_sortie)
-
-    # Marqueurs de sévérité
-    ctx["marqueurs_severite"] = detect_severity_markers(dossier)
-
-    return ctx
-
-
-def format_enriched_context(context: dict) -> str:
-    """Formate le contexte enrichi en texte structuré pour le prompt.
-
-    Inclut les mêmes sections que l'ancien _format_contexte() PLUS :
-    interprétations bio, conditions implicites traitements, marqueurs sévérité.
-    """
-    lines = []
-
-    # Patient
-    sexe = context.get("sexe")
-    age = context.get("age")
-    imc = context.get("imc")
-    patient_parts = []
-    if sexe:
-        patient_parts.append(sexe)
-    if age:
-        patient_parts.append(f"{age} ans")
-    if imc:
-        patient_parts.append(f"IMC {imc}")
-    if patient_parts:
-        lines.append(f"- Patient : {', '.join(str(p) for p in patient_parts)}")
-
-    # Durée de séjour
-    duree = context.get("duree_sejour")
-    if duree:
-        lines.append(f"- Durée séjour : {duree} jours")
-
-    # Antécédents
-    antecedents = context.get("antecedents")
-    if antecedents:
-        lines.append(f"- Antécédents : {', '.join(antecedents[:5])}")
-
-    # Biologie (avec normes)
-    biologie = context.get("biologie_cle")
-    if biologie:
-        bio_parts = []
-        for b in biologie:
-            test, valeur, anomalie = (
-                b if isinstance(b, (list, tuple))
-                else (b.get("test"), b.get("valeur"), b.get("anomalie"))
-            )
-            norme_str = ""
-            if test in BIO_NORMALS:
-                lo, hi = BIO_NORMALS[test]
-                lo_s = int(lo) if lo == int(lo) else lo
-                hi_s = int(hi) if hi == int(hi) else hi
-                norme_str = f" [N: {lo_s}-{hi_s}]"
-            marker = " (\u2191)" if anomalie else ""
-            bio_parts.append(f"{test} {valeur}{norme_str}{marker}")
-        lines.append(f"- Biologie : {', '.join(bio_parts)}")
-
-    # Imagerie
-    imagerie = context.get("imagerie")
-    if imagerie:
-        for img in imagerie:
-            img_type, conclusion = (
-                img if isinstance(img, (list, tuple))
-                else (img.get("type"), img.get("conclusion"))
-            )
-            if conclusion:
-                lines.append(f"- Imagerie : {img_type} — {conclusion[:200]}")
-
-    # Complications
-    complications = context.get("complications")
-    if complications:
-        lines.append(f"- Complications : {', '.join(complications)}")
-
-    # DP du séjour
-    dp_texte = context.get("dp_texte")
-    if dp_texte:
-        lines.append(f"- DP du séjour : {dp_texte}")
-
-    # DAS déjà codés
-    das_codes = context.get("das_codes_existants")
-    if das_codes:
-        lines.append(f"- DAS déjà codés : {', '.join(das_codes)}")
-
-    # --- Sections enrichies ---
-
-    # Interprétations biologiques
-    interpretations = context.get("interpretations_bio", [])
-    if interpretations:
-        interp_parts = [
-            f"{i['test']} {i['valeur']} \u2192 {i['interpretation']}"
-            for i in interpretations
-        ]
-        lines.append(f"\nINTERPRÉTATION CLINIQUE :")
-        lines.append(f"- Biologie : {' ; '.join(interp_parts)}")
-
-    # Conditions implicites via traitements
-    conditions = context.get("conditions_traitements", [])
-    if conditions:
-        cond_parts = [
-            f"{c['medicament']} \u2192 {c['condition']}"
-            for c in conditions
-        ]
-        if not interpretations:
-            lines.append(f"\nINTERPRÉTATION CLINIQUE :")
-        lines.append(f"- Traitements indicatifs : {' ; '.join(cond_parts)}")
-
-    # Marqueurs de sévérité
-    marqueurs = context.get("marqueurs_severite", [])
-    if marqueurs:
-        if not interpretations and not conditions:
-            lines.append(f"\nINTERPRÉTATION CLINIQUE :")
-        lines.append(f"- Marqueurs de sévérité : {', '.join(marqueurs)}")
-
-    return "\n".join(lines) if lines else "Non précisé"
diff --git a/t2a_install_rag_cleanup/src/medical/das_filter.py b/t2a_install_rag_cleanup/src/medical/das_filter.py
deleted file mode 100644
index ad0301f..0000000
--- a/t2a_install_rag_cleanup/src/medical/das_filter.py
+++ /dev/null
@@ -1,152 +0,0 @@
-"""Filtrage des diagnostics associés parasites (artefacts OCR trackare)."""
-
-import re
-import unicodedata
-
-# Corrections de codes CIM-10 systématiquement mal attribués par le LLM
-# D55.9 (anémie enzymatique) est proposé pour "Anémie" non qualifiée → D64.9
-CODE_CORRECTIONS: dict[str, dict] = {
-    "D55.9": {
-        "correct_code": "D64.9",
-        "condition_texte": r"^an[ée]mie$",  # uniquement si texte = "Anémie" seul
-        "reason": "Anémie non qualifiée → D64.9 (sans précision), pas D55.9 (enzymatique)",
-    },
-}
-
-
-def clean_diagnostic_text(text: str) -> str:
-    """Nettoie un texte de diagnostic (newlines, ponctuation trailing, espaces)."""
-    text = text.replace("\n", " ")
-    text = re.sub(r"\s+", " ", text).strip()
-    text = text.rstrip(",.;:!")
-    return text
-
-
-def is_valid_diagnostic_text(text: str) -> bool:
-    """Retourne True si le texte ressemble à un diagnostic médical légitime."""
-    t = text.strip()
-
-    # 1. Trop court
-    if len(t) < 3:
-        return False
-
-    # 2. Chiffres purs (>= 50% de chiffres)
-    digits = sum(c.isdigit() for c in t)
-    if digits >= len(t) * 0.5:
-        return False
-
-    # 3. Lettre + chiffres OCR : "H 51", "À 08", "H\n10", "K 3.6", "B 12,5"
-    if re.match(r"^[A-ZÀ-Ú]\s*\d{1,3}([.,]\d+)?$", t):
-        return False
-
-    # 4. Mots concaténés et/ou répétés avec espaces : "VentilationVentilation Ventilation..."
-    if re.match(r"^([a-zà-ÿ]{3,})(\s*\1)+\s*$", t, re.IGNORECASE):
-        return False
-
-    # 5. Mots répétés : tous identiques ("Absence absence", "Anticoagulant anticoagulant")
-    # ou ≥ 3 occurrences du même mot
-    words = t.lower().split()
-    if len(words) >= 2:
-        if len(set(words)) == 1:
-            return False
-        from collections import Counter
-        counts = Counter(words)
-        if counts.most_common(1)[0][1] >= 3:
-            return False
-
-    # 6. Fragments non-médicaux
-    if re.match(r"^(De |Du |Des |]\s)", t):
-        return False
-    if t in {"Isolement", "Pp 500"}:
-        return False
-
-    # 7. Ponctuation initiale (artefacts OCR) : ", sans précision"
-    if re.match(r'^[,.\-;:!)\]]\s', t):
-        return False
-
-    # 8. Pattern "À X.X" / "A X.X" (valeurs numériques OCR)
-    if re.match(r'^[ÀA]\s+\d+([.,]\d+)?$', t):
-        return False
-
-    # 9. Crochets (artefacts OCR) : "Episode [episode"
-    if '[' in t or ']' in t:
-        return False
-
-    # 10. Termes de laboratoire isolés (un seul mot ≠ diagnostic)
-    _LAB_TERMS = {"hémoglobine", "créatinine", "plaquettes", "leucocytes", "glycémie",
-                  "natrémie", "kaliémie", "calcémie", "bilirubine", "albumine",
-                  "fibrinogène", "hématocrite", "cétonurie", "glycosurie"}
-    if t.lower() in _LAB_TERMS:
-        return False
-
-    # 11. Fragments anatomiques courts sans pathologie : "Dans la vessie", "Le rein"
-    if re.match(r'^(Dans |La |Le |Les |Au |Aux )', t) and len(t) < 30:
-        return False
-
-    # 12. En-têtes de systèmes anatomiques (catégories sans pathologie)
-    _ANATOMICAL_HEADERS = {
-        "musculaire", "squelettique", "cardiovasculaire", "pulmonaire",
-        "neurologique", "digestif", "digestive", "hépatique", "rénal",
-        "rénale", "urinaire", "cutané", "cutanée", "articulaire",
-        "osseux", "osseuse", "gastrique", "intestinal", "intestinale",
-        "cérébral", "thoracique", "abdominal", "abdominale",
-    }
-    if len(words) == 1 and t.lower() in _ANATOMICAL_HEADERS:
-        return False
-    # Catégorie + description vague : "Musculaire - masse musculaire"
-    if re.match(r'^[A-ZÀ-Ú][a-zà-ÿ]+ - (masse|zone|région|état|bilan)', t, re.IGNORECASE):
-        return False
-
-    return True
-
-
-# Paires de redondance sémantique CIM-10 en PMSI
-# Format: (dominated_prefix, dominant_prefixes)
-# Si un code commençant par dominated_prefix ET un code commençant par un dominant_prefix
-# sont tous deux en DAS, le dominated est supprimé.
-SEMANTIC_REDUNDANCIES: list[tuple[str, list[str]]] = [
-    # I10 (HTA essentielle) redondant si I11/I12/I13 présent (cardio/néphropathie hypertensive)
-    ("I10", ["I11", "I12", "I13"]),
-    # N30 (cystite) redondant si N39.0 présent (infection urinaire)
-    ("N30", ["N39"]),
-    # J18 (pneumonie SAI) redondant si J15/J16 présent (pneumonie spécifique)
-    ("J18", ["J15", "J16"]),
-]
-
-
-def apply_semantic_dedup(das_list: list) -> list:
-    """Retire les DAS rendus redondants par la présence d'un code plus spécifique.
-
-    Utilise SEMANTIC_REDUNDANCIES pour déterminer les paires dominé/dominant.
-    Accepte une liste de Diagnostic (avec attribut cim10_suggestion).
-    """
-    codes_present = {d.cim10_suggestion for d in das_list if d.cim10_suggestion}
-    to_remove: set[str] = set()
-
-    for dominated_prefix, dominant_prefixes in SEMANTIC_REDUNDANCIES:
-        dominated_codes = [c for c in codes_present if c.startswith(dominated_prefix)]
-        if not dominated_codes:
-            continue
-        has_dominant = any(
-            c.startswith(dp) for c in codes_present for dp in dominant_prefixes
-        )
-        if has_dominant:
-            to_remove.update(dominated_codes)
-
-    if not to_remove:
-        return das_list
-    return [d for d in das_list if d.cim10_suggestion not in to_remove]
-
-
-def correct_known_miscodes(code: str, texte: str) -> str | None:
-    """Corrige les codes CIM-10 systématiquement mal attribués par le LLM.
-
-    Returns:
-        Le code corrigé, ou None si pas de correction nécessaire.
-    """
-    correction = CODE_CORRECTIONS.get(code)
-    if not correction:
-        return None
-    if re.match(correction["condition_texte"], texte.strip(), re.IGNORECASE):
-        return correction["correct_code"]
-    return None
diff --git a/t2a_install_rag_cleanup/src/medical/edsnlp_pipeline.py b/t2a_install_rag_cleanup/src/medical/edsnlp_pipeline.py
deleted file mode 100644
index d5737a1..0000000
--- a/t2a_install_rag_cleanup/src/medical/edsnlp_pipeline.py
+++ /dev/null
@@ -1,140 +0,0 @@
-"""Pipeline edsnlp pour l'extraction médicale (CIM-10, médicaments, négation)."""
-
-from __future__ import annotations
-
-import logging
-from dataclasses import dataclass, field
-from typing import Optional
-
-logger = logging.getLogger(__name__)
-
-_nlp = None
-_available = None
-
-
-@dataclass
-class CIM10Entity:
-    texte: str
-    code: str
-    negation: bool = False
-    hypothese: bool = False
-
-
-@dataclass
-class DrugEntity:
-    texte: str
-    code_atc: Optional[str] = None
-    negation: bool = False
-
-
-@dataclass
-class DateEntity:
-    texte: str
-    value: Optional[str] = None
-
-
-@dataclass
-class EdsnlpResult:
-    cim10_entities: list[CIM10Entity] = field(default_factory=list)
-    drug_entities: list[DrugEntity] = field(default_factory=list)
-    date_entities: list[DateEntity] = field(default_factory=list)
-
-
-def is_available() -> bool:
-    """Vérifie si edsnlp est installé et utilisable."""
-    global _available
-    if _available is not None:
-        return _available
-    try:
-        import edsnlp  # noqa: F401
-        _available = True
-    except ImportError:
-        _available = False
-    return _available
-
-
-def get_pipeline():
-    """Retourne le pipeline edsnlp (singleton lazy-loaded)."""
-    global _nlp
-    if _nlp is not None:
-        return _nlp
-
-    if not is_available():
-        raise RuntimeError("edsnlp n'est pas installé")
-
-    import edsnlp
-
-    logger.info("Initialisation du pipeline edsnlp...")
-    nlp = edsnlp.blank("eds")
-
-    nlp.add_pipe("eds.normalizer")
-    nlp.add_pipe("eds.sentences")
-    nlp.add_pipe("eds.cim10", config=dict(attr="NORM", term_matcher="simstring"))
-    nlp.add_pipe("eds.drugs", config=dict(attr="NORM", term_matcher="exact"))
-    nlp.add_pipe("eds.negation")
-    nlp.add_pipe("eds.hypothesis")
-    nlp.add_pipe("eds.dates")
-
-    _nlp = nlp
-    logger.info("Pipeline edsnlp initialisé avec succès")
-    return _nlp
-
-
-def analyze(text: str) -> EdsnlpResult:
-    """Analyse un texte médical avec edsnlp.
-
-    Retourne les entités CIM-10, médicaments et dates détectées.
-    """
-    result = EdsnlpResult()
-
-    if not is_available():
-        return result
-
-    try:
-        nlp = get_pipeline()
-        doc = nlp(text)
-    except Exception:
-        logger.exception("Erreur lors de l'analyse edsnlp")
-        return result
-
-    for ent in doc.ents:
-        negation = getattr(ent._, "negation", False) or False
-        hypothese = getattr(ent._, "hypothesis", False) or False
-
-        if ent.label_ == "cim10":
-            code = ent.kb_id_ or ""
-            if code:
-                result.cim10_entities.append(CIM10Entity(
-                    texte=ent.text,
-                    code=code,
-                    negation=negation,
-                    hypothese=hypothese,
-                ))
-        elif ent.label_ == "drug":
-            code_atc = ent.kb_id_ or None
-            result.drug_entities.append(DrugEntity(
-                texte=ent.text,
-                code_atc=code_atc,
-                negation=negation,
-            ))
-
-    # Dates
-    for span in doc.spans.get("dates", []):
-        date_value = None
-        if hasattr(span._, "date"):
-            date_obj = span._.date
-            if date_obj is not None:
-                date_value = str(date_obj)
-        result.date_entities.append(DateEntity(
-            texte=span.text,
-            value=date_value,
-        ))
-
-    return result
-
-
-def reset():
-    """Réinitialise le pipeline (utile pour les tests)."""
-    global _nlp, _available
-    _nlp = None
-    _available = None
diff --git a/t2a_install_rag_cleanup/src/medical/exclusion_rules.py b/t2a_install_rag_cleanup/src/medical/exclusion_rules.py
deleted file mode 100644
index 9b62901..0000000
--- a/t2a_install_rag_cleanup/src/medical/exclusion_rules.py
+++ /dev/null
@@ -1,169 +0,0 @@
-"""Règles d'exclusion diagnostique : symptôme (Chapitre XVIII) vs diagnostic précis.
-
-Lorsqu'un symptôme (R00-R99) et un diagnostic précis (Chapitres I-XIV, A00-N99)
-coexistent et que le symptôme est expliqué par le diagnostic précis, le symptôme
-ne doit PAS être codé comme DAS (règle ATIH de non-redondance).
-"""
-
-from __future__ import annotations
-
-import re
-from dataclasses import dataclass, field
-
-
-def is_symptom_code(code: str) -> bool:
-    """Vérifie si un code CIM-10 appartient au Chapitre XVIII (R00-R99 = Symptômes)."""
-    if not code:
-        return False
-    return bool(re.match(r"^R\d{2}", code, re.IGNORECASE))
-
-
-def is_precise_diagnosis(code: str) -> bool:
-    """Vérifie si un code CIM-10 appartient aux Chapitres I-XIV (A00-N99)."""
-    if not code:
-        return False
-    return bool(re.match(r"^[A-N]\d{2}", code, re.IGNORECASE))
-
-
-# Mapping R-code → set de codes précis qui excluent le symptôme.
-# Chaque R-code est exclu si l'un des codes précis (ou un code commençant par
-# l'une de ces racines) est présent parmi les diagnostics du séjour.
-EXCLUSION_MAP: dict[str, set[str]] = {
-    # R10 — Douleur abdominale → exclu par pathologies digestives précises
-    "R10": {"K35", "K80", "K81", "K83", "K85", "K86", "K56", "K57", "K25", "K26", "K29"},
-    "R10.1": {"K80", "K81", "K83"},  # Douleur hypochondre droit
-    "R10.3": {"K35", "K36", "K37"},  # Douleur hypogastre
-    "R10.4": {"K35", "K80", "K85", "K56", "K57"},  # Douleur abdominale autre/non précisée
-
-    # R11 — Nausées et vomissements
-    "R11": {"K29", "K80", "K81", "K85", "K56", "K91"},
-
-    # R17 — Ictère → exclu par pathologies hépatobiliaires
-    "R17": {"K80", "K83", "K70", "K71", "K72", "K73", "K74", "B15", "B16", "B17", "B18", "B19", "C22"},
-
-    # R50 — Fièvre → exclu par infections précises
-    "R50": {"A41", "J18", "J15", "J13", "J14", "J06", "N10", "N39", "K81", "K83",
-            "L03", "T81", "A09", "A04"},
-    "R50.9": {"A41", "J18", "J15", "J13", "J14", "N10", "N39", "K81"},
-
-    # R07 — Douleur thoracique → exclu par pathologies cardiaques/pulmonaires
-    "R07": {"I20", "I21", "I22", "I23", "I24", "I25", "I26", "J18", "J93"},
-    "R07.4": {"I20", "I21", "I24", "I25"},
-
-    # R06 — Dyspnée → exclu par pathologies respiratoires/cardiaques
-    "R06": {"J18", "J44", "J45", "J96", "I50", "I26"},
-    "R06.0": {"J18", "J44", "J45", "J96", "I50", "I26"},
-
-    # R31 — Hématurie → exclu par pathologies urologiques/rénales
-    "R31": {"N20", "N13", "C64", "C67", "N02", "N00", "N01"},
-
-    # R04 — Hémoptysie → exclu par pathologies pulmonaires
-    "R04": {"J18", "C34", "I26", "A16"},
-
-    # R63.4 — Perte de poids → exclu par tumeurs, infections chroniques
-    "R63.4": {"C15", "C16", "C18", "C19", "C20", "C22", "C25", "C34", "C50",
-              "A15", "A16", "B20", "B21", "B22", "B23", "B24", "E46"},
-
-    # R00 — Anomalies du rythme cardiaque → exclu par troubles du rythme précis
-    "R00": {"I47", "I48", "I49"},
-    "R00.0": {"I47", "I48"},  # Tachycardie
-    "R00.1": {"I49.5", "I49.8"},  # Bradycardie
-}
-
-
-def _code_matches(code: str, roots: set[str]) -> bool:
-    """Vérifie si un code CIM-10 commence par l'une des racines données."""
-    if not code:
-        return False
-    code_upper = code.upper()
-    for root in roots:
-        if code_upper.startswith(root.upper()):
-            return True
-    return False
-
-
-@dataclass
-class ExclusionResult:
-    """Résultat de l'application des règles d'exclusion."""
-    cleaned_das: list  # Diagnostics DAS conservés
-    excluded: list  # Diagnostics DAS exclus
-    warnings: list[str] = field(default_factory=list)
-
-
-def check_exclusions(dp, das_list: list) -> ExclusionResult:
-    """Applique les règles d'exclusion symptôme vs diagnostic précis.
-
-    Args:
-        dp: Diagnostic principal (objet avec attribut cim10_suggestion).
-        das_list: Liste des diagnostics associés (même type).
-
-    Returns:
-        ExclusionResult avec les DAS nettoyés, exclus, et les warnings.
-    """
-    # Collecter tous les codes du séjour (DP + DAS)
-    all_codes: list[str] = []
-    if dp and dp.cim10_suggestion:
-        all_codes.append(dp.cim10_suggestion)
-    for das in das_list:
-        if das.cim10_suggestion:
-            all_codes.append(das.cim10_suggestion)
-
-    # Identifier les codes précis présents (Chapitres I-XIV)
-    precise_codes = [c for c in all_codes if is_precise_diagnosis(c)]
-
-    cleaned = []
-    excluded = []
-    warnings = []
-
-    for das in das_list:
-        code = das.cim10_suggestion
-        if not code or not is_symptom_code(code):
-            # Non-symptôme : toujours conservé
-            cleaned.append(das)
-            continue
-
-        # Vérifier si ce symptôme est exclu par un diagnostic précis
-        should_exclude = False
-        excluding_code = None
-
-        # Chercher dans EXCLUSION_MAP : d'abord le code exact, puis la racine (3 chars)
-        exclusion_roots = EXCLUSION_MAP.get(code.upper())
-        if exclusion_roots is None:
-            # Essayer la racine 3 caractères (ex: R10.4 → R10)
-            root3 = code.upper()[:3]
-            exclusion_roots = EXCLUSION_MAP.get(root3)
-
-        if exclusion_roots:
-            for precise in precise_codes:
-                if _code_matches(precise, exclusion_roots):
-                    should_exclude = True
-                    excluding_code = precise
-                    break
-
-        if should_exclude:
-            excluded.append(das)
-            warnings.append(
-                f"DAS '{das.texte}' ({code}) exclu : symptôme redondant avec "
-                f"le diagnostic précis {excluding_code}"
-            )
-        else:
-            cleaned.append(das)
-
-    # Vérifier aussi si le DP est un symptôme avec un diagnostic précis en DAS
-    if dp and dp.cim10_suggestion and is_symptom_code(dp.cim10_suggestion):
-        dp_code = dp.cim10_suggestion
-        exclusion_roots = EXCLUSION_MAP.get(dp_code.upper())
-        if exclusion_roots is None:
-            exclusion_roots = EXCLUSION_MAP.get(dp_code.upper()[:3])
-
-        if exclusion_roots:
-            for precise in precise_codes:
-                if _code_matches(precise, exclusion_roots):
-                    warnings.append(
-                        f"ALERTE DP : le DP '{dp.texte}' ({dp_code}) est un symptôme "
-                        f"alors qu'un diagnostic précis {precise} est présent — "
-                        f"vérifier si le DP devrait être changé"
-                    )
-                    break
-
-    return ExclusionResult(cleaned_das=cleaned, excluded=excluded, warnings=warnings)
diff --git a/t2a_install_rag_cleanup/src/medical/fusion.py b/t2a_install_rag_cleanup/src/medical/fusion.py
deleted file mode 100644
index 3b727cf..0000000
--- a/t2a_install_rag_cleanup/src/medical/fusion.py
+++ /dev/null
@@ -1,294 +0,0 @@
-"""Fusion de dossiers médicaux multi-PDFs pour un même patient.
-
-Combine les informations de plusieurs documents (Trackare, CRH, CRO) en un
-dossier unique avec des règles de priorité et de déduplication.
-"""
-
-from __future__ import annotations
-
-import logging
-
-from ..config import (
-    ActeCCAM,
-    Antecedent,
-    BiologieCle,
-    Complication,
-    Diagnostic,
-    DossierMedical,
-    Imagerie,
-    Sejour,
-    Traitement,
-)
-from ..medical.das_filter import is_valid_diagnostic_text, apply_semantic_dedup
-from ..medical.cim10_extractor import _is_dp_family_redundant
-
-logger = logging.getLogger(__name__)
-
-# Priorité des types de documents pour les données de séjour
-_DOC_PRIORITY = {"trackare": 0, "crh": 1, "cro": 2}
-
-
-def _cim10_specificity(code: str | None) -> int:
-    """Score de spécificité d'un code CIM-10 : longueur sans le point."""
-    if not code:
-        return 0
-    return len(code.replace(".", ""))
-
-
-def _prefer_most_specific_dp(dossiers: list[DossierMedical]) -> Diagnostic | None:
-    """Sélectionne le DP le plus spécifique parmi tous les dossiers."""
-    candidates: list[tuple[Diagnostic, int]] = []
-    for d in dossiers:
-        if d.diagnostic_principal:
-            spec = _cim10_specificity(d.diagnostic_principal.cim10_suggestion)
-            candidates.append((d.diagnostic_principal, spec))
-
-    if not candidates:
-        return None
-
-    # Tri : spécificité décroissante, puis confiance (high > medium > low)
-    conf_order = {"high": 0, "medium": 1, "low": 2}
-    candidates.sort(
-        key=lambda x: (-x[1], conf_order.get(x[0].cim10_confidence or "", 3))
-    )
-    return candidates[0][0]
-
-
-def _merge_sejour(dossiers: list[DossierMedical]) -> Sejour:
-    """Fusionne les informations de séjour avec priorité Trackare > CRH > CRO."""
-    # Trier par priorité de type de document
-    sorted_dossiers = sorted(
-        dossiers,
-        key=lambda d: _DOC_PRIORITY.get(d.document_type, 99),
-    )
-
-    merged = Sejour()
-    for d in sorted_dossiers:
-        s = d.sejour
-        if s.sexe and not merged.sexe:
-            merged.sexe = s.sexe
-        if s.age is not None and merged.age is None:
-            merged.age = s.age
-        if s.date_entree and not merged.date_entree:
-            merged.date_entree = s.date_entree
-        if s.date_sortie and not merged.date_sortie:
-            merged.date_sortie = s.date_sortie
-        if s.duree_sejour is not None and merged.duree_sejour is None:
-            merged.duree_sejour = s.duree_sejour
-        if s.mode_entree and not merged.mode_entree:
-            merged.mode_entree = s.mode_entree
-        if s.mode_sortie and not merged.mode_sortie:
-            merged.mode_sortie = s.mode_sortie
-        if s.imc is not None and merged.imc is None:
-            merged.imc = s.imc
-        if s.poids is not None and merged.poids is None:
-            merged.poids = s.poids
-        if s.taille is not None and merged.taille is None:
-            merged.taille = s.taille
-
-    return merged
-
-
-def _is_enriched(d: Diagnostic) -> bool:
-    """Retourne True si le diagnostic a une justification RAG."""
-    return bool(d.justification or d.sources_rag)
-
-
-def _dedup_diagnostics(all_das: list[Diagnostic]) -> list[Diagnostic]:
-    """Déduplique les diagnostics associés par code CIM-10, garde la meilleure confiance."""
-    conf_order = {"high": 0, "medium": 1, "low": 2}
-    seen: dict[str | None, Diagnostic] = {}
-
-    for d in all_das:
-        key = d.cim10_suggestion
-        if key is None:
-            # Sans code, dédup par texte normalisé
-            key = f"__text__{d.texte.lower().strip()}"
-
-        if key not in seen:
-            seen[key] = d
-        else:
-            existing = seen[key]
-            new_conf = conf_order.get(d.cim10_confidence or "", 3)
-            old_conf = conf_order.get(existing.cim10_confidence or "", 3)
-            # Garder celui avec la meilleure confiance, ou à confiance égale celui enrichi
-            if new_conf < old_conf or (new_conf == old_conf and _is_enriched(d) and not _is_enriched(existing)):
-                seen[key] = d
-
-    # Supprimer les codes parents quand un code plus spécifique existe
-    # Ex: K85 retiré si K85.9 présent (K85 est préfixe strict de K859)
-    codes = {k for k in seen if k and not k.startswith("__text__")}
-    normalized = {c: c.replace(".", "") for c in codes}
-    parents_to_remove: set[str] = set()
-    for code_a in codes:
-        norm_a = normalized[code_a]
-        for code_b in codes:
-            if code_a == code_b:
-                continue
-            norm_b = normalized[code_b]
-            if norm_b.startswith(norm_a) and len(norm_b) > len(norm_a):
-                parents_to_remove.add(code_a)
-                break
-
-    for parent in parents_to_remove:
-        del seen[parent]
-
-    return list(seen.values())
-
-
-def _dedup_actes(all_actes: list[ActeCCAM]) -> list[ActeCCAM]:
-    """Déduplique les actes CCAM par code."""
-    seen: dict[str | None, ActeCCAM] = {}
-    for a in all_actes:
-        key = a.code_ccam_suggestion
-        if key is None:
-            key = f"__text__{a.texte.lower().strip()}"
-
-        if key not in seen:
-            seen[key] = a
-        else:
-            existing = seen[key]
-            # Garder celui avec date si possible
-            if a.date and not existing.date:
-                seen[key] = a
-
-    return list(seen.values())
-
-
-def merge_dossiers(dossiers: list[DossierMedical]) -> DossierMedical:
-    """Fusionne plusieurs dossiers médicaux d'un même patient.
-
-    Args:
-        dossiers: Liste de DossierMedical issus de PDFs différents.
-
-    Returns:
-        Un DossierMedical fusionné.
-    """
-    if len(dossiers) == 1:
-        result = dossiers[0].model_copy(deep=True)
-        result.source_files = [result.source_file]
-        # Appliquer la dédup famille DP + sémantique même pour un seul dossier
-        dp_code = result.diagnostic_principal.cim10_suggestion if result.diagnostic_principal else None
-        if dp_code:
-            result.diagnostics_associes = [
-                d for d in result.diagnostics_associes
-                if not d.cim10_suggestion or not _is_dp_family_redundant(d.cim10_suggestion, dp_code)
-            ]
-        result.diagnostics_associes = apply_semantic_dedup(result.diagnostics_associes)
-        return result
-
-    merged = DossierMedical()
-
-    # Source files
-    merged.source_files = [d.source_file for d in dossiers if d.source_file]
-
-    # Séjour
-    merged.sejour = _merge_sejour(dossiers)
-
-    # Diagnostic principal : le plus spécifique
-    merged.diagnostic_principal = _prefer_most_specific_dp(dossiers)
-
-    # Collecter tous les DAS + DP non retenus comme DAS
-    all_das: list[Diagnostic] = []
-    for d in dossiers:
-        all_das.extend(d.diagnostics_associes)
-        # Si le DP de ce dossier est différent du DP fusionné, l'ajouter comme DAS
-        # mais seulement si le texte est un diagnostic valide (filtre artefacts OCR)
-        if (
-            d.diagnostic_principal
-            and merged.diagnostic_principal
-            and d.diagnostic_principal.cim10_suggestion
-            != merged.diagnostic_principal.cim10_suggestion
-            and is_valid_diagnostic_text(d.diagnostic_principal.texte)
-        ):
-            all_das.append(d.diagnostic_principal)
-
-    merged.diagnostics_associes = _dedup_diagnostics(all_das)
-
-    # Retirer les DAS redondants avec le DP (même code, famille, parent/enfant)
-    dp_code = merged.diagnostic_principal.cim10_suggestion if merged.diagnostic_principal else None
-    if dp_code:
-        merged.diagnostics_associes = [
-            d for d in merged.diagnostics_associes
-            if not d.cim10_suggestion or not _is_dp_family_redundant(d.cim10_suggestion, dp_code)
-        ]
-
-    # Redondances sémantiques entre DAS
-    merged.diagnostics_associes = apply_semantic_dedup(merged.diagnostics_associes)
-
-    # Actes CCAM
-    all_actes: list[ActeCCAM] = []
-    for d in dossiers:
-        all_actes.extend(d.actes_ccam)
-    merged.actes_ccam = _dedup_actes(all_actes)
-
-    # Biologie : union, dédup par (test, valeur)
-    bio_seen: set[tuple[str, str | None]] = set()
-    for d in dossiers:
-        for b in d.biologie_cle:
-            key = (b.test, b.valeur)
-            if key not in bio_seen:
-                merged.biologie_cle.append(b)
-                bio_seen.add(key)
-
-    # Imagerie : union, dédup par (type, conclusion)
-    img_seen: set[tuple[str, str | None]] = set()
-    for d in dossiers:
-        for i in d.imagerie:
-            key = (i.type, i.conclusion)
-            if key not in img_seen:
-                merged.imagerie.append(i)
-                img_seen.add(key)
-
-    # Traitements : union, dédup par médicament (normalisé)
-    med_seen: set[str] = set()
-    for d in dossiers:
-        for t in d.traitements_sortie:
-            key = t.medicament.lower().strip()
-            if key not in med_seen:
-                merged.traitements_sortie.append(t)
-                med_seen.add(key)
-
-    # Antécédents : union, dédup par texte normalisé
-    ant_seen: set[str] = set()
-    for d in dossiers:
-        for a in d.antecedents:
-            key = a.texte.lower().strip()
-            if key not in ant_seen:
-                merged.antecedents.append(a)
-                ant_seen.add(key)
-
-    # Complications : union, dédup par texte normalisé
-    comp_seen: set[str] = set()
-    for d in dossiers:
-        for c in d.complications:
-            key = c.texte.lower().strip()
-            if key not in comp_seen:
-                merged.complications.append(c)
-                comp_seen.add(key)
-
-    # Alertes : alerte de fusion en tête + union
-    merged.alertes_codage = [f"FUSION: {len(dossiers)} documents fusionnés"]
-    alert_seen: set[str] = set()
-    for d in dossiers:
-        for a in d.alertes_codage:
-            if a not in alert_seen:
-                merged.alertes_codage.append(a)
-                alert_seen.add(a)
-
-    # Document type : le type prioritaire
-    sorted_by_prio = sorted(
-        dossiers,
-        key=lambda d: _DOC_PRIORITY.get(d.document_type, 99),
-    )
-    merged.document_type = sorted_by_prio[0].document_type
-
-    logger.info(
-        "Fusion de %d dossiers : DP=%s, %d DAS, %d actes",
-        len(dossiers),
-        merged.diagnostic_principal.cim10_suggestion if merged.diagnostic_principal else "aucun",
-        len(merged.diagnostics_associes),
-        len(merged.actes_ccam),
-    )
-
-    return merged
diff --git a/t2a_install_rag_cleanup/src/medical/ghm.py b/t2a_install_rag_cleanup/src/medical/ghm.py
deleted file mode 100644
index 95e8cbb..0000000
--- a/t2a_install_rag_cleanup/src/medical/ghm.py
+++ /dev/null
@@ -1,225 +0,0 @@
-"""Estimation heuristique du GHM (Groupe Homogène de Malades).
-
-L'algorithme officiel (ATIH FG-MCO) est propriétaire. Ce module fournit une
-estimation approximative utile comme pré-codage / aide au DIM :
-  1. CMD depuis le DP (table de plages CIM-10)
-  2. Type de prise en charge depuis les actes CCAM
-  3. Sévérité depuis les CMA/CMS
-  4. Construction du code GHM approximatif
-"""
-
-from __future__ import annotations
-
-import bisect
-from typing import Optional
-
-from ..config import DossierMedical, GHMEstimation
-
-
-# ---------------------------------------------------------------------------
-# Table CIM-10 → CMD (Catégorie Majeure de Diagnostic)
-# Triée par borne inférieure pour lookup par bisect.
-# Format : (debut, fin, cmd, libelle)
-# ---------------------------------------------------------------------------
-
-_CMD_RANGES: list[tuple[str, str, str, str]] = [
-    ("A00", "A99", "18", "Maladies infectieuses et parasitaires"),
-    ("B00", "B19", "18", "Maladies infectieuses et parasitaires"),
-    ("B20", "B24", "25", "Maladies dues au VIH"),
-    ("B25", "B99", "18", "Maladies infectieuses et parasitaires"),
-    ("C00", "C97", "17", "Tumeurs malignes"),
-    ("D00", "D09", "17", "Tumeurs malignes"),
-    ("D10", "D48", "16", "Tumeurs bénignes, hémopathies"),
-    ("D50", "D89", "16", "Tumeurs bénignes, hémopathies"),
-    ("E00", "E07", "10", "Maladies endocriniennes"),
-    ("E10", "E14", "10", "Maladies endocriniennes"),
-    ("E15", "E46", "10", "Maladies endocriniennes"),
-    ("E47", "E90", "10", "Maladies endocriniennes"),
-    ("F00", "F09", "19", "Maladies mentales"),
-    ("F10", "F19", "20", "Troubles mentaux liés à l'alcool et aux toxiques"),
-    ("F20", "F99", "19", "Maladies mentales"),
-    ("G00", "G99", "01", "Affections du système nerveux"),
-    ("H00", "H59", "02", "Affections de l'oeil"),
-    ("H60", "H95", "03", "Affections ORL"),
-    ("I00", "I99", "05", "Affections de l'appareil circulatoire"),
-    ("J00", "J99", "04", "Affections de l'appareil respiratoire"),
-    ("K00", "K67", "06", "Affections du tube digestif"),
-    ("K70", "K87", "07", "Affections hépatobiliaires et pancréatiques"),
-    ("K90", "K93", "06", "Affections du tube digestif"),
-    ("L00", "L99", "09", "Affections de la peau"),
-    ("M00", "M99", "08", "Affections du système ostéo-articulaire"),
-    ("N00", "N39", "11", "Affections du rein et des voies urinaires"),
-    ("N40", "N51", "12", "Affections de l'appareil génital masculin"),
-    ("N60", "N98", "13", "Affections de l'appareil génital féminin"),
-    ("N99", "N99", "11", "Affections du rein et des voies urinaires"),
-    ("O00", "O99", "14", "Grossesses, accouchements, post-partum"),
-    ("P00", "P96", "15", "Nouveau-nés, période périnatale"),
-    ("Q00", "Q99", "15", "Nouveau-nés, période périnatale"),
-    ("R00", "R99", "23", "Facteurs influençant l'état de santé (symptômes)"),
-    ("S00", "S99", "21", "Traumatismes"),
-    ("T00", "T19", "21", "Traumatismes"),
-    ("T20", "T32", "22", "Brûlures"),
-    ("T33", "T98", "21", "Traumatismes"),
-    ("U00", "U99", "26", "Catégories spéciales"),
-    ("V00", "Y98", "24", "Causes externes"),
-    ("Z00", "Z99", "23", "Facteurs influençant l'état de santé"),
-]
-
-# Pré-calcul : liste triée des bornes inférieures pour bisect
-_CMD_STARTS = [r[0] for r in _CMD_RANGES]
-
-
-def find_cmd(code_cim10: str) -> tuple[Optional[str], Optional[str]]:
-    """Trouve la CMD correspondant à un code CIM-10.
-
-    Returns:
-        (cmd, libelle) ou (None, None) si non trouvé.
-    """
-    if not code_cim10:
-        return None, None
-
-    # Normaliser : majuscules, retirer le point
-    code = code_cim10.upper().replace(".", "").strip()
-    if len(code) < 3:
-        return None, None
-
-    # Prendre les 3 premiers caractères pour le lookup
-    code3 = code[:3]
-
-    # bisect pour trouver la plage candidate
-    idx = bisect.bisect_right(_CMD_STARTS, code3) - 1
-    if idx < 0:
-        return None, None
-
-    debut, fin, cmd, libelle = _CMD_RANGES[idx]
-    if debut <= code3 <= fin:
-        return cmd, libelle
-
-    return None, None
-
-
-# ---------------------------------------------------------------------------
-# Préfixes CCAM classants (chirurgicaux)
-# Les codes CCAM commençant par ces lettres correspondent à des organes
-# et sont considérés chirurgicaux quand ils désignent un acte opératoire.
-# ---------------------------------------------------------------------------
-
-_CCAM_CHIRURGICAL_PREFIXES = {"H", "J", "K", "L", "N", "P", "Q"}
-
-# Préfixes interventionnels (imagerie, endoscopie)
-_CCAM_INTERVENTIONNEL_PREFIXES = {"Z", "Y"}
-
-
-def _detect_type_ghm(actes_ccam: list) -> str:
-    """Détermine le type de prise en charge depuis les actes CCAM.
-
-    Returns:
-        "C" (chirurgical), "K" (interventionnel) ou "M" (médical).
-    """
-    has_chirurgical = False
-    has_interventionnel = False
-
-    for acte in actes_ccam:
-        code = acte.code_ccam_suggestion
-        if not code or len(code) < 4:
-            continue
-
-        prefix = code[0].upper()
-        if prefix in _CCAM_CHIRURGICAL_PREFIXES:
-            has_chirurgical = True
-            break
-        if prefix in _CCAM_INTERVENTIONNEL_PREFIXES:
-            has_interventionnel = True
-
-    if has_chirurgical:
-        return "C"
-    if has_interventionnel:
-        return "K"
-    return "M"
-
-
-def _compute_severity(das_list: list) -> tuple[int, int, int]:
-    """Calcule le niveau de sévérité à partir des DAS.
-
-    Utilise le max des niveau_cma officiels ATIH quand disponibles,
-    avec fallback sur le comptage CMA/CMS.
-
-    Returns:
-        (niveau, cma_count, cms_count)
-    """
-    cma_count = 0
-    cms_count = 0
-    max_cma_level = 1
-
-    for das in das_list:
-        niveau_cma = getattr(das, "niveau_cma", None)
-        if niveau_cma and niveau_cma > 1:
-            max_cma_level = max(max_cma_level, niveau_cma)
-        if getattr(das, "est_cma", False):
-            cma_count += 1
-        if getattr(das, "est_cms", False):
-            cms_count += 1
-
-    # Priorité au niveau CMA officiel ATIH
-    if max_cma_level > 1:
-        niveau = max_cma_level
-    elif cms_count >= 2:
-        niveau = 4
-    elif cms_count >= 1 or cma_count >= 3:
-        niveau = 3
-    elif cma_count >= 2:
-        niveau = 2
-    else:
-        niveau = 1
-
-    return niveau, cma_count, cms_count
-
-
-def estimate_ghm(dossier: DossierMedical) -> GHMEstimation:
-    """Estime le GHM d'un dossier médical.
-
-    Heuristique en 4 étapes :
-    1. CMD depuis le DP
-    2. Type de prise en charge depuis les actes CCAM
-    3. Sévérité depuis les CMA/CMS
-    4. Construction du code approximatif
-    """
-    estimation = GHMEstimation()
-
-    # 1. CMD depuis le DP
-    dp = dossier.diagnostic_principal
-    dp_code = dp.cim10_suggestion if dp else None
-
-    if not dp:
-        estimation.alertes.append("DP absent — CMD non déterminable")
-    elif not dp_code:
-        estimation.alertes.append("DP sans code CIM-10 — CMD non déterminable")
-    else:
-        cmd, libelle = find_cmd(dp_code)
-        if cmd:
-            estimation.cmd = cmd
-            estimation.cmd_libelle = libelle
-        else:
-            estimation.alertes.append(f"CMD inconnue pour le code {dp_code}")
-
-        # Alerte DP symptomatique
-        code_letter = dp_code.upper().replace(".", "").strip()[:1]
-        if code_letter in ("R", "Z"):
-            estimation.alertes.append(
-                f"DP symptomatique ({dp_code}) — risque de CMD 23, impact tarif"
-            )
-
-    # 2. Type de prise en charge
-    estimation.type_ghm = _detect_type_ghm(dossier.actes_ccam)
-
-    # 3. Sévérité
-    niveau, cma_count, cms_count = _compute_severity(dossier.diagnostics_associes)
-    estimation.severite = niveau
-    estimation.cma_count = cma_count
-    estimation.cms_count = cms_count
-
-    # 4. Code approximatif
-    if estimation.cmd and estimation.type_ghm:
-        estimation.ghm_approx = f"{estimation.cmd}{estimation.type_ghm}??{estimation.severite}"
-
-    return estimation
diff --git a/t2a_install_rag_cleanup/src/medical/ollama_cache.py b/t2a_install_rag_cleanup/src/medical/ollama_cache.py
deleted file mode 100644
index caf6c5f..0000000
--- a/t2a_install_rag_cleanup/src/medical/ollama_cache.py
+++ /dev/null
@@ -1,85 +0,0 @@
-"""Cache persistant thread-safe pour les résultats Ollama."""
-
-from __future__ import annotations
-
-import json
-import logging
-import threading
-from pathlib import Path
-
-logger = logging.getLogger(__name__)
-
-
-class OllamaCache:
-    """Cache JSON persistant pour éviter les appels Ollama redondants.
-
-    Clé = (texte_diagnostic_normalisé, type).
-    Le modèle Ollama est stocké dans les métadonnées : si le modèle change,
-    le cache est automatiquement invalidé.
-    """
-
-    def __init__(self, cache_path: Path, model: str):
-        self._path = cache_path
-        self._model = model
-        self._lock = threading.Lock()
-        self._data: dict[str, dict] = {}
-        self._dirty = False
-        self._load()
-
-    def _load(self) -> None:
-        """Charge le cache depuis le disque."""
-        if not self._path.exists():
-            logger.info("Cache Ollama : nouveau cache (%s)", self._path)
-            return
-        try:
-            raw = json.loads(self._path.read_text(encoding="utf-8"))
-            if raw.get("model") != self._model:
-                logger.info(
-                    "Cache Ollama : modèle changé (%s → %s), cache invalidé",
-                    raw.get("model"), self._model,
-                )
-                return
-            self._data = raw.get("entries", {})
-            logger.info("Cache Ollama : %d entrées chargées", len(self._data))
-        except (json.JSONDecodeError, KeyError) as e:
-            logger.warning("Cache Ollama : fichier corrompu (%s), réinitialisé", e)
-            self._data = {}
-
-    @staticmethod
-    def _make_key(texte: str, diag_type: str) -> str:
-        """Construit une clé normalisée."""
-        return f"{diag_type}::{texte.strip().lower()}"
-
-    def get(self, texte: str, diag_type: str) -> dict | None:
-        """Récupère un résultat caché, ou None si absent."""
-        key = self._make_key(texte, diag_type)
-        with self._lock:
-            return self._data.get(key)
-
-    def put(self, texte: str, diag_type: str, result: dict) -> None:
-        """Stocke un résultat dans le cache."""
-        key = self._make_key(texte, diag_type)
-        with self._lock:
-            self._data[key] = result
-            self._dirty = True
-
-    def save(self) -> None:
-        """Persiste le cache sur disque si modifié."""
-        with self._lock:
-            if not self._dirty:
-                return
-            self._path.parent.mkdir(parents=True, exist_ok=True)
-            payload = {
-                "model": self._model,
-                "entries": self._data,
-            }
-            self._path.write_text(
-                json.dumps(payload, ensure_ascii=False, indent=2),
-                encoding="utf-8",
-            )
-            self._dirty = False
-            logger.info("Cache Ollama : %d entrées sauvegardées", len(self._data))
-
-    def __len__(self) -> int:
-        with self._lock:
-            return len(self._data)
diff --git a/t2a_install_rag_cleanup/src/medical/ollama_client.py b/t2a_install_rag_cleanup/src/medical/ollama_client.py
deleted file mode 100644
index 199e649..0000000
--- a/t2a_install_rag_cleanup/src/medical/ollama_client.py
+++ /dev/null
@@ -1,135 +0,0 @@
-"""Client LLM partagé — Ollama (local) avec fallback Anthropic Haiku."""
-
-from __future__ import annotations
-
-import json
-import logging
-import os
-
-import requests
-
-from ..config import OLLAMA_URL, OLLAMA_MODEL, OLLAMA_TIMEOUT
-
-logger = logging.getLogger(__name__)
-
-# --- Fallback Anthropic ---
-_ANTHROPIC_MODEL = os.environ.get("ANTHROPIC_FALLBACK_MODEL", "claude-haiku-4-5-20251001")
-_anthropic_client = None
-
-
-def _get_anthropic_client():
-    """Lazy-init du client Anthropic (uniquement si clé API présente)."""
-    global _anthropic_client
-    if _anthropic_client is not None:
-        return _anthropic_client
-    api_key = os.environ.get("ANTHROPIC_API_KEY")
-    if not api_key:
-        return None
-    try:
-        import anthropic
-        _anthropic_client = anthropic.Anthropic(api_key=api_key)
-        return _anthropic_client
-    except Exception as e:
-        logger.warning("Anthropic SDK non disponible : %s", e)
-        return None
-
-
-def call_anthropic(
-    prompt: str,
-    temperature: float = 0.1,
-    max_tokens: int = 2500,
-) -> dict | None:
-    """Appelle l'API Anthropic (Haiku)."""
-    client = _get_anthropic_client()
-    if client is None:
-        return None
-    try:
-        response = client.messages.create(
-            model=_ANTHROPIC_MODEL,
-            max_tokens=max_tokens,
-            temperature=temperature,
-            messages=[{"role": "user", "content": prompt}],
-        )
-        raw = response.content[0].text
-        result = parse_json_response(raw)
-        if result is not None:
-            logger.debug("Anthropic fallback OK (%s)", _ANTHROPIC_MODEL)
-        return result
-    except Exception as e:
-        logger.warning("Anthropic fallback erreur : %s", e)
-        return None
-
-
-def parse_json_response(raw: str) -> dict | None:
-    """Parse une réponse JSON, en gérant les blocs markdown."""
-    text = raw.strip()
-    if text.startswith("```"):
-        first_nl = text.find("\n")
-        if first_nl != -1:
-            text = text[first_nl + 1:]
-        if text.rstrip().endswith("```"):
-            text = text.rstrip()[:-3]
-        text = text.strip()
-
-    try:
-        return json.loads(text)
-    except json.JSONDecodeError:
-        logger.warning("LLM : JSON invalide : %s", raw[:200])
-        return None
-
-
-def call_ollama(
-    prompt: str,
-    temperature: float = 0.1,
-    max_tokens: int = 2500,
-    model: str | None = None,
-    timeout: int | None = None,
-) -> dict | None:
-    """Appelle Ollama en mode JSON natif, avec fallback Anthropic si indisponible.
-
-    Args:
-        prompt: Le prompt à envoyer.
-        temperature: Température de génération (défaut: 0.1).
-        max_tokens: Nombre max de tokens (défaut: 2500).
-        model: Modèle Ollama à utiliser (défaut: OLLAMA_MODEL global).
-        timeout: Timeout en secondes (défaut: OLLAMA_TIMEOUT global).
-
-    Returns:
-        Le dict JSON parsé, ou None en cas d'erreur.
-    """
-    use_model = model or OLLAMA_MODEL
-    use_timeout = timeout or OLLAMA_TIMEOUT
-    for attempt in range(2):
-        try:
-            response = requests.post(
-                f"{OLLAMA_URL}/api/generate",
-                json={
-                    "model": use_model,
-                    "prompt": prompt,
-                    "stream": False,
-                    "format": "json",
-                    "options": {
-                        "temperature": temperature,
-                        "num_predict": max_tokens,
-                    },
-                },
-                timeout=use_timeout,
-            )
-            response.raise_for_status()
-            raw = response.json().get("response", "")
-            result = parse_json_response(raw)
-            if result is not None:
-                return result
-            if attempt == 0:
-                logger.info("Ollama (%s) : retry après échec de parsing", use_model)
-        except requests.ConnectionError:
-            logger.info("Ollama indisponible → fallback Anthropic (%s)", _ANTHROPIC_MODEL)
-            return call_anthropic(prompt, temperature, max_tokens)
-        except requests.Timeout:
-            logger.warning("Ollama (%s) timeout après %ds → fallback Anthropic",
-                           use_model, use_timeout)
-            return call_anthropic(prompt, temperature, max_tokens)
-        except (requests.RequestException, json.JSONDecodeError) as e:
-            logger.warning("Ollama erreur : %s", e)
-            return None
-    return None
diff --git a/t2a_install_rag_cleanup/src/medical/rag_index.py b/t2a_install_rag_cleanup/src/medical/rag_index.py
deleted file mode 100644
index 8fddd16..0000000
--- a/t2a_install_rag_cleanup/src/medical/rag_index.py
+++ /dev/null
@@ -1,725 +0,0 @@
-"""Indexation FAISS des documents de référence.
-
-Objectif : éviter que des documents "procédure/méthodo" influencent le codage.
-
-On maintient donc 2 index FAISS :
-- ref : référentiels (CIM-10, CCAM, référentiels uploadés en ref:...)
-- proc : procédures / guide méthodologique (guide_methodo + uploadés en proc:...)
-
-Backwards compat : si les nouveaux fichiers n'existent pas, on retombe sur faiss.index.
-"""
-
-from __future__ import annotations
-
-import json
-import logging
-import re
-from dataclasses import dataclass, asdict
-from pathlib import Path
-from typing import Optional
-
-import pdfplumber
-
-from ..config import RAG_INDEX_DIR, CIM10_PDF, GUIDE_METHODO_PDF, CCAM_PDF, CCAM_DICT_PATH, REFERENTIELS_DIR, EMBEDDING_MODEL
-
-logger = logging.getLogger(__name__)
-
-# Singletons pour les index chargés en mémoire
-_loaded: dict[str, tuple] = {}
-
-
-@dataclass
-class Chunk:
-    text: str
-    document: str  # "cim10", "guide_methodo", "ccam"
-    page: Optional[int] = None
-    code: Optional[str] = None
-
-
-def _paths(kind: str) -> tuple[Path, Path]:
-    """Retourne (index_path, meta_path) pour un type d'index.
-
-    kind:
-      - "ref" : référentiels
-      - "proc" : procédures
-      - "all" : legacy (faiss.index)
-    """
-    kind = (kind or "ref").lower()
-    if kind == "proc":
-        return (RAG_INDEX_DIR / "faiss_proc.index", RAG_INDEX_DIR / "metadata_proc.json")
-    if kind == "all":
-        return (RAG_INDEX_DIR / "faiss.index", RAG_INDEX_DIR / "metadata.json")
-    # ref (default)
-    return (RAG_INDEX_DIR / "faiss_ref.index", RAG_INDEX_DIR / "metadata_ref.json")
-
-
-def _kind_for_chunk(chunk: Chunk) -> str:
-    """Détermine le type d'index cible pour un chunk."""
-    doc = (chunk.document or "").lower()
-    if doc == "guide_methodo" or doc.startswith("proc:"):
-        return "proc"
-    return "ref"
-
-
-# ---------------------------------------------------------------------------
-# Chunking CIM-10
-# ---------------------------------------------------------------------------
-
-def _chunk_cim10(pdf_path: Path) -> list[Chunk]:
-    """Découpe le PDF CIM-10 en double chunking : sous-codes individuels + parents 3-char."""
-    chunks: list[Chunk] = []
-    current_code3: str | None = None
-    current_code3_text: list[str] = []
-    current_code3_page: int | None = None
-
-    # Sous-codes en cours d'accumulation
-    current_subcode: str | None = None
-    current_subcode_text: list[str] = []
-    current_subcode_page: int | None = None
-
-    code3_pattern = re.compile(r"^([A-Z]\d{2})\s+(.+)")
-    subcode_pattern = re.compile(r"^([A-Z]\d{2}\.\d+)\s+(.+)")
-
-    logger.info("Extraction des chunks CIM-10 (double chunking) depuis %s", pdf_path.name)
-
-    def _flush_subcode():
-        """Sauvegarde le chunk sous-code en cours."""
-        if current_subcode and current_subcode_text:
-            chunk_text = "\n".join(current_subcode_text)
-            if len(chunk_text.split()) >= 3:
-                chunks.append(Chunk(
-                    text=chunk_text,
-                    document="cim10",
-                    page=current_subcode_page,
-                    code=current_subcode,
-                ))
-
-    def _flush_code3():
-        """Sauvegarde le chunk parent 3-char en cours."""
-        _flush_subcode()
-        if current_code3 and current_code3_text:
-            chunk_text = "\n".join(current_code3_text)
-            if len(chunk_text.split()) >= 5:
-                chunks.append(Chunk(
-                    text=chunk_text,
-                    document="cim10",
-                    page=current_code3_page,
-                    code=current_code3,
-                ))
-
-    with pdfplumber.open(pdf_path) as pdf:
-        for page_num, page in enumerate(pdf.pages, start=1):
-            text = page.extract_text()
-            if not text:
-                continue
-
-            for line in text.split("\n"):
-                line = line.strip()
-                if not line:
-                    continue
-
-                m_sub = subcode_pattern.match(line)
-                m3 = code3_pattern.match(line)
-
-                if m_sub:
-                    # Nouveau sous-code → flush le sous-code précédent
-                    _flush_subcode()
-                    current_subcode = m_sub.group(1)
-                    current_subcode_text = [line]
-                    current_subcode_page = page_num
-                    # Ajouter aussi au chunk parent
-                    if current_code3:
-                        current_code3_text.append(line)
-                elif m3 and not m_sub:
-                    # Nouveau code 3-char → flush tout le bloc précédent
-                    _flush_code3()
-                    current_code3 = m3.group(1)
-                    current_code3_text = [line]
-                    current_code3_page = page_num
-                    current_subcode = None
-                    current_subcode_text = []
-                    current_subcode_page = None
-                else:
-                    # Ligne de continuation
-                    if current_subcode:
-                        current_subcode_text.append(line)
-                    if current_code3:
-                        current_code3_text.append(line)
-
-    # Flush final
-    _flush_code3()
-
-    logger.info("CIM-10 : %d chunks extraits (double chunking sous-codes + parents)", len(chunks))
-    return chunks
-
-
-# ---------------------------------------------------------------------------
-# Chunking Guide Méthodologique MCO
-# ---------------------------------------------------------------------------
-
-def _chunk_guide_methodo(pdf_path: Path) -> list[Chunk]:
-    """Découpe le Guide Méthodologique MCO par sections/titres."""
-    chunks: list[Chunk] = []
-    current_title: str | None = None
-    current_text: list[str] = []
-    current_page: int | None = None
-
-    # Patterns de titres de sections (chapitres, sous-chapitres)
-    title_patterns = [
-        re.compile(r"^((?:CHAPITRE|TITRE|PARTIE)\s+[IVXLCDM0-9]+.*)$", re.IGNORECASE),
-        re.compile(r"^(\d+\.\d*\s+[A-ZÉÈÊÀÂÔÙÛÜ].{5,})$"),
-        re.compile(r"^([A-ZÉÈÊÀÂÔÙÛÜ][A-ZÉÈÊÀÂÔÙÛÜ\s]{10,})$"),
-    ]
-
-    logger.info("Extraction des chunks Guide Métho depuis %s", pdf_path.name)
-
-    with pdfplumber.open(pdf_path) as pdf:
-        for page_num, page in enumerate(pdf.pages, start=1):
-            text = page.extract_text()
-            if not text:
-                continue
-
-            for line in text.split("\n"):
-                line = line.strip()
-                if not line:
-                    continue
-
-                is_title = False
-                for pat in title_patterns:
-                    if pat.match(line):
-                        is_title = True
-                        break
-
-                if is_title and len(line) > 8:
-                    # Sauvegarder le chunk précédent
-                    if current_title and current_text:
-                        chunk_text = current_title + "\n" + "\n".join(current_text)
-                        if len(chunk_text.split()) >= 20:
-                            chunks.append(Chunk(
-                                text=chunk_text,
-                                document="guide_methodo",
-                                page=current_page,
-                            ))
-                    current_title = line
-                    current_text = []
-                    current_page = page_num
-                else:
-                    current_text.append(line)
-
-    # Dernier chunk
-    if current_title and current_text:
-        chunk_text = current_title + "\n" + "\n".join(current_text)
-        if len(chunk_text.split()) >= 20:
-            chunks.append(Chunk(
-                text=chunk_text,
-                document="guide_methodo",
-                page=current_page,
-            ))
-
-    # Si trop peu de chunks (le PDF ne suit pas les patterns de titre),
-    # fallback : découper par pages groupées par 3
-    if len(chunks) < 10:
-        logger.info("Guide Métho : fallback découpe par pages (peu de titres détectés)")
-        chunks = []
-        with pdfplumber.open(pdf_path) as pdf:
-            page_texts: list[str] = []
-            start_page = 1
-            for page_num, page in enumerate(pdf.pages, start=1):
-                text = page.extract_text()
-                if text:
-                    page_texts.append(text)
-                if len(page_texts) >= 3:
-                    combined = "\n".join(page_texts)
-                    if len(combined.split()) >= 20:
-                        chunks.append(Chunk(
-                            text=combined,
-                            document="guide_methodo",
-                            page=start_page,
-                        ))
-                    page_texts = []
-                    start_page = page_num + 1
-            if page_texts:
-                combined = "\n".join(page_texts)
-                if len(combined.split()) >= 20:
-                    chunks.append(Chunk(
-                        text=combined,
-                        document="guide_methodo",
-                        page=start_page,
-                    ))
-
-    logger.info("Guide Métho : %d chunks extraits", len(chunks))
-    return chunks
-
-
-# ---------------------------------------------------------------------------
-# Chunking CCAM
-# ---------------------------------------------------------------------------
-
-def _chunk_ccam(pdf_path: Path) -> list[Chunk]:
-    """Découpe le PDF CCAM en chunks par code d'acte."""
-    chunks: list[Chunk] = []
-    ccam_pattern = re.compile(r"([A-Z]{4}\d{3})\s+(.*)")
-
-    logger.info("Extraction des chunks CCAM depuis %s", pdf_path.name)
-
-    with pdfplumber.open(pdf_path) as pdf:
-        for page_num, page in enumerate(pdf.pages, start=1):
-            text = page.extract_text()
-            if not text:
-                continue
-
-            current_code: str | None = None
-            current_lines: list[str] = []
-
-            for line in text.split("\n"):
-                line = line.strip()
-                if not line:
-                    continue
-
-                m = ccam_pattern.match(line)
-                if m:
-                    if current_code and current_lines:
-                        chunks.append(Chunk(
-                            text="\n".join(current_lines),
-                            document="ccam",
-                            page=page_num,
-                            code=current_code,
-                        ))
-                    current_code = m.group(1)
-                    current_lines = [line]
-                elif current_code:
-                    current_lines.append(line)
-
-            if current_code and current_lines:
-                chunks.append(Chunk(
-                    text="\n".join(current_lines),
-                    document="ccam",
-                    page=page_num,
-                    code=current_code,
-                ))
-
-    # Fallback : si aucun code CCAM détecté, indexer par page
-    if not chunks:
-        logger.info("CCAM : aucun code détecté, fallback par page")
-        with pdfplumber.open(pdf_path) as pdf:
-            for page_num, page in enumerate(pdf.pages, start=1):
-                text = page.extract_text()
-                if text and len(text.split()) >= 10:
-                    chunks.append(Chunk(
-                        text=text,
-                        document="ccam",
-                        page=page_num,
-                    ))
-
-    logger.info("CCAM : %d chunks extraits", len(chunks))
-    return chunks
-
-
-# ---------------------------------------------------------------------------
-# Chunking CCAM depuis le dictionnaire JSON
-# ---------------------------------------------------------------------------
-
-def _chunk_ccam_from_dict() -> list[Chunk]:
-    """Génère des chunks CCAM depuis ccam_dict.json (un chunk par code+description).
-
-    Prioritaire sur les chunks PDF si le dictionnaire existe.
-    """
-    if not CCAM_DICT_PATH.exists():
-        return []
-
-    import json as _json
-    with open(CCAM_DICT_PATH, encoding="utf-8") as f:
-        ccam_dict = _json.load(f)
-
-    chunks: list[Chunk] = []
-    for code, info in ccam_dict.items():
-        desc = info.get("description", "") if isinstance(info, dict) else str(info)
-        if not desc:
-            continue
-        regroupement = info.get("regroupement", "") if isinstance(info, dict) else ""
-        tarif = info.get("tarif_s1") if isinstance(info, dict) else None
-        text_parts = [f"{code} {desc}"]
-        if regroupement:
-            text_parts.append(f"Regroupement: {regroupement}")
-        if tarif is not None:
-            text_parts.append(f"Tarif S1: {tarif}€")
-        chunks.append(Chunk(
-            text="\n".join(text_parts),
-            document="ccam",
-            code=code,
-        ))
-
-    logger.info("CCAM dict : %d chunks générés depuis %s", len(chunks), CCAM_DICT_PATH)
-    return chunks
-
-
-# ---------------------------------------------------------------------------
-# Chunking CIM-10 Index Alphabétique
-# ---------------------------------------------------------------------------
-
-def _chunk_cim10_alpha(pdf_path: Path) -> list[Chunk]:
-    """Parse la section INDEX ALPHABÉTIQUE du PDF CIM-10.
-
-    Détecte les entrées de type "terme → code" et génère des chunks
-    avec document="cim10_alpha".
-    """
-    chunks: list[Chunk] = []
-    # Pattern : ligne avec un terme suivi d'un code CIM-10 en fin de ligne
-    entry_pattern = re.compile(r"^(.+?)\s+([A-Z]\d{2}(?:\.\d+)?)\s*$")
-
-    logger.info("Extraction de l'index alphabétique CIM-10 depuis %s", pdf_path.name)
-
-    in_alpha_section = False
-    with pdfplumber.open(pdf_path) as pdf:
-        for page_num, page in enumerate(pdf.pages, start=1):
-            text = page.extract_text()
-            if not text:
-                continue
-
-            # Détecter le début de la section index alphabétique
-            text_upper = text.upper()
-            if "INDEX ALPHAB" in text_upper:
-                in_alpha_section = True
-            # Certaines pages avant l'index : ne pas parser
-            if not in_alpha_section:
-                continue
-
-            for line in text.split("\n"):
-                line = line.strip()
-                if not line:
-                    continue
-                m = entry_pattern.match(line)
-                if m:
-                    terme = m.group(1).strip()
-                    code = m.group(2)
-                    if len(terme) >= 3:
-                        chunks.append(Chunk(
-                            text=f"{terme} → {code}",
-                            document="cim10_alpha",
-                            page=page_num,
-                            code=code,
-                        ))
-
-    logger.info("CIM-10 index alphabétique : %d entrées extraites", len(chunks))
-    return chunks
-
-
-# ---------------------------------------------------------------------------
-# Construction de l'index FAISS
-# ---------------------------------------------------------------------------
-
-def build_index(force: bool = False) -> None:
-    """Construit les index FAISS à partir des PDFs de référence.
-
-    - ref : CIM-10 (+ index alpha) + CCAM
-    - proc : Guide méthodologique
-
-    Args:
-        force: Si True, reconstruit même si l'index existe déjà.
-    """
-    import faiss
-    import numpy as np
-    from sentence_transformers import SentenceTransformer
-
-    ref_index_path, ref_meta_path = _paths("ref")
-    proc_index_path, proc_meta_path = _paths("proc")
-
-    # Si tout existe déjà et pas de force
-    ref_ok = ref_index_path.exists() and ref_meta_path.exists()
-    proc_ok = proc_index_path.exists() and proc_meta_path.exists()
-    guide_expected = GUIDE_METHODO_PDF.exists()
-    if not force and ref_ok and ((not guide_expected) or proc_ok):
-        logger.info("Index FAISS déjà existants dans %s (use force=True pour reconstruire)", RAG_INDEX_DIR)
-        return
-
-    # Collecter les chunks
-    ref_chunks: list[Chunk] = []
-    proc_chunks: list[Chunk] = []
-
-    # CIM-10 (référentiel)
-    if CIM10_PDF.exists():
-        ref_chunks.extend(_chunk_cim10(CIM10_PDF))
-        ref_chunks.extend(_chunk_cim10_alpha(CIM10_PDF))
-    else:
-        logger.warning("PDF non trouvé : %s", CIM10_PDF)
-
-    # Guide méthodologique (procédures)
-    if GUIDE_METHODO_PDF.exists():
-        proc_chunks.extend(_chunk_guide_methodo(GUIDE_METHODO_PDF))
-    else:
-        logger.warning("PDF non trouvé : %s", GUIDE_METHODO_PDF)
-
-    # CCAM (référentiel)
-    ccam_dict_chunks = _chunk_ccam_from_dict()
-    if ccam_dict_chunks:
-        ref_chunks.extend(ccam_dict_chunks)
-    elif CCAM_PDF.exists():
-        ref_chunks.extend(_chunk_ccam(CCAM_PDF))
-    else:
-        logger.warning("Ni dictionnaire CCAM ni PDF CCAM trouvé")
-
-    if not ref_chunks and not proc_chunks:
-        logger.error("Aucun chunk extrait — vérifiez les chemins des PDFs")
-        return
-
-    logger.info("Total ref : %d chunks | total proc : %d chunks", len(ref_chunks), len(proc_chunks))
-
-    # Embeddings — GPU si disponible
-    import torch
-    _device = "cuda" if torch.cuda.is_available() else "cpu"
-    logger.info("Chargement du modèle d'embedding %s (%s)...", EMBEDDING_MODEL, _device)
-    model = SentenceTransformer(EMBEDDING_MODEL, device=_device)
-    model.max_seq_length = 512  # CamemBERT max position embeddings
-
-    def _write_index(chunks: list[Chunk], idx_path: Path, meta_path: Path, label: str) -> None:
-        if not chunks:
-            return
-        texts = [c.text[:2000] for c in chunks]
-        logger.info("Calcul des embeddings (%s) pour %d chunks...", label, len(texts))
-        embeddings = model.encode(texts, show_progress_bar=True, normalize_embeddings=True, batch_size=64)
-        embeddings = np.array(embeddings, dtype=np.float32)
-        dim = embeddings.shape[1]
-        index = faiss.IndexFlatIP(dim)
-        index.add(embeddings)
-
-        RAG_INDEX_DIR.mkdir(parents=True, exist_ok=True)
-        faiss.write_index(index, str(idx_path))
-
-        metadata = [asdict(c) for c in chunks]
-        for m in metadata:
-            m["extrait"] = m.pop("text")[:800]
-        meta_path.write_text(json.dumps(metadata, ensure_ascii=False, indent=2), encoding="utf-8")
-
-        logger.info("Index FAISS sauvegardé (%s) : %s (%d vecteurs, dim=%d)", label, idx_path, len(chunks), dim)
-
-    _write_index(ref_chunks, ref_index_path, ref_meta_path, "ref")
-    _write_index(proc_chunks, proc_index_path, proc_meta_path, "proc")
-
-    # Invalider les singletons
-    reset_index()
-
-
-def get_index(kind: str = "ref") -> tuple | None:
-    """Charge un index FAISS et ses métadonnées (singleton lazy-loaded).
-
-    Args:
-        kind: "ref" | "proc" | "all".
-
-    Returns:
-        Tuple (faiss_index, metadata_list) ou None si l'index n'existe pas.
-    """
-    kind = (kind or "ref").lower()
-
-    if kind in _loaded:
-        return _loaded[kind]
-
-    index_path, meta_path = _paths(kind)
-
-    # Backwards compat : si ref/proc absent, fallback sur all
-    if kind in ("ref", "proc") and (not index_path.exists() or not meta_path.exists()):
-        legacy_idx, legacy_meta = _paths("all")
-        if legacy_idx.exists() and legacy_meta.exists():
-            logger.warning("Index %s absent — fallback legacy faiss.index", kind)
-            index_path, meta_path = legacy_idx, legacy_meta
-        else:
-            logger.warning("Index FAISS non trouvé dans %s — lancez build_index() d'abord", RAG_INDEX_DIR)
-            return None
-
-    if not index_path.exists() or not meta_path.exists():
-        logger.warning("Index FAISS non trouvé (%s) dans %s — lancez build_index() d'abord", kind, RAG_INDEX_DIR)
-        return None
-
-    import faiss
-
-    faiss_index = faiss.read_index(str(index_path))
-    metadata = json.loads(meta_path.read_text(encoding="utf-8"))
-
-    logger.info("Index FAISS chargé (%s) : %d vecteurs", kind, faiss_index.ntotal)
-    _loaded[kind] = (faiss_index, metadata)
-    return _loaded[kind]
-
-
-# ---------------------------------------------------------------------------
-# Chunking générique pour fichiers utilisateur (référentiels)
-# ---------------------------------------------------------------------------
-
-def chunk_user_file(file_path: Path, doc_name: str) -> list[Chunk]:
-    """Découpe un fichier utilisateur en chunks pour indexation FAISS.
-
-    Dispatch selon l'extension :
-    - PDF : pages groupées par 2
-    - CSV/Excel : une ligne = un chunk
-    - TXT : paragraphes (blocs séparés par lignes vides)
-
-    Args:
-        file_path: Chemin du fichier.
-        doc_name: Nom du document (utilisé comme identifiant dans les métadonnées).
-
-    Returns:
-        Liste de Chunk prêts pour l'indexation.
-    """
-    suffix = file_path.suffix.lower()
-    if suffix == ".pdf":
-        return _chunk_user_pdf(file_path, doc_name)
-    elif suffix in (".csv", ".xlsx", ".xls"):
-        return _chunk_user_tabular(file_path, doc_name)
-    elif suffix == ".txt":
-        return _chunk_user_txt(file_path, doc_name)
-    else:
-        logger.warning("Extension non supportée pour chunking : %s", suffix)
-        return []
-
-
-def _chunk_user_pdf(file_path: Path, doc_name: str) -> list[Chunk]:
-    """Découpe un PDF utilisateur en chunks de 2 pages."""
-    chunks: list[Chunk] = []
-    try:
-        with pdfplumber.open(file_path) as pdf:
-            page_texts: list[str] = []
-            start_page = 1
-            for page_num, page in enumerate(pdf.pages, start=1):
-                text = page.extract_text()
-                if text:
-                    page_texts.append(text)
-                if len(page_texts) >= 2:
-                    combined = "\n".join(page_texts)
-                    if len(combined.split()) >= 10:
-                        chunks.append(Chunk(
-                            text=combined,
-                            document=doc_name,
-                            page=start_page,
-                        ))
-                    page_texts = []
-                    start_page = page_num + 1
-            if page_texts:
-                combined = "\n".join(page_texts)
-                if len(combined.split()) >= 10:
-                    chunks.append(Chunk(
-                        text=combined,
-                        document=doc_name,
-                        page=start_page,
-                    ))
-    except Exception:
-        logger.warning("Erreur lors du chunking PDF %s", file_path, exc_info=True)
-    logger.info("Référentiel PDF %s : %d chunks", doc_name, len(chunks))
-    return chunks
-
-
-def _chunk_user_tabular(file_path: Path, doc_name: str) -> list[Chunk]:
-    """Découpe un CSV/Excel : une ligne = un chunk."""
-    chunks: list[Chunk] = []
-    try:
-        import pandas as pd
-        suffix = file_path.suffix.lower()
-        if suffix == ".csv":
-            df = pd.read_csv(file_path, encoding="utf-8", on_bad_lines="skip")
-        else:
-            df = pd.read_excel(file_path)
-
-        for idx, row in df.iterrows():
-            text = " | ".join(str(v) for v in row.values if pd.notna(v))
-            if len(text.split()) >= 3:
-                chunks.append(Chunk(
-                    text=text,
-                    document=doc_name,
-                    page=int(idx) + 1,
-                ))
-    except Exception:
-        logger.warning("Erreur lors du chunking tabular %s", file_path, exc_info=True)
-    logger.info("Référentiel tabular %s : %d chunks", doc_name, len(chunks))
-    return chunks
-
-
-def _chunk_user_txt(file_path: Path, doc_name: str) -> list[Chunk]:
-    """Découpe un fichier TXT en paragraphes (blocs séparés par lignes vides)."""
-    chunks: list[Chunk] = []
-    try:
-        text = file_path.read_text(encoding="utf-8")
-        paragraphs = re.split(r"\n\s*\n", text)
-        for i, para in enumerate(paragraphs):
-            para = para.strip()
-            if len(para.split()) >= 5:
-                chunks.append(Chunk(
-                    text=para,
-                    document=doc_name,
-                    page=i + 1,
-                ))
-    except Exception:
-        logger.warning("Erreur lors du chunking TXT %s", file_path, exc_info=True)
-    logger.info("Référentiel TXT %s : %d chunks", doc_name, len(chunks))
-    return chunks
-
-
-def add_chunks_to_index(chunks: list[Chunk]) -> int:
-    """Ajoute des chunks à l'index FAISS existant (incrémental).
-
-    Charge l'index si nécessaire, encode les chunks, ajoute les vecteurs,
-    et sauvegarde le tout.
-
-    Args:
-        chunks: Liste de Chunk à ajouter.
-
-    Returns:
-        Nombre de chunks effectivement ajoutés.
-    """
-    if not chunks:
-        return 0
-
-    import faiss
-    import numpy as np
-    from .rag_search import _get_embed_model
-
-    # Dans 99% des cas, on veut éviter de mélanger : on route vers ref/proc selon le préfixe.
-    # Si l'appelant veut forcer, il peut passer des chunks avec document="proc:...".
-    kind = _kind_for_chunk(chunks[0])
-    index_path, meta_path = _paths(kind)
-
-    # Backwards compat : si on n'a que l'ancien index, on l'utilise.
-    if not index_path.exists() or not meta_path.exists():
-        legacy_idx, legacy_meta = _paths("all")
-        if legacy_idx.exists() and legacy_meta.exists():
-            index_path, meta_path = legacy_idx, legacy_meta
-
-    # Charger l'index existant ou en créer un nouveau
-    if index_path.exists() and meta_path.exists():
-        faiss_idx = faiss.read_index(str(index_path))
-        metadata = json.loads(meta_path.read_text(encoding="utf-8"))
-    else:
-        model = _get_embed_model()
-        # Obtenir la dimension via un encodage test
-        test_vec = model.encode(["test"], normalize_embeddings=True)
-        dim = test_vec.shape[1]
-        faiss_idx = faiss.IndexFlatIP(dim)
-        metadata = []
-
-    # Encoder les nouveaux chunks
-    model = _get_embed_model()
-    texts = [c.text[:2000] for c in chunks]
-    embeddings = model.encode(texts, normalize_embeddings=True, batch_size=64)
-    embeddings = np.array(embeddings, dtype=np.float32)
-
-    # Ajouter à l'index
-    faiss_idx.add(embeddings)
-
-    # Ajouter les métadonnées
-    from dataclasses import asdict
-    for chunk in chunks:
-        meta = asdict(chunk)
-        meta["extrait"] = meta.pop("text")[:800]
-        metadata.append(meta)
-
-    # Sauvegarder
-    RAG_INDEX_DIR.mkdir(parents=True, exist_ok=True)
-    faiss.write_index(faiss_idx, str(index_path))
-    meta_path.write_text(json.dumps(metadata, ensure_ascii=False, indent=2), encoding="utf-8")
-
-    # Invalider le singleton pour forcer le rechargement
-    reset_index()
-
-    logger.info("Index FAISS : %d chunks ajoutés (total : %d)", len(chunks), faiss_idx.ntotal)
-    return len(chunks)
-
-
-def reset_index() -> None:
-    """Invalide les singletons FAISS pour forcer le rechargement au prochain accès."""
-    _loaded.clear()
diff --git a/t2a_install_rag_cleanup/src/medical/rag_search.py b/t2a_install_rag_cleanup/src/medical/rag_search.py
deleted file mode 100644
index 4c4d620..0000000
--- a/t2a_install_rag_cleanup/src/medical/rag_search.py
+++ /dev/null
@@ -1,837 +0,0 @@
-"""Recherche RAG (FAISS) + génération via Ollama pour le codage CIM-10."""
-
-from __future__ import annotations
-
-import logging
-import threading
-from concurrent.futures import ThreadPoolExecutor, as_completed
-
-from ..config import (
-    ActeCCAM, Diagnostic, DossierMedical, PreuveClinique, RAGSource,
-    OLLAMA_CACHE_PATH, OLLAMA_MAX_PARALLEL, OLLAMA_MODEL,
-    EMBEDDING_MODEL, RERANKER_MODEL,
-)
-from .cim10_dict import normalize_code, validate_code as cim10_validate, fallback_parent_code
-from .cim10_extractor import BIO_NORMALS
-from .clinical_context import build_enriched_context, format_enriched_context
-from .ccam_dict import validate_code as ccam_validate
-from .ollama_client import call_ollama, parse_json_response
-from .ollama_cache import OllamaCache
-
-logger = logging.getLogger(__name__)
-
-# Singleton pour le modèle d'embedding (chargé une seule fois)
-_embed_model = None
-_embed_lock = threading.Lock()
-_embed_failed = False  # Sentinelle pour éviter les retries infinis
-
-# Singleton pour le cross-encoder de re-ranking (CPU uniquement)
-_reranker_model = None
-
-# Score minimum de similarité FAISS pour retenir un résultat
-_MIN_SCORE = 0.3
-# Seuil rehaussé pour le contexte CPAM (filtrage plus agressif du bruit)
-_MIN_SCORE_CPAM = 0.40
-
-
-def _get_embed_model():
-    """Charge le modèle d'embedding (singleton thread-safe).
-
-    Tente CUDA d'abord, fallback CPU si OOM (Ollama peut occuper la VRAM).
-    low_cpu_mem_usage=False évite les meta tensors (accelerate + sentence-transformers 5.x).
-    Un Lock empêche les chargements concurrents depuis le ThreadPool.
-    """
-    global _embed_model, _embed_failed
-    if _embed_model is not None:
-        return _embed_model
-    if _embed_failed:
-        raise RuntimeError("Modèle d'embedding indisponible (échec précédent)")
-    with _embed_lock:
-        # Double-check après acquisition du lock
-        if _embed_model is not None:
-            return _embed_model
-        if _embed_failed:
-            raise RuntimeError("Modèle d'embedding indisponible (échec précédent)")
-        from sentence_transformers import SentenceTransformer
-        import torch
-        _device = "cuda" if torch.cuda.is_available() else "cpu"
-        _model_kwargs = {"low_cpu_mem_usage": False}
-        try:
-            logger.info("Chargement du modèle d'embedding (%s)...", _device)
-            _embed_model = SentenceTransformer(
-                EMBEDDING_MODEL, device=_device, model_kwargs=_model_kwargs,
-            )
-        except (torch.OutOfMemoryError, torch.cuda.CudaError, torch.AcceleratorError,
-                RuntimeError, NotImplementedError) as exc:
-            exc_msg = str(exc).lower()
-            if _device == "cuda" and ("memory" in exc_msg or "meta tensor" in exc_msg):
-                logger.warning("CUDA erreur pour l'embedding — fallback CPU : %s", exc)
-                torch.cuda.empty_cache()
-                try:
-                    _embed_model = SentenceTransformer(
-                        EMBEDDING_MODEL, device="cpu", model_kwargs=_model_kwargs,
-                    )
-                except Exception as exc2:
-                    logger.error("Fallback CPU aussi en échec : %s", exc2)
-                    _embed_failed = True
-                    raise
-            else:
-                _embed_failed = True
-                raise
-        _embed_model.max_seq_length = 512
-    return _embed_model
-
-
-def _get_reranker():
-    """Charge le cross-encoder de re-ranking (singleton, CPU uniquement).
-
-    Forcé sur CPU pour ne pas interférer avec Ollama sur GPU.
-    """
-    global _reranker_model
-    if _reranker_model is None:
-        from sentence_transformers import CrossEncoder
-        logger.info("Chargement du cross-encoder de re-ranking (cpu)...")
-        _reranker_model = CrossEncoder(RERANKER_MODEL, device="cpu")
-    return _reranker_model
-
-
-def _rerank(query: str, results: list[dict], top_k: int) -> list[dict]:
-    """Re-classe les résultats FAISS via un cross-encoder.
-
-    Args:
-        query: Texte de la requête originale.
-        results: Résultats FAISS avec clé 'extrait'.
-        top_k: Nombre de résultats à retourner.
-
-    Returns:
-        Résultats re-classés par score cross-encoder, limités à top_k.
-    """
-    if not results:
-        return results
-
-    reranker = _get_reranker()
-
-    # Construire les paires (query, passage) pour le cross-encoder
-    pairs = [(query, r.get("extrait", "")) for r in results]
-    ce_scores = reranker.predict(pairs)
-
-    # Injecter le score cross-encoder et trier
-    for r, ce_score in zip(results, ce_scores):
-        r["score_faiss"] = r["score"]
-        r["score"] = float(ce_score)
-
-    results.sort(key=lambda r: r["score"], reverse=True)
-    return results[:top_k]
-
-
-def search_similar(query: str, top_k: int = 10) -> list[dict]:
-    """Recherche les passages les plus similaires dans l'index FAISS.
-
-    Args:
-        query: Texte du diagnostic à rechercher.
-        top_k: Nombre de résultats à retourner.
-
-    Returns:
-        Liste de dicts avec les métadonnées + score de similarité,
-        filtrés par score minimum et priorisant les sources CIM-10.
-    """
-    from .rag_index import get_index
-    import numpy as np
-
-    # Codage CIM-10 : on interroge l'index "ref" (pas le guide méthodo).
-    result = get_index(kind="ref")
-    if result is None:
-        logger.warning("Index FAISS non disponible")
-        return []
-
-    faiss_index, metadata = result
-
-    model = _get_embed_model()
-    query_vec = model.encode([query], normalize_embeddings=True)
-    query_vec = np.array(query_vec, dtype=np.float32)
-
-    # Chercher plus de résultats que top_k pour pouvoir filtrer ensuite
-    fetch_k = min(top_k * 2, faiss_index.ntotal)
-    scores, indices = faiss_index.search(query_vec, fetch_k)
-
-    raw_results = []
-    for score, idx in zip(scores[0], indices[0]):
-        if idx < 0:
-            continue
-        if float(score) < _MIN_SCORE:
-            continue
-        meta = metadata[idx].copy()
-        meta["score"] = float(score)
-        raw_results.append(meta)
-
-    # Codage : on garde uniquement CIM-10 + index alpha + éventuels référentiels uploadés en ref:...
-    cim10_results = [r for r in raw_results if r["document"] in ("cim10", "cim10_alpha")]
-    ref_uploads = [r for r in raw_results if str(r.get("document", "")).startswith("ref:")]
-
-    # Ne pas laisser les procédures/méthodo contaminer la sélection.
-    other_results = ref_uploads
-
-    min_cim10 = min(6, len(cim10_results))
-    final = cim10_results[:min_cim10]
-    remaining_slots = top_k - len(final)
-    # Remplir le reste avec les meilleurs résultats (CIM-10 restants + autres)
-    remaining = cim10_results[min_cim10:] + other_results
-    remaining.sort(key=lambda r: r["score"], reverse=True)
-    final.extend(remaining[:remaining_slots])
-
-    return final
-
-
-def search_similar_ccam(query: str, top_k: int = 8) -> list[dict]:
-    """Recherche les passages CCAM les plus similaires dans l'index FAISS.
-
-    Même logique que search_similar() mais priorise les sources CCAM.
-    """
-    from .rag_index import get_index
-    import numpy as np
-
-    # CCAM : index "ref".
-    result = get_index(kind="ref")
-    if result is None:
-        logger.warning("Index FAISS non disponible")
-        return []
-
-    faiss_index, metadata = result
-
-    model = _get_embed_model()
-    query_vec = model.encode([query], normalize_embeddings=True)
-    query_vec = np.array(query_vec, dtype=np.float32)
-
-    fetch_k = min(top_k * 2, faiss_index.ntotal)
-    scores, indices = faiss_index.search(query_vec, fetch_k)
-
-    raw_results = []
-    for score, idx in zip(scores[0], indices[0]):
-        if idx < 0:
-            continue
-        if float(score) < _MIN_SCORE:
-            continue
-        meta = metadata[idx].copy()
-        meta["score"] = float(score)
-        raw_results.append(meta)
-
-    # Prioriser les sources CCAM (au moins 5 sur top_k)
-    ccam_results = [r for r in raw_results if r["document"] == "ccam"]
-    other_results = [r for r in raw_results if r["document"] != "ccam"]
-
-    min_ccam = min(5, len(ccam_results))
-    final = ccam_results[:min_ccam]
-    remaining_slots = top_k - len(final)
-    remaining = ccam_results[min_ccam:] + other_results
-    remaining.sort(key=lambda r: r["score"], reverse=True)
-    final.extend(remaining[:remaining_slots])
-
-    return final
-
-
-def search_similar_cpam(query: str, top_k: int = 8) -> list[dict]:
-    """Recherche RAG spécifique au contexte CPAM (contre-argumentation).
-
-    Différences avec search_similar() :
-    - Priorité Guide Méthodologique (min 3 résultats) plutôt que CIM-10
-    - Seuil de score rehaussé (0.40 vs 0.30) pour éliminer le bruit
-    - Fetch élargi (top_k * 3) car filtrage plus agressif
-    - Déduplication par code CIM-10 (garde le meilleur score par code)
-    """
-    from .rag_index import get_index
-    import numpy as np
-
-    # Contexte CPAM : on veut des procédures (guide) + définitions référentielles (CIM-10).
-    proc = get_index(kind="proc")
-    ref = get_index(kind="ref")
-    if proc is None and ref is None:
-        logger.warning("Index FAISS non disponible")
-        return []
-
-    model = _get_embed_model()
-    query_vec = model.encode([query], normalize_embeddings=True)
-    query_vec = np.array(query_vec, dtype=np.float32)
-
-    def _search_one(result_tuple, fetch_mult: int) -> list[dict]:
-        if result_tuple is None:
-            return []
-        faiss_index, metadata = result_tuple
-        fetch_k = min(top_k * fetch_mult, faiss_index.ntotal)
-        scores, indices = faiss_index.search(query_vec, fetch_k)
-        out = []
-        for score, idx in zip(scores[0], indices[0]):
-            if idx < 0:
-                continue
-            if float(score) < _MIN_SCORE_CPAM:
-                continue
-            meta = metadata[idx].copy()
-            meta["score"] = float(score)
-            out.append(meta)
-        return out
-
-    raw_proc = _search_one(proc, fetch_mult=3)
-    raw_ref = _search_one(ref, fetch_mult=3)
-
-    # Filtrer clairement :
-    # - proc : guide_methodo + uploads proc:
-    raw_proc = [r for r in raw_proc if r.get("document") == "guide_methodo" or str(r.get("document", "")).startswith("proc:")]
-    # - ref : CIM-10 + index alpha + uploads ref:
-    raw_ref = [r for r in raw_ref if r.get("document") in ("cim10", "cim10_alpha") or str(r.get("document", "")).startswith("ref:")]
-
-    raw_results = raw_proc + raw_ref
-
-    # Dédupliquer par code CIM-10 (garder meilleur score par code)
-    seen_codes: dict[str, dict] = {}
-    deduped = []
-    for r in raw_results:
-        code = r.get("code")
-        if code:
-            if code in seen_codes:
-                if r["score"] > seen_codes[code]["score"]:
-                    seen_codes[code] = r
-            else:
-                seen_codes[code] = r
-        else:
-            deduped.append(r)  # pas de code → garder (guide_methodo, etc.)
-    deduped.extend(seen_codes.values())
-    deduped.sort(key=lambda r: r["score"], reverse=True)
-
-    # Re-ranking cross-encoder (CPU) pour affiner le classement
-    reranked = _rerank(query, deduped, top_k=len(deduped))
-
-    # Prioriser le Guide Méthodologique (min 3 résultats)
-    guide_results = [r for r in reranked if r.get("document") == "guide_methodo" or str(r.get("document", "")).startswith("proc:")]
-    other_results = [
-        r for r in reranked
-        if not (r.get("document") == "guide_methodo" or str(r.get("document", "")).startswith("proc:"))
-    ]
-
-    min_guide = min(3, len(guide_results))
-    final = guide_results[:min_guide]
-    remaining_slots = top_k - len(final)
-    remaining = guide_results[min_guide:] + other_results
-    remaining.sort(key=lambda r: r["score"], reverse=True)
-    final.extend(remaining[:remaining_slots])
-
-    return final
-
-
-def _format_contexte(contexte: dict) -> str:
-    """Formate le contexte patient de manière structurée pour le prompt."""
-    lines = []
-
-    sexe = contexte.get("sexe")
-    age = contexte.get("age")
-    imc = contexte.get("imc")
-    patient_parts = []
-    if sexe:
-        patient_parts.append(sexe)
-    if age:
-        patient_parts.append(f"{age} ans")
-    if imc:
-        patient_parts.append(f"IMC {imc}")
-    if patient_parts:
-        lines.append(f"- Patient : {', '.join(patient_parts)}")
-
-    duree = contexte.get("duree_sejour")
-    if duree:
-        lines.append(f"- Durée séjour : {duree} jours")
-
-    antecedents = contexte.get("antecedents")
-    if antecedents:
-        lines.append(f"- Antécédents : {', '.join(antecedents[:5])}")
-
-    biologie = contexte.get("biologie_cle")
-    if biologie:
-        bio_parts = []
-        for b in biologie:
-            test, valeur, anomalie = b if isinstance(b, (list, tuple)) else (b.get("test"), b.get("valeur"), b.get("anomalie"))
-            # Ajouter la plage de référence si connue
-            norme_str = ""
-            if test in BIO_NORMALS:
-                lo, hi = BIO_NORMALS[test]
-                lo_s = int(lo) if lo == int(lo) else lo
-                hi_s = int(hi) if hi == int(hi) else hi
-                norme_str = f" [N: {lo_s}-{hi_s}]"
-            marker = " (\u2191)" if anomalie else ""
-            bio_parts.append(f"{test} {valeur}{norme_str}{marker}")
-        lines.append(f"- Biologie : {', '.join(bio_parts)}")
-
-    imagerie = contexte.get("imagerie")
-    if imagerie:
-        for img in imagerie:
-            img_type, conclusion = img if isinstance(img, (list, tuple)) else (img.get("type"), img.get("conclusion"))
-            if conclusion:
-                lines.append(f"- Imagerie : {img_type} — {conclusion[:200]}")
-
-    complications = contexte.get("complications")
-    if complications:
-        lines.append(f"- Complications : {', '.join(complications)}")
-
-    dp_texte = contexte.get("dp_texte")
-    if dp_texte:
-        lines.append(f"- DP du séjour : {dp_texte}")
-
-    das_codes = contexte.get("das_codes_existants")
-    if das_codes:
-        lines.append(f"- DAS déjà codés : {', '.join(das_codes)}")
-
-    return "\n".join(lines) if lines else "Non précisé"
-
-
-def _build_prompt(texte: str, sources: list[dict], contexte: dict, est_dp: bool = True) -> str:
-    """Construit le prompt expert DIM avec raisonnement structuré."""
-    sources_text = ""
-    for i, src in enumerate(sources, 1):
-        doc_raw = str(src.get("document", ""))
-        if doc_raw.startswith("ref:"):
-            doc_name = f"Référentiel uploadé : {doc_raw[4:]}"
-        elif doc_raw.startswith("proc:"):
-            doc_name = f"Procédure uploadée : {doc_raw[5:]}"
-        else:
-            doc_name = {
-                "cim10": "CIM-10 FR 2026",
-                "cim10_alpha": "CIM-10 Index Alphabétique 2026",
-                "guide_methodo": "Guide Méthodologique MCO 2026",
-                "ccam": "CCAM PMSI V4 2025",
-            }.get(doc_raw, doc_raw)
-
-        code_info = f" (code: {src['code']})" if src.get("code") else ""
-        page_info = f" [page {src['page']}]" if src.get("page") else ""
-
-        sources_text += f"--- Source {i}: {doc_name}{code_info}{page_info} ---\n"
-        sources_text += (src.get("extrait", "")[:800]) + "\n\n"
-
-    type_diag = "DP (diagnostic principal)" if est_dp else "DAS (diagnostic associé significatif)"
-    ctx_str = format_enriched_context(contexte)
-
-    return f"""Tu es un médecin DIM (Département d'Information Médicale) expert en codage PMSI.
-Tu dois coder le diagnostic suivant en respectant STRICTEMENT les règles de l'ATIH.
-
-RÈGLES IMPÉRATIVES :
-- Le code doit provenir UNIQUEMENT des sources CIM-10 fournies
-- Distingue la DESCRIPTION CLINIQUE (ce que le médecin écrit) de la LOGIQUE DE CODAGE (ce que l'ATIH impose)
-- Privilégie le code le plus SPÉCIFIQUE disponible (4e ou 5e caractère)
-- Vérifie les notes d'inclusion/exclusion de chaque code candidat
-- Si le diagnostic est un DP, il doit refléter le motif principal de prise en charge du séjour
-- Si c'est un DAS, il doit avoir mobilisé des ressources supplémentaires pendant le séjour
-- EXCLUSION SYMPTÔME : Si le diagnostic est un symptôme (R00-R99) et qu'un diagnostic précis (Chapitres I-XIV, A00-N99) expliquant ce symptôme est présent, le symptôme ne doit PAS être codé comme DAS
-
-DIAGNOSTIC À CODER : "{texte}"
-TYPE : {type_diag}
-
-CONTEXTE CLINIQUE :
-{ctx_str}
-
-SOURCES DE RÉFÉRENCE :
-{sources_text}
-Réponds UNIQUEMENT avec un objet JSON au format suivant, sans aucun texte avant ou après :
-{{
-  "analyse_clinique": "que signifie ce diagnostic sur le plan médical",
-  "codes_candidats": "quels codes CIM-10 des sources sont compatibles",
-  "discrimination": "pourquoi choisir ce code plutôt qu'un autre (inclusions/exclusions, spécificité)",
-  "regle_pmsi": "conformité aux règles PMSI pour un {type_diag} (guide méthodologique)",
-  "code": "X99.9",
-  "confidence": "high ou medium ou low",
-  "justification": "explication courte en français",
-  "preuves_cliniques": [
-    {{"type": "biologie|imagerie|traitement|acte|clinique", "element": "élément concret du dossier", "interpretation": "signification clinique justifiant le code"}}
-  ]
-}}"""
-
-
-def _build_prompt_ccam(texte: str, sources: list[dict], contexte: dict) -> str:
-    """Construit le prompt expert DIM pour le codage CCAM avec raisonnement structuré."""
-    sources_text = ""
-    for i, src in enumerate(sources, 1):
-        doc_raw = str(src.get("document", ""))
-        if doc_raw.startswith("ref:"):
-            doc_name = f"Référentiel uploadé : {doc_raw[4:]}"
-        elif doc_raw.startswith("proc:"):
-            doc_name = f"Procédure uploadée : {doc_raw[5:]}"
-        else:
-            doc_name = {
-                "cim10": "CIM-10 FR 2026",
-                "cim10_alpha": "CIM-10 Index Alphabétique 2026",
-                "guide_methodo": "Guide Méthodologique MCO 2026",
-                "ccam": "CCAM PMSI V4 2025",
-            }.get(doc_raw, doc_raw)
-
-        code_info = f" (code: {src['code']})" if src.get("code") else ""
-        page_info = f" [page {src['page']}]" if src.get("page") else ""
-
-        sources_text += f"--- Source {i}: {doc_name}{code_info}{page_info} ---\n"
-        sources_text += (src.get("extrait", "")[:800]) + "\n\n"
-
-    ctx_str = format_enriched_context(contexte)
-
-    return f"""Tu es un médecin DIM (Département d'Information Médicale) expert en codage CCAM PMSI.
-Tu dois coder l'acte chirurgical/médical suivant en respectant STRICTEMENT la nomenclature CCAM.
-
-RÈGLES IMPÉRATIVES :
-- Le code doit provenir UNIQUEMENT des sources CCAM fournies
-- Un code CCAM est composé de 4 lettres + 3 chiffres (ex: HMFC004)
-- Vérifie l'activité (1=acte technique, 4=anesthésie) et le regroupement
-- Tiens compte du tarif secteur 1 pour valider la cohérence
-- Si plusieurs codes sont possibles, choisis le plus spécifique à l'acte décrit
-- En cas de doute, indique confidence "low" plutôt que de proposer un code inadapté
-
-ACTE À CODER : "{texte}"
-
-CONTEXTE CLINIQUE :
-{ctx_str}
-
-SOURCES CCAM :
-{sources_text}
-Réponds UNIQUEMENT avec un objet JSON au format suivant, sans aucun texte avant ou après :
-{{
-  "analyse_acte": "que décrit cet acte sur le plan technique/chirurgical",
-  "codes_candidats": "quels codes CCAM des sources sont compatibles",
-  "discrimination": "pourquoi choisir ce code plutôt qu'un autre (activité, regroupement, tarif)",
-  "code": "ABCD123",
-  "confidence": "high ou medium ou low",
-  "justification": "explication courte en français"
-}}"""
-
-
-def _parse_ollama_response(raw: str) -> dict | None:
-    """Parse la réponse JSON d'Ollama et reconstitue le raisonnement structuré."""
-    parsed = parse_json_response(raw)
-    if parsed is None:
-        return None
-
-    # Reconstituer le raisonnement à partir des champs structurés
-    reasoning_parts = []
-    for key in ("analyse_clinique", "analyse_acte", "codes_candidats", "discrimination", "regle_pmsi"):
-        val = parsed.pop(key, None)
-        if val:
-            titre = key.replace("_", " ").upper()
-            reasoning_parts.append(f"{titre} :\n{val}")
-    if reasoning_parts:
-        parsed["raisonnement"] = "\n\n".join(reasoning_parts)
-
-    return parsed
-
-
-def _call_ollama(prompt: str) -> dict | None:
-    """Appelle Ollama (mode JSON) et parse la réponse avec reconstitution du raisonnement."""
-    result = call_ollama(prompt, temperature=0.1, max_tokens=2500)
-    if result is None:
-        return None
-    # Reconstituer le raisonnement structuré
-    reasoning_parts = []
-    for key in ("analyse_clinique", "analyse_acte", "codes_candidats", "discrimination", "regle_pmsi"):
-        val = result.pop(key, None)
-        if val:
-            titre = key.replace("_", " ").upper()
-            reasoning_parts.append(f"{titre} :\n{val}")
-    if reasoning_parts:
-        result["raisonnement"] = "\n\n".join(reasoning_parts)
-    return result
-
-
-def _apply_llm_result_diagnostic(diagnostic: Diagnostic, llm_result: dict) -> None:
-    """Applique un résultat LLM (frais ou caché) à un Diagnostic."""
-    code = llm_result.get("code")
-    confidence = llm_result.get("confidence")
-    justification = llm_result.get("justification")
-    raisonnement = llm_result.get("raisonnement")
-
-    if code:
-        code = normalize_code(code)
-        is_valid, _ = cim10_validate(code)
-        if is_valid:
-            diagnostic.cim10_suggestion = code
-        else:
-            # Tenter fallback vers le code parent (D71.9 → D71)
-            parent = fallback_parent_code(code)
-            if parent:
-                logger.info(
-                    "RAG : code Ollama %s invalide → fallback parent %s pour « %s »",
-                    code, parent, diagnostic.texte,
-                )
-                diagnostic.cim10_suggestion = parent
-            else:
-                logger.warning(
-                    "RAG : code Ollama %s invalide pour « %s », code ignoré",
-                    code, diagnostic.texte,
-                )
-    if confidence in ("high", "medium", "low"):
-        diagnostic.cim10_confidence = confidence
-    if justification:
-        diagnostic.justification = justification
-    if raisonnement:
-        diagnostic.raisonnement = raisonnement
-
-    # Stocker les preuves cliniques
-    preuves = llm_result.get("preuves_cliniques", [])
-    if preuves and isinstance(preuves, list):
-        for p in preuves:
-            if isinstance(p, dict) and p.get("element"):
-                try:
-                    diagnostic.preuves_cliniques.append(PreuveClinique(
-                        type=p.get("type", "clinique"),
-                        element=p["element"],
-                        interpretation=p.get("interpretation", ""),
-                    ))
-                except Exception:
-                    pass
-
-
-def enrich_diagnostic(
-    diagnostic: Diagnostic,
-    contexte: dict,
-    est_dp: bool = True,
-    cache: OllamaCache | None = None,
-) -> None:
-    """Enrichit un Diagnostic avec le RAG (FAISS + Ollama).
-
-    Modifie le diagnostic en place. Fallback gracieux si FAISS ou Ollama échouent.
-    """
-    diag_type = "dp" if est_dp else "das"
-
-    # 1. Vérifier le cache
-    cached = cache.get(diagnostic.texte, diag_type) if cache else None
-
-    # 2. Recherche FAISS (toujours, pour les sources_rag fraîches)
-    sources = search_similar(diagnostic.texte, top_k=10)
-
-    if not sources:
-        logger.debug("Aucune source RAG trouvée pour : %s", diagnostic.texte)
-        return
-
-    # 3. Stocker les sources RAG
-    diagnostic.sources_rag = [
-        RAGSource(
-            document=s["document"],
-            page=s.get("page"),
-            code=s.get("code"),
-            extrait=s.get("extrait", "")[:200],
-        )
-        for s in sources
-    ]
-
-    # 4. Si cache hit, appliquer et court-circuiter Ollama
-    if cached is not None:
-        logger.info("Cache hit pour %s : « %s »", diag_type.upper(), diagnostic.texte)
-        _apply_llm_result_diagnostic(diagnostic, cached)
-        return
-
-    # 5. Appel Ollama pour justification avec raisonnement structuré
-    prompt = _build_prompt(diagnostic.texte, sources, contexte, est_dp=est_dp)
-    llm_result = _call_ollama(prompt)
-
-    if llm_result:
-        _apply_llm_result_diagnostic(diagnostic, llm_result)
-        if cache:
-            cache.put(diagnostic.texte, diag_type, llm_result)
-    else:
-        logger.info("Ollama non disponible — sources FAISS conservées sans justification LLM")
-
-
-def _apply_llm_result_acte(acte: ActeCCAM, llm_result: dict) -> None:
-    """Applique un résultat LLM (frais ou caché) à un ActeCCAM."""
-    code = llm_result.get("code")
-    confidence = llm_result.get("confidence")
-    justification = llm_result.get("justification")
-    raisonnement = llm_result.get("raisonnement")
-
-    if code:
-        code = code.strip().upper()
-        is_valid, _ = ccam_validate(code)
-        if is_valid:
-            acte.code_ccam_suggestion = code
-        else:
-            logger.warning(
-                "RAG : code CCAM Ollama %s invalide pour « %s », code ignoré",
-                code, acte.texte,
-            )
-    if confidence in ("high", "medium", "low"):
-        acte.ccam_confidence = confidence
-    if justification:
-        acte.justification = justification
-    if raisonnement:
-        acte.raisonnement = raisonnement
-
-
-def enrich_acte(acte: ActeCCAM, contexte: dict, cache: OllamaCache | None = None) -> None:
-    """Enrichit un ActeCCAM avec le RAG (FAISS + Ollama).
-
-    Modifie l'acte en place. Fallback gracieux si FAISS ou Ollama échouent.
-    """
-    # 1. Vérifier le cache
-    cached = cache.get(acte.texte, "ccam") if cache else None
-
-    # 2. Recherche FAISS (sources CCAM priorisées)
-    sources = search_similar_ccam(acte.texte, top_k=8)
-
-    if not sources:
-        logger.debug("Aucune source RAG CCAM trouvée pour : %s", acte.texte)
-        return
-
-    # 3. Stocker les sources RAG
-    acte.sources_rag = [
-        RAGSource(
-            document=s["document"],
-            page=s.get("page"),
-            code=s.get("code"),
-            extrait=s.get("extrait", "")[:200],
-        )
-        for s in sources
-    ]
-
-    # 4. Si cache hit, appliquer et court-circuiter Ollama
-    if cached is not None:
-        logger.info("Cache hit pour CCAM : « %s »", acte.texte)
-        _apply_llm_result_acte(acte, cached)
-        return
-
-    # 5. Appel Ollama pour justification avec raisonnement structuré
-    prompt = _build_prompt_ccam(acte.texte, sources, contexte)
-    llm_result = _call_ollama(prompt)
-
-    if llm_result:
-        _apply_llm_result_acte(acte, llm_result)
-        if cache:
-            cache.put(acte.texte, "ccam", llm_result)
-    else:
-        logger.info("Ollama non disponible — sources FAISS CCAM conservées sans justification LLM")
-
-
-def _build_prompt_das_extraction(text: str, contexte: dict, existing_das: list[str], dp_texte: str) -> str:
-    """Construit le prompt pour l'extraction LLM de DAS supplémentaires."""
-    ctx_str = format_enriched_context(contexte)
-    existing_str = "\n".join(f"- {d}" for d in existing_das) if existing_das else "Aucun"
-
-    return f"""Tu es un médecin DIM (Département d'Information Médicale) expert en codage PMSI.
-Analyse le texte médical suivant et identifie les diagnostics associés significatifs (DAS) qui n'ont PAS encore été codés.
-
-RÈGLES IMPÉRATIVES :
-- Un DAS doit avoir mobilisé des ressources supplémentaires pendant le séjour
-- Ne PAS proposer de doublons avec les DAS déjà codés ci-dessous
-- Ne PAS proposer le diagnostic principal comme DAS
-- Ne PAS coder les symptômes (R00-R99) si un diagnostic précis les explique
-- Ne PAS coder les antécédents non pertinents pour le séjour
-- Privilégie les codes CIM-10 les plus SPÉCIFIQUES (4e ou 5e caractère)
-- Ne propose que des diagnostics CLAIREMENT mentionnés dans le texte
-- ATTENTION aux valeurs biologiques : ne code PAS un diagnostic si les valeurs sont dans les normes indiquées entre crochets [N: min-max]. Exemple : Créatinine 76 [N: 50-120] = NORMAL, pas d'insuffisance rénale.
-
-DIAGNOSTIC PRINCIPAL : {dp_texte or "Non identifié"}
-
-DAS DÉJÀ CODÉS :
-{existing_str}
-
-CONTEXTE CLINIQUE :
-{ctx_str}
-
-TEXTE MÉDICAL :
-{text[:4000]}
-
-Réponds UNIQUEMENT avec un objet JSON au format suivant, sans aucun texte avant ou après :
-{{
-  "diagnostics_supplementaires": [
-    {{
-      "texte": "description du diagnostic",
-      "code_cim10": "X99.9",
-      "justification": "pourquoi ce DAS est pertinent pour le séjour"
-    }}
-  ]
-}}
-
-Si aucun DAS supplémentaire n'est pertinent, retourne : {{"diagnostics_supplementaires": []}}"""
-
-
-def extract_das_llm(
-    text: str,
-    contexte: dict,
-    existing_das: list[str],
-    dp_texte: str,
-    cache: OllamaCache | None = None,
-) -> list[dict]:
-    """Extrait des DAS supplémentaires via un pass LLM.
-
-    Args:
-        text: Texte médical complet.
-        contexte: Contexte patient (sexe, age, etc.).
-        existing_das: Liste des DAS déjà codés (texte + code).
-        dp_texte: Texte du diagnostic principal.
-        cache: Cache Ollama optionnel.
-
-    Returns:
-        Liste de dicts {texte, code_cim10, justification} pour les DAS détectés.
-    """
-    import hashlib
-
-    # Clé de cache basée sur le hash du texte
-    text_hash = hashlib.md5(text[:4000].encode()).hexdigest()[:16]
-    cache_key_text = f"das_extract::{text_hash}"
-
-    # Vérifier le cache
-    if cache is not None:
-        cached = cache.get(cache_key_text, "das_llm")
-        if cached is not None:
-            logger.info("Cache hit pour extraction DAS LLM")
-            return cached.get("diagnostics_supplementaires", [])
-
-    # Construire le prompt et appeler Ollama
-    prompt = _build_prompt_das_extraction(text, contexte, existing_das, dp_texte)
-    result = call_ollama(prompt, temperature=0.1, max_tokens=2000)
-
-    if result is None:
-        logger.warning("Extraction DAS LLM : Ollama non disponible")
-        return []
-
-    das_list = result.get("diagnostics_supplementaires", [])
-    if not isinstance(das_list, list):
-        logger.warning("Extraction DAS LLM : format inattendu")
-        return []
-
-    # Stocker dans le cache
-    if cache is not None:
-        cache.put(cache_key_text, "das_llm", result)
-
-    logger.info("Extraction DAS LLM : %d diagnostics supplémentaires détectés", len(das_list))
-    return das_list
-
-
-def enrich_dossier(dossier: DossierMedical) -> None:
-    """Enrichit le DP et tous les DAS d'un dossier via le RAG.
-
-    Utilise un cache persistant et parallélise les appels Ollama
-    pour les DAS et actes CCAM (max_workers = OLLAMA_MAX_PARALLEL).
-    """
-    cache = OllamaCache(OLLAMA_CACHE_PATH, OLLAMA_MODEL)
-
-    contexte = build_enriched_context(dossier)
-
-    # Phase 1 : DP seul (le contexte DAS en dépend)
-    if dossier.diagnostic_principal:
-        logger.info("RAG enrichissement DP : %s", dossier.diagnostic_principal.texte)
-        enrich_diagnostic(dossier.diagnostic_principal, contexte, est_dp=True, cache=cache)
-
-    # Mettre à jour le contexte avec le DP pour les DAS
-    if dossier.diagnostic_principal:
-        contexte["dp_texte"] = dossier.diagnostic_principal.texte
-    contexte["das_codes_existants"] = [
-        f"{d.cim10_suggestion} ({d.texte})"
-        for d in dossier.diagnostics_associes
-        if d.cim10_suggestion
-    ]
-
-    # Phase 2 : DAS + Actes en parallèle
-    das_list = dossier.diagnostics_associes
-    actes_list = dossier.actes_ccam
-
-    if das_list or actes_list:
-        with ThreadPoolExecutor(max_workers=OLLAMA_MAX_PARALLEL) as executor:
-            futures = []
-            for das in das_list:
-                logger.info("RAG enrichissement DAS : %s", das.texte)
-                futures.append(executor.submit(enrich_diagnostic, das, contexte, False, cache))
-            for acte in actes_list:
-                logger.info("RAG enrichissement CCAM : %s", acte.texte)
-                futures.append(executor.submit(enrich_acte, acte, contexte, cache))
-            for f in as_completed(futures):
-                f.result()  # propage les exceptions
-
-    cache.save()
diff --git a/t2a_install_rag_cleanup/src/medical/severity.py b/t2a_install_rag_cleanup/src/medical/severity.py
deleted file mode 100644
index cfe19d9..0000000
--- a/t2a_install_rag_cleanup/src/medical/severity.py
+++ /dev/null
@@ -1,242 +0,0 @@
-"""Détection heuristique de sévérité et CMA/CMS pour le codage GHM.
-
-Phase 1 : heuristique basée sur des marqueurs textuels et des racines CIM-10.
-Phase 2 (future) : tables CMA/CMS officielles ATIH.
-"""
-
-from __future__ import annotations
-
-import json
-import logging
-import re
-from dataclasses import dataclass, field
-from typing import Optional
-
-from .cim10_dict import load_dict, normalize_text
-
-logger = logging.getLogger(__name__)
-
-
-# --- Marqueurs de sévérité dans le texte ---
-
-_SEVERE_MARKERS = {
-    "aigu", "aigue", "severe", "grave", "maligne", "malin",
-    "foudroyant", "foudroyante", "necrosant", "necrosante",
-    "septique", "decompense", "decompensee", "choc",
-    "defaillance", "hemorragique",
-    "fulminant", "fulminante", "massif", "massive", "critique",
-}
-
-_MODERATE_MARKERS = {
-    "modere", "moderee", "moderes", "moderees",
-    "subaigu", "subaigue", "subaiguë",
-    "persistant", "persistante", "recidivant", "recidivante",
-}
-
-_MILD_MARKERS = {
-    "chronique", "leger", "legere",
-    "benin", "benigne", "mineur", "mineure",
-    "superficiel", "superficielle", "stable",
-}
-
-
-# --- Racines CIM-10 fréquemment CMA (heuristique Phase 1) ---
-# Ces racines sont connues pour être souvent classées CMA dans les tables ATIH.
-
-_HEURISTIC_CMA_ROOTS: set[str] = {
-    # Infectieux
-    "A41",   # Sepsis
-    "A40",   # Septicémie streptococcique
-    # Hématologie / nutrition
-    "D64",   # Anémie
-    "D65",   # CIVD
-    "E46",   # Dénutrition
-    "E87",   # Troubles hydro-électrolytiques
-    "E86",   # Déshydratation
-    # Métabolique
-    "E11",   # Diabète type 2 (avec complications)
-    "E10",   # Diabète type 1 (avec complications)
-    # Cardiovasculaire
-    "I48",   # Fibrillation auriculaire
-    "I50",   # Insuffisance cardiaque
-    "I26",   # Embolie pulmonaire
-    "I80",   # Thrombose veineuse
-    # Respiratoire
-    "J18",   # Pneumopathie
-    "J96",   # Insuffisance respiratoire
-    "J69",   # Pneumopathie d'inhalation
-    # Rénal
-    "N17",   # Insuffisance rénale aiguë
-    "N18",   # Insuffisance rénale chronique
-    "N39",   # Infection urinaire
-    # Hépatique
-    "K72",   # Insuffisance hépatique
-    # Infectieux nosocomial
-    "T81",   # Complications d'actes (infection post-op)
-    "T80",   # Complications post-perfusion
-}
-
-
-_cma_levels: dict[str, int] | None = None
-
-
-def _load_cma_levels() -> dict[str, int]:
-    """Charge les niveaux CMA officiels depuis data/cma_levels.json (lazy-loaded)."""
-    global _cma_levels
-    if _cma_levels is not None:
-        return _cma_levels
-    from ..config import CMA_LEVELS_PATH
-    try:
-        data = json.loads(CMA_LEVELS_PATH.read_text(encoding="utf-8"))
-        _cma_levels = {k: int(v) for k, v in data.items()}
-        logger.debug("CMA levels chargés : %d codes", len(_cma_levels))
-    except FileNotFoundError:
-        logger.warning("Fichier CMA levels non trouvé : %s", CMA_LEVELS_PATH)
-        _cma_levels = {}
-    except Exception:
-        logger.warning("Erreur chargement CMA levels", exc_info=True)
-        _cma_levels = {}
-    return _cma_levels
-
-
-@dataclass
-class SeverityInfo:
-    """Résultat de l'évaluation de sévérité d'un diagnostic."""
-    est_cma_probable: bool = False
-    niveau_severite: str = "non_evalue"  # "leger" | "modere" | "severe" | "non_evalue"
-    niveau_cma: int = 1  # 1 (pas CMA), 2, 3 ou 4 (officiel ATIH)
-    marqueurs_trouves: list[str] = field(default_factory=list)
-
-
-def _detect_severity_markers(text: str) -> tuple[str, list[str]]:
-    """Détecte les marqueurs de sévérité dans un texte normalisé.
-
-    Returns:
-        (niveau, marqueurs_trouves) où niveau est "severe", "modere", "leger" ou "non_evalue".
-    """
-    text_norm = normalize_text(text)
-    words = set(text_norm.split())
-
-    found_severe = words & _SEVERE_MARKERS
-    found_moderate = words & _MODERATE_MARKERS
-    found_mild = words & _MILD_MARKERS
-
-    all_found = list(found_severe | found_moderate | found_mild)
-
-    if found_severe:
-        return "severe", all_found
-    if found_moderate:
-        return "modere", all_found
-    if found_mild:
-        return "leger", all_found
-    return "non_evalue", []
-
-
-def _is_heuristic_cma(code: str) -> bool:
-    """Vérifie si un code CIM-10 est probablement CMA selon les racines heuristiques."""
-    if not code:
-        return False
-    code_upper = code.upper()
-    for root in _HEURISTIC_CMA_ROOTS:
-        if code_upper.startswith(root):
-            return True
-    return False
-
-
-def evaluate_severity(diagnostic) -> SeverityInfo:
-    """Évalue la sévérité d'un diagnostic (texte + code CIM-10).
-
-    Utilise en priorité les niveaux CMA officiels ATIH (2/3/4),
-    avec fallback sur l'heuristique par racines CIM-10.
-
-    Args:
-        diagnostic: Objet avec attributs texte, cim10_suggestion.
-
-    Returns:
-        SeverityInfo avec est_cma_probable, niveau_cma, niveau_severite, marqueurs_trouves.
-    """
-    info = SeverityInfo()
-
-    # 1. Marqueurs textuels depuis le texte du diagnostic
-    texte = diagnostic.texte or ""
-    niveau, marqueurs = _detect_severity_markers(texte)
-
-    # 2. Chercher aussi dans le label du dictionnaire CIM-10
-    code = diagnostic.cim10_suggestion
-    if code:
-        cim10_dict = load_dict()
-        label = cim10_dict.get(code, "")
-        if label:
-            niveau_label, marqueurs_label = _detect_severity_markers(label)
-            # Prendre le niveau le plus sévère
-            severity_order = {"severe": 3, "modere": 2, "leger": 1, "non_evalue": 0}
-            if severity_order.get(niveau_label, 0) > severity_order.get(niveau, 0):
-                niveau = niveau_label
-            marqueurs = list(set(marqueurs + marqueurs_label))
-
-    info.niveau_severite = niveau
-    info.marqueurs_trouves = marqueurs
-
-    # 3. Lookup officiel CMA ATIH (prioritaire)
-    if code:
-        cma_levels = _load_cma_levels()
-        official_level = cma_levels.get(code)
-        if official_level:
-            info.niveau_cma = official_level
-            info.est_cma_probable = True
-        elif _is_heuristic_cma(code):
-            # Fallback heuristique → niveau 2
-            info.niveau_cma = 2
-            info.est_cma_probable = True
-
-    return info
-
-
-def enrich_dossier_severity(dp, das_list: list) -> tuple[list[str], int, int]:
-    """Enrichit les diagnostics d'un dossier avec les informations de sévérité.
-
-    Modifie les diagnostics en place (attributs est_cma, est_cms, niveau_severite).
-
-    Args:
-        dp: Diagnostic principal.
-        das_list: Liste des diagnostics associés.
-
-    Returns:
-        (alertes, cma_count, cms_count).
-    """
-    alertes = []
-
-    # Évaluer le DP
-    if dp and dp.cim10_suggestion:
-        info = evaluate_severity(dp)
-        dp.niveau_severite = info.niveau_severite
-        dp.niveau_cma = info.niveau_cma
-        if info.est_cma_probable:
-            dp.est_cma = True
-
-    # Évaluer chaque DAS
-    cma_count = 0
-    cms_count = 0
-    for das in das_list:
-        if not das.cim10_suggestion:
-            continue
-        info = evaluate_severity(das)
-        das.niveau_severite = info.niveau_severite
-        das.niveau_cma = info.niveau_cma
-        if info.est_cma_probable:
-            das.est_cma = True
-            cma_count += 1
-            # CMS = CMA niveau 4 ou CMA sévère
-            if info.niveau_cma >= 4 or info.niveau_severite == "severe":
-                das.est_cms = True
-                cms_count += 1
-            alertes.append(
-                f"CMA niveau {info.niveau_cma} : '{das.texte}' ({das.cim10_suggestion}) — "
-                f"sévérité {info.niveau_severite}"
-                + (f", marqueurs : {', '.join(info.marqueurs_trouves)}" if info.marqueurs_trouves else "")
-            )
-
-    if cma_count >= 2:
-        alertes.insert(0, f"{cma_count} CMA probables détectées — impact potentiel sur le niveau de sévérité GHM")
-
-    return alertes, cma_count, cms_count
diff --git a/t2a_install_rag_cleanup/src/quality/__init__.py b/t2a_install_rag_cleanup/src/quality/__init__.py
deleted file mode 100644
index 8ae31a1..0000000
--- a/t2a_install_rag_cleanup/src/quality/__init__.py
+++ /dev/null
@@ -1 +0,0 @@
-"""Contrôles qualité (vetos) pour réduire la contestabilité CPAM."""
diff --git a/t2a_install_rag_cleanup/src/quality/decision_engine.py b/t2a_install_rag_cleanup/src/quality/decision_engine.py
deleted file mode 100644
index a34446e..0000000
--- a/t2a_install_rag_cleanup/src/quality/decision_engine.py
+++ /dev/null
@@ -1,170 +0,0 @@
-"""Moteur de décisions (post-traitement qualité).
-
-But: conserver la proposition du modèle (cim10_suggestion) tout en produisant une
-*sortie finale* plus défendable (cim10_final + cim10_decision).
-
-Ce module est déterministe, court, et auditable.
-"""
-
-from __future__ import annotations
-
-import re
-import unicodedata
-from typing import Optional
-
-from ..config import CodeDecision, Diagnostic, DossierMedical
-
-
-# --- Règles "étiologiques" : ne pas affirmer sans preuve spécifique ---
-
-IRON_MARKERS = (
-    "ferrit",  # ferritine
-    "transferr",  # transferrine
-    "saturation",  # saturation transferrine
-    "cst",  # coefficient de saturation
-    "carence mart",
-    "martiale",
-    "ferripr",  # ferriprive
-    "fer intraveineux",
-    "fer iv",
-    "traitement martial",
-)
-
-
-def _norm(s: str) -> str:
-    s = s.replace("’", "'")
-    s = unicodedata.normalize("NFKD", s)
-    s = "".join(ch for ch in s if not unicodedata.combining(ch))
-    s = s.lower()
-    return re.sub(r"\s+", " ", s).strip()
-
-
-def _first_float(text: str) -> Optional[float]:
-    m = re.search(r"(-?\d+(?:[\.,]\d+)?)", text)
-    if not m:
-        return None
-    return float(m.group(1).replace(",", "."))
-
-
-def _parse_normal_range(text: str) -> tuple[Optional[float], Optional[float]]:
-    # Ex: "[N: 12-17]" / "[N: 12 - 17]"
-    m = re.search(r"\[\s*N\s*:\s*([0-9]+(?:[\.,][0-9]+)?)\s*-\s*([0-9]+(?:[\.,][0-9]+)?)\s*\]", text)
-    if not m:
-        return None, None
-    lo = float(m.group(1).replace(",", "."))
-    hi = float(m.group(2).replace(",", "."))
-    return lo, hi
-
-
-def _anemia_bio(diag: Diagnostic) -> bool:
-    # 1) via preuves_cliniques (souvent déjà interprétées)
-    for p in diag.preuves_cliniques or []:
-        blob = f"{p.element} {p.interpretation}".lower()
-        if "hemoglob" in blob or "hémoglob" in blob or blob.strip().startswith("hb"):
-            val = _first_float(p.element) or _first_float(p.interpretation)
-            lo, _ = _parse_normal_range(p.element)
-            lo = lo if lo is not None else 12.0
-            if val is not None and val < lo:
-                return True
-            if "confirm" in blob and "anemie" in blob:
-                return True
-    # 2) fallback : le texte mentionne une anémie chiffrée
-    ex = _norm(diag.source_excerpt or "")
-    if "hemoglob" in ex or "hémoglob" in ex:
-        return True
-    return False
-
-
-def _iron_evidence_blob(dossier: DossierMedical, diag: Diagnostic) -> str:
-    parts: list[str] = []
-
-    # Preuves patient (extraits + éléments structurés)
-    if diag.source_excerpt:
-        parts.append(str(diag.source_excerpt))
-
-    for p in diag.preuves_cliniques or []:
-        parts.append(f"{p.element} {p.interpretation}")
-
-    # Biologie clé globale (si ferritine/fer a été capté ailleurs)
-    for b in dossier.biologie_cle or []:
-        parts.append(f"{b.test} {b.valeur or ''}")
-
-    # Traitements (si supplémentation martiale documentée)
-    for t in dossier.traitements_sortie or []:
-        parts.append(f"{t.medicament} {t.posologie or ''}")
-
-    return _norm("\n".join(parts))
-
-
-def apply_decisions(dossier: DossierMedical) -> None:
-    """Applique des décisions finales sur DP/DAS.
-
-    - Ne supprime pas la suggestion du modèle.
-    - Remplit cim10_final systématiquement quand une suggestion existe.
-    - Remplit cim10_decision uniquement si action != KEEP (pour garder le JSON lisible).
-    """
-
-    def _set_default_final(diag: Diagnostic):
-        if diag.cim10_suggestion and diag.cim10_final is None:
-            diag.cim10_final = diag.cim10_suggestion
-
-    # DP
-    if dossier.diagnostic_principal:
-        _set_default_final(dossier.diagnostic_principal)
-
-    # DAS
-    for das in dossier.diagnostics_associes or []:
-        _set_default_final(das)
-
-    # --- Règle: D50 sans preuve martiale -> downgrade D64.9 + needs_info ---
-    for das in dossier.diagnostics_associes or []:
-        if das.cim10_suggestion != "D50":
-            continue
-
-        blob = _iron_evidence_blob(dossier, das)
-        has_iron = any(m in blob for m in IRON_MARKERS)
-        has_anemia = _anemia_bio(das)
-
-        # Si on n'a même pas d'anémie biologique, on n'automatise pas.
-        if not has_anemia:
-            continue
-
-        if not has_iron:
-            das.cim10_final = "D64.9"
-            das.cim10_decision = CodeDecision(
-                action="DOWNGRADE",
-                final_code="D64.9",
-                downgraded_from="D50",
-                reason="Anémie biologique sans preuve d'étiologie ferriprive (bilan martial absent/insuffisant).",
-                needs_info=[
-                    "Bilan martial disponible ? (ferritine, fer, CST/transferrine)",
-                    "Mention explicite 'anémie ferriprive' ou carence martiale ?",
-                    "Traitement martial (fer per os/IV) documenté ?",
-                ],
-                applied_rules=["RULE-D50-NEEDS-IRON"],
-            )
-
-
-
-def decision_summaries(dossier: DossierMedical) -> list[str]:
-    """Retourne une liste de lignes lisibles à injecter dans alertes_codage."""
-    lines: list[str] = []
-
-    def _summ(where: str, d: Diagnostic):
-        dec = d.cim10_decision
-        if not dec or dec.action == "KEEP":
-            return
-        if dec.action == "DOWNGRADE":
-            lines.append(f"DECISION: {where} {dec.downgraded_from}→{dec.final_code} ({', '.join(dec.applied_rules)})")
-            for ni in dec.needs_info[:3]:
-                lines.append(f"DECISION:   besoin_info: {ni}")
-        elif dec.action == "REMOVE":
-            lines.append(f"DECISION: {where} {d.cim10_suggestion} supprimé ({', '.join(dec.applied_rules)})")
-
-    if dossier.diagnostic_principal:
-        _summ("diagnostic_principal", dossier.diagnostic_principal)
-
-    for i, das in enumerate(dossier.diagnostics_associes or []):
-        _summ(f"diagnostics_associes[{i}]", das)
-
-    return lines
diff --git a/t2a_install_rag_cleanup/src/quality/veto_engine.py b/t2a_install_rag_cleanup/src/quality/veto_engine.py
deleted file mode 100644
index 9f44ce4..0000000
--- a/t2a_install_rag_cleanup/src/quality/veto_engine.py
+++ /dev/null
@@ -1,380 +0,0 @@
-"""Moteur de vetos (contrôle de contestabilité).
-
-Objectif : bloquer automatiquement les propositions CIM-10/CCAM contestables
-(absence de preuve, négation/conditionnel, doublons incohérents, etc.).
-
-Ce module est volontairement simple et déterministe : il doit être stable,
-audit-able, et indépendant des modèles.
-"""
-
-from __future__ import annotations
-
-import re
-import unicodedata
-from typing import Iterable
-
-from ..config import (
-    ActeCCAM,
-    BiologieCle,
-    Diagnostic,
-    DossierMedical,
-    VetoIssue,
-    VetoReport,
-)
-
-
-# NOTE: Vetos = déterministes et auditables.
-# On évite d'interpréter le « raisonnement » du modèle comme une preuve.
-
-_NEGATION_CUES = (
-    "pas de",
-    "pas d",
-    "absence de",
-    "non retenu",
-    "exclu",
-    "a eliminer",
-    "a éliminer",
-    "negatif",
-    "négatif",
-)
-
-_CONDITIONAL_CUES = (
-    "si",
-    "s il",  # OCR fréquent de "s'il"
-    "eventuel",
-    "éventuel",
-    "suspect",
-    "probable",
-    "hypothese",
-    "hypothèse",
-    "?",
-)
-
-_EVIDENCE_TEMPLATE_CUES = (
-    "score",
-    "fib4",
-    "fibrosis-4",
-    "test de depistage",
-    "test de dépistage",
-    "outil de depistage",
-    "outil de dépistage",
-)
-
-
-def _norm(s: str) -> str:
-    """Normalisation légère (lower + sans accents) pour matcher OCR."""
-    s = s.replace("’", "'")
-    s = unicodedata.normalize("NFKD", s)
-    s = "".join(ch for ch in s if not unicodedata.combining(ch))
-    s = s.lower()
-    # simplifier ponctuation en espaces
-    s = re.sub(r"[^a-z0-9]+", " ", s)
-    return re.sub(r"\s+", " ", s).strip()
-
-
-def _split_sentences(text: str) -> list[str]:
-    # volontairement simple : robuste sur OCR
-    text = text.replace("\r", "\n")
-    parts = re.split(r"[\n\.\;\:]+", text)
-    return [p.strip() for p in parts if p.strip()]
-
-
-def _concept_keywords(label: str) -> list[str]:
-    """Extrait des mots-clés discriminants depuis le libellé Diagnostic."""
-    stop = {
-        "de", "du", "des", "la", "le", "les", "un", "une", "et", "a", "au", "aux",
-        "gauche", "droite", "bilaterale", "bilat", "chronique", "aigue", "aigu",
-        "sans", "avec",
-    }
-    tokens = [t for t in _norm(label).split() if len(t) >= 4 and t not in stop]
-    # garder l'ordre, éviter doublons
-    seen: set[str] = set()
-    out: list[str] = []
-    for t in tokens:
-        if t not in seen:
-            seen.add(t)
-            out.append(t)
-    return out[:5]
-
-
-def _analyze_neg_cond(excerpts: Iterable[str], label: str) -> tuple[bool, bool, bool, bool]:
-    """Retourne (negated, conditional, contradictory, positive).
-
-    *negated* : une phrase qui contient le concept ET une négation proche.
-    *conditional* : une phrase qui contient le concept ET un marqueur conditionnel.
-    *positive* : une phrase qui contient le concept sans négation proche.
-    *contradictory* : negated et positive.
-    """
-    kws = _concept_keywords(label)
-    if not kws:
-        return False, False, False, False
-
-    negated = False
-    conditional = False
-    positive = False
-
-    for ex in excerpts:
-        if not ex or not str(ex).strip():
-            continue
-        for sent in _split_sentences(str(ex)):
-            ns = _norm(sent)
-            if not ns:
-                continue
-            # le concept est-il mentionné ?
-            hit_pos = None
-            for kw in kws:
-                pos = ns.find(kw)
-                if pos != -1:
-                    hit_pos = pos
-                    break
-            if hit_pos is None:
-                continue
-
-            pre = ns[max(0, hit_pos - 40):hit_pos]
-            has_neg = any(cue in pre for cue in _NEGATION_CUES)
-            has_cond = any(cue in ns for cue in _CONDITIONAL_CUES)
-
-            if has_neg:
-                negated = True
-            else:
-                positive = True
-
-            if has_cond:
-                conditional = True
-
-    contradictory = negated and positive
-    return negated, conditional, contradictory, positive
-
-
-def _evidence_excerpts(d: Diagnostic | ActeCCAM) -> list[str]:
-    """Ne retourne que des preuves (extraits), pas le raisonnement du modèle."""
-    texts: list[str] = []
-    if getattr(d, "source_excerpt", None):
-        texts.append(str(getattr(d, "source_excerpt")))
-    # Sources RAG (extraits)
-    for s in getattr(d, "sources_rag", []) or []:
-        if getattr(s, "extrait", None):
-            texts.append(str(s.extrait))
-    return [t for t in texts if t.strip()]
-
-
-def _has_evidence(d: Diagnostic | ActeCCAM) -> bool:
-    if getattr(d, "source_excerpt", None):
-        return True
-    if getattr(d, "sources_rag", None):
-        # un extrait RAG suffit
-        for s in d.sources_rag:
-            if s.extrait and str(s.extrait).strip():
-                return True
-    if isinstance(d, Diagnostic) and getattr(d, "preuves_cliniques", None):
-        return len(d.preuves_cliniques) > 0
-    return False
-
-
-def _has_template_evidence(excerpts: Iterable[str]) -> bool:
-    joined = _norm("\n".join([str(x) for x in excerpts if x]))
-    cues = [_norm(c) for c in _EVIDENCE_TEMPLATE_CUES]
-    return any(cue in joined for cue in cues)
-
-
-def _parse_float(v: str | None) -> float | None:
-    if v is None:
-        return None
-    s = str(v).strip().replace(",", ".")
-    # extraire le premier nombre
-    m = re.search(r"(-?\d+(?:\.\d+)?)", s)
-    if not m:
-        return None
-    try:
-        return float(m.group(1))
-    except ValueError:
-        return None
-
-
-def _get_bio_value(bios: list[BiologieCle], keywords: tuple[str, ...]) -> float | None:
-    for b in bios:
-        t = (b.test or "").lower()
-        if any(k in t for k in keywords):
-            return _parse_float(b.valeur)
-    return None
-
-
-def apply_vetos(dossier: DossierMedical) -> VetoReport:
-    """Applique des vetos déterministes et retourne un rapport.
-
-    Verdicts :
-      - FAIL : au moins un veto HARD.
-      - NEED_INFO : pas de HARD, au moins un MEDIUM.
-      - PASS : aucun HARD/MEDIUM.
-    """
-
-    issues: list[VetoIssue] = []
-    seen_issue_keys: set[tuple[str, str, str]] = set()  # (veto, where, message)
-
-    def add(veto: str, severity: str, where: str, message: str):
-        key = (veto, where, message)
-        if key in seen_issue_keys:
-            return
-        seen_issue_keys.add(key)
-        issues.append(VetoIssue(veto=veto, severity=severity, where=where, message=message))
-
-    # -----------------------------
-    # VETO-02 : code sans preuve
-    # -----------------------------
-    dp = dossier.diagnostic_principal
-    if dp and dp.cim10_suggestion:
-        if not _has_evidence(dp):
-            add("VETO-02", "HARD", "diagnostic_principal", f"DP {dp.cim10_suggestion} sans preuve exploitable")
-
-    for i, das in enumerate(dossier.diagnostics_associes):
-        if das.cim10_suggestion and not _has_evidence(das):
-            add("VETO-02", "MEDIUM", f"diagnostics_associes[{i}]", f"DAS {das.cim10_suggestion} sans preuve exploitable")
-
-    for i, acte in enumerate(dossier.actes_ccam):
-        if acte.code_ccam_suggestion and not _has_evidence(acte):
-            add("VETO-02", "HARD", f"actes_ccam[{i}]", f"Acte {acte.code_ccam_suggestion} sans preuve exploitable")
-
-    # -------------------------------------------------
-    # VETO-03 : négation / conditionnel DANS LES PREUVES
-    # (pas dans le raisonnement du modèle)
-    # -------------------------------------------------
-    if dp and dp.cim10_suggestion:
-        excerpts = _evidence_excerpts(dp)
-        neg, cond, contra, pos = _analyze_neg_cond(excerpts, dp.texte or dp.cim10_suggestion)
-        if neg and not pos:
-            add("VETO-03", "HARD", "diagnostic_principal", f"DP {dp.cim10_suggestion} contredit par la preuve (négation)")
-        elif contra:
-            add("VETO-03", "MEDIUM", "diagnostic_principal", f"DP {dp.cim10_suggestion} preuves contradictoires (positif vs négatif)")
-        elif cond and dp.cim10_confidence == "high":
-            add("VETO-03", "MEDIUM", "diagnostic_principal", f"DP {dp.cim10_suggestion} basé sur du conditionnel")
-
-    for i, das in enumerate(dossier.diagnostics_associes):
-        if not das.cim10_suggestion:
-            continue
-        excerpts = _evidence_excerpts(das)
-        neg, cond, contra, pos = _analyze_neg_cond(excerpts, das.texte or das.cim10_suggestion)
-        where = f"diagnostics_associes[{i}]"
-        if neg and not pos:
-            # En contrôle CPAM : une négation explicite = bloquant, surtout si le modèle est « high ».
-            severity = "HARD" if das.cim10_confidence == "high" else "MEDIUM"
-            add("VETO-03", severity, where, f"DAS {das.cim10_suggestion} contredit par la preuve (négation)")
-        elif contra:
-            add("VETO-03", "MEDIUM", where, f"DAS {das.cim10_suggestion} preuves contradictoires")
-        elif cond and das.cim10_confidence == "high":
-            add("VETO-03", "LOW", where, f"DAS {das.cim10_suggestion} potentiellement conditionnel")
-
-    # -------------------------------------------------
-    # VETO-15 : preuve de type "score/test" (risque élevé de sur-codage)
-    # -------------------------------------------------
-    for i, das in enumerate(dossier.diagnostics_associes):
-        if not das.cim10_suggestion:
-            continue
-        excerpts = _evidence_excerpts(das)
-        if _has_template_evidence(excerpts) and ("fibrose" in _norm(das.texte or "") or str(das.cim10_suggestion).startswith("K74")):
-            add("VETO-15", "MEDIUM", f"diagnostics_associes[{i}]", f"{das.cim10_suggestion}: preuve issue d'un score/test (à confirmer par diagnostic explicite)")
-
-    # -------------------------------------------------
-    # VETO-16 : incohérence libellé→code (heuristique)
-    # -------------------------------------------------
-    for i, das in enumerate(dossier.diagnostics_associes):
-        if not das.cim10_suggestion:
-            continue
-        label_n = _norm(das.texte or "")
-        if "sacroili" in label_n and str(das.cim10_suggestion) == "M53.3":
-            add("VETO-16", "MEDIUM", f"diagnostics_associes[{i}]", "Sacro-iliite : M53.3 semble hors-sujet (à revalider via candidats, ex. M46.1)")
-
-    # -------------------------------------------------
-    # VETO-06 : DP dupliqué en DAS (incohérent)
-    # -------------------------------------------------
-    if dp and dp.cim10_suggestion:
-        dp_code = dp.cim10_suggestion
-        for i, das in enumerate(dossier.diagnostics_associes):
-            if das.cim10_suggestion == dp_code:
-                add("VETO-06", "HARD", "diagnostics_associes", f"Code DP {dp_code} dupliqué dans les DAS (index {i})")
-                break
-
-    # -------------------------------------------------
-    # VETO-07 : doublons DAS (à fusionner)
-    # -------------------------------------------------
-    seen: dict[str, int] = {}
-    for i, das in enumerate(dossier.diagnostics_associes):
-        c = das.cim10_suggestion
-        if not c:
-            continue
-        if c in seen:
-            add("VETO-07", "MEDIUM", "diagnostics_associes", f"Doublon DAS {c} (index {seen[c]} et {i})")
-        else:
-            seen[c] = i
-
-    # -------------------------------------------------
-    # VETO-09 : contradiction bio simple (plaquettes / créat)
-    # -------------------------------------------------
-    # Plaquettes : si code suggère thrombopénie (D69*) mais valeur normale
-    plaquettes = _get_bio_value(dossier.biologie_cle, ("plaquette", "platelet"))
-    if plaquettes is not None:
-        # seuil volontairement large pour éviter faux positifs
-        if dp and dp.cim10_suggestion and dp.cim10_suggestion.startswith("D69") and plaquettes >= 150:
-            add("VETO-09", "HARD", "diagnostic_principal", f"DP {dp.cim10_suggestion} incompatible avec plaquettes={plaquettes} (sans preuve explicite)")
-        for i, das in enumerate(dossier.diagnostics_associes):
-            if das.cim10_suggestion and das.cim10_suggestion.startswith("D69") and plaquettes >= 150:
-                # Si les preuves disent explicitement "pas de thrombopénie" ou si le modèle est très confiant,
-                # on passe en HARD (risque CPAM maximal).
-                excerpts = _evidence_excerpts(das)
-                neg, _, _, _ = _analyze_neg_cond(excerpts, das.texte or das.cim10_suggestion)
-                severity = "HARD" if (das.cim10_confidence == "high" or neg) else "MEDIUM"
-                add("VETO-09", severity, f"diagnostics_associes[{i}]", f"DAS {das.cim10_suggestion} incompatible avec plaquettes={plaquettes}")
-
-    creat = _get_bio_value(dossier.biologie_cle, ("créat", "creat", "creatin"))
-    if creat is not None:
-        # ultra prudence : on ne hard-fail pas sur l'IR, on alerte
-        for i, das in enumerate(dossier.diagnostics_associes):
-            if das.cim10_suggestion and das.cim10_suggestion.startswith(("N17", "N18", "N19")) and creat < 110 and das.cim10_confidence == "high":
-                add("VETO-09", "LOW", f"diagnostics_associes[{i}]", f"IR {das.cim10_suggestion} à confirmer (créat={creat})")
-
-    # -------------------------------------------------
-    # VETO-12 : sur-confiance
-    # -------------------------------------------------
-    def _overconf(d: Diagnostic | ActeCCAM) -> bool:
-        conf = getattr(d, "cim10_confidence", None) or getattr(d, "ccam_confidence", None)
-        return conf == "high" and not _has_evidence(d)
-
-    if dp and dp.cim10_suggestion and _overconf(dp):
-        add("VETO-12", "HARD", "diagnostic_principal", f"DP {dp.cim10_suggestion} en high sans preuve")
-
-
-    # -------------------------------------------------
-    # Post-traitement : si un veto HARD existe pour un même 'where',
-    # on évite de polluer avec des vetos plus faibles redondants.
-    # Exemple : thrombopénie (VETO-09 HARD) -> VETO-03 devient secondaire.
-    # -------------------------------------------------
-    hard_where = {it.where for it in issues if it.severity == "HARD"}
-    if hard_where:
-        issues = [
-            it for it in issues
-            if not (it.where in hard_where and it.severity in ("LOW", "MEDIUM") and it.veto in ("VETO-03", "VETO-15"))
-        ]
-
-    # -----------------------------
-    # Verdict + score
-    # -----------------------------
-    hard = any(i.severity == "HARD" for i in issues)
-    medium = any(i.severity == "MEDIUM" for i in issues)
-
-    if hard:
-        verdict = "FAIL"
-    elif medium:
-        verdict = "NEED_INFO"
-    else:
-        verdict = "PASS"
-
-    score = 100
-    for it in issues:
-        if it.severity == "HARD":
-            score -= 30
-        elif it.severity == "MEDIUM":
-            score -= 10
-        else:
-            score -= 3
-    score = max(0, min(100, score))
-
-    return VetoReport(verdict=verdict, score_contestabilite=score, issues=issues)
diff --git a/t2a_install_rag_cleanup/src/viewer/__init__.py b/t2a_install_rag_cleanup/src/viewer/__init__.py
deleted file mode 100644
index e69de29..0000000
diff --git a/t2a_install_rag_cleanup/src/viewer/__main__.py b/t2a_install_rag_cleanup/src/viewer/__main__.py
deleted file mode 100644
index 1f0bbbd..0000000
--- a/t2a_install_rag_cleanup/src/viewer/__main__.py
+++ /dev/null
@@ -1,20 +0,0 @@
-"""Point d'entrée : python -m src.viewer [--host 127.0.0.1] [--port 5000] [--debug]."""
-
-import argparse
-
-from .app import create_app
-
-
-def main():
-    parser = argparse.ArgumentParser(description="Viewer CIM-10 T2A")
-    parser.add_argument("--host", default="127.0.0.1")
-    parser.add_argument("--port", type=int, default=5000)
-    parser.add_argument("--debug", action="store_true")
-    args = parser.parse_args()
-
-    app = create_app()
-    app.run(host=args.host, port=args.port, debug=args.debug)
-
-
-if __name__ == "__main__":
-    main()
diff --git a/t2a_install_rag_cleanup/src/viewer/app.py b/t2a_install_rag_cleanup/src/viewer/app.py
deleted file mode 100644
index f6da34f..0000000
--- a/t2a_install_rag_cleanup/src/viewer/app.py
+++ /dev/null
@@ -1,872 +0,0 @@
-"""App Flask — viewer CIM-10 T2A."""
-
-from __future__ import annotations
-
-import json
-import logging
-import re
-from pathlib import Path
-
-import requests
-from flask import Flask, Response, abort, render_template, request, jsonify
-from markupsafe import Markup
-
-from werkzeug.utils import secure_filename
-
-from collections import Counter
-
-from ..config import (
-    ANONYMIZED_DIR, STRUCTURED_DIR, INPUT_DIR, REPORTS_DIR,
-    OLLAMA_URL, CCAM_DICT_PATH, DossierMedical,
-    ALLOWED_EXTENSIONS, UPLOAD_MAX_SIZE_MB,
-    CIM10_PDF, GUIDE_METHODO_PDF, CCAM_PDF, CIM10_DICT_PATH, CIM10_SUPPLEMENTS_PATH,
-)
-from .. import config as cfg
-from .referentiels import ReferentielManager
-from .validation import ValidationManager
-
-logger = logging.getLogger(__name__)
-
-
-# ---------------------------------------------------------------------------
-# Helpers
-# ---------------------------------------------------------------------------
-
-def compute_group_stats(items: list[dict]) -> dict:
-    """Calcule des statistiques agrégées pour un groupe de dossiers.
-
-    Returns:
-        {das_count, alertes_count, actes_count, cma_count}
-    """
-    das_count = 0
-    alertes_count = 0
-    actes_count = 0
-    cma_count = 0
-
-    for item in items:
-        d = item["dossier"]
-        das_count += len(d.diagnostics_associes)
-        alertes_count += len(d.alertes_codage)
-        actes_count += len(d.actes_ccam)
-        for diag in d.diagnostics_associes:
-            if diag.est_cma:
-                cma_count += 1
-        if d.diagnostic_principal and d.diagnostic_principal.est_cma:
-            cma_count += 1
-
-    return {
-        "das_count": das_count,
-        "alertes_count": alertes_count,
-        "actes_count": actes_count,
-        "cma_count": cma_count,
-    }
-
-
-def compute_dashboard_stats(groups: dict[str, list[dict]]) -> dict:
-    """Calcule les statistiques globales du pipeline pour le dashboard."""
-    total_dossiers = len(groups)
-    total_fichiers = 0
-    total_das = 0
-    total_actes = 0
-    total_alertes = 0
-    total_cma = 0
-    total_cpam = 0
-    dp_confidence: Counter = Counter()
-    dp_validity: Counter = Counter()
-    code_counter: Counter = Counter()
-    ghm_types: Counter = Counter()
-    severity_dist: Counter = Counter()
-    processing_times: list[float] = []
-
-    for items in groups.values():
-        total_fichiers += len(items)
-        for item in items:
-            d = item["dossier"]
-            total_das += len(d.diagnostics_associes)
-            total_actes += len(d.actes_ccam)
-            total_alertes += len(d.alertes_codage)
-            total_cpam += len(d.controles_cpam)
-
-            if d.processing_time_s is not None:
-                processing_times.append(d.processing_time_s)
-
-            # DP confidence & validity
-            dp = d.diagnostic_principal
-            if dp:
-                conf = dp.cim10_confidence or "none"
-                dp_confidence[conf] += 1
-                if dp.cim10_suggestion:
-                    dp_validity["valide"] += 1
-                    code_counter[dp.cim10_suggestion] += 1
-                else:
-                    dp_validity["absent"] += 1
-            else:
-                dp_confidence["none"] += 1
-                dp_validity["absent"] += 1
-
-            # DAS codes + CMA
-            for das in d.diagnostics_associes:
-                if das.cim10_suggestion:
-                    code_counter[das.cim10_suggestion] += 1
-                if das.est_cma:
-                    total_cma += 1
-            if dp and dp.est_cma:
-                total_cma += 1
-
-            # GHM
-            ghm = d.ghm_estimation
-            if ghm:
-                if ghm.type_ghm:
-                    ghm_types[ghm.type_ghm] += 1
-                severity_dist[ghm.severite] += 1
-
-    top_codes = code_counter.most_common(15)
-    top_max = top_codes[0][1] if top_codes else 1
-
-    return {
-        "total_dossiers": total_dossiers,
-        "total_fichiers": total_fichiers,
-        "total_das": total_das,
-        "total_actes": total_actes,
-        "total_alertes": total_alertes,
-        "total_cma": total_cma,
-        "total_cpam": total_cpam,
-        "dp_confidence": dict(dp_confidence),
-        "dp_validity": dict(dp_validity),
-        "top_codes": top_codes,
-        "top_max": top_max,
-        "ghm_types": dict(ghm_types),
-        "severity_dist": dict(severity_dist),
-        "processing_time_total": sum(processing_times),
-        "processing_time_avg": sum(processing_times) / len(processing_times) if processing_times else 0,
-    }
-
-
-def collect_cpam_controls(groups: dict[str, list[dict]]) -> list[dict]:
-    """Collecte tous les contrôles CPAM de tous les dossiers."""
-    controls = []
-    for group_name, items in groups.items():
-        for item in items:
-            d = item["dossier"]
-            dp_code = d.diagnostic_principal.cim10_suggestion if d.diagnostic_principal else None
-            for ctrl in d.controles_cpam:
-                controls.append({
-                    "group_name": group_name,
-                    "filepath": item["path_rel"],
-                    "ctrl": ctrl,
-                    "dp_code": dp_code,
-                })
-    controls.sort(key=lambda c: c["ctrl"].numero_ogc)
-    return controls
-
-
-def get_builtin_referentiels() -> list[dict]:
-    """Retourne les infos sur les référentiels intégrés (PDFs + dicts)."""
-    rag_index_meta = Path(STRUCTURED_DIR).parent / "data" / "rag_index" / "metadata.json"
-    chunks_by_doc: dict[str, int] = {}
-    if rag_index_meta.exists():
-        try:
-            import json as _json
-            meta = _json.loads(rag_index_meta.read_text(encoding="utf-8"))
-            for m in meta:
-                doc = m.get("document", "")
-                chunks_by_doc[doc] = chunks_by_doc.get(doc, 0) + 1
-        except Exception:
-            pass
-
-    refs = []
-    builtin_sources = [
-        ("CIM-10 FR 2026", CIM10_PDF, ".pdf", ["cim10", "cim10_alpha"]),
-        ("Guide Méthodologique MCO 2026", GUIDE_METHODO_PDF, ".pdf", ["guide_methodo"]),
-        ("CCAM 2025", CCAM_PDF, ".pdf", ["ccam"]),
-        ("Dictionnaire CIM-10", CIM10_DICT_PATH, ".json", []),
-        ("Suppléments CIM-10", CIM10_SUPPLEMENTS_PATH, ".json", []),
-        ("Dictionnaire CCAM", CCAM_DICT_PATH, ".json", []),
-    ]
-    for name, path, ext, doc_keys in builtin_sources:
-        size_mb = path.stat().st_size / (1024 * 1024) if path.exists() else 0
-        chunks = sum(chunks_by_doc.get(k, 0) for k in doc_keys)
-        refs.append({
-            "name": name,
-            "filename": path.name,
-            "extension": ext,
-            "size_mb": size_mb,
-            "chunks": chunks,
-            "exists": path.exists(),
-        })
-    return refs
-
-
-def load_ccam_dict() -> dict[str, dict]:
-    """Charge le dictionnaire CCAM pour les regroupements."""
-    if CCAM_DICT_PATH.exists():
-        try:
-            data = json.loads(CCAM_DICT_PATH.read_text(encoding="utf-8"))
-            return data
-        except Exception:
-            logger.warning("Impossible de charger le dictionnaire CCAM")
-    return {}
-
-
-def scan_dossiers() -> dict[str, list[dict]]:
-    """Scanne output/structured/ et retourne les fichiers groupés par sous-dossier.
-
-    Returns:
-        {"racine": [{name, path_rel, dossier}, ...], "sous-dossier": [...]}
-        Chaque groupe contient aussi une clé "stats" avec les compteurs agrégés.
-    """
-    groups: dict[str, list[dict]] = {}
-
-    for json_path in sorted(STRUCTURED_DIR.rglob("*.json")):
-        rel = json_path.relative_to(STRUCTURED_DIR)
-        parts = rel.parts
-
-        if len(parts) == 1:
-            group_name = "racine"
-        else:
-            group_name = str(Path(*parts[:-1]))
-
-        try:
-            data = json.loads(json_path.read_text(encoding="utf-8"))
-            dossier = DossierMedical.model_validate(data)
-        except Exception:
-            logger.warning("Impossible de charger %s", json_path)
-            continue
-
-        groups.setdefault(group_name, []).append({
-            "name": json_path.stem,
-            "path_rel": str(rel),
-            "dossier": dossier,
-        })
-
-    return groups
-
-
-def load_dossier(path_rel: str) -> DossierMedical:
-    """Charge un JSON et le désérialise. Vérifie contre le path traversal."""
-    safe_path = (STRUCTURED_DIR / path_rel).resolve()
-    if not safe_path.is_relative_to(STRUCTURED_DIR.resolve()):
-        abort(403)
-    if not safe_path.exists():
-        abort(404)
-
-    data = json.loads(safe_path.read_text(encoding="utf-8"))
-    return DossierMedical.model_validate(data)
-
-
-def fetch_ollama_models() -> list[str]:
-    """Appelle GET {OLLAMA_URL}/api/tags pour lister les modèles disponibles."""
-    try:
-        resp = requests.get(f"{cfg.OLLAMA_URL}/api/tags", timeout=5)
-        resp.raise_for_status()
-        models = resp.json().get("models", [])
-        return [m["name"] for m in models]
-    except Exception:
-        logger.warning("Impossible de contacter Ollama pour lister les modèles")
-        return []
-
-
-# ---------------------------------------------------------------------------
-# Filtres Jinja2
-# ---------------------------------------------------------------------------
-
-_CONFIDENCE_COLORS = {
-    "high": ("#16a34a", "#dcfce7"),
-    "medium": ("#ca8a04", "#fef9c3"),
-    "low": ("#dc2626", "#fee2e2"),
-}
-
-_CONFIDENCE_LABELS = {
-    "high": "Haute",
-    "medium": "Moyenne",
-    "low": "Basse",
-}
-
-
-def confidence_badge(value: str | None) -> Markup:
-    if not value:
-        return Markup("")
-    fg, bg = _CONFIDENCE_COLORS.get(value, ("#6b7280", "#f3f4f6"))
-    label = _CONFIDENCE_LABELS.get(value, value)
-    return Markup(
-        f'<span style="display:inline-block;padding:2px 8px;border-radius:9999px;'
-        f'font-size:0.75rem;font-weight:600;color:{fg};background:{bg}">'
-        f'{label}</span>'
-    )
-
-
-def confidence_label(value: str | None) -> str:
-    if not value:
-        return ""
-    return _CONFIDENCE_LABELS.get(value, value)
-
-
-_SEVERITY_STYLES = {
-    "severe": ("Sévère", "#dc2626", "#fee2e2"),
-    "modere": ("Modéré", "#92400e", "#fef3c7"),
-    "leger": ("Léger", "#065f46", "#d1fae5"),
-}
-
-_CMA_LEVEL_STYLES = {
-    1: ("1", "#6b7280", "#f3f4f6"),   # gris — pas CMA
-    2: ("2", "#065f46", "#d1fae5"),   # vert
-    3: ("3", "#92400e", "#fef3c7"),   # jaune/orange
-    4: ("4", "#dc2626", "#fee2e2"),   # rouge
-}
-
-
-def format_duration(seconds: float | None) -> str:
-    """Formate une durée en secondes vers un format lisible (ex: 2min 30s)."""
-    if seconds is None:
-        return ""
-    if seconds < 60:
-        return f"{seconds:.1f}s"
-    minutes = int(seconds // 60)
-    secs = int(seconds % 60)
-    if secs == 0:
-        return f"{minutes}min"
-    return f"{minutes}min {secs:02d}s"
-
-
-def severity_badge(value: str | None) -> Markup:
-    if not value or value not in _SEVERITY_STYLES:
-        return Markup("")
-    label, fg, bg = _SEVERITY_STYLES[value]
-    return Markup(
-        f'<span style="display:inline-block;padding:2px 8px;border-radius:9999px;'
-        f'font-size:0.75rem;font-weight:600;color:{fg};background:{bg}">'
-        f'{label}</span>'
-    )
-
-
-def cma_level_badge(value: int | None) -> Markup:
-    """Badge CMA niveau 1-4 avec couleurs graduées."""
-    if value is None or value < 1:
-        return Markup("")
-    level = min(value, 4)
-    label, fg, bg = _CMA_LEVEL_STYLES.get(level, _CMA_LEVEL_STYLES[1])
-    title = {1: "Pas CMA", 2: "CMA niveau 2", 3: "CMA niveau 3", 4: "CMA niveau 4"}.get(level, "")
-    return Markup(
-        f'<span title="{title}" style="display:inline-block;padding:2px 8px;border-radius:9999px;'
-        f'font-size:0.75rem;font-weight:600;color:{fg};background:{bg}">'
-        f'CMA {label}</span>'
-    )
-
-
-def format_dossier_name(name: str) -> str:
-    """Retourne le nom complet du dossier (ex: 1_23096332)."""
-    if name == "racine":
-        return "Non classés"
-    return name
-
-
-def format_doc_name(name: str) -> str:
-    """Transforme un nom de fichier JSON en nom lisible."""
-    n = name.lower()
-    if "fusionne" in n:
-        return "Fusionné"
-    if n.startswith("cro") or n.startswith("crh"):
-        return name.split("_")[0].upper()
-    if "trackare" in n:
-        return "Trackare"
-    if "anapath" in n:
-        return "Anapath"
-    return name
-
-
-def format_cpam_text(text: str | None) -> Markup:
-    """Convertit un texte CPAM (section) en HTML avec puces et paragraphes."""
-    if not text:
-        return Markup("")
-    from markupsafe import escape
-    lines = str(text).split("\n")
-    html_parts: list[str] = []
-    in_list = False
-    for line in lines:
-        stripped = line.strip()
-        if not stripped:
-            if in_list:
-                html_parts.append("</ul>")
-                in_list = False
-            html_parts.append("<br>")
-            continue
-        if stripped.startswith("- "):
-            if not in_list:
-                html_parts.append("<ul style='margin:0.3rem 0;padding-left:1.2rem;'>")
-                in_list = True
-            html_parts.append(f"<li>{escape(stripped[2:])}</li>")
-        else:
-            if in_list:
-                html_parts.append("</ul>")
-                in_list = False
-            html_parts.append(f"<p style='margin:0.2rem 0;'>{escape(stripped)}</p>")
-    if in_list:
-        html_parts.append("</ul>")
-    return Markup("\n".join(html_parts))
-
-
-# ---------------------------------------------------------------------------
-# App factory
-# ---------------------------------------------------------------------------
-
-def create_app() -> Flask:
-    app = Flask(__name__)
-
-    app.jinja_env.filters["confidence_badge"] = confidence_badge
-    app.jinja_env.filters["confidence_label"] = confidence_label
-    app.jinja_env.filters["severity_badge"] = severity_badge
-    app.jinja_env.filters["cma_level_badge"] = cma_level_badge
-    app.jinja_env.filters["format_duration"] = format_duration
-    app.jinja_env.filters["format_dossier_name"] = format_dossier_name
-    app.jinja_env.filters["format_doc_name"] = format_doc_name
-    app.jinja_env.filters["format_cpam_text"] = format_cpam_text
-
-    ccam_dict = load_ccam_dict()
-
-    @app.route("/")
-    def index():
-        groups = scan_dossiers()
-        group_stats = {name: compute_group_stats(items) for name, items in groups.items()}
-        return render_template("index.html", groups=groups, group_stats=group_stats)
-
-    @app.route("/dossier/<path:filepath>")
-    def detail(filepath: str):
-        dossier = load_dossier(filepath)
-        # Trouver les fichiers du même groupe pour la navigation
-        groups = scan_dossiers()
-        siblings = []
-        current_group = None
-        rel_parts = Path(filepath).parts
-        if len(rel_parts) > 1:
-            current_group = str(Path(*rel_parts[:-1]))
-            siblings = groups.get(current_group, [])
-        return render_template(
-            "detail.html",
-            dossier=dossier,
-            filepath=filepath,
-            ccam_dict=ccam_dict,
-            siblings=siblings,
-            current_group=current_group,
-        )
-
-    @app.route("/dashboard")
-    def dashboard():
-        groups = scan_dossiers()
-        stats = compute_dashboard_stats(groups)
-        return render_template("dashboard.html", stats=stats, groups=groups)
-
-    @app.route("/cpam")
-    def cpam_list():
-        groups = scan_dossiers()
-        controls = collect_cpam_controls(groups)
-        return render_template("cpam.html", controls=controls, total=len(controls), groups=groups)
-
-    @app.route("/admin/models", methods=["GET"])
-    def list_models():
-        models = fetch_ollama_models()
-        return jsonify({"models": models, "current": cfg.OLLAMA_MODEL})
-
-    @app.route("/admin/models", methods=["POST"])
-    def set_model():
-        data = request.get_json(silent=True) or {}
-        new_model = data.get("model", "").strip()
-        if not new_model:
-            return jsonify({"error": "Champ 'model' requis"}), 400
-        cfg.OLLAMA_MODEL = new_model
-        logger.info("Modèle Ollama changé : %s", new_model)
-        return jsonify({"ok": True, "model": cfg.OLLAMA_MODEL})
-
-    @app.route("/reprocess/<path:filepath>", methods=["POST"])
-    def reprocess(filepath: str):
-        """Relance le pipeline complet : process PDFs + fusion + GHM + CPAM."""
-        from ..main import process_pdf, write_outputs
-        from ..medical.ghm import estimate_ghm
-
-        dossier = load_dossier(filepath)
-        input_dir = Path(__file__).parent.parent.parent / "input"
-
-        # Collecter les PDFs sources (fusionné → source_files, simple → source_file)
-        source_names = []
-        if dossier.source_files:
-            source_names = list(dossier.source_files)
-        elif dossier.source_file:
-            source_names = [dossier.source_file]
-
-        if not source_names:
-            return jsonify({"error": "Fichier source introuvable"}), 400
-
-        # Résoudre les chemins PDF dans input/
-        pdf_paths = []
-        missing = []
-        for name in source_names:
-            found = None
-            for p in input_dir.rglob(name):
-                if p.is_file():
-                    found = p
-                    break
-            if found:
-                pdf_paths.append(found)
-            else:
-                missing.append(name)
-
-        if not pdf_paths:
-            return jsonify({"error": f"PDF sources introuvables : {', '.join(missing)}"}), 404
-
-        try:
-            # Déterminer le subdir depuis le premier PDF trouvé
-            subdir = None
-            if pdf_paths[0].parent != input_dir:
-                subdir = pdf_paths[0].parent.name
-
-            # 1. Traiter chaque PDF
-            group_dossiers = []
-            for pdf_path in pdf_paths:
-                pdf_results = process_pdf(pdf_path)
-                stem = pdf_path.stem.replace(" ", "_")
-                multi = len(pdf_results) > 1
-                for part_idx, (anonymized_text, new_dossier, report) in enumerate(pdf_results):
-                    part_stem = f"{stem}_part{part_idx + 1}" if multi else stem
-                    write_outputs(part_stem, anonymized_text, new_dossier, report, subdir=subdir)
-                    group_dossiers.append(new_dossier)
-
-            # 2. Fusion multi-PDF
-            merged = None
-            if len(group_dossiers) > 1 and subdir:
-                try:
-                    from ..medical.fusion import merge_dossiers
-                    merged = merge_dossiers(group_dossiers)
-                    try:
-                        ghm = estimate_ghm(merged)
-                        merged.ghm_estimation = ghm
-                    except Exception:
-                        logger.warning("Erreur estimation GHM fusionné", exc_info=True)
-                except Exception:
-                    logger.exception("Erreur fusion groupe %s", subdir)
-
-            # 3. Contrôle CPAM (auto-détection Excel)
-            target = merged if merged else (group_dossiers[-1] if group_dossiers else None)
-            if target and subdir:
-                cpam_dir = input_dir / "Control_cpam"
-                cpam_path = None
-                if cpam_dir.is_dir():
-                    xlsx_files = sorted(cpam_dir.glob("*.xlsx"))
-                    if xlsx_files:
-                        cpam_path = xlsx_files[0]
-                if cpam_path:
-                    try:
-                        from ..control.cpam_parser import parse_cpam_excel, match_dossier_ogc
-                        from ..control.cpam_response import generate_cpam_response
-                        cpam_data = parse_cpam_excel(str(cpam_path))
-                        if cpam_data:
-                            controles = match_dossier_ogc(subdir, cpam_data)
-                            if controles:
-                                logger.info("CPAM reprocess : %d contrôle(s) pour %s",
-                                            len(controles), subdir)
-                                for ctrl in controles:
-                                    text, response_data, sources = generate_cpam_response(target, ctrl)
-                                    ctrl.contre_argumentation = text
-                                    ctrl.response_data = response_data
-                                    ctrl.sources_reponse = sources
-                                target.controles_cpam = controles
-                    except Exception:
-                        logger.exception("Erreur CPAM reprocess pour %s", subdir)
-
-            # 4. Écrire le dossier fusionné (après CPAM)
-            if merged is not None and subdir:
-                struct_dir = STRUCTURED_DIR / subdir
-                struct_dir.mkdir(parents=True, exist_ok=True)
-                merged_path = struct_dir / f"{subdir}_fusionne_cim10.json"
-                merged_path.write_text(
-                    merged.model_dump_json(indent=2, exclude_none=True),
-                    encoding="utf-8",
-                )
-                logger.info("Dossier fusionné réécrit : %s", merged_path)
-
-            msg = f"Traitement terminé ({len(group_dossiers)} dossier(s)"
-            if merged:
-                msg += ", fusionné"
-            if target and getattr(target, "controles_cpam", None):
-                msg += f", {len(target.controles_cpam)} contrôle(s) CPAM"
-            if missing:
-                msg += f", {len(missing)} PDF(s) manquant(s)"
-            msg += ")"
-            return jsonify({"ok": True, "message": msg})
-        except Exception as e:
-            logger.exception("Erreur lors du retraitement")
-            return jsonify({"error": str(e)}), 500
-
-    # ------------------------------------------------------------------
-    # API texte source anonymisé
-    # ------------------------------------------------------------------
-
-    @app.route("/api/source-text/<path:dossier_id>")
-    def source_text(dossier_id: str):
-        """Retourne le contenu texte anonymisé de tous les fichiers d'un dossier."""
-        safe_dir = (ANONYMIZED_DIR / dossier_id).resolve()
-        if not safe_dir.is_relative_to(ANONYMIZED_DIR.resolve()):
-            abort(403)
-        if not safe_dir.is_dir():
-            abort(404)
-
-        result = {}
-        for txt_path in sorted(safe_dir.glob("*_anonymized.txt")):
-            try:
-                result[txt_path.name] = txt_path.read_text(encoding="utf-8")
-            except Exception:
-                logger.warning("Impossible de lire %s", txt_path)
-        return jsonify(result)
-
-    # ------------------------------------------------------------------
-    # API PDF caviardé
-    # ------------------------------------------------------------------
-
-    @app.route("/api/pdf/<path:dossier_id>/<filename>")
-    def serve_redacted_pdf(dossier_id: str, filename: str):
-        """Sert un PDF avec les données personnelles caviardées (rectangles noirs).
-
-        Query params optionnels :
-          - highlight : texte à surligner en jaune
-          - page : numéro de page (1-indexed) pour cibler le surlignage
-        """
-        from .pdf_redactor import load_entities_from_report, redact_pdf, highlight_text
-
-        # Sécurité path traversal
-        safe_dir = (INPUT_DIR / dossier_id).resolve()
-        if not safe_dir.is_relative_to(INPUT_DIR.resolve()):
-            abort(403)
-
-        pdf_path = safe_dir / filename
-        if not pdf_path.exists() or pdf_path.suffix.lower() != ".pdf":
-            abort(404)
-
-        # Charger les entités depuis le rapport d'anonymisation
-        stem = Path(filename).stem.replace(" ", "_")
-        report_path = REPORTS_DIR / dossier_id / f"{stem}_report.json"
-        entities = load_entities_from_report(report_path) if report_path.exists() else set()
-
-        pdf_bytes = redact_pdf(pdf_path, entities)
-
-        # Surlignage optionnel
-        highlight = request.args.get("highlight", "")
-        page_num = request.args.get("page", type=int)
-        if highlight:
-            pdf_bytes = highlight_text(pdf_bytes, highlight, page_num)
-
-        return Response(pdf_bytes, mimetype="application/pdf")
-
-    # ------------------------------------------------------------------
-    # Routes admin référentiels
-    # ------------------------------------------------------------------
-
-    ref_manager = ReferentielManager()
-
-    @app.route("/admin/referentiels")
-    def admin_referentiels():
-        refs = ref_manager.list_all()
-        builtin = get_builtin_referentiels()
-        return render_template("admin_referentiels.html", referentiels=refs, builtin_refs=builtin, max_size=UPLOAD_MAX_SIZE_MB)
-
-    @app.route("/admin/referentiels/upload", methods=["POST"])
-    def upload_referentiel():
-        if "file" not in request.files:
-            return jsonify({"error": "Aucun fichier envoyé"}), 400
-        f = request.files["file"]
-        if not f.filename:
-            return jsonify({"error": "Nom de fichier vide"}), 400
-
-        filename = secure_filename(f.filename)
-        try:
-            file_data = f.read()
-            ref = ref_manager.add_file(filename, file_data)
-            return jsonify({"ok": True, "referentiel": ref})
-        except ValueError as e:
-            return jsonify({"error": str(e)}), 400
-
-    @app.route("/admin/referentiels/<ref_id>/index", methods=["POST"])
-    def index_referentiel(ref_id: str):
-        try:
-            count = ref_manager.index_referentiel(ref_id)
-            return jsonify({"ok": True, "chunks": count})
-        except ValueError as e:
-            return jsonify({"error": str(e)}), 404
-        except Exception as e:
-            logger.exception("Erreur lors de l'indexation du référentiel %s", ref_id)
-            return jsonify({"error": str(e)}), 500
-
-    @app.route("/admin/referentiels/<ref_id>", methods=["DELETE"])
-    def delete_referentiel(ref_id: str):
-        if ref_manager.remove(ref_id):
-            return jsonify({"ok": True})
-        return jsonify({"error": "Référentiel introuvable"}), 404
-
-    @app.route("/admin/referentiels/rebuild-index", methods=["POST"])
-    def rebuild_index():
-        try:
-            from ..medical.rag_index import build_index
-            build_index(force=True)
-            # Réindexer tous les référentiels actifs
-            reindexed = 0
-            for ref in ref_manager.list_all():
-                if ref["status"] == "indexed":
-                    ref_manager.index_referentiel(ref["id"])
-                    reindexed += 1
-            return jsonify({"ok": True, "reindexed": reindexed})
-        except Exception as e:
-            logger.exception("Erreur lors du rebuild de l'index")
-            return jsonify({"error": str(e)}), 500
-
-    # ------------------------------------------------------------------
-    # Routes validation DIM
-    # ------------------------------------------------------------------
-
-    val_manager = ValidationManager()
-
-    @app.route("/validation")
-    def validation_list():
-        groups = scan_dossiers()
-        selection = val_manager.load_selection()
-        annotations = {a["dossier_id"]: a for a in val_manager.list_annotations()}
-
-        # Construire la liste enrichie
-        items = []
-        for dossier_id in selection:
-            annot = annotations.get(dossier_id, {})
-            # Trouver les données pipeline
-            parts = dossier_id.split("/")
-            group_name = parts[0] if parts else ""
-            group_items = groups.get(group_name, [])
-            pipeline = None
-            for gi in group_items:
-                if "fusionne" in gi["name"]:
-                    pipeline = gi
-                    break
-            if not pipeline and group_items:
-                pipeline = group_items[0]
-
-            d = pipeline["dossier"] if pipeline else None
-            items.append({
-                "dossier_id": dossier_id,
-                "group_name": group_name,
-                "dp_code": d.diagnostic_principal.cim10_suggestion if d and d.diagnostic_principal else "",
-                "dp_texte": d.diagnostic_principal.texte if d and d.diagnostic_principal else "",
-                "dp_confidence": d.diagnostic_principal.cim10_confidence if d and d.diagnostic_principal else "",
-                "nb_das": len(d.diagnostics_associes) if d else 0,
-                "has_cpam": bool(d and d.controles_cpam),
-                "statut": annot.get("statut", "non_commence"),
-                "validateur": annot.get("validateur", ""),
-                "date_validation": annot.get("date_validation", ""),
-            })
-
-        total = len(items)
-        valides = sum(1 for i in items if i["statut"] == "valide")
-        en_cours = sum(1 for i in items if i["statut"] == "en_cours")
-
-        return render_template(
-            "validation_list.html",
-            items=items,
-            total=total,
-            valides=valides,
-            en_cours=en_cours,
-            groups=groups,
-        )
-
-    @app.route("/validation/<path:dossier_id>")
-    def validation_detail(dossier_id: str):
-        groups = scan_dossiers()
-        # Charger l'annotation
-        annotation = val_manager.load_annotation(dossier_id)
-        if not annotation:
-            abort(404)
-
-        # Charger les données pipeline
-        parts = dossier_id.split("/")
-        group_name = parts[0] if parts else ""
-        group_items = groups.get(group_name, [])
-        pipeline = None
-        for gi in group_items:
-            if "fusionne" in gi["name"]:
-                pipeline = gi
-                break
-        if not pipeline and group_items:
-            pipeline = group_items[0]
-
-        dossier = pipeline["dossier"] if pipeline else None
-
-        # Navigation : dossier précédent / suivant
-        selection = val_manager.load_selection()
-        current_idx = selection.index(dossier_id) if dossier_id in selection else -1
-        prev_id = selection[current_idx - 1] if current_idx > 0 else None
-        next_id = selection[current_idx + 1] if current_idx < len(selection) - 1 else None
-
-        return render_template(
-            "validation_detail.html",
-            annotation=annotation,
-            dossier=dossier,
-            dossier_id=dossier_id,
-            group_name=group_name,
-            prev_id=prev_id,
-            next_id=next_id,
-            groups=groups,
-        )
-
-    @app.route("/api/validation/save", methods=["POST"])
-    def api_validation_save():
-        data = request.get_json(silent=True)
-        if not data or "dossier_id" not in data:
-            return jsonify({"error": "dossier_id requis"}), 400
-        dossier_id = data["dossier_id"]
-        # Vérifier que le dossier fait partie de la sélection
-        selection = val_manager.load_selection()
-        if selection and dossier_id not in selection:
-            return jsonify({"error": "Dossier non sélectionné pour validation"}), 403
-        try:
-            val_manager.save_annotation(dossier_id, data)
-            return jsonify({"ok": True})
-        except Exception as e:
-            logger.exception("Erreur sauvegarde annotation %s", dossier_id)
-            return jsonify({"error": str(e)}), 500
-
-    @app.route("/api/cim10/search")
-    def api_cim10_search():
-        from ..medical.cim10_dict import load_dict, normalize_text
-        q = request.args.get("q", "").strip()
-        if len(q) < 2:
-            return jsonify({"results": []})
-
-        cim10 = load_dict()
-        q_norm = normalize_text(q)
-        q_upper = q.upper().strip()
-
-        results = []
-        # Recherche par code exact d'abord
-        for code, label in cim10.items():
-            if code.upper().startswith(q_upper):
-                results.append({"code": code, "label": label})
-                if len(results) >= 20:
-                    break
-
-        # Puis recherche par texte normalisé
-        if len(results) < 20:
-            for code, label in cim10.items():
-                if any(r["code"] == code for r in results):
-                    continue
-                if q_norm in normalize_text(label):
-                    results.append({"code": code, "label": label})
-                    if len(results) >= 20:
-                        break
-
-        return jsonify({"results": results})
-
-    @app.route("/validation/metrics")
-    def validation_metrics():
-        groups = scan_dossiers()
-        metrics = val_manager.compute_metrics(groups)
-        selection = val_manager.load_selection()
-        return render_template(
-            "validation_metrics.html",
-            metrics=metrics,
-            total_selection=len(selection),
-            groups=groups,
-        )
-
-    return app
diff --git a/t2a_install_rag_cleanup/src/viewer/pdf_redactor.py b/t2a_install_rag_cleanup/src/viewer/pdf_redactor.py
deleted file mode 100644
index 864bd50..0000000
--- a/t2a_install_rag_cleanup/src/viewer/pdf_redactor.py
+++ /dev/null
@@ -1,154 +0,0 @@
-"""Caviardage PDF à la volée — remplace les entités NER par des rectangles noirs."""
-
-from __future__ import annotations
-
-import json
-import logging
-import time
-import unicodedata
-from pathlib import Path
-
-import fitz  # PyMuPDF
-
-logger = logging.getLogger(__name__)
-
-# Cache simple : (pdf_path, frozenset(entities)) -> (bytes, timestamp)
-_pdf_cache: dict[tuple[str, frozenset[str]], tuple[bytes, float]] = {}
-_CACHE_TTL_S = 300  # 5 minutes
-
-
-def load_entities_from_report(report_path: Path) -> set[str]:
-    """Extrait les entités uniques à caviarder depuis le rapport d'anonymisation."""
-    data = json.loads(report_path.read_text(encoding="utf-8"))
-    entities: set[str] = set()
-    for e in data.get("entities_found", []):
-        orig = e.get("original", "")
-        # Ignorer les pseudonymes et les chaînes trop courtes
-        if not orig.startswith("[") and len(orig) >= 2:
-            entities.add(orig)
-    return entities
-
-
-def redact_pdf(pdf_path: Path, entities: set[str]) -> bytes:
-    """Ouvre un PDF, caviarde toutes les occurrences des entités, retourne les bytes."""
-    cache_key = (str(pdf_path), frozenset(entities))
-
-    # Vérifier le cache
-    if cache_key in _pdf_cache:
-        cached_bytes, cached_time = _pdf_cache[cache_key]
-        if time.time() - cached_time < _CACHE_TTL_S:
-            return cached_bytes
-
-    doc = fitz.open(str(pdf_path))
-    try:
-        for page in doc:
-            for entity in entities:
-                rects = page.search_for(entity)
-                for rect in rects:
-                    page.add_redact_annot(rect, fill=(0, 0, 0))
-            page.apply_redactions()
-        pdf_bytes = doc.tobytes()
-    finally:
-        doc.close()
-
-    # Mettre en cache
-    _pdf_cache[cache_key] = (pdf_bytes, time.time())
-
-    # Nettoyer les entrées expirées
-    now = time.time()
-    expired = [k for k, (_, t) in _pdf_cache.items() if now - t >= _CACHE_TTL_S]
-    for k in expired:
-        _pdf_cache.pop(k, None)
-
-    return pdf_bytes
-
-
-def _strip_accents(s: str) -> str:
-    """Retire les accents d'une chaîne (é→e, è→e, etc.)."""
-    nfkd = unicodedata.normalize("NFD", s)
-    return "".join(c for c in nfkd if unicodedata.category(c) != "Mn")
-
-
-def _add_highlight(page, rects) -> None:
-    """Ajoute des annotations highlight jaunes sur une liste de rectangles."""
-    for rect in rects:
-        annot = page.add_highlight_annot(rect)
-        annot.set_colors(stroke=(1, 0.95, 0))  # jaune
-        annot.update()
-
-
-def highlight_text(pdf_bytes: bytes, text: str, page_num: int | None = None) -> bytes:
-    """Ajoute un surlignage jaune sur les occurrences d'un texte dans le PDF.
-
-    Appliqué après le caviardage (sur les bytes déjà caviardés).
-    Si page_num est fourni (1-indexed), cherche uniquement sur cette page.
-
-    Le texte reçu est typiquement le nom du diagnostic/item médical (court,
-    une seule ligne) — pas l'excerpt brut qui est multi-lignes et bruité.
-    """
-    if not text or len(text) < 3:
-        return pdf_bytes
-
-    # Nettoyer le texte : retirer les "..." ajoutés par extract_excerpt()
-    clean = text.strip()
-    if clean.startswith("..."):
-        clean = clean[3:]
-    if clean.endswith("..."):
-        clean = clean[:-3]
-    clean = clean.strip()
-    if len(clean) < 3:
-        return pdf_bytes
-
-    doc = fitz.open(stream=pdf_bytes, filetype="pdf")
-    try:
-        pages = [doc[page_num - 1]] if page_num and 0 < page_num <= len(doc) else list(doc)
-
-        single_line = " ".join(clean.split())
-        found = False
-
-        # Essai 1 : texte exact
-        for page in pages:
-            rects = page.search_for(single_line)
-            if rects:
-                _add_highlight(page, rects)
-                found = True
-                break
-
-        # Essai 2 : fallback accents — le texte du diagnostic peut manquer
-        # d'accents ("renale") alors que le PDF les a ("rénale")
-        if not found:
-            page_text_cache: dict[int, str] = {}
-            for page in pages:
-                page_text = page.get_text()
-                page_text_cache[page.number] = page_text
-                # Chercher dans le texte normalisé (sans accents) du PDF
-                page_text_stripped = _strip_accents(page_text)
-                search_stripped = _strip_accents(single_line)
-                idx = page_text_stripped.lower().find(search_stripped.lower())
-                if idx >= 0:
-                    # Extraire le texte original (avec accents) à cette position
-                    original_match = page_text[idx:idx + len(search_stripped)]
-                    # Chercher ce texte exact dans le PDF
-                    rects = page.search_for(original_match)
-                    if rects:
-                        _add_highlight(page, rects)
-                        found = True
-                        break
-
-        # Essai 3 : si multi-lignes, chercher ligne par ligne
-        if not found and "\n" in clean:
-            for line in clean.split("\n"):
-                line = line.strip()
-                if len(line) >= 10:
-                    for page in pages:
-                        rects = page.search_for(line)
-                        if rects:
-                            _add_highlight(page, rects)
-                            found = True
-                            break
-                    if found:
-                        break
-
-        return doc.tobytes()
-    finally:
-        doc.close()
diff --git a/t2a_install_rag_cleanup/src/viewer/referentiels.py b/t2a_install_rag_cleanup/src/viewer/referentiels.py
deleted file mode 100644
index 026f24b..0000000
--- a/t2a_install_rag_cleanup/src/viewer/referentiels.py
+++ /dev/null
@@ -1,160 +0,0 @@
-"""Gestionnaire de référentiels utilisateur pour le RAG."""
-
-from __future__ import annotations
-
-import json
-import logging
-import shutil
-import uuid
-from datetime import datetime
-from pathlib import Path
-
-from ..config import REFERENTIELS_DIR, ALLOWED_EXTENSIONS, UPLOAD_MAX_SIZE_MB
-
-logger = logging.getLogger(__name__)
-
-
-class ReferentielManager:
-    """CRUD pour les fichiers de référentiels utilisateur.
-
-    Stocke les fichiers dans REFERENTIELS_DIR avec un index.json
-    pour les métadonnées.
-    """
-
-    def __init__(self, referentiels_dir: Path | None = None):
-        self._dir = referentiels_dir or REFERENTIELS_DIR
-        self._dir.mkdir(parents=True, exist_ok=True)
-        self._index_path = self._dir / "index.json"
-        self._index: list[dict] = self._load_index()
-
-    def _load_index(self) -> list[dict]:
-        if self._index_path.exists():
-            try:
-                return json.loads(self._index_path.read_text(encoding="utf-8"))
-            except (json.JSONDecodeError, KeyError):
-                logger.warning("Index référentiels corrompu, réinitialisé")
-        return []
-
-    def _save_index(self) -> None:
-        self._index_path.write_text(
-            json.dumps(self._index, ensure_ascii=False, indent=2),
-            encoding="utf-8",
-        )
-
-    def list_all(self) -> list[dict]:
-        """Retourne la liste de tous les référentiels."""
-        return list(self._index)
-
-    def get(self, ref_id: str) -> dict | None:
-        """Retourne un référentiel par son ID."""
-        for ref in self._index:
-            if ref["id"] == ref_id:
-                return ref
-        return None
-
-    def add_file(self, filename: str, file_data: bytes) -> dict:
-        """Ajoute un fichier de référentiel.
-
-        Args:
-            filename: Nom original du fichier.
-            file_data: Contenu binaire du fichier.
-
-        Returns:
-            Métadonnées du référentiel créé.
-
-        Raises:
-            ValueError: Extension non autorisée ou taille dépassée.
-        """
-        ext = Path(filename).suffix.lower()
-        if ext not in ALLOWED_EXTENSIONS:
-            raise ValueError(f"Extension '{ext}' non autorisée. Extensions valides : {ALLOWED_EXTENSIONS}")
-
-        size_mb = len(file_data) / (1024 * 1024)
-        if size_mb > UPLOAD_MAX_SIZE_MB:
-            raise ValueError(f"Fichier trop volumineux ({size_mb:.1f} Mo > {UPLOAD_MAX_SIZE_MB} Mo)")
-
-        ref_id = uuid.uuid4().hex[:12]
-        safe_name = f"{ref_id}_{Path(filename).stem}{ext}"
-        file_path = self._dir / safe_name
-
-        file_path.write_bytes(file_data)
-
-        ref = {
-            "id": ref_id,
-            "filename": filename,
-            "stored_name": safe_name,
-            "extension": ext,
-            "size_bytes": len(file_data),
-            "date_added": datetime.now().isoformat(),
-            "status": "uploaded",
-            "chunks_count": 0,
-        }
-        self._index.append(ref)
-        self._save_index()
-
-        logger.info("Référentiel ajouté : %s (%s)", filename, ref_id)
-        return ref
-
-    def remove(self, ref_id: str) -> bool:
-        """Supprime un référentiel (fichier + métadonnées).
-
-        Returns:
-            True si trouvé et supprimé, False sinon.
-        """
-        ref = self.get(ref_id)
-        if not ref:
-            return False
-
-        file_path = self._dir / ref["stored_name"]
-        if file_path.exists():
-            file_path.unlink()
-
-        self._index = [r for r in self._index if r["id"] != ref_id]
-        self._save_index()
-
-        logger.info("Référentiel supprimé : %s (%s)", ref["filename"], ref_id)
-        return True
-
-    def index_referentiel(self, ref_id: str) -> int:
-        """Indexe un référentiel dans FAISS.
-
-        Args:
-            ref_id: ID du référentiel à indexer.
-
-        Returns:
-            Nombre de chunks indexés.
-
-        Raises:
-            ValueError: Référentiel introuvable.
-        """
-        ref = self.get(ref_id)
-        if not ref:
-            raise ValueError(f"Référentiel {ref_id} introuvable")
-
-        file_path = self._dir / ref["stored_name"]
-        if not file_path.exists():
-            raise ValueError(f"Fichier {ref['stored_name']} introuvable")
-
-        from ..medical.rag_index import chunk_user_file, add_chunks_to_index
-
-        # Heuristique simple : si le fichier ressemble à une procédure/méthodo,
-        # on l'isole pour éviter qu'il n'influence le codage.
-        fname = (ref.get("filename") or "").lower()
-        is_proc = any(k in fname for k in ("guide", "methodo", "méthodo", "procedure", "procédure", "pmsi", "atlh", "atih", "cpam"))
-        prefix = "proc" if is_proc else "ref"
-        doc_name = f"{prefix}:{ref['filename']}"
-        chunks = chunk_user_file(file_path, doc_name)
-
-        if not chunks:
-            ref["status"] = "empty"
-            ref["chunks_count"] = 0
-            self._save_index()
-            return 0
-
-        count = add_chunks_to_index(chunks)
-        ref["status"] = "indexed"
-        ref["chunks_count"] = count
-        self._save_index()
-
-        logger.info("Référentiel indexé : %s → %d chunks", ref["filename"], count)
-        return count
diff --git a/t2a_install_rag_cleanup/src/viewer/templates/admin_referentiels.html b/t2a_install_rag_cleanup/src/viewer/templates/admin_referentiels.html
deleted file mode 100644
index bdbce7c..0000000
--- a/t2a_install_rag_cleanup/src/viewer/templates/admin_referentiels.html
+++ /dev/null
@@ -1,266 +0,0 @@
-{% extends "base.html" %}
-
-{% block title %}Référentiels RAG{% endblock %}
-
-{% block sidebar %}
-<div class="group-title">Admin</div>
-<a href="/admin/referentiels" style="color:#60a5fa;font-weight:600;border-left-color:#3b82f6;">Référentiels RAG</a>
-<a href="/">Retour aux dossiers</a>
-{% endblock %}
-
-{% block content %}
-<h2>Référentiels RAG</h2>
-<p style="font-size:0.85rem;color:#64748b;margin-bottom:1.5rem;">
-  Ajoutez des documents de référence (PDF, CSV, Excel, TXT) pour enrichir la base de connaissances du RAG.
-</p>
-
-<!-- Zone upload -->
-<div class="card" style="margin-bottom:1.5rem;">
-  <h3>Ajouter un référentiel</h3>
-  <form id="upload-form" style="display:flex;gap:0.75rem;align-items:end;flex-wrap:wrap;margin-top:0.75rem;">
-    <div>
-      <label style="display:block;font-size:0.7rem;color:#64748b;text-transform:uppercase;letter-spacing:0.05em;font-weight:600;margin-bottom:0.25rem;">Fichier</label>
-      <input type="file" id="file-input" name="file" accept=".pdf,.csv,.xlsx,.xls,.txt"
-        style="font-size:0.85rem;padding:0.35rem;">
-    </div>
-    <button type="submit" id="upload-btn"
-      style="padding:0.5rem 1.25rem;border-radius:6px;border:none;background:#3b82f6;color:#fff;font-size:0.85rem;font-weight:600;cursor:pointer;">
-      Uploader
-    </button>
-    <span id="upload-status" style="font-size:0.8rem;"></span>
-  </form>
-  <p style="font-size:0.7rem;color:#94a3b8;margin-top:0.5rem;">
-    Extensions : .pdf, .csv, .xlsx, .xls, .txt — Max {{ max_size }} Mo
-  </p>
-</div>
-
-<!-- Référentiels intégrés (built-in) -->
-<div class="card" style="margin-bottom:1.5rem;">
-  <h3>Référentiels intégrés</h3>
-  <p style="font-size:0.8rem;color:#64748b;margin-bottom:0.75rem;">
-    Sources intégrées automatiquement dans l'index FAISS au build.
-  </p>
-  <table>
-    <thead>
-      <tr>
-        <th>Nom</th>
-        <th>Fichier</th>
-        <th>Type</th>
-        <th>Taille</th>
-        <th>Chunks</th>
-        <th>Statut</th>
-      </tr>
-    </thead>
-    <tbody>
-      {% for ref in builtin_refs %}
-      <tr>
-        <td style="font-weight:600;">{{ ref.name }}</td>
-        <td style="font-size:0.8rem;color:#64748b;"><code>{{ ref.filename }}</code></td>
-        <td><span class="badge" style="background:#f1f5f9;color:#334155;">{{ ref.extension }}</span></td>
-        <td>{{ "%.1f"|format(ref.size_mb) }} Mo</td>
-        <td>
-          {% if ref.chunks %}
-            <strong>{{ ref.chunks }}</strong>
-          {% else %}
-            <span style="color:#94a3b8;">—</span>
-          {% endif %}
-        </td>
-        <td>
-          {% if not ref.exists %}
-            <span class="badge" style="background:#fee2e2;color:#dc2626;">Fichier absent</span>
-          {% elif ref.chunks %}
-            <span class="badge" style="background:#dcfce7;color:#16a34a;">Indexé</span>
-          {% else %}
-            <span class="badge" style="background:#f1f5f9;color:#64748b;">Dictionnaire</span>
-          {% endif %}
-        </td>
-      </tr>
-      {% endfor %}
-    </tbody>
-  </table>
-</div>
-
-<!-- Tableau référentiels utilisateur -->
-<div class="card">
-  <div style="display:flex;justify-content:space-between;align-items:center;margin-bottom:0.75rem;">
-    <h3>Référentiels utilisateur</h3>
-    <button id="rebuild-btn"
-      style="padding:0.35rem 0.75rem;border-radius:6px;border:1px solid #e2e8f0;background:#fff;font-size:0.75rem;cursor:pointer;">
-      Rebuild complet
-    </button>
-  </div>
-
-  <table>
-    <thead>
-      <tr>
-        <th>Nom</th>
-        <th>Type</th>
-        <th>Taille</th>
-        <th>Date</th>
-        <th>Chunks</th>
-        <th>Statut</th>
-        <th>Actions</th>
-      </tr>
-    </thead>
-    <tbody id="ref-table">
-      {% for ref in referentiels %}
-      <tr id="row-{{ ref.id }}">
-        <td>{{ ref.filename }}</td>
-        <td><span class="badge" style="background:#f1f5f9;color:#334155;">{{ ref.extension }}</span></td>
-        <td>{{ "%.1f"|format(ref.size_bytes / 1024 / 1024) }} Mo</td>
-        <td style="font-size:0.8rem;">{{ ref.date_added[:10] }}</td>
-        <td>{{ ref.chunks_count }}</td>
-        <td>
-          {% if ref.status == 'indexed' %}
-            <span class="badge" style="background:#dcfce7;color:#16a34a;">Indexé</span>
-          {% elif ref.status == 'empty' %}
-            <span class="badge" style="background:#fef9c3;color:#ca8a04;">Vide</span>
-          {% else %}
-            <span class="badge" style="background:#f1f5f9;color:#64748b;">Uploadé</span>
-          {% endif %}
-        </td>
-        <td>
-          <button onclick="indexRef('{{ ref.id }}')" class="action-btn"
-            style="padding:2px 8px;border-radius:4px;border:1px solid #3b82f6;background:#eff6ff;color:#2563eb;font-size:0.75rem;cursor:pointer;margin-right:4px;">
-            Indexer
-          </button>
-          <button onclick="deleteRef('{{ ref.id }}')" class="action-btn"
-            style="padding:2px 8px;border-radius:4px;border:1px solid #fca5a5;background:#fef2f2;color:#dc2626;font-size:0.75rem;cursor:pointer;">
-            Supprimer
-          </button>
-        </td>
-      </tr>
-      {% endfor %}
-      {% if not referentiels %}
-      <tr id="empty-row">
-        <td colspan="7" style="text-align:center;color:#94a3b8;padding:2rem;">Aucun référentiel</td>
-      </tr>
-      {% endif %}
-    </tbody>
-  </table>
-</div>
-
-<div id="global-status" style="margin-top:1rem;font-size:0.8rem;"></div>
-{% endblock %}
-
-{% block scripts %}
-<script>
-(function() {
-  const uploadForm = document.getElementById('upload-form');
-  const fileInput = document.getElementById('file-input');
-  const uploadBtn = document.getElementById('upload-btn');
-  const uploadStatus = document.getElementById('upload-status');
-  const globalStatus = document.getElementById('global-status');
-  const rebuildBtn = document.getElementById('rebuild-btn');
-
-  uploadForm.addEventListener('submit', function(e) {
-    e.preventDefault();
-    const file = fileInput.files[0];
-    if (!file) { uploadStatus.textContent = 'Sélectionnez un fichier'; return; }
-
-    const fd = new FormData();
-    fd.append('file', file);
-
-    uploadBtn.disabled = true;
-    uploadBtn.innerHTML = '<span class="spinner"></span>';
-    uploadStatus.textContent = '';
-
-    fetch('/admin/referentiels/upload', { method: 'POST', body: fd })
-      .then(r => r.json())
-      .then(d => {
-        uploadBtn.disabled = false;
-        uploadBtn.textContent = 'Uploader';
-        if (d.ok) {
-          uploadStatus.style.color = '#16a34a';
-          uploadStatus.textContent = 'Uploadé';
-          setTimeout(() => location.reload(), 800);
-        } else {
-          uploadStatus.style.color = '#dc2626';
-          uploadStatus.textContent = d.error || 'Erreur';
-        }
-      })
-      .catch(() => {
-        uploadBtn.disabled = false;
-        uploadBtn.textContent = 'Uploader';
-        uploadStatus.style.color = '#dc2626';
-        uploadStatus.textContent = 'Erreur réseau';
-      });
-  });
-
-  window.indexRef = function(id) {
-    const btn = event.target;
-    btn.disabled = true;
-    btn.innerHTML = '<span class="spinner" style="border-color:rgba(37,99,235,0.3);border-top-color:#2563eb;width:10px;height:10px;"></span>';
-
-    fetch('/admin/referentiels/' + id + '/index', { method: 'POST' })
-      .then(r => r.json())
-      .then(d => {
-        if (d.ok) {
-          globalStatus.style.color = '#16a34a';
-          globalStatus.textContent = d.chunks + ' chunks indexés';
-          setTimeout(() => location.reload(), 800);
-        } else {
-          btn.disabled = false;
-          btn.textContent = 'Indexer';
-          globalStatus.style.color = '#dc2626';
-          globalStatus.textContent = d.error || 'Erreur';
-        }
-      })
-      .catch(() => {
-        btn.disabled = false;
-        btn.textContent = 'Indexer';
-        globalStatus.style.color = '#dc2626';
-        globalStatus.textContent = 'Erreur réseau';
-      });
-  };
-
-  window.deleteRef = function(id) {
-    if (!confirm('Supprimer ce référentiel ?')) return;
-
-    fetch('/admin/referentiels/' + id, { method: 'DELETE' })
-      .then(r => r.json())
-      .then(d => {
-        if (d.ok) {
-          const row = document.getElementById('row-' + id);
-          if (row) row.remove();
-          globalStatus.style.color = '#16a34a';
-          globalStatus.textContent = 'Supprimé';
-        } else {
-          globalStatus.style.color = '#dc2626';
-          globalStatus.textContent = d.error || 'Erreur';
-        }
-      })
-      .catch(() => {
-        globalStatus.style.color = '#dc2626';
-        globalStatus.textContent = 'Erreur réseau';
-      });
-  };
-
-  rebuildBtn.addEventListener('click', function() {
-    if (!confirm('Reconstruire l\'index FAISS complet ? Cela peut prendre plusieurs minutes.')) return;
-    rebuildBtn.disabled = true;
-    rebuildBtn.innerHTML = '<span class="spinner" style="border-color:rgba(0,0,0,0.2);border-top-color:#333;width:10px;height:10px;"></span> Rebuild…';
-
-    fetch('/admin/referentiels/rebuild-index', { method: 'POST' })
-      .then(r => r.json())
-      .then(d => {
-        rebuildBtn.disabled = false;
-        rebuildBtn.textContent = 'Rebuild complet';
-        if (d.ok) {
-          globalStatus.style.color = '#16a34a';
-          globalStatus.textContent = 'Index reconstruit (' + d.reindexed + ' référentiels réindexés)';
-        } else {
-          globalStatus.style.color = '#dc2626';
-          globalStatus.textContent = d.error || 'Erreur';
-        }
-      })
-      .catch(() => {
-        rebuildBtn.disabled = false;
-        rebuildBtn.textContent = 'Rebuild complet';
-        globalStatus.style.color = '#dc2626';
-        globalStatus.textContent = 'Erreur réseau';
-      });
-  });
-})();
-</script>
-{% endblock %}
diff --git a/t2a_install_rag_cleanup/src/viewer/templates/base.html b/t2a_install_rag_cleanup/src/viewer/templates/base.html
deleted file mode 100644
index 5b690e2..0000000
--- a/t2a_install_rag_cleanup/src/viewer/templates/base.html
+++ /dev/null
@@ -1,481 +0,0 @@
-<!DOCTYPE html>
-<html lang="fr">
-<head>
-<meta charset="utf-8">
-<meta name="viewport" content="width=device-width, initial-scale=1">
-<title>{% block title %}Viewer CIM-10{% endblock %} — T2A</title>
-<style>
-  *, *::before, *::after { box-sizing: border-box; margin: 0; padding: 0; }
-  body {
-    font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, Helvetica, Arial, sans-serif;
-    background: #f1f5f9;
-    color: #1e293b;
-    display: flex;
-    min-height: 100vh;
-  }
-
-  /* Sidebar */
-  .sidebar {
-    width: 280px;
-    min-width: 280px;
-    background: #1e293b;
-    color: #e2e8f0;
-    display: flex;
-    flex-direction: column;
-    position: fixed;
-    top: 0;
-    left: 0;
-    bottom: 0;
-    overflow-y: auto;
-  }
-  .sidebar-header {
-    padding: 1.25rem 1rem;
-    border-bottom: 1px solid #334155;
-  }
-  .sidebar-header h1 {
-    font-size: 1.1rem;
-    color: #f1f5f9;
-    font-weight: 700;
-  }
-  .sidebar-header p {
-    font-size: 0.75rem;
-    color: #94a3b8;
-    margin-top: 0.25rem;
-  }
-  .sidebar-nav {
-    flex: 1;
-    padding: 0.75rem 0;
-    overflow-y: auto;
-  }
-  .sidebar-nav .group-title {
-    padding: 0.5rem 1rem 0.25rem;
-    font-size: 0.65rem;
-    text-transform: uppercase;
-    letter-spacing: 0.08em;
-    color: #94a3b8;
-    font-weight: 700;
-  }
-  .sidebar-nav a {
-    display: block;
-    padding: 0.4rem 1rem;
-    color: #cbd5e1;
-    text-decoration: none;
-    font-size: 0.8rem;
-    font-weight: 600;
-    border-left: 3px solid transparent;
-    transition: all 0.15s;
-    white-space: nowrap;
-    overflow: hidden;
-    text-overflow: ellipsis;
-  }
-  .sidebar-nav a:hover {
-    color: #f8fafc;
-    background: #334155;
-    border-left-color: #3b82f6;
-  }
-  .sidebar-nav a.sidebar-fusionne {
-    color: #60a5fa;
-    font-weight: 700;
-  }
-
-  /* Search */
-  .sidebar-search {
-    padding: 0.75rem 1rem 0.5rem;
-    border-bottom: 1px solid #334155;
-  }
-  .sidebar-search input {
-    width: 100%;
-    padding: 0.45rem 0.6rem;
-    border-radius: 6px;
-    border: 1px solid #475569;
-    background: #0f172a;
-    color: #e2e8f0;
-    font-size: 0.8rem;
-    outline: none;
-    transition: border-color 0.15s;
-  }
-  .sidebar-search input::placeholder { color: #64748b; }
-  .sidebar-search input:focus { border-color: #3b82f6; }
-
-  /* Admin section */
-  .sidebar-admin {
-    padding: 1rem;
-    border-top: 1px solid #334155;
-    font-size: 0.8rem;
-  }
-  .sidebar-admin label {
-    display: block;
-    margin-bottom: 0.35rem;
-    font-weight: 600;
-    color: #cbd5e1;
-    font-size: 0.7rem;
-    text-transform: uppercase;
-    letter-spacing: 0.05em;
-  }
-  .sidebar-admin select {
-    width: 100%;
-    padding: 0.4rem;
-    border-radius: 6px;
-    border: 1px solid #475569;
-    background: #0f172a;
-    color: #e2e8f0;
-    font-size: 0.8rem;
-    margin-bottom: 0.5rem;
-  }
-  .sidebar-admin button {
-    width: 100%;
-    padding: 0.45rem;
-    border-radius: 6px;
-    border: none;
-    background: #3b82f6;
-    color: #fff;
-    font-size: 0.8rem;
-    font-weight: 600;
-    cursor: pointer;
-    transition: background 0.15s;
-  }
-  .sidebar-admin button:hover { background: #2563eb; }
-  .sidebar-admin .status-msg {
-    margin-top: 0.35rem;
-    font-size: 0.7rem;
-    min-height: 1rem;
-  }
-
-  /* Main content */
-  .main {
-    margin-left: 280px;
-    flex: 1;
-    padding: 2rem;
-  }
-
-  /* Utilities */
-  .card {
-    background: #fff;
-    border-radius: 10px;
-    box-shadow: 0 1px 3px rgba(0,0,0,0.08);
-    padding: 1.25rem;
-    margin-bottom: 1rem;
-  }
-  .badge {
-    display: inline-block;
-    padding: 2px 8px;
-    border-radius: 9999px;
-    font-size: 0.7rem;
-    font-weight: 600;
-  }
-  table { width: 100%; border-collapse: collapse; font-size: 0.85rem; }
-  th, td { text-align: left; padding: 0.5rem 0.75rem; border-bottom: 1px solid #e2e8f0; }
-  th { font-weight: 600; color: #475569; font-size: 0.75rem; text-transform: uppercase; letter-spacing: 0.05em; }
-  tr.anomalie { background: #fef2f2; }
-  details { margin-top: 0.35rem; }
-  details summary {
-    cursor: pointer;
-    font-size: 0.75rem;
-    color: #3b82f6;
-  }
-  details pre {
-    font-size: 0.75rem;
-    background: #f8fafc;
-    padding: 0.5rem;
-    border-radius: 6px;
-    margin-top: 0.25rem;
-    white-space: pre-wrap;
-    word-break: break-word;
-  }
-  h2 { font-size: 1.1rem; margin-bottom: 0.75rem; color: #0f172a; }
-  h3 { font-size: 0.95rem; margin-bottom: 0.5rem; color: #334155; }
-  .info-grid {
-    display: grid;
-    grid-template-columns: repeat(auto-fill, minmax(180px, 1fr));
-    gap: 0.75rem;
-  }
-  .info-item label { display: block; font-size: 0.7rem; color: #64748b; text-transform: uppercase; letter-spacing: 0.05em; font-weight: 600; }
-  .info-item span { font-size: 0.9rem; }
-  .section { margin-bottom: 1.5rem; }
-  ul.bullet { list-style: disc; padding-left: 1.5rem; font-size: 0.85rem; }
-  ul.bullet li { margin-bottom: 0.25rem; }
-  a.back { font-size: 0.85rem; color: #3b82f6; text-decoration: none; }
-  a.back:hover { text-decoration: underline; }
-
-  /* Badges compteurs */
-  .badge-count {
-    display: inline-flex;
-    align-items: center;
-    gap: 0.2rem;
-    padding: 2px 8px;
-    border-radius: 9999px;
-    font-size: 0.7rem;
-    font-weight: 600;
-  }
-  .badge-das { background: #dbeafe; color: #1d4ed8; }
-  .badge-actes { background: #e0e7ff; color: #3730a3; }
-  .badge-alertes { background: #ffedd5; color: #c2410c; }
-  .badge-cma { background: #fee2e2; color: #dc2626; }
-  .badge-regroup { background: #f0fdf4; color: #166534; font-size: 0.65rem; }
-  .badge-fusion { background: #ede9fe; color: #5b21b6; }
-
-  /* Alertes non-cumul (rouge) vs standard (orange) */
-  .alerte-noncumul { color: #dc2626; font-weight: 600; }
-  .alerte-standard { color: #9a3412; }
-
-  /* Source files */
-  .source-files { font-size: 0.8rem; color: #64748b; margin-top: 0.5rem; }
-  .source-files code { background: #f1f5f9; padding: 1px 4px; border-radius: 3px; }
-
-  /* Spinner animation */
-  @keyframes spin { to { transform: rotate(360deg); } }
-  .spinner {
-    display: inline-block;
-    width: 14px;
-    height: 14px;
-    border: 2px solid rgba(255,255,255,0.3);
-    border-top-color: #fff;
-    border-radius: 50%;
-    animation: spin 0.8s linear infinite;
-  }
-
-  /* Source tracking badges */
-  .src-btn {
-    display: inline-block;
-    padding: 1px 6px;
-    border-radius: 9999px;
-    font-size: 0.65rem;
-    font-weight: 600;
-    background: #e0f2fe;
-    color: #0369a1;
-    border: 1px solid #bae6fd;
-    cursor: pointer;
-    margin-left: 0.3rem;
-    vertical-align: middle;
-    transition: background 0.15s;
-  }
-  .src-btn:hover { background: #bae6fd; }
-
-  /* Source modal */
-  #source-modal {
-    display: none;
-    position: fixed;
-    inset: 0;
-    z-index: 9999;
-    background: rgba(0,0,0,0.5);
-    padding: 2rem;
-  }
-  #source-modal-inner {
-    background: #fff;
-    border-radius: 12px;
-    max-width: 95vw;
-    width: 95vw;
-    margin: 0 auto;
-    max-height: 95vh;
-    height: 95vh;
-    display: flex;
-    flex-direction: column;
-    box-shadow: 0 8px 30px rgba(0,0,0,0.2);
-  }
-  #source-modal-inner.source-modal-text {
-    max-width: 900px;
-    width: auto;
-    max-height: 90vh;
-    height: auto;
-  }
-  #source-header {
-    padding: 1rem 1.25rem;
-    border-bottom: 1px solid #e2e8f0;
-    font-weight: 700;
-    font-size: 0.9rem;
-    color: #0f172a;
-    display: flex;
-    justify-content: space-between;
-    align-items: center;
-  }
-  #source-content {
-    flex: 1;
-    overflow-y: auto;
-    padding: 1.25rem;
-    font-size: 0.85rem;
-    line-height: 1.6;
-    white-space: pre-wrap;
-    word-break: break-word;
-    color: #334155;
-  }
-  #source-content.source-content-pdf {
-    padding: 0;
-    white-space: normal;
-    overflow: hidden;
-  }
-  #source-content mark {
-    background: #fef08a;
-    padding: 2px 0;
-    border-radius: 2px;
-  }
-  #source-close-btn {
-    padding: 0.4rem 1rem;
-    background: #64748b;
-    color: #fff;
-    border: none;
-    border-radius: 6px;
-    cursor: pointer;
-    font-size: 0.8rem;
-    font-weight: 600;
-  }
-  #source-close-btn:hover { background: #475569; }
-
-  /* PDF file picker buttons */
-  .src-file-btn {
-    display: inline-block;
-    padding: 0.35rem 0.75rem;
-    border-radius: 6px;
-    border: 1px solid #cbd5e1;
-    background: #f8fafc;
-    color: #1e293b;
-    font-size: 0.8rem;
-    font-weight: 600;
-    cursor: pointer;
-    transition: all 0.15s;
-  }
-  .src-file-btn:hover { background: #e2e8f0; border-color: #3b82f6; }
-  .src-file-btn.active { background: #3b82f6; color: #fff; border-color: #3b82f6; }
-</style>
-</head>
-<body>
-
-<!-- Sidebar -->
-<aside class="sidebar">
-  <div class="sidebar-header">
-    <h1>T2A Viewer</h1>
-    <p>Visualisation CIM-10</p>
-  </div>
-  <div class="sidebar-search">
-    <input type="text" id="sidebar-search" placeholder="Rechercher un dossier…" autocomplete="off">
-  </div>
-  <nav class="sidebar-nav" id="sidebar-nav">
-    {% block sidebar %}{% endblock %}
-  </nav>
-  <div class="sidebar-admin" style="border-top:1px solid #334155;padding:0.5rem 1rem;">
-    <a href="/dashboard" style="display:block;color:#cbd5e1;text-decoration:none;font-size:0.8rem;font-weight:600;padding:0.35rem 0;transition:color 0.15s;"
-       onmouseover="this.style.color='#f8fafc'" onmouseout="this.style.color='#cbd5e1'">
-      Dashboard
-    </a>
-    <a href="/cpam" style="display:block;color:#cbd5e1;text-decoration:none;font-size:0.8rem;font-weight:600;padding:0.35rem 0;transition:color 0.15s;"
-       onmouseover="this.style.color='#f8fafc'" onmouseout="this.style.color='#cbd5e1'">
-      Contrôles CPAM
-    </a>
-    <a href="/admin/referentiels" style="display:block;color:#cbd5e1;text-decoration:none;font-size:0.8rem;font-weight:600;padding:0.35rem 0;transition:color 0.15s;"
-       onmouseover="this.style.color='#f8fafc'" onmouseout="this.style.color='#cbd5e1'">
-      Référentiels RAG
-    </a>
-    <a href="/validation" style="display:block;color:#fbbf24;text-decoration:none;font-size:0.8rem;font-weight:600;padding:0.35rem 0;transition:color 0.15s;"
-       onmouseover="this.style.color='#fde68a'" onmouseout="this.style.color='#fbbf24'">
-      Validation DIM
-    </a>
-  </div>
-  <div class="sidebar-admin">
-    <label for="model-select">Modèle Ollama</label>
-    <select id="model-select"><option>Chargement…</option></select>
-    <button id="model-apply">Appliquer</button>
-    <div class="status-msg" id="model-status"></div>
-  </div>
-</aside>
-
-<!-- Main -->
-<div class="main">
-  {% block content %}{% endblock %}
-</div>
-
-<script>
-(function() {
-  const sel = document.getElementById('model-select');
-  const btn = document.getElementById('model-apply');
-  const status = document.getElementById('model-status');
-
-  function loadModels() {
-    fetch('/admin/models')
-      .then(r => r.json())
-      .then(d => {
-        sel.innerHTML = '';
-        if (d.models && d.models.length) {
-          d.models.forEach(m => {
-            const opt = document.createElement('option');
-            opt.value = m;
-            opt.textContent = m;
-            if (m === d.current) opt.selected = true;
-            sel.appendChild(opt);
-          });
-        } else {
-          sel.innerHTML = '<option>Aucun modèle</option>';
-        }
-      })
-      .catch(() => { sel.innerHTML = '<option>Erreur</option>'; });
-  }
-
-  btn.addEventListener('click', function() {
-    const model = sel.value;
-    if (!model || model === 'Aucun modèle' || model === 'Erreur') return;
-    status.textContent = '…';
-    status.style.color = '#94a3b8';
-    fetch('/admin/models', {
-      method: 'POST',
-      headers: {'Content-Type': 'application/json'},
-      body: JSON.stringify({model: model})
-    })
-    .then(r => r.json())
-    .then(d => {
-      if (d.ok) {
-        status.textContent = 'Modèle appliqué';
-        status.style.color = '#16a34a';
-      } else {
-        status.textContent = d.error || 'Erreur';
-        status.style.color = '#dc2626';
-      }
-    })
-    .catch(() => {
-      status.textContent = 'Erreur réseau';
-      status.style.color = '#dc2626';
-    });
-  });
-
-  loadModels();
-})();
-
-// Sidebar search filter
-(function() {
-  const input = document.getElementById('sidebar-search');
-  const nav = document.getElementById('sidebar-nav');
-  if (!input || !nav) return;
-
-  input.addEventListener('input', function() {
-    const q = this.value.toLowerCase().trim();
-    const groups = nav.querySelectorAll('.group-title');
-
-    groups.forEach(function(groupEl) {
-      // Collect all sibling links until next group-title
-      const links = [];
-      let next = groupEl.nextElementSibling;
-      while (next && !next.classList.contains('group-title')) {
-        if (next.tagName === 'A') links.push(next);
-        next = next.nextElementSibling;
-      }
-
-      if (!q) {
-        groupEl.style.display = '';
-        links.forEach(function(a) { a.style.display = ''; });
-        return;
-      }
-
-      const groupMatch = groupEl.textContent.toLowerCase().includes(q);
-      let anyLinkMatch = false;
-
-      links.forEach(function(a) {
-        const match = groupMatch || a.textContent.toLowerCase().includes(q);
-        a.style.display = match ? '' : 'none';
-        if (match) anyLinkMatch = true;
-      });
-
-      groupEl.style.display = (groupMatch || anyLinkMatch) ? '' : 'none';
-    });
-  });
-})();
-</script>
-{% block scripts %}{% endblock %}
-</body>
-</html>
diff --git a/t2a_install_rag_cleanup/src/viewer/templates/cpam.html b/t2a_install_rag_cleanup/src/viewer/templates/cpam.html
deleted file mode 100644
index 1416929..0000000
--- a/t2a_install_rag_cleanup/src/viewer/templates/cpam.html
+++ /dev/null
@@ -1,88 +0,0 @@
-{% extends "base.html" %}
-{% block title %}Contrôles CPAM{% endblock %}
-
-{% block sidebar %}
-{% for group_name, items in groups.items() %}
-  <div class="group-title">{{ group_name | format_dossier_name }}</div>
-  {% for item in items %}
-    {% if 'fusionne' in item.name %}
-      <a href="/dossier/{{ item.path_rel }}" class="sidebar-fusionne">&#9733; Fusionné</a>
-    {% else %}
-      <a href="/dossier/{{ item.path_rel }}">{{ item.name | format_doc_name }}</a>
-    {% endif %}
-  {% endfor %}
-{% endfor %}
-{% endblock %}
-
-{% block content %}
-<a class="back" href="/">&larr; Retour à la liste</a>
-
-<div style="display:flex;align-items:center;gap:0.75rem;margin-top:1rem;margin-bottom:1rem;">
-  <h2 style="margin:0;">Contrôles CPAM</h2>
-  <span class="badge" style="background:#fef3c7;color:#b45309;font-size:0.85rem;padding:4px 12px;">{{ total }}</span>
-</div>
-
-{% if not controls %}
-<div class="card">
-  <p>Aucun contrôle CPAM trouvé dans les dossiers.</p>
-</div>
-{% else %}
-<div class="card" style="overflow-x:auto;">
-  <table>
-    <thead>
-      <tr>
-        <th>Dossier</th>
-        <th>OGC</th>
-        <th>Titre</th>
-        <th>Décision</th>
-        <th>Codes contestés</th>
-        <th>Contre-argumentation</th>
-      </tr>
-    </thead>
-    <tbody>
-      {% for c in controls %}
-      <tr>
-        <td>
-          <a href="/dossier/{{ c.filepath }}" style="color:#3b82f6;text-decoration:none;font-weight:600;">
-            {{ c.group_name | format_dossier_name }}
-          </a>
-          {% if c.dp_code %}
-          <div style="font-size:0.7rem;color:#64748b;margin-top:2px;">DP: {{ c.dp_code }}</div>
-          {% endif %}
-        </td>
-        <td style="font-weight:600;">{{ c.ctrl.numero_ogc }}</td>
-        <td style="max-width:200px;">{{ c.ctrl.titre }}</td>
-        <td>
-          {% if 'retient' in c.ctrl.decision_ucr|lower %}
-            <span class="badge" style="background:#d1fae5;color:#065f46;">{{ c.ctrl.decision_ucr }}</span>
-          {% elif 'confirme' in c.ctrl.decision_ucr|lower %}
-            <span class="badge" style="background:#fee2e2;color:#dc2626;">{{ c.ctrl.decision_ucr }}</span>
-          {% else %}
-            <span class="badge" style="background:#e0e7ff;color:#3730a3;">{{ c.ctrl.decision_ucr }}</span>
-          {% endif %}
-        </td>
-        <td>
-          <div style="display:flex;gap:0.3rem;flex-wrap:wrap;">
-            {% if c.ctrl.dp_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;font-size:0.65rem;">DP: {{ c.ctrl.dp_ucr }}</span>{% endif %}
-            {% if c.ctrl.da_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;font-size:0.65rem;">DA: {{ c.ctrl.da_ucr }}</span>{% endif %}
-            {% if c.ctrl.dr_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;font-size:0.65rem;">DR: {{ c.ctrl.dr_ucr }}</span>{% endif %}
-            {% if c.ctrl.actes_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;font-size:0.65rem;">Actes: {{ c.ctrl.actes_ucr }}</span>{% endif %}
-          </div>
-        </td>
-        <td style="max-width:300px;">
-          {% if c.ctrl.contre_argumentation %}
-          <details>
-            <summary>{{ c.ctrl.contre_argumentation[:80] }}{% if c.ctrl.contre_argumentation|length > 80 %}…{% endif %}</summary>
-            <pre>{{ c.ctrl.contre_argumentation }}</pre>
-          </details>
-          {% else %}
-            <span style="color:#94a3b8;font-size:0.8rem;">—</span>
-          {% endif %}
-        </td>
-      </tr>
-      {% endfor %}
-    </tbody>
-  </table>
-</div>
-{% endif %}
-{% endblock %}
diff --git a/t2a_install_rag_cleanup/src/viewer/templates/dashboard.html b/t2a_install_rag_cleanup/src/viewer/templates/dashboard.html
deleted file mode 100644
index c80c729..0000000
--- a/t2a_install_rag_cleanup/src/viewer/templates/dashboard.html
+++ /dev/null
@@ -1,145 +0,0 @@
-{% extends "base.html" %}
-{% block title %}Dashboard{% endblock %}
-
-{% block sidebar %}
-{% for group_name, items in groups.items() %}
-  <div class="group-title">{{ group_name | format_dossier_name }}</div>
-  {% for item in items %}
-    {% if 'fusionne' in item.name %}
-      <a href="/dossier/{{ item.path_rel }}" class="sidebar-fusionne">&#9733; Fusionné</a>
-    {% else %}
-      <a href="/dossier/{{ item.path_rel }}">{{ item.name | format_doc_name }}</a>
-    {% endif %}
-  {% endfor %}
-{% endfor %}
-{% endblock %}
-
-{% block content %}
-<a class="back" href="/">&larr; Retour à la liste</a>
-<h2 style="margin-top:1rem;">Dashboard</h2>
-
-{# ---- Cartes métriques ---- #}
-<div style="display:grid;grid-template-columns:repeat(4,1fr);gap:0.75rem;margin-bottom:1.5rem;">
-  {% set cards = [
-    ("Dossiers", stats.total_dossiers, "#3b82f6", "#dbeafe"),
-    ("Fichiers", stats.total_fichiers, "#6366f1", "#e0e7ff"),
-    ("DAS total", stats.total_das, "#1d4ed8", "#dbeafe"),
-    ("Actes total", stats.total_actes, "#3730a3", "#e0e7ff"),
-    ("Alertes", stats.total_alertes, "#c2410c", "#ffedd5"),
-    ("CMA", stats.total_cma, "#dc2626", "#fee2e2"),
-    ("Contrôles CPAM", stats.total_cpam, "#b45309", "#fef3c7"),
-    ("Temps total", stats.processing_time_total | format_duration, "#065f46", "#d1fae5"),
-  ] %}
-  {% for label, value, fg, bg in cards %}
-  <div class="card" style="text-align:center;padding:1rem;">
-    <div style="font-size:0.7rem;text-transform:uppercase;letter-spacing:0.05em;color:#64748b;font-weight:600;">{{ label }}</div>
-    <div style="font-size:1.5rem;font-weight:700;color:{{ fg }};margin-top:0.25rem;">{{ value }}</div>
-  </div>
-  {% endfor %}
-</div>
-
-{# ---- Temps moyen ---- #}
-{% if stats.processing_time_avg %}
-<div class="card" style="margin-bottom:1rem;">
-  <div style="font-size:0.8rem;color:#64748b;">Temps moyen par fichier : <strong style="color:#0f172a;">{{ stats.processing_time_avg | format_duration }}</strong></div>
-</div>
-{% endif %}
-
-{# ---- Distribution confiance DP ---- #}
-{% set conf = stats.dp_confidence %}
-{% set conf_total = (conf.get('high', 0) + conf.get('medium', 0) + conf.get('low', 0) + conf.get('none', 0)) or 1 %}
-<div class="card section">
-  <h3>Confiance DP</h3>
-  <div style="display:flex;height:28px;border-radius:6px;overflow:hidden;margin-bottom:0.5rem;">
-    {% if conf.get('high', 0) %}
-    <div style="width:{{ (conf.get('high', 0) / conf_total * 100)|round(1) }}%;background:#16a34a;" title="Haute : {{ conf.get('high', 0) }}"></div>
-    {% endif %}
-    {% if conf.get('medium', 0) %}
-    <div style="width:{{ (conf.get('medium', 0) / conf_total * 100)|round(1) }}%;background:#ca8a04;" title="Moyenne : {{ conf.get('medium', 0) }}"></div>
-    {% endif %}
-    {% if conf.get('low', 0) %}
-    <div style="width:{{ (conf.get('low', 0) / conf_total * 100)|round(1) }}%;background:#dc2626;" title="Basse : {{ conf.get('low', 0) }}"></div>
-    {% endif %}
-    {% if conf.get('none', 0) %}
-    <div style="width:{{ (conf.get('none', 0) / conf_total * 100)|round(1) }}%;background:#94a3b8;" title="Aucune : {{ conf.get('none', 0) }}"></div>
-    {% endif %}
-  </div>
-  <div style="display:flex;gap:1.5rem;font-size:0.8rem;">
-    <span><span style="display:inline-block;width:10px;height:10px;border-radius:50%;background:#16a34a;margin-right:4px;"></span>Haute : {{ conf.get('high', 0) }}</span>
-    <span><span style="display:inline-block;width:10px;height:10px;border-radius:50%;background:#ca8a04;margin-right:4px;"></span>Moyenne : {{ conf.get('medium', 0) }}</span>
-    <span><span style="display:inline-block;width:10px;height:10px;border-radius:50%;background:#dc2626;margin-right:4px;"></span>Basse : {{ conf.get('low', 0) }}</span>
-    <span><span style="display:inline-block;width:10px;height:10px;border-radius:50%;background:#94a3b8;margin-right:4px;"></span>Aucune : {{ conf.get('none', 0) }}</span>
-  </div>
-</div>
-
-{# ---- Top 15 codes CIM-10 ---- #}
-{% if stats.top_codes %}
-<div class="card section">
-  <h3>Top 15 codes CIM-10</h3>
-  {% for code, count in stats.top_codes %}
-  <div style="display:flex;align-items:center;gap:0.5rem;margin-bottom:0.4rem;">
-    <code style="min-width:60px;font-size:0.8rem;font-weight:600;">{{ code }}</code>
-    <div style="flex:1;height:20px;background:#f1f5f9;border-radius:4px;overflow:hidden;">
-      <div style="width:{{ (count / stats.top_max * 100)|round(1) }}%;height:100%;background:#3b82f6;border-radius:4px;"></div>
-    </div>
-    <span style="min-width:30px;text-align:right;font-size:0.8rem;color:#64748b;">{{ count }}</span>
-  </div>
-  {% endfor %}
-</div>
-{% endif %}
-
-{# ---- Distribution GHM types ---- #}
-{% set ghm = stats.ghm_types %}
-{% set ghm_total = (ghm.get('C', 0) + ghm.get('M', 0) + ghm.get('K', 0)) or 1 %}
-{% if ghm.get('C', 0) or ghm.get('M', 0) or ghm.get('K', 0) %}
-<div class="card section">
-  <h3>Types GHM</h3>
-  <div style="display:flex;height:28px;border-radius:6px;overflow:hidden;margin-bottom:0.5rem;">
-    {% if ghm.get('C', 0) %}
-    <div style="width:{{ (ghm.get('C', 0) / ghm_total * 100)|round(1) }}%;background:#dc2626;" title="Chirurgical : {{ ghm.get('C', 0) }}"></div>
-    {% endif %}
-    {% if ghm.get('M', 0) %}
-    <div style="width:{{ (ghm.get('M', 0) / ghm_total * 100)|round(1) }}%;background:#3b82f6;" title="Médical : {{ ghm.get('M', 0) }}"></div>
-    {% endif %}
-    {% if ghm.get('K', 0) %}
-    <div style="width:{{ (ghm.get('K', 0) / ghm_total * 100)|round(1) }}%;background:#f59e0b;" title="Interventionnel : {{ ghm.get('K', 0) }}"></div>
-    {% endif %}
-  </div>
-  <div style="display:flex;gap:1.5rem;font-size:0.8rem;">
-    <span><span style="display:inline-block;width:10px;height:10px;border-radius:50%;background:#dc2626;margin-right:4px;"></span>C — Chirurgical : {{ ghm.get('C', 0) }}</span>
-    <span><span style="display:inline-block;width:10px;height:10px;border-radius:50%;background:#3b82f6;margin-right:4px;"></span>M — Médical : {{ ghm.get('M', 0) }}</span>
-    <span><span style="display:inline-block;width:10px;height:10px;border-radius:50%;background:#f59e0b;margin-right:4px;"></span>K — Interventionnel : {{ ghm.get('K', 0) }}</span>
-  </div>
-</div>
-{% endif %}
-
-{# ---- Distribution sévérité ---- #}
-{% set sev = stats.severity_dist %}
-{% set sev_total = (sev.get(1, 0) + sev.get(2, 0) + sev.get(3, 0) + sev.get(4, 0)) or 1 %}
-{% if sev.get(1, 0) or sev.get(2, 0) or sev.get(3, 0) or sev.get(4, 0) %}
-<div class="card section">
-  <h3>Sévérité GHM</h3>
-  <div style="display:flex;height:28px;border-radius:6px;overflow:hidden;margin-bottom:0.5rem;">
-    {% if sev.get(1, 0) %}
-    <div style="width:{{ (sev.get(1, 0) / sev_total * 100)|round(1) }}%;background:#16a34a;" title="Niveau 1 : {{ sev.get(1, 0) }}"></div>
-    {% endif %}
-    {% if sev.get(2, 0) %}
-    <div style="width:{{ (sev.get(2, 0) / sev_total * 100)|round(1) }}%;background:#ca8a04;" title="Niveau 2 : {{ sev.get(2, 0) }}"></div>
-    {% endif %}
-    {% if sev.get(3, 0) %}
-    <div style="width:{{ (sev.get(3, 0) / sev_total * 100)|round(1) }}%;background:#f97316;" title="Niveau 3 : {{ sev.get(3, 0) }}"></div>
-    {% endif %}
-    {% if sev.get(4, 0) %}
-    <div style="width:{{ (sev.get(4, 0) / sev_total * 100)|round(1) }}%;background:#dc2626;" title="Niveau 4 : {{ sev.get(4, 0) }}"></div>
-    {% endif %}
-  </div>
-  <div style="display:flex;gap:1.5rem;font-size:0.8rem;">
-    <span><span style="display:inline-block;width:10px;height:10px;border-radius:50%;background:#16a34a;margin-right:4px;"></span>Niveau 1 : {{ sev.get(1, 0) }}</span>
-    <span><span style="display:inline-block;width:10px;height:10px;border-radius:50%;background:#ca8a04;margin-right:4px;"></span>Niveau 2 : {{ sev.get(2, 0) }}</span>
-    <span><span style="display:inline-block;width:10px;height:10px;border-radius:50%;background:#f97316;margin-right:4px;"></span>Niveau 3 : {{ sev.get(3, 0) }}</span>
-    <span><span style="display:inline-block;width:10px;height:10px;border-radius:50%;background:#dc2626;margin-right:4px;"></span>Niveau 4 : {{ sev.get(4, 0) }}</span>
-  </div>
-</div>
-{% endif %}
-
-{% endblock %}
diff --git a/t2a_install_rag_cleanup/src/viewer/templates/detail.html b/t2a_install_rag_cleanup/src/viewer/templates/detail.html
deleted file mode 100644
index 53e77a8..0000000
--- a/t2a_install_rag_cleanup/src/viewer/templates/detail.html
+++ /dev/null
@@ -1,757 +0,0 @@
-{% extends "base.html" %}
-{% block title %}{{ dossier.source_file or filepath }}{% endblock %}
-
-{% block sidebar %}
-<div class="group-title">Navigation</div>
-<a href="/">Retour à la liste</a>
-{% if siblings %}
-<div class="group-title" style="margin-top:1rem;">{{ current_group }}</div>
-{% for sib in siblings %}
-  <a href="/dossier/{{ sib.path_rel }}" {% if sib.path_rel == filepath %}style="color:#f8fafc;border-left-color:#3b82f6;background:#334155;"{% endif %}>
-    {{ sib.name }}
-  </a>
-{% endfor %}
-{% endif %}
-<div class="group-title" style="margin-top:1.5rem;">Actions</div>
-<button id="reprocess-btn" style="width:100%;padding:0.6rem;background:#3b82f6;color:white;border:none;border-radius:0.375rem;cursor:pointer;font-size:0.875rem;font-weight:600;margin-bottom:0.5rem;">Relancer l'étude</button>
-<div id="reprocess-status" style="font-size:0.75rem;padding:0.25rem;min-height:1.5rem;"></div>
-{% endblock %}
-
-{% block content %}
-<a class="back" href="/">&larr; Retour à la liste</a>
-
-{# ---- En-tête ---- #}
-<div class="card" style="margin-top:1rem;">
-  <h2>{{ dossier.source_file or filepath }}</h2>
-  <div class="info-grid">
-    {% if dossier.document_type %}
-    <div class="info-item">
-      <label>Type de document</label>
-      <span class="badge" style="background:#e0e7ff;color:#3730a3;">{{ dossier.document_type }}</span>
-    </div>
-    {% endif %}
-    {% if dossier.processing_time_s is not none %}
-    <div class="info-item">
-      <label>Temps de traitement</label>
-      <span>{{ dossier.processing_time_s|format_duration }}</span>
-    </div>
-    {% endif %}
-  </div>
-  {% if dossier.source_files %}
-  <div class="source-files" style="margin-top:0.75rem;">
-    <label style="font-size:0.7rem;color:#64748b;text-transform:uppercase;letter-spacing:0.05em;font-weight:600;">Documents sources</label>
-    <div style="margin-top:0.25rem;">
-      {% for sf in dossier.source_files %}
-        <code>{{ sf }}</code>{% if not loop.last %}, {% endif %}
-      {% endfor %}
-    </div>
-  </div>
-  {% endif %}
-</div>
-
-{# ---- Séjour ---- #}
-{% set s = dossier.sejour %}
-{% if s.sexe or s.age or s.date_entree or s.date_sortie or s.duree_sejour is not none or s.imc or s.poids or s.taille %}
-<div class="card section">
-  <h3>Séjour</h3>
-  <div class="info-grid">
-    {% if s.sexe %}<div class="info-item"><label>Sexe</label><span>{{ s.sexe }}</span></div>{% endif %}
-    {% if s.age is not none %}<div class="info-item"><label>Âge</label><span>{{ s.age }} ans</span></div>{% endif %}
-    {% if s.date_entree %}<div class="info-item"><label>Entrée</label><span>{{ s.date_entree }}</span></div>{% endif %}
-    {% if s.date_sortie %}<div class="info-item"><label>Sortie</label><span>{{ s.date_sortie }}</span></div>{% endif %}
-    {% if s.duree_sejour is not none %}<div class="info-item"><label>Durée</label><span>{{ s.duree_sejour }} jour(s)</span></div>{% endif %}
-    {% if s.mode_entree %}<div class="info-item"><label>Mode entrée</label><span>{{ s.mode_entree }}</span></div>{% endif %}
-    {% if s.mode_sortie %}<div class="info-item"><label>Mode sortie</label><span>{{ s.mode_sortie }}</span></div>{% endif %}
-    {% if s.poids %}<div class="info-item"><label>Poids</label><span>{{ s.poids }} kg</span></div>{% endif %}
-    {% if s.taille %}<div class="info-item"><label>Taille</label><span>{{ s.taille }} cm</span></div>{% endif %}
-    {% if s.imc %}<div class="info-item"><label>IMC</label><span>{{ s.imc }}</span></div>{% endif %}
-  </div>
-</div>
-{% endif %}
-
-{# ---- Estimation GHM ---- #}
-{% if dossier.ghm_estimation %}
-{% set ghm = dossier.ghm_estimation %}
-<div class="card section" style="border-left:4px solid #8b5cf6;">
-  <h3 style="color:#6d28d9;">Estimation GHM</h3>
-  <div class="info-grid">
-    {% if ghm.cmd %}
-    <div class="info-item">
-      <label>CMD</label>
-      <span><strong>{{ ghm.cmd }}</strong>{% if ghm.cmd_libelle %} — {{ ghm.cmd_libelle }}{% endif %}</span>
-    </div>
-    {% endif %}
-    <div class="info-item">
-      <label>Type</label>
-      {% if ghm.type_ghm == 'C' %}
-        <span class="badge" style="background:#fee2e2;color:#dc2626;">C — Chirurgical</span>
-      {% elif ghm.type_ghm == 'K' %}
-        <span class="badge" style="background:#fef3c7;color:#92400e;">K — Interventionnel</span>
-      {% elif ghm.type_ghm == 'M' %}
-        <span class="badge" style="background:#dbeafe;color:#1d4ed8;">M — Médical</span>
-      {% endif %}
-    </div>
-    <div class="info-item">
-      <label>Sévérité</label>
-      {% if ghm.severite <= 1 %}
-        <span class="badge" style="background:#d1fae5;color:#065f46;">Niveau {{ ghm.severite }}</span>
-      {% elif ghm.severite == 2 %}
-        <span class="badge" style="background:#fef3c7;color:#92400e;">Niveau {{ ghm.severite }}</span>
-      {% elif ghm.severite == 3 %}
-        <span class="badge" style="background:#fed7aa;color:#9a3412;">Niveau {{ ghm.severite }}</span>
-      {% else %}
-        <span class="badge" style="background:#fee2e2;color:#dc2626;">Niveau {{ ghm.severite }}</span>
-      {% endif %}
-    </div>
-    {% if ghm.ghm_approx %}
-    <div class="info-item">
-      <label>Code GHM approx.</label>
-      <code style="font-size:1.1rem;font-weight:700;letter-spacing:0.05em;">{{ ghm.ghm_approx }}</code>
-    </div>
-    {% endif %}
-    <div class="info-item">
-      <label>CMA / CMS</label>
-      <span>{{ ghm.cma_count }} CMA, {{ ghm.cms_count }} CMS</span>
-    </div>
-  </div>
-  {% if ghm.alertes %}
-  <div style="margin-top:0.75rem;">
-    {% for alerte in ghm.alertes %}
-      <div style="font-size:0.8rem;color:#c2410c;margin-bottom:0.2rem;">{{ alerte }}</div>
-    {% endfor %}
-  </div>
-  {% endif %}
-  <div style="margin-top:0.75rem;font-size:0.7rem;color:#94a3b8;font-style:italic;">
-    Estimation heuristique — le GHM définitif nécessite le groupeur officiel ATIH
-  </div>
-</div>
-{% endif %}
-
-{# ---- Contrôle CPAM ---- #}
-{% if dossier.controles_cpam %}
-<div class="card section" style="border-left:4px solid #f59e0b;">
-  <h3 style="color:#b45309;">Contrôle CPAM ({{ dossier.controles_cpam|length }})</h3>
-  {% for ctrl in dossier.controles_cpam %}
-  <div style="margin-bottom:1.5rem;{% if not loop.last %}border-bottom:1px solid #e2e8f0;padding-bottom:1rem;{% endif %}">
-    <div style="display:flex;align-items:center;gap:0.5rem;margin-bottom:0.5rem;">
-      <strong>OGC {{ ctrl.numero_ogc }} — {{ ctrl.titre }}</strong>
-      {% if 'retient' in ctrl.decision_ucr|lower %}
-        <span class="badge" style="background:#d1fae5;color:#065f46;">{{ ctrl.decision_ucr }}</span>
-      {% elif 'confirme' in ctrl.decision_ucr|lower %}
-        <span class="badge" style="background:#fee2e2;color:#dc2626;">{{ ctrl.decision_ucr }}</span>
-      {% else %}
-        <span class="badge" style="background:#e0e7ff;color:#3730a3;">{{ ctrl.decision_ucr }}</span>
-      {% endif %}
-    </div>
-
-    {# Argument CPAM #}
-    {% if ctrl.arg_ucr %}
-    <div style="border-left:3px solid #f59e0b;padding:0.5rem 0.75rem;background:#fffbeb;margin-bottom:0.75rem;font-size:0.85rem;color:#78350f;">
-      <div style="font-size:0.7rem;color:#92400e;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Argument CPAM</div>
-      {{ ctrl.arg_ucr }}
-    </div>
-    {% endif %}
-
-    {# Codes contestés #}
-    {% if ctrl.dp_ucr or ctrl.da_ucr or ctrl.dr_ucr or ctrl.actes_ucr %}
-    <div style="margin-bottom:0.75rem;">
-      <div style="font-size:0.7rem;color:#64748b;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Codes contestés</div>
-      <div style="display:flex;gap:0.5rem;flex-wrap:wrap;">
-        {% if ctrl.dp_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">DP: {{ ctrl.dp_ucr }}</span>{% endif %}
-        {% if ctrl.da_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">DA: {{ ctrl.da_ucr }}</span>{% endif %}
-        {% if ctrl.dr_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">DR: {{ ctrl.dr_ucr }}</span>{% endif %}
-        {% if ctrl.actes_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">Actes: {{ ctrl.actes_ucr }}</span>{% endif %}
-      </div>
-    </div>
-    {% endif %}
-
-    {# Contre-argumentation structurée ou fallback texte brut #}
-    {% if ctrl.response_data %}
-    <div style="margin-bottom:0.75rem;">
-      <div style="font-size:0.7rem;color:#1d4ed8;text-transform:uppercase;font-weight:600;margin-bottom:0.5rem;">Contre-argumentation</div>
-
-      {% if ctrl.response_data.analyse_contestation %}
-      <div style="border-left:3px solid #94a3b8;padding:0.5rem 0.75rem;background:#f8fafc;margin-bottom:0.5rem;font-size:0.85rem;">
-        <div style="font-size:0.7rem;color:#64748b;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Analyse de la contestation</div>
-        {{ ctrl.response_data.analyse_contestation | format_cpam_text }}
-      </div>
-      {% endif %}
-
-      {% if ctrl.response_data.points_accord and ctrl.response_data.points_accord|lower not in ['aucun', 'non applicable', 'n/a', ''] %}
-      <div style="border-left:3px solid #22c55e;padding:0.5rem 0.75rem;background:#f0fdf4;margin-bottom:0.5rem;font-size:0.85rem;">
-        <div style="font-size:0.7rem;color:#16a34a;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Points d'accord</div>
-        {{ ctrl.response_data.points_accord | format_cpam_text }}
-      </div>
-      {% endif %}
-
-      {% if ctrl.response_data.contre_arguments_medicaux %}
-      <div style="border-left:3px solid #3b82f6;padding:0.5rem 0.75rem;background:#eff6ff;margin-bottom:0.5rem;font-size:0.85rem;">
-        <div style="font-size:0.7rem;color:#1d4ed8;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Contre-arguments médicaux</div>
-        {{ ctrl.response_data.contre_arguments_medicaux | format_cpam_text }}
-      </div>
-      {% endif %}
-
-      {% if ctrl.response_data.preuves_dossier %}
-      <div style="border-left:3px solid #0ea5e9;padding:0.5rem 0.75rem;background:#f0f9ff;margin-bottom:0.5rem;font-size:0.85rem;">
-        <div style="font-size:0.7rem;color:#0369a1;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Preuves du dossier</div>
-        <ul style="margin:0.3rem 0;padding-left:1.2rem;">
-        {% for p in ctrl.response_data.preuves_dossier %}
-          {% if p is mapping %}
-          <li style="margin-bottom:0.3rem;">
-            <span style="display:inline-block;padding:1px 6px;border-radius:9999px;font-size:0.7rem;font-weight:600;background:#e0f2fe;color:#0369a1;">{{ p.element or p.get('type', '') }}</span>
-            {{ p.valeur or '' }} <span style="color:#64748b;">&rarr; {{ p.signification or '' }}</span>
-          </li>
-          {% endif %}
-        {% endfor %}
-        </ul>
-      </div>
-      {% endif %}
-
-      {% if ctrl.response_data.contre_arguments_asymetrie %}
-      <div style="border-left:3px solid #8b5cf6;padding:0.5rem 0.75rem;background:#f5f3ff;margin-bottom:0.5rem;font-size:0.85rem;">
-        <div style="font-size:0.7rem;color:#7c3aed;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Asymétrie d'information</div>
-        {{ ctrl.response_data.contre_arguments_asymetrie | format_cpam_text }}
-      </div>
-      {% endif %}
-
-      {% if ctrl.response_data.contre_arguments_reglementaires %}
-      <div style="border-left:3px solid #6366f1;padding:0.5rem 0.75rem;background:#eef2ff;margin-bottom:0.5rem;font-size:0.85rem;">
-        <div style="font-size:0.7rem;color:#4f46e5;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Contre-arguments réglementaires</div>
-        {{ ctrl.response_data.contre_arguments_reglementaires | format_cpam_text }}
-      </div>
-      {% endif %}
-
-      {% if ctrl.response_data.references %}
-      <div style="border-left:3px solid #64748b;padding:0.5rem 0.75rem;background:#f8fafc;margin-bottom:0.5rem;font-size:0.85rem;">
-        <div style="font-size:0.7rem;color:#475569;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Références</div>
-        {% for ref in ctrl.response_data.references %}
-          {% if ref is mapping %}
-          <blockquote style="margin:0.3rem 0;padding:0.3rem 0.5rem;border-left:2px solid #cbd5e1;background:#f1f5f9;font-size:0.8rem;color:#334155;">
-            <strong>[{{ ref.document or '' }}{% if ref.page %}, p.{{ ref.page }}{% endif %}]</strong>
-            {{ ref.citation or '' }}
-          </blockquote>
-          {% elif ref is string %}
-          <p style="margin:0.2rem 0;font-size:0.8rem;color:#334155;">{{ ref }}</p>
-          {% endif %}
-        {% endfor %}
-      </div>
-      {% endif %}
-
-      {% if ctrl.response_data.conclusion %}
-      <div style="border-left:3px solid #f59e0b;padding:0.5rem 0.75rem;background:#fffbeb;margin-bottom:0.5rem;font-size:0.85rem;border:1px solid #fde68a;border-left:3px solid #f59e0b;border-radius:0.25rem;">
-        <div style="font-size:0.7rem;color:#b45309;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Conclusion</div>
-        {{ ctrl.response_data.conclusion | format_cpam_text }}
-      </div>
-      {% endif %}
-    </div>
-    {% elif ctrl.contre_argumentation %}
-    <div style="border-left:3px solid #3b82f6;padding:0.5rem 0.75rem;background:#eff6ff;margin-bottom:0.75rem;font-size:0.85rem;color:#1e3a5f;">
-      <div style="font-size:0.7rem;color:#1d4ed8;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Contre-argumentation</div>
-      <pre style="white-space:pre-wrap;font-family:inherit;margin:0;">{{ ctrl.contre_argumentation }}</pre>
-    </div>
-    {% endif %}
-
-    {# Sources RAG #}
-    {% if ctrl.sources_reponse %}
-    <details>
-      <summary style="font-size:0.8rem;color:#64748b;">Sources RAG ({{ ctrl.sources_reponse|length }})</summary>
-      {% for src in ctrl.sources_reponse %}
-      <pre style="font-size:0.75rem;">{{ src.document }}{% if src.code %} — {{ src.code }}{% endif %}{% if src.page %} [p.{{ src.page }}]{% endif %}
-{{ src.extrait or '' }}</pre>
-      {% endfor %}
-    </details>
-    {% endif %}
-  </div>
-  {% endfor %}
-</div>
-{% endif %}
-
-{# ---- Alertes de codage ---- #}
-{% if dossier.alertes_codage %}
-<div class="card section" style="border-left:4px solid #f97316;background:#fff7ed;">
-  <h3 style="color:#c2410c;">Alertes de codage ({{ dossier.alertes_codage|length }})</h3>
-  <ul style="margin:0;padding-left:1.2rem;">
-    {% for alerte in dossier.alertes_codage %}
-      {% if alerte.startswith('NON-CUMUL') %}
-        <li class="alerte-noncumul" style="font-size:0.85rem;margin-bottom:0.25rem;">{{ alerte }}</li>
-      {% else %}
-        <li class="alerte-standard" style="font-size:0.85rem;margin-bottom:0.25rem;">{{ alerte }}</li>
-      {% endif %}
-    {% endfor %}
-  </ul>
-</div>
-{% endif %}
-
-{# ---- Diagnostic principal ---- #}
-{% if dossier.diagnostic_principal %}
-{% set dp = dossier.diagnostic_principal %}
-<div class="card section">
-  <h3>Diagnostic principal</h3>
-  <div style="font-size:0.95rem;margin-bottom:0.5rem;">
-    {{ dp.texte }}
-    {% if dp.source_page %}<button class="src-btn" data-texte="{{ dp.texte|e }}" data-excerpt="{{ dp.source_excerpt|default('',true)|e }}" data-page="{{ dp.source_page }}">p.{{ dp.source_page }}</button>{% endif %}
-  </div>
-  {% if dp.cim10_suggestion %}
-    <span class="badge" style="background:#dbeafe;color:#1d4ed8;font-size:0.85rem;">{{ dp.cim10_suggestion }}</span>
-    {{ dp.cim10_confidence | confidence_badge }}
-    {% if dp.niveau_cma and dp.niveau_cma > 1 %}
-      {{ dp.niveau_cma | cma_level_badge }}
-    {% elif dp.est_cma %}
-      <span class="badge" style="background:#fee2e2;color:#dc2626;font-size:0.75rem;">CMA</span>
-    {% endif %}
-    {{ dp.niveau_severite | severity_badge }}
-  {% endif %}
-  {% if dp.justification %}
-    <div style="margin-top:0.5rem;font-size:0.8rem;color:#475569;">{{ dp.justification }}</div>
-  {% endif %}
-  {% if dp.preuves_cliniques %}
-  <details style="margin-top:0.5rem;">
-    <summary style="font-size:0.8rem;color:#0369a1;cursor:pointer;font-weight:600;">Preuves cliniques ({{ dp.preuves_cliniques|length }})</summary>
-    <ul style="margin:0.25rem 0 0 0;padding-left:1.2rem;font-size:0.8rem;">
-    {% for p in dp.preuves_cliniques %}
-      <li style="margin-bottom:0.15rem;"><span class="badge" style="background:#e0f2fe;color:#0369a1;font-size:0.7rem;">{{ p.type }}</span> {{ p.element }} <span style="color:#64748b;">&rarr; {{ p.interpretation }}</span></li>
-    {% endfor %}
-    </ul>
-  </details>
-  {% endif %}
-  {% if dp.raisonnement %}
-  <details style="margin-top:0.5rem;">
-    <summary>Raisonnement LLM</summary>
-    <pre>{{ dp.raisonnement }}</pre>
-  </details>
-  {% endif %}
-  {% if dp.sources_rag %}
-  <details>
-    <summary>Sources RAG ({{ dp.sources_rag|length }})</summary>
-    {% for src in dp.sources_rag %}
-    <pre>{{ src.document }}{% if src.code %} — {{ src.code }}{% endif %}{% if src.page %} [p.{{ src.page }}]{% endif %}
-{{ src.extrait or '' }}</pre>
-    {% endfor %}
-  </details>
-  {% endif %}
-</div>
-{% endif %}
-
-{# ---- Diagnostics associés ---- #}
-{% if dossier.diagnostics_associes %}
-<div class="card section">
-  <h3>Diagnostics associés ({{ dossier.diagnostics_associes|length }})</h3>
-  <table>
-    <thead><tr><th>Texte</th><th>CIM-10</th><th>Confiance</th><th>CMA</th><th>Source</th><th>Justification</th></tr></thead>
-    <tbody>
-    {% for das in dossier.diagnostics_associes %}
-      <tr>
-        <td>{{ das.texte }}</td>
-        <td>{% if das.cim10_suggestion %}<span class="badge" style="background:#dbeafe;color:#1d4ed8;">{{ das.cim10_suggestion }}</span>{% endif %}</td>
-        <td>{{ das.cim10_confidence | confidence_badge }}</td>
-        <td>
-          {% if das.niveau_cma and das.niveau_cma > 1 %}
-            {{ das.niveau_cma | cma_level_badge }}
-          {% elif das.est_cma %}
-            <span class="badge" style="background:#fee2e2;color:#dc2626;font-size:0.7rem;">CMA</span>
-          {% else %}
-            —
-          {% endif %}
-        </td>
-        <td>
-          {% if das.source %}
-            <span class="badge" style="background:#e0e7ff;color:#3730a3;font-size:0.7rem;">{{ das.source }}</span>
-          {% endif %}
-          {% if das.source_page %}
-            <button class="src-btn" data-texte="{{ das.texte|e }}" data-excerpt="{{ das.source_excerpt|default('',true)|e }}" data-page="{{ das.source_page }}">p.{{ das.source_page }}</button>
-          {% endif %}
-        </td>
-        <td style="font-size:0.8rem;color:#475569;">
-          {{ das.justification or '' }}
-          {% if das.preuves_cliniques %}
-          <details style="margin-top:0.3rem;"><summary style="font-size:0.7rem;color:#0369a1;cursor:pointer;">preuves ({{ das.preuves_cliniques|length }})</summary>
-            <ul style="margin:0.15rem 0 0 0;padding-left:1rem;font-size:0.75rem;">
-            {% for p in das.preuves_cliniques %}
-              <li><span style="font-weight:600;color:#0369a1;">[{{ p.type }}]</span> {{ p.element }} <span style="color:#64748b;">&rarr; {{ p.interpretation }}</span></li>
-            {% endfor %}
-            </ul>
-          </details>
-          {% endif %}
-        </td>
-      </tr>
-      {% if das.raisonnement %}
-      <tr>
-        <td colspan="6" style="padding:0 0.75rem 0.5rem;">
-          <details>
-            <summary>Raisonnement LLM</summary>
-            <pre>{{ das.raisonnement }}</pre>
-          </details>
-        </td>
-      </tr>
-      {% endif %}
-      {% if das.sources_rag %}
-      <tr>
-        <td colspan="6" style="padding:0 0.75rem 0.5rem;">
-          <details>
-            <summary>Sources RAG ({{ das.sources_rag|length }})</summary>
-            {% for src in das.sources_rag %}
-            <pre>{{ src.document }}{% if src.code %} — {{ src.code }}{% endif %}{% if src.page %} [p.{{ src.page }}]{% endif %}
-{{ src.extrait or '' }}</pre>
-            {% endfor %}
-          </details>
-        </td>
-      </tr>
-      {% endif %}
-    {% endfor %}
-    </tbody>
-  </table>
-</div>
-{% endif %}
-
-{# ---- Actes CCAM ---- #}
-{% if dossier.actes_ccam %}
-<div class="card section">
-  <h3>Actes CCAM ({{ dossier.actes_ccam|length }})</h3>
-  <table>
-    <thead><tr><th>Texte</th><th>Code CCAM</th><th>Regroupement</th><th>Date</th><th>Validité</th><th>Source</th></tr></thead>
-    <tbody>
-    {% for a in dossier.actes_ccam %}
-      <tr>
-        <td>{{ a.texte }}</td>
-        <td>{% if a.code_ccam_suggestion %}<span class="badge" style="background:#e0e7ff;color:#3730a3;">{{ a.code_ccam_suggestion }}</span>{% endif %}</td>
-        <td>
-          {% if a.code_ccam_suggestion and ccam_dict.get(a.code_ccam_suggestion, {}).get('regroupement') %}
-            <span class="badge badge-regroup">{{ ccam_dict[a.code_ccam_suggestion]['regroupement'] }}</span>
-          {% else %}
-            —
-          {% endif %}
-        </td>
-        <td>{{ a.date or '' }}</td>
-        <td>
-          {% if a.validite == 'valide' %}<span class="badge" style="background:#d1fae5;color:#065f46;">Valide</span>
-          {% elif a.validite == 'obsolete' %}<span class="badge" style="background:#fee2e2;color:#dc2626;">Obsolète</span>
-          {% else %}—{% endif %}
-          {% for alerte in a.alertes %}
-            <div style="font-size:0.7rem;color:#dc2626;">{{ alerte }}</div>
-          {% endfor %}
-        </td>
-        <td>{% if a.source_page %}<button class="src-btn" data-texte="{{ a.texte|e }}" data-excerpt="{{ a.source_excerpt|default('',true)|e }}" data-page="{{ a.source_page }}">p.{{ a.source_page }}</button>{% endif %}</td>
-      </tr>
-    {% endfor %}
-    </tbody>
-  </table>
-</div>
-{% endif %}
-
-{# ---- Biologie clé ---- #}
-{% if dossier.biologie_cle %}
-<div class="card section">
-  <h3>Biologie clé ({{ dossier.biologie_cle|length }})</h3>
-  <table>
-    <thead><tr><th>Test</th><th>Valeur</th><th>Anomalie</th><th>Source</th></tr></thead>
-    <tbody>
-    {% for b in dossier.biologie_cle %}
-      <tr{% if b.anomalie %} class="anomalie"{% endif %}>
-        <td>{{ b.test }}</td>
-        <td>{{ b.valeur or '' }}</td>
-        <td>{% if b.anomalie %}<span class="badge" style="background:#fee2e2;color:#dc2626;">Oui</span>{% else %}—{% endif %}</td>
-        <td>{% if b.source_page %}<button class="src-btn" data-texte="{{ b.test|e }}" data-excerpt="{{ b.source_excerpt|default('',true)|e }}" data-page="{{ b.source_page }}">p.{{ b.source_page }}</button>{% endif %}</td>
-      </tr>
-    {% endfor %}
-    </tbody>
-  </table>
-</div>
-{% endif %}
-
-{# ---- Imagerie ---- #}
-{% if dossier.imagerie %}
-<div class="card section">
-  <h3>Imagerie ({{ dossier.imagerie|length }})</h3>
-  {% for img in dossier.imagerie %}
-  <div style="margin-bottom:0.5rem;">
-    <strong>{{ img.type }}</strong>
-    {% if img.score %} — Score : {{ img.score }}{% endif %}
-    {% if img.source_page %}<button class="src-btn" data-texte="{{ img.type|e }}" data-excerpt="{{ img.source_excerpt|default('',true)|e }}" data-page="{{ img.source_page }}">p.{{ img.source_page }}</button>{% endif %}
-    {% if img.conclusion %}
-      <div style="font-size:0.85rem;color:#475569;">{{ img.conclusion }}</div>
-    {% endif %}
-  </div>
-  {% endfor %}
-</div>
-{% endif %}
-
-{# ---- Traitements de sortie ---- #}
-{% if dossier.traitements_sortie %}
-<div class="card section">
-  <h3>Traitements de sortie ({{ dossier.traitements_sortie|length }})</h3>
-  <table>
-    <thead><tr><th>Médicament</th><th>Posologie</th><th>Code ATC</th><th>Source</th></tr></thead>
-    <tbody>
-    {% for t in dossier.traitements_sortie %}
-      <tr>
-        <td>{{ t.medicament }}</td>
-        <td>{{ t.posologie or '' }}</td>
-        <td>{% if t.code_atc %}<span class="badge" style="background:#e0e7ff;color:#3730a3;">{{ t.code_atc }}</span>{% endif %}</td>
-        <td>{% if t.source_page %}<button class="src-btn" data-texte="{{ t.medicament|e }}" data-excerpt="{{ t.source_excerpt|default('',true)|e }}" data-page="{{ t.source_page }}">p.{{ t.source_page }}</button>{% endif %}</td>
-      </tr>
-    {% endfor %}
-    </tbody>
-  </table>
-</div>
-{% endif %}
-
-{# ---- Antécédents ---- #}
-{% if dossier.antecedents %}
-<div class="card section">
-  <h3>Antécédents ({{ dossier.antecedents|length }})</h3>
-  <ul class="bullet">
-    {% for a in dossier.antecedents %}
-      <li>{{ a.texte }}{% if a.source_page %} <button class="src-btn" data-texte="{{ a.texte|e }}" data-excerpt="{{ a.source_excerpt|default('',true)|e }}" data-page="{{ a.source_page }}">p.{{ a.source_page }}</button>{% endif %}</li>
-    {% endfor %}
-  </ul>
-</div>
-{% endif %}
-
-{# ---- Complications ---- #}
-{% if dossier.complications %}
-<div class="card section">
-  <h3>Complications ({{ dossier.complications|length }})</h3>
-  <ul class="bullet">
-    {% for c in dossier.complications %}
-      <li>{{ c.texte }}{% if c.source_page %} <button class="src-btn" data-texte="{{ c.texte|e }}" data-excerpt="{{ c.source_excerpt|default('',true)|e }}" data-page="{{ c.source_page }}">p.{{ c.source_page }}</button>{% endif %}</li>
-    {% endfor %}
-  </ul>
-</div>
-{% endif %}
-
-{# ---- Modal source ---- #}
-<div id="source-modal">
-  <div id="source-modal-inner">
-    <div id="source-header">
-      <span id="source-title">Document source</span>
-      <button id="source-close-btn" onclick="closeSource()">Fermer</button>
-    </div>
-    <div id="source-content"></div>
-  </div>
-</div>
-
-{% endblock %}
-
-{% block scripts %}
-<script>
-/* --- Source modal --- */
-let _sourceCache = null;
-const _dossierId = (function() {
-  const fp = {{ filepath|tojson }};
-  const parts = fp.split('/');
-  return parts.length > 1 ? parts.slice(0, -1).join('/') : '';
-})();
-const _sourceFiles = {{ dossier.source_files|tojson }};
-
-function getDossierId() { return _dossierId; }
-
-async function loadSourceTexts() {
-  if (_sourceCache !== null) return _sourceCache;
-  if (!_dossierId) { _sourceCache = {}; return _sourceCache; }
-  try {
-    const resp = await fetch('/api/source-text/' + _dossierId);
-    if (resp.ok) { _sourceCache = await resp.json(); }
-    else { _sourceCache = {}; }
-  } catch (e) { _sourceCache = {}; }
-  return _sourceCache;
-}
-
-/* Teste si le PDF caviardé est disponible (HEAD request) */
-async function pdfAvailable(dossierId, filename) {
-  try {
-    const resp = await fetch('/api/pdf/' + dossierId + '/' + encodeURIComponent(filename), {method: 'HEAD'});
-    return resp.ok;
-  } catch (e) { return false; }
-}
-
-/* Construit l'URL du PDF avec highlight + page */
-function buildPdfUrl(dossierId, filename, page, excerpt) {
-  let url = '/api/pdf/' + dossierId + '/' + encodeURIComponent(filename);
-  const params = [];
-  if (excerpt) params.push('highlight=' + encodeURIComponent(excerpt));
-  if (page) params.push('page=' + page);
-  if (params.length) url += '?' + params.join('&');
-  url += '#page=' + (page || 1);
-  return url;
-}
-
-/* Affiche un PDF dans l'iframe */
-function loadPdf(dossierId, filename, page, excerpt) {
-  const content = document.getElementById('source-content');
-  const url = buildPdfUrl(dossierId, filename, page, excerpt);
-  content.className = 'source-content-pdf';
-  content.innerHTML = '<iframe src="' + url + '" style="width:100%;height:100%;border:none;"></iframe>';
-  // Marquer le bouton actif
-  document.querySelectorAll('.src-file-btn').forEach(b => b.classList.remove('active'));
-  document.querySelectorAll('.src-file-btn').forEach(b => {
-    if (b.textContent === filename) b.classList.add('active');
-  });
-}
-
-/* Affiche le modal source — PDF caviardé si disponible, sinon fallback texte */
-async function showSource(excerpt, page, texte) {
-  // Pour le surlignage PDF, on utilise le texte du diagnostic (pas l'excerpt brut)
-  const highlightText = texte || excerpt;
-  const modal = document.getElementById('source-modal');
-  const modalInner = document.getElementById('source-modal-inner');
-  const content = document.getElementById('source-content');
-  const title = document.getElementById('source-title');
-
-  title.textContent = 'Document source — Page ' + page;
-  content.innerHTML = '<em style="color:#94a3b8;">Chargement...</em>';
-  content.className = '';
-  modalInner.className = '';
-  modal.style.display = 'block';
-
-  // Essayer le mode PDF
-  if (_sourceFiles && _sourceFiles.length > 0 && _dossierId) {
-    const firstFile = _sourceFiles[0];
-    const available = await pdfAvailable(_dossierId, firstFile);
-    if (available) {
-      modalInner.className = '';
-      if (_sourceFiles.length === 1) {
-        loadPdf(_dossierId, firstFile, page, highlightText);
-      } else {
-        // Multi-PDF : boutons de sélection + iframe
-        const safeHighlight = (highlightText || '').replace(/\\/g, '\\\\').replace(/'/g, "\\'");
-        let html = '<div style="padding:0.5rem 0.75rem;border-bottom:1px solid #e2e8f0;display:flex;gap:0.5rem;flex-wrap:wrap;">';
-        _sourceFiles.forEach(function(f) {
-          const safeF = f.replace(/\\/g, '\\\\').replace(/'/g, "\\'");
-          html += '<button class="src-file-btn" onclick="loadPdf(\'' + _dossierId + '\', \'' + safeF + '\', ' + page + ', \'' + safeHighlight + '\')">' + f + '</button>';
-        });
-        html += '</div>';
-        html += '<iframe id="pdf-frame" style="width:100%;flex:1;border:none;"></iframe>';
-        content.className = 'source-content-pdf';
-        content.style.display = 'flex';
-        content.style.flexDirection = 'column';
-        content.innerHTML = html;
-        // Charger le premier PDF
-        const iframe = content.querySelector('iframe');
-        iframe.src = buildPdfUrl(_dossierId, firstFile, page, highlightText);
-        content.querySelector('.src-file-btn').classList.add('active');
-      }
-      return;
-    }
-  }
-
-  // Fallback : mode texte (ancien comportement)
-  modalInner.className = 'source-modal-text';
-  content.className = '';
-  content.style.display = '';
-
-  const texts = await loadSourceTexts();
-  const allText = Object.values(texts).join('\n\n--- ---\n\n');
-
-  if (!allText) {
-    content.innerHTML = '<em style="color:#94a3b8;">Texte source non disponible</em>';
-    return;
-  }
-
-  // Nettoyer l'extrait : retirer les "..." ajoutés par extract_excerpt()
-  let searchText = (excerpt || '').trim();
-  if (searchText.startsWith('...')) searchText = searchText.substring(3);
-  if (searchText.endsWith('...')) searchText = searchText.slice(0, -3);
-  searchText = searchText.trim();
-
-  // Chercher l'extrait dans le texte et le surligner
-  if (searchText.length > 10) {
-    let idx = allText.indexOf(searchText);
-    if (idx < 0 && searchText.length > 60) {
-      const mid = Math.floor(searchText.length / 2);
-      searchText = searchText.substring(mid - 30, mid + 30);
-      idx = allText.indexOf(searchText);
-    }
-    if (idx >= 0) {
-      const before = allText.substring(0, idx);
-      const match = allText.substring(idx, idx + searchText.length);
-      const after = allText.substring(idx + searchText.length);
-      content.innerHTML = '';
-      content.appendChild(document.createTextNode(before));
-      const mark = document.createElement('mark');
-      mark.textContent = match;
-      mark.id = 'source-highlight';
-      content.appendChild(mark);
-      content.appendChild(document.createTextNode(after));
-      setTimeout(() => {
-        const el = document.getElementById('source-highlight');
-        if (el) el.scrollIntoView({ behavior: 'smooth', block: 'center' });
-      }, 100);
-      return;
-    }
-  }
-
-  content.textContent = allText;
-}
-
-function closeSource() {
-  const content = document.getElementById('source-content');
-  // Détruire l'iframe pour stopper le chargement PDF
-  content.innerHTML = '';
-  content.style.display = '';
-  content.className = '';
-  document.getElementById('source-modal').style.display = 'none';
-}
-
-// Fermer le modal en cliquant sur le fond
-document.getElementById('source-modal').addEventListener('click', function(e) {
-  if (e.target === this) closeSource();
-});
-
-// Fermer avec Escape
-document.addEventListener('keydown', function(e) {
-  if (e.key === 'Escape') closeSource();
-});
-
-// Délégation événements pour tous les boutons .src-btn
-document.addEventListener('click', function(e) {
-  const btn = e.target.closest('.src-btn');
-  if (btn && btn.dataset.page) {
-    showSource(btn.dataset.excerpt || '', parseInt(btn.dataset.page), btn.dataset.texte || '');
-  }
-});
-
-/* --- Reprocess --- */
-document.getElementById('reprocess-btn').addEventListener('click', async () => {
-  const btn = document.getElementById('reprocess-btn');
-  const status = document.getElementById('reprocess-status');
-
-  btn.disabled = true;
-  btn.style.background = '#64748b';
-  btn.innerHTML = '<span style="display:inline-flex;align-items:center;gap:0.4rem;"><span class="spinner"></span> Traitement en cours...</span>';
-  status.innerHTML = '<span style="color:#3b82f6;">Demande envoyée, traitement lancé. Veuillez patienter...</span>';
-
-  const startTime = Date.now();
-  const timer = setInterval(() => {
-    const elapsed = Math.floor((Date.now() - startTime) / 1000);
-    const min = Math.floor(elapsed / 60);
-    const sec = elapsed % 60;
-    const timeStr = min > 0 ? min + 'min ' + String(sec).padStart(2, '0') + 's' : sec + 's';
-    status.innerHTML = '<span style="color:#3b82f6;">Traitement en cours... ' + timeStr + '</span>';
-  }, 1000);
-
-  try {
-    const response = await fetch('/reprocess/{{ filepath }}', { method: 'POST' });
-    clearInterval(timer);
-    const data = await response.json();
-
-    if (data.ok) {
-      status.innerHTML = '<span style="color:#16a34a;font-weight:600;">Traitement terminé. Rechargement...</span>';
-      btn.style.background = '#16a34a';
-      btn.innerHTML = 'Terminé';
-      setTimeout(() => location.reload(), 1000);
-    } else {
-      status.innerHTML = '<span style="color:#dc2626;">' + (data.error || 'Erreur') + '</span>';
-      btn.disabled = false;
-      btn.style.background = '#3b82f6';
-      btn.innerHTML = 'Relancer l\'étude';
-    }
-  } catch (err) {
-    clearInterval(timer);
-    status.innerHTML = '<span style="color:#dc2626;">Erreur réseau</span>';
-    btn.disabled = false;
-    btn.style.background = '#3b82f6';
-    btn.innerHTML = 'Relancer l\'étude';
-  }
-});
-</script>
-{% endblock %}
diff --git a/t2a_install_rag_cleanup/src/viewer/templates/index.html b/t2a_install_rag_cleanup/src/viewer/templates/index.html
deleted file mode 100644
index 16c1364..0000000
--- a/t2a_install_rag_cleanup/src/viewer/templates/index.html
+++ /dev/null
@@ -1,100 +0,0 @@
-{% extends "base.html" %}
-{% block title %}Accueil{% endblock %}
-
-{% block sidebar %}
-{% for group_name, items in groups.items() %}
-  <div class="group-title">{{ group_name | format_dossier_name }}</div>
-  {% for item in items %}
-    {% if 'fusionne' in item.name %}
-      <a href="/dossier/{{ item.path_rel }}" class="sidebar-fusionne">&#9733; Fusionné</a>
-    {% else %}
-      <a href="/dossier/{{ item.path_rel }}">{{ item.name | format_doc_name }}</a>
-    {% endif %}
-  {% endfor %}
-{% endfor %}
-{% endblock %}
-
-{% block content %}
-<h2>Dossiers médicaux traités</h2>
-
-{% if not groups %}
-  <div class="card">
-    <p>Aucun dossier trouvé dans <code>output/structured/</code>.</p>
-    <p style="margin-top:0.5rem;font-size:0.85rem;color:#64748b">
-      Lancez le pipeline avec <code>python -m src.main</code> pour générer des fichiers.
-    </p>
-  </div>
-{% endif %}
-
-{% for group_name, items in groups.items() %}
-<div class="section">
-  {% set ns = namespace(total=0.0, count=0) %}
-  {% for item in items %}
-    {% if item.dossier.processing_time_s is not none %}
-      {% set ns.total = ns.total + item.dossier.processing_time_s %}
-      {% set ns.count = ns.count + 1 %}
-    {% endif %}
-  {% endfor %}
-  {% set stats = group_stats.get(group_name, {}) %}
-  <h3 style="display:flex;align-items:baseline;gap:0.75rem;flex-wrap:wrap;">
-    {{ group_name | format_dossier_name }}
-    <span style="font-size:0.75rem;font-weight:400;color:#64748b;">
-      {{ items|length }} fichier(s){% if ns.count %} — total : {{ ns.total|format_duration }}{% endif %}
-    </span>
-    {% if stats %}
-      <span class="badge-count badge-das">{{ stats.das_count }} DAS</span>
-      <span class="badge-count badge-actes">{{ stats.actes_count }} actes</span>
-      {% if stats.alertes_count %}<span class="badge-count badge-alertes">{{ stats.alertes_count }} alertes</span>{% endif %}
-      {% if stats.cma_count %}<span class="badge-count badge-cma">{{ stats.cma_count }} CMA</span>{% endif %}
-    {% endif %}
-  </h3>
-  {% if items|length > 1 %}
-    {% for item in items if 'fusionne' in item.name %}
-      {% if loop.first %}
-      <div style="margin-bottom:0.75rem;">
-        <a href="/dossier/{{ item.path_rel }}" class="badge-count badge-fusion" style="text-decoration:none;font-size:0.8rem;padding:4px 12px;">
-          Vue patient fusionnée
-        </a>
-      </div>
-      {% endif %}
-    {% endfor %}
-  {% endif %}
-  <div style="display:grid;grid-template-columns:repeat(auto-fill,minmax(300px,1fr));gap:1rem;">
-    {% for item in items %}
-    <a href="/dossier/{{ item.path_rel }}" style="text-decoration:none;color:inherit;">
-      <div class="card" style="cursor:pointer;transition:box-shadow 0.15s;">
-        <div style="font-weight:600;font-size:0.9rem;margin-bottom:0.4rem;color:#0f172a;">
-          {{ item.name | format_doc_name }}
-        </div>
-        <div style="display:flex;flex-wrap:wrap;gap:0.3rem;margin-bottom:0.4rem;">
-          {% if item.dossier.document_type %}
-            <span class="badge" style="background:#e0e7ff;color:#3730a3;">{{ item.dossier.document_type }}</span>
-          {% endif %}
-          {% if item.dossier.source_files %}<span class="badge badge-fusion">fusionné</span>{% endif %}
-          {% if item.dossier.diagnostics_associes %}<span class="badge-count badge-das">{{ item.dossier.diagnostics_associes|length }} DAS</span>{% endif %}
-          {% if item.dossier.actes_ccam %}<span class="badge-count badge-actes">{{ item.dossier.actes_ccam|length }} actes</span>{% endif %}
-          {% if item.dossier.alertes_codage %}<span class="badge-count badge-alertes">{{ item.dossier.alertes_codage|length }} alertes</span>{% endif %}
-        </div>
-        {% if item.dossier.diagnostic_principal %}
-          <div style="margin-top:0.5rem;font-size:0.8rem;color:#334155;">
-            <strong>DP :</strong> {{ item.dossier.diagnostic_principal.texte[:80] }}{% if item.dossier.diagnostic_principal.texte|length > 80 %}…{% endif %}
-          </div>
-          {% if item.dossier.diagnostic_principal.cim10_suggestion %}
-            <div style="margin-top:0.25rem;">
-              <span class="badge" style="background:#dbeafe;color:#1d4ed8;">{{ item.dossier.diagnostic_principal.cim10_suggestion }}</span>
-              {{ item.dossier.diagnostic_principal.cim10_confidence | confidence_badge }}
-            </div>
-          {% endif %}
-        {% endif %}
-        {% if item.dossier.processing_time_s is not none %}
-          <div style="margin-top:0.5rem;font-size:0.75rem;color:#64748b;">
-            Traitement : {{ item.dossier.processing_time_s|format_duration }}
-          </div>
-        {% endif %}
-      </div>
-    </a>
-    {% endfor %}
-  </div>
-</div>
-{% endfor %}
-{% endblock %}
diff --git a/t2a_install_rag_cleanup/src/viewer/templates/validation_detail.html b/t2a_install_rag_cleanup/src/viewer/templates/validation_detail.html
deleted file mode 100644
index 3063ee3..0000000
--- a/t2a_install_rag_cleanup/src/viewer/templates/validation_detail.html
+++ /dev/null
@@ -1,404 +0,0 @@
-{% extends "base.html" %}
-{% block title %}Validation — {{ group_name }}{% endblock %}
-
-{% block sidebar %}
-{% for gn, items in groups.items() %}
-  <div class="group-title">{{ gn | format_dossier_name }}</div>
-  {% for item in items %}
-    {% if 'fusionne' in item.name %}
-      <a href="/dossier/{{ item.path_rel }}" class="sidebar-fusionne">&#9733; Fusionné</a>
-    {% else %}
-      <a href="/dossier/{{ item.path_rel }}">{{ item.name | format_doc_name }}</a>
-    {% endif %}
-  {% endfor %}
-{% endfor %}
-{% endblock %}
-
-{% block content %}
-<style>
-  .seg-btn { display:inline-block;padding:4px 12px;border:1px solid #cbd5e1;font-size:0.8rem;font-weight:600;cursor:pointer;background:#fff;color:#475569;transition:all 0.15s; }
-  .seg-btn:first-child { border-radius:6px 0 0 6px; }
-  .seg-btn:last-child { border-radius:0 6px 6px 0; }
-  .seg-btn:not(:first-child) { border-left:none; }
-  .seg-btn.active-correct { background:#dcfce7;color:#16a34a;border-color:#16a34a; }
-  .seg-btn.active-modifie { background:#fef9c3;color:#ca8a04;border-color:#ca8a04; }
-  .seg-btn.active-supprime { background:#fee2e2;color:#dc2626;border-color:#dc2626; }
-  .code-input { padding:4px 8px;border:1px solid #cbd5e1;border-radius:6px;font-size:0.85rem;font-family:monospace;width:120px; }
-  .comment-input { padding:4px 8px;border:1px solid #e2e8f0;border-radius:6px;font-size:0.8rem;width:100%;max-width:300px; }
-  .autocomplete-wrapper { position:relative;display:inline-block; }
-  .autocomplete-dropdown { position:absolute;top:100%;left:0;z-index:100;background:#fff;border:1px solid #cbd5e1;border-radius:6px;box-shadow:0 4px 12px rgba(0,0,0,0.1);max-height:250px;overflow-y:auto;width:400px;display:none; }
-  .autocomplete-dropdown .ac-item { padding:6px 10px;cursor:pointer;font-size:0.8rem;border-bottom:1px solid #f1f5f9; }
-  .autocomplete-dropdown .ac-item:hover { background:#f1f5f9; }
-  .autocomplete-dropdown .ac-code { font-family:monospace;font-weight:700;color:#1e293b;margin-right:8px; }
-  .autocomplete-dropdown .ac-label { color:#64748b; }
-  .save-bar { position:sticky;bottom:0;background:#fff;border-top:2px solid #e2e8f0;padding:1rem;display:flex;align-items:center;gap:1rem;z-index:50; }
-  .btn-save { padding:8px 20px;border-radius:8px;border:none;font-size:0.85rem;font-weight:600;cursor:pointer;transition:all 0.15s; }
-  .btn-brouillon { background:#f1f5f9;color:#475569; }
-  .btn-brouillon:hover { background:#e2e8f0; }
-  .btn-valider { background:#16a34a;color:#fff; }
-  .btn-valider:hover { background:#15803d; }
-  .nav-link { font-size:0.85rem;color:#3b82f6;text-decoration:none;font-weight:600; }
-  .nav-link:hover { text-decoration:underline; }
-  .das-row-added { background:#f0fdf4; }
-</style>
-
-<!-- Navigation -->
-<div style="display:flex;align-items:center;gap:1rem;margin-bottom:1rem;">
-  <a href="/validation" class="back">Retour à la liste</a>
-  <span style="color:#cbd5e1;">|</span>
-  {% if prev_id %}
-  <a href="/validation/{{ prev_id }}" class="nav-link">Précédent</a>
-  {% endif %}
-  {% if next_id %}
-  <a href="/validation/{{ next_id }}" class="nav-link">Suivant</a>
-  {% endif %}
-  <span style="flex:1;"></span>
-  <a href="/dossier/{{ group_name }}/{{ group_name }}_fusionne_cim10.json" class="nav-link" target="_blank">Voir le dossier complet</a>
-</div>
-
-<h2>Validation : {{ group_name }}</h2>
-
-{% if dossier %}
-<!-- Infos séjour (lecture seule) -->
-<div class="card" style="margin-bottom:1rem;">
-  <h3>Séjour</h3>
-  <div class="info-grid">
-    {% if dossier.sejour.sexe %}<div class="info-item"><label>Sexe</label><span>{{ dossier.sejour.sexe }}</span></div>{% endif %}
-    {% if dossier.sejour.age is not none %}<div class="info-item"><label>Âge</label><span>{{ dossier.sejour.age }} ans</span></div>{% endif %}
-    {% if dossier.sejour.date_entree %}<div class="info-item"><label>Entrée</label><span>{{ dossier.sejour.date_entree }}</span></div>{% endif %}
-    {% if dossier.sejour.date_sortie %}<div class="info-item"><label>Sortie</label><span>{{ dossier.sejour.date_sortie }}</span></div>{% endif %}
-    {% if dossier.sejour.duree_sejour is not none %}<div class="info-item"><label>Durée</label><span>{{ dossier.sejour.duree_sejour }}j</span></div>{% endif %}
-  </div>
-</div>
-
-<!-- DP -->
-<div class="card" style="margin-bottom:1rem;">
-  <h3>Diagnostic Principal</h3>
-  {% set dp = annotation.dp %}
-  <div style="margin-bottom:0.75rem;">
-    <span style="font-size:0.9rem;">{{ dp.texte_original }}</span>
-  </div>
-  <div style="display:flex;align-items:center;gap:1rem;flex-wrap:wrap;">
-    <span style="font-family:monospace;font-size:1rem;font-weight:700;background:#dbeafe;color:#1d4ed8;padding:2px 10px;border-radius:6px;">{{ dp.code_pipeline }}</span>
-    {{ dp.confidence | confidence_badge }}
-
-    <!-- Boutons segmentés -->
-    <div class="seg-group" data-target="dp">
-      <span class="seg-btn active-correct" data-value="correct" onclick="setStatut(this)">Correct</span>
-      <span class="seg-btn" data-value="modifie" onclick="setStatut(this)">Modifier</span>
-      <span class="seg-btn" data-value="supprime" onclick="setStatut(this)">Supprimer</span>
-    </div>
-
-    <!-- Champ code alternatif -->
-    <div class="autocomplete-wrapper dp-code-field" style="display:none;">
-      <input type="text" class="code-input" placeholder="Code CIM-10" data-ac="dp"
-             value="{{ dp.code_corrige or '' }}" autocomplete="off">
-      <div class="autocomplete-dropdown"></div>
-    </div>
-
-    <input type="text" class="comment-input dp-comment" placeholder="Commentaire (optionnel)" value="{{ dp.commentaire or '' }}">
-  </div>
-</div>
-
-<!-- DAS -->
-<div class="card" style="margin-bottom:1rem;">
-  <h3>Diagnostics Associés ({{ annotation.das|length }})</h3>
-  <table id="das-table">
-    <thead>
-      <tr>
-        <th style="width:30px;">#</th>
-        <th>Texte</th>
-        <th>Code pipeline</th>
-        <th>Conf.</th>
-        <th>Source</th>
-        <th>Validation</th>
-        <th>Code corrigé</th>
-        <th>Commentaire</th>
-      </tr>
-    </thead>
-    <tbody>
-      {% for das in annotation.das %}
-      <tr class="das-row" data-index="{{ das.index }}">
-        <td style="color:#94a3b8;font-size:0.8rem;">{{ loop.index }}</td>
-        <td style="font-size:0.85rem;max-width:250px;">{{ das.texte_original }}</td>
-        <td><span style="font-family:monospace;font-weight:600;">{{ das.code_pipeline }}</span></td>
-        <td>{{ das.confidence | confidence_badge }}</td>
-        <td>
-          {% if das.source %}
-          <span style="font-size:0.7rem;padding:2px 6px;border-radius:4px;background:#f1f5f9;color:#475569;">{{ das.source }}</span>
-          {% endif %}
-        </td>
-        <td>
-          <div class="seg-group" data-target="das-{{ das.index }}">
-            <span class="seg-btn {% if das.statut == 'correct' %}active-correct{% endif %}" data-value="correct" onclick="setStatut(this)">OK</span>
-            <span class="seg-btn {% if das.statut == 'modifie' %}active-modifie{% endif %}" data-value="modifie" onclick="setStatut(this)">Mod</span>
-            <span class="seg-btn {% if das.statut == 'supprime' %}active-supprime{% endif %}" data-value="supprime" onclick="setStatut(this)">Sup</span>
-          </div>
-        </td>
-        <td>
-          <div class="autocomplete-wrapper das-code-field-{{ das.index }}" style="{% if das.statut != 'modifie' %}display:none;{% endif %}">
-            <input type="text" class="code-input" placeholder="CIM-10" data-ac="das-{{ das.index }}"
-                   value="{{ das.code_corrige or '' }}" autocomplete="off">
-            <div class="autocomplete-dropdown"></div>
-          </div>
-        </td>
-        <td>
-          <input type="text" class="comment-input das-comment" data-index="{{ das.index }}" placeholder="" value="{{ das.commentaire or '' }}">
-        </td>
-      </tr>
-      {% endfor %}
-    </tbody>
-  </table>
-
-  <!-- DAS ajoutés -->
-  <div id="das-ajoutes" style="margin-top:1rem;">
-    <h3 style="font-size:0.85rem;color:#16a34a;">DAS manquants (ajoutés par le DIM)</h3>
-    <div id="das-ajoutes-list">
-      {% for aj in annotation.das_ajoutes %}
-      <div class="das-added-row das-row-added" style="display:flex;align-items:center;gap:0.5rem;padding:0.5rem 0;border-bottom:1px solid #e2e8f0;" data-aj-index="{{ loop.index0 }}">
-        <input type="text" class="comment-input aj-texte" placeholder="Texte du diagnostic" value="{{ aj.texte or '' }}" style="flex:1;max-width:300px;">
-        <div class="autocomplete-wrapper">
-          <input type="text" class="code-input aj-code" placeholder="CIM-10" value="{{ aj.code or '' }}" autocomplete="off" data-ac="aj-{{ loop.index0 }}">
-          <div class="autocomplete-dropdown"></div>
-        </div>
-        <input type="text" class="comment-input aj-comment" placeholder="Commentaire" value="{{ aj.commentaire or '' }}" style="max-width:200px;">
-        <button onclick="removeAjoute(this)" style="background:none;border:none;color:#dc2626;cursor:pointer;font-size:1.1rem;padding:4px 8px;">&times;</button>
-      </div>
-      {% endfor %}
-    </div>
-    <button id="btn-add-das" onclick="addDasManquant()" style="margin-top:0.5rem;padding:6px 14px;border-radius:6px;border:1px dashed #16a34a;background:#f0fdf4;color:#16a34a;font-size:0.8rem;font-weight:600;cursor:pointer;">
-      + Ajouter un DAS manquant
-    </button>
-  </div>
-</div>
-
-<!-- Commentaire général -->
-<div class="card" style="margin-bottom:5rem;">
-  <h3>Commentaire général</h3>
-  <textarea id="commentaire-general" rows="3"
-            style="width:100%;padding:8px;border:1px solid #cbd5e1;border-radius:6px;font-size:0.85rem;resize:vertical;">{{ annotation.commentaire_general or '' }}</textarea>
-</div>
-{% endif %}
-
-<!-- Barre de sauvegarde sticky -->
-<div class="save-bar">
-  <button class="btn-save btn-brouillon" onclick="saveAnnotation('en_cours')">Enregistrer (brouillon)</button>
-  <button class="btn-save btn-valider" onclick="saveAnnotation('valide')">Marquer comme validé</button>
-  <span id="save-status" style="font-size:0.8rem;color:#64748b;"></span>
-  <span style="flex:1;"></span>
-  <span style="font-size:0.8rem;color:#94a3b8;">Dossier : {{ dossier_id }}</span>
-</div>
-
-{% endblock %}
-
-{% block scripts %}
-<script>
-const DOSSIER_ID = {{ dossier_id | tojson }};
-let ajouteCounter = {{ annotation.das_ajoutes|length }};
-
-// --- Boutons segmentés ---
-function setStatut(btn) {
-  const group = btn.parentElement;
-  const target = group.dataset.target;
-  const value = btn.dataset.value;
-
-  // Reset tous les boutons du groupe
-  group.querySelectorAll('.seg-btn').forEach(function(b) {
-    b.className = 'seg-btn';
-  });
-  btn.classList.add('active-' + value);
-
-  // Afficher/cacher le champ code
-  let codeField;
-  if (target === 'dp') {
-    codeField = document.querySelector('.dp-code-field');
-  } else {
-    const idx = target.replace('das-', '');
-    codeField = document.querySelector('.das-code-field-' + idx);
-  }
-  if (codeField) {
-    codeField.style.display = (value === 'modifie') ? '' : 'none';
-  }
-}
-
-// --- Autocomplete CIM-10 ---
-let acDebounceTimer = null;
-
-document.addEventListener('input', function(e) {
-  if (!e.target.matches('[data-ac]') && !e.target.matches('.aj-code')) return;
-
-  const input = e.target;
-  const dropdown = input.parentElement.querySelector('.autocomplete-dropdown');
-  const q = input.value.trim();
-
-  if (q.length < 2) {
-    dropdown.style.display = 'none';
-    return;
-  }
-
-  clearTimeout(acDebounceTimer);
-  acDebounceTimer = setTimeout(function() {
-    fetch('/api/cim10/search?q=' + encodeURIComponent(q))
-      .then(function(r) { return r.json(); })
-      .then(function(data) {
-        if (!data.results || !data.results.length) {
-          dropdown.style.display = 'none';
-          return;
-        }
-        dropdown.innerHTML = '';
-        data.results.forEach(function(item) {
-          const div = document.createElement('div');
-          div.className = 'ac-item';
-          div.innerHTML = '<span class="ac-code">' + item.code + '</span><span class="ac-label">' + item.label.substring(0, 80) + '</span>';
-          div.addEventListener('click', function() {
-            input.value = item.code;
-            dropdown.style.display = 'none';
-          });
-          dropdown.appendChild(div);
-        });
-        dropdown.style.display = 'block';
-      })
-      .catch(function() { dropdown.style.display = 'none'; });
-  }, 300);
-});
-
-// Fermer les dropdowns quand on clique ailleurs
-document.addEventListener('click', function(e) {
-  if (!e.target.matches('[data-ac]') && !e.target.matches('.aj-code') && !e.target.closest('.autocomplete-dropdown')) {
-    document.querySelectorAll('.autocomplete-dropdown').forEach(function(d) { d.style.display = 'none'; });
-  }
-});
-
-// --- Ajouter DAS manquant ---
-function addDasManquant() {
-  const list = document.getElementById('das-ajoutes-list');
-  const idx = ajouteCounter++;
-  const row = document.createElement('div');
-  row.className = 'das-added-row das-row-added';
-  row.style.cssText = 'display:flex;align-items:center;gap:0.5rem;padding:0.5rem 0;border-bottom:1px solid #e2e8f0;';
-  row.dataset.ajIndex = idx;
-  row.innerHTML = '<input type="text" class="comment-input aj-texte" placeholder="Texte du diagnostic" style="flex:1;max-width:300px;">' +
-    '<div class="autocomplete-wrapper">' +
-    '<input type="text" class="code-input aj-code" placeholder="CIM-10" autocomplete="off" data-ac="aj-' + idx + '">' +
-    '<div class="autocomplete-dropdown"></div>' +
-    '</div>' +
-    '<input type="text" class="comment-input aj-comment" placeholder="Commentaire" style="max-width:200px;">' +
-    '<button onclick="removeAjoute(this)" style="background:none;border:none;color:#dc2626;cursor:pointer;font-size:1.1rem;padding:4px 8px;">&times;</button>';
-  list.appendChild(row);
-}
-
-function removeAjoute(btn) {
-  btn.closest('.das-added-row').remove();
-}
-
-// --- Collecte et sauvegarde ---
-function collectAnnotation(statut) {
-  const validateur = document.getElementById('validateur-name');
-  const valName = validateur ? validateur.value : (localStorage.getItem('t2a_validateur') || '');
-
-  // DP
-  const dpGroup = document.querySelector('.seg-group[data-target="dp"]');
-  const dpActive = dpGroup ? dpGroup.querySelector('.seg-btn[class*="active-"]') : null;
-  let dpStatut = 'correct';
-  if (dpActive) {
-    if (dpActive.classList.contains('active-modifie')) dpStatut = 'modifie';
-    else if (dpActive.classList.contains('active-supprime')) dpStatut = 'supprime';
-  }
-  const dpCodeField = document.querySelector('.dp-code-field input');
-  const dpComment = document.querySelector('.dp-comment');
-
-  const dp = {
-    texte_original: {{ (annotation.dp.texte_original or '') | tojson }},
-    code_pipeline: {{ (annotation.dp.code_pipeline or '') | tojson }},
-    confidence: {{ (annotation.dp.confidence or '') | tojson }},
-    statut: dpStatut,
-    code_corrige: (dpStatut === 'modifie' && dpCodeField) ? dpCodeField.value : null,
-    commentaire: dpComment ? dpComment.value : ''
-  };
-
-  // DAS
-  const dasRows = document.querySelectorAll('.das-row');
-  const das = [];
-  dasRows.forEach(function(row) {
-    const idx = parseInt(row.dataset.index);
-    const group = row.querySelector('.seg-group');
-    const active = group ? group.querySelector('.seg-btn[class*="active-"]') : null;
-    let dasStatut = 'correct';
-    if (active) {
-      if (active.classList.contains('active-modifie')) dasStatut = 'modifie';
-      else if (active.classList.contains('active-supprime')) dasStatut = 'supprime';
-    }
-    const codeInput = row.querySelector('.code-input');
-    const commentInput = row.querySelector('.das-comment');
-
-    das.push({
-      index: idx,
-      texte_original: row.querySelector('td:nth-child(2)').textContent.trim(),
-      code_pipeline: row.querySelector('td:nth-child(3)').textContent.trim(),
-      confidence: {{ annotation.das | tojson }}.find(function(d) { return d.index === idx; })?.confidence || '',
-      source: {{ annotation.das | tojson }}.find(function(d) { return d.index === idx; })?.source || '',
-      statut: dasStatut,
-      code_corrige: (dasStatut === 'modifie' && codeInput) ? codeInput.value : null,
-      commentaire: commentInput ? commentInput.value : ''
-    });
-  });
-
-  // DAS ajoutés
-  const ajRows = document.querySelectorAll('.das-added-row');
-  const das_ajoutes = [];
-  ajRows.forEach(function(row) {
-    const texte = row.querySelector('.aj-texte').value.trim();
-    const code = row.querySelector('.aj-code').value.trim();
-    const comment = row.querySelector('.aj-comment').value.trim();
-    if (texte || code) {
-      das_ajoutes.push({ texte: texte, code: code, commentaire: comment });
-    }
-  });
-
-  return {
-    dossier_id: DOSSIER_ID,
-    validateur: valName,
-    statut: statut,
-    dp: dp,
-    das: das,
-    das_ajoutes: das_ajoutes,
-    commentaire_general: document.getElementById('commentaire-general').value
-  };
-}
-
-function saveAnnotation(statut) {
-  const data = collectAnnotation(statut);
-  const statusEl = document.getElementById('save-status');
-  statusEl.textContent = 'Sauvegarde...';
-  statusEl.style.color = '#64748b';
-
-  fetch('/api/validation/save', {
-    method: 'POST',
-    headers: { 'Content-Type': 'application/json' },
-    body: JSON.stringify(data)
-  })
-  .then(function(r) { return r.json(); })
-  .then(function(d) {
-    if (d.ok) {
-      statusEl.textContent = statut === 'valide' ? 'Validé !' : 'Brouillon enregistré';
-      statusEl.style.color = '#16a34a';
-    } else {
-      statusEl.textContent = d.error || 'Erreur';
-      statusEl.style.color = '#dc2626';
-    }
-  })
-  .catch(function() {
-    statusEl.textContent = 'Erreur réseau';
-    statusEl.style.color = '#dc2626';
-  });
-}
-
-// Raccourci clavier : Ctrl+S pour sauvegarder en brouillon
-document.addEventListener('keydown', function(e) {
-  if ((e.ctrlKey || e.metaKey) && e.key === 's') {
-    e.preventDefault();
-    saveAnnotation('en_cours');
-  }
-});
-</script>
-{% endblock %}
diff --git a/t2a_install_rag_cleanup/src/viewer/templates/validation_list.html b/t2a_install_rag_cleanup/src/viewer/templates/validation_list.html
deleted file mode 100644
index 1fd34f5..0000000
--- a/t2a_install_rag_cleanup/src/viewer/templates/validation_list.html
+++ /dev/null
@@ -1,179 +0,0 @@
-{% extends "base.html" %}
-{% block title %}Validation DIM{% endblock %}
-
-{% block sidebar %}
-{% for group_name, items in groups.items() %}
-  <div class="group-title">{{ group_name | format_dossier_name }}</div>
-  {% for item in items %}
-    {% if 'fusionne' in item.name %}
-      <a href="/dossier/{{ item.path_rel }}" class="sidebar-fusionne">&#9733; Fusionné</a>
-    {% else %}
-      <a href="/dossier/{{ item.path_rel }}">{{ item.name | format_doc_name }}</a>
-    {% endif %}
-  {% endfor %}
-{% endfor %}
-{% endblock %}
-
-{% block content %}
-<div style="display:flex;align-items:center;gap:1rem;margin-bottom:1.5rem;">
-  <h2 style="margin:0;">Validation DIM</h2>
-  <a href="/validation/metrics" style="font-size:0.85rem;color:#3b82f6;text-decoration:none;font-weight:600;">Voir les métriques</a>
-</div>
-
-<!-- Barre de progression -->
-<div class="card" style="margin-bottom:1.5rem;">
-  <div style="display:flex;align-items:center;gap:1rem;margin-bottom:0.75rem;">
-    <span style="font-weight:600;font-size:0.9rem;">Progression</span>
-    <span style="font-size:0.85rem;color:#64748b;">{{ valides }} / {{ total }} validés</span>
-    {% if en_cours > 0 %}
-    <span style="font-size:0.85rem;color:#ca8a04;">{{ en_cours }} en cours</span>
-    {% endif %}
-  </div>
-  <div style="background:#e2e8f0;border-radius:9999px;height:12px;overflow:hidden;">
-    {% set pct_valide = (valides / total * 100) if total > 0 else 0 %}
-    {% set pct_encours = (en_cours / total * 100) if total > 0 else 0 %}
-    <div style="display:flex;height:100%;">
-      <div style="width:{{ pct_valide }}%;background:#16a34a;transition:width 0.3s;"></div>
-      <div style="width:{{ pct_encours }}%;background:#eab308;transition:width 0.3s;"></div>
-    </div>
-  </div>
-</div>
-
-<!-- Nom du validateur -->
-<div class="card" style="margin-bottom:1rem;padding:0.75rem 1.25rem;">
-  <div style="display:flex;align-items:center;gap:0.75rem;">
-    <label for="validateur-name" style="font-size:0.8rem;font-weight:600;color:#475569;white-space:nowrap;">Nom du validateur :</label>
-    <input type="text" id="validateur-name" placeholder="Dr. X"
-           style="flex:1;padding:0.35rem 0.6rem;border:1px solid #cbd5e1;border-radius:6px;font-size:0.85rem;max-width:300px;">
-  </div>
-</div>
-
-<!-- Filtres -->
-<div style="display:flex;gap:0.5rem;margin-bottom:1rem;">
-  <button class="filter-btn active" data-filter="all"
-          style="padding:0.35rem 0.75rem;border-radius:6px;border:1px solid #cbd5e1;background:#fff;font-size:0.8rem;font-weight:600;cursor:pointer;">
-    Tous ({{ total }})
-  </button>
-  <button class="filter-btn" data-filter="non_commence"
-          style="padding:0.35rem 0.75rem;border-radius:6px;border:1px solid #cbd5e1;background:#fff;font-size:0.8rem;font-weight:600;cursor:pointer;">
-    Non commencés ({{ total - valides - en_cours }})
-  </button>
-  <button class="filter-btn" data-filter="en_cours"
-          style="padding:0.35rem 0.75rem;border-radius:6px;border:1px solid #cbd5e1;background:#fff;font-size:0.8rem;font-weight:600;cursor:pointer;">
-    En cours ({{ en_cours }})
-  </button>
-  <button class="filter-btn" data-filter="valide"
-          style="padding:0.35rem 0.75rem;border-radius:6px;border:1px solid #cbd5e1;background:#fff;font-size:0.8rem;font-weight:600;cursor:pointer;">
-    Validés ({{ valides }})
-  </button>
-</div>
-
-<!-- Tableau -->
-<div class="card" style="padding:0;">
-<table>
-  <thead>
-    <tr>
-      <th>#</th>
-      <th>Dossier</th>
-      <th>DP</th>
-      <th>Conf. DP</th>
-      <th>DAS</th>
-      <th>CPAM</th>
-      <th>Statut</th>
-      <th>Validateur</th>
-    </tr>
-  </thead>
-  <tbody>
-    {% for item in items %}
-    <tr class="validation-row" data-statut="{{ item.statut }}">
-      <td style="color:#94a3b8;font-size:0.8rem;">{{ loop.index }}</td>
-      <td>
-        <a href="/validation/{{ item.dossier_id }}" style="color:#1e293b;text-decoration:none;font-weight:600;font-size:0.85rem;">
-          {{ item.group_name }}
-        </a>
-      </td>
-      <td>
-        <span style="font-family:monospace;font-size:0.85rem;font-weight:600;">{{ item.dp_code or '—' }}</span>
-        {% if item.dp_texte %}
-        <br><span style="font-size:0.75rem;color:#64748b;">{{ item.dp_texte[:50] }}{% if item.dp_texte|length > 50 %}…{% endif %}</span>
-        {% endif %}
-      </td>
-      <td>{{ item.dp_confidence | confidence_badge }}</td>
-      <td style="text-align:center;font-weight:600;">{{ item.nb_das }}</td>
-      <td style="text-align:center;">
-        {% if item.has_cpam %}
-        <span style="display:inline-block;padding:2px 8px;border-radius:9999px;font-size:0.7rem;font-weight:600;color:#7c3aed;background:#ede9fe;">CPAM</span>
-        {% endif %}
-      </td>
-      <td>
-        {% if item.statut == 'valide' %}
-        <span style="display:inline-block;padding:2px 8px;border-radius:9999px;font-size:0.7rem;font-weight:600;color:#16a34a;background:#dcfce7;">Validé</span>
-        {% elif item.statut == 'en_cours' %}
-        <span style="display:inline-block;padding:2px 8px;border-radius:9999px;font-size:0.7rem;font-weight:600;color:#ca8a04;background:#fef9c3;">En cours</span>
-        {% else %}
-        <span style="display:inline-block;padding:2px 8px;border-radius:9999px;font-size:0.7rem;font-weight:600;color:#6b7280;background:#f3f4f6;">Non commencé</span>
-        {% endif %}
-      </td>
-      <td style="font-size:0.8rem;color:#64748b;">{{ item.validateur }}</td>
-    </tr>
-    {% endfor %}
-  </tbody>
-</table>
-</div>
-
-{% if not items %}
-<div class="card" style="text-align:center;padding:2rem;">
-  <p style="color:#64748b;font-size:0.9rem;">Aucun dossier sélectionné pour validation.</p>
-  <p style="margin-top:0.5rem;font-size:0.85rem;color:#94a3b8;">
-    Lancez <code>python scripts/select_validation_dossiers.py</code> pour sélectionner les dossiers.
-  </p>
-</div>
-{% endif %}
-
-{% endblock %}
-
-{% block scripts %}
-<script>
-(function() {
-  // Persistance nom validateur dans localStorage
-  const input = document.getElementById('validateur-name');
-  if (input) {
-    const saved = localStorage.getItem('t2a_validateur');
-    if (saved) input.value = saved;
-    input.addEventListener('input', function() {
-      localStorage.setItem('t2a_validateur', this.value);
-    });
-  }
-
-  // Filtres
-  document.querySelectorAll('.filter-btn').forEach(function(btn) {
-    btn.addEventListener('click', function() {
-      document.querySelectorAll('.filter-btn').forEach(function(b) {
-        b.classList.remove('active');
-        b.style.background = '#fff';
-        b.style.color = '#1e293b';
-      });
-      this.classList.add('active');
-      this.style.background = '#1e293b';
-      this.style.color = '#fff';
-
-      const filter = this.dataset.filter;
-      document.querySelectorAll('.validation-row').forEach(function(row) {
-        if (filter === 'all' || row.dataset.statut === filter) {
-          row.style.display = '';
-        } else {
-          row.style.display = 'none';
-        }
-      });
-    });
-  });
-
-  // Activer le style du premier bouton
-  const firstBtn = document.querySelector('.filter-btn.active');
-  if (firstBtn) {
-    firstBtn.style.background = '#1e293b';
-    firstBtn.style.color = '#fff';
-  }
-})();
-</script>
-{% endblock %}
diff --git a/t2a_install_rag_cleanup/src/viewer/templates/validation_metrics.html b/t2a_install_rag_cleanup/src/viewer/templates/validation_metrics.html
deleted file mode 100644
index 2c22897..0000000
--- a/t2a_install_rag_cleanup/src/viewer/templates/validation_metrics.html
+++ /dev/null
@@ -1,243 +0,0 @@
-{% extends "base.html" %}
-{% block title %}Métriques Validation DIM{% endblock %}
-
-{% block sidebar %}
-{% for group_name, items in groups.items() %}
-  <div class="group-title">{{ group_name | format_dossier_name }}</div>
-  {% for item in items %}
-    {% if 'fusionne' in item.name %}
-      <a href="/dossier/{{ item.path_rel }}" class="sidebar-fusionne">&#9733; Fusionné</a>
-    {% else %}
-      <a href="/dossier/{{ item.path_rel }}">{{ item.name | format_doc_name }}</a>
-    {% endif %}
-  {% endfor %}
-{% endfor %}
-{% endblock %}
-
-{% block content %}
-<div style="display:flex;align-items:center;gap:1rem;margin-bottom:1.5rem;">
-  <a href="/validation" class="back">Retour à la liste</a>
-  <h2 style="margin:0;">Métriques de qualité</h2>
-</div>
-
-{% if metrics.total_valides == 0 %}
-<div class="card" style="text-align:center;padding:2rem;">
-  <p style="color:#64748b;font-size:0.9rem;">Aucun dossier validé pour le moment.</p>
-  <p style="margin-top:0.5rem;font-size:0.85rem;color:#94a3b8;">
-    Validez des dossiers depuis la <a href="/validation">liste de validation</a> pour voir les métriques.
-  </p>
-</div>
-{% else %}
-
-<!-- Progression -->
-<div class="card" style="margin-bottom:1.5rem;">
-  <div style="display:flex;align-items:center;gap:1rem;margin-bottom:0.75rem;">
-    <span style="font-weight:600;font-size:0.9rem;">Progression</span>
-    <span style="font-size:0.85rem;color:#64748b;">{{ metrics.total_valides }} / {{ total_selection }} dossiers validés</span>
-  </div>
-  <div style="background:#e2e8f0;border-radius:9999px;height:12px;overflow:hidden;">
-    {% set pct = (metrics.total_valides / total_selection * 100) if total_selection > 0 else 0 %}
-    <div style="width:{{ pct }}%;background:#16a34a;transition:width 0.3s;height:100%;"></div>
-  </div>
-</div>
-
-<!-- Métriques DP + DAS côte à côte -->
-<div style="display:grid;grid-template-columns:1fr 1fr;gap:1rem;margin-bottom:1.5rem;">
-
-  <!-- DP -->
-  <div class="card">
-    <h3>Diagnostic Principal</h3>
-    <div class="info-grid" style="margin-top:0.75rem;">
-      <div class="info-item">
-        <label>Accuracy</label>
-        <span style="font-size:1.3rem;font-weight:700;color:#16a34a;">{{ "%.1f" | format(metrics.dp.accuracy * 100) }}%</span>
-      </div>
-      <div class="info-item">
-        <label>Correct</label>
-        <span>{{ metrics.dp.correct }} / {{ metrics.dp.total }}</span>
-      </div>
-      <div class="info-item">
-        <label>Modifié</label>
-        <span style="color:#ca8a04;">{{ metrics.dp.modifie }}</span>
-      </div>
-      <div class="info-item">
-        <label>Supprimé</label>
-        <span style="color:#dc2626;">{{ metrics.dp.supprime }}</span>
-      </div>
-    </div>
-    <!-- Barre visuelle -->
-    <div style="margin-top:1rem;display:flex;height:20px;border-radius:6px;overflow:hidden;">
-      {% set dp_t = metrics.dp.total or 1 %}
-      <div style="width:{{ metrics.dp.correct / dp_t * 100 }}%;background:#16a34a;" title="Correct"></div>
-      <div style="width:{{ metrics.dp.modifie / dp_t * 100 }}%;background:#eab308;" title="Modifié"></div>
-      <div style="width:{{ metrics.dp.supprime / dp_t * 100 }}%;background:#dc2626;" title="Supprimé"></div>
-    </div>
-    <div style="display:flex;gap:1rem;margin-top:0.35rem;font-size:0.7rem;color:#64748b;">
-      <span><span style="display:inline-block;width:8px;height:8px;border-radius:50%;background:#16a34a;margin-right:3px;"></span>Correct</span>
-      <span><span style="display:inline-block;width:8px;height:8px;border-radius:50%;background:#eab308;margin-right:3px;"></span>Modifié</span>
-      <span><span style="display:inline-block;width:8px;height:8px;border-radius:50%;background:#dc2626;margin-right:3px;"></span>Supprimé</span>
-    </div>
-  </div>
-
-  <!-- DAS -->
-  <div class="card">
-    <h3>Diagnostics Associés</h3>
-    <div class="info-grid" style="margin-top:0.75rem;">
-      <div class="info-item">
-        <label>Precision</label>
-        <span style="font-size:1.3rem;font-weight:700;color:#1d4ed8;">{{ "%.1f" | format(metrics.das.precision * 100) }}%</span>
-      </div>
-      <div class="info-item">
-        <label>Recall</label>
-        <span style="font-size:1.3rem;font-weight:700;color:#7c3aed;">{{ "%.1f" | format(metrics.das.recall * 100) }}%</span>
-      </div>
-      <div class="info-item">
-        <label>F1-score</label>
-        <span style="font-size:1.3rem;font-weight:700;color:#0f172a;">{{ "%.1f" | format(metrics.das.f1 * 100) }}%</span>
-      </div>
-      <div class="info-item">
-        <label>Hallucination</label>
-        <span style="font-size:1.3rem;font-weight:700;color:#dc2626;">{{ "%.1f" | format(metrics.das.hallucination_rate * 100) }}%</span>
-      </div>
-    </div>
-    <div style="margin-top:0.75rem;font-size:0.8rem;color:#64748b;">
-      <div style="display:flex;gap:1.5rem;">
-        <span>Pipeline : {{ metrics.das.total_pipeline }} DAS</span>
-        <span>Référence DIM : {{ metrics.das.reference }}</span>
-        <span style="color:#16a34a;">Correct : {{ metrics.das.correct }}</span>
-        <span style="color:#ca8a04;">Modifié : {{ metrics.das.modifie }}</span>
-        <span style="color:#dc2626;">Supprimé : {{ metrics.das.supprime }}</span>
-        <span style="color:#7c3aed;">Ajouté : {{ metrics.das.ajoutes }}</span>
-      </div>
-    </div>
-    <!-- Taux manqués -->
-    <div style="margin-top:0.5rem;font-size:0.8rem;">
-      <span style="color:#64748b;">Taux DAS manqués : </span>
-      <span style="font-weight:600;color:#7c3aed;">{{ "%.1f" | format(metrics.das.miss_rate * 100) }}%</span>
-      <span style="color:#94a3b8;font-size:0.75rem;"> ({{ metrics.das.ajoutes }} ajoutés / {{ metrics.das.reference }} référence)</span>
-    </div>
-  </div>
-</div>
-
-<!-- Ventilation par confiance -->
-{% if metrics.by_confidence %}
-<div class="card" style="margin-bottom:1rem;">
-  <h3>Par niveau de confiance</h3>
-  <table style="margin-top:0.75rem;">
-    <thead>
-      <tr>
-        <th>Confiance</th>
-        <th>Total DAS</th>
-        <th>Correct</th>
-        <th>Modifié</th>
-        <th>Supprimé</th>
-        <th>Precision</th>
-        <th>Hallucination</th>
-      </tr>
-    </thead>
-    <tbody>
-      {% for conf, bucket in metrics.by_confidence.items() %}
-      <tr>
-        <td>{{ conf | confidence_badge }}</td>
-        <td>{{ bucket.total }}</td>
-        <td style="color:#16a34a;">{{ bucket.correct }}</td>
-        <td style="color:#ca8a04;">{{ bucket.modifie }}</td>
-        <td style="color:#dc2626;">{{ bucket.supprime }}</td>
-        <td style="font-weight:600;">{{ "%.1f" | format(bucket.precision * 100) }}%</td>
-        <td style="font-weight:600;color:#dc2626;">{{ "%.1f" | format(bucket.hallucination * 100) }}%</td>
-      </tr>
-      {% endfor %}
-    </tbody>
-  </table>
-</div>
-{% endif %}
-
-<!-- Ventilation par source -->
-{% if metrics.by_source %}
-<div class="card" style="margin-bottom:1rem;">
-  <h3>Par source d'extraction</h3>
-  <table style="margin-top:0.75rem;">
-    <thead>
-      <tr>
-        <th>Source</th>
-        <th>Total DAS</th>
-        <th>Correct</th>
-        <th>Modifié</th>
-        <th>Supprimé</th>
-        <th>Precision</th>
-        <th>Hallucination</th>
-      </tr>
-    </thead>
-    <tbody>
-      {% for source, bucket in metrics.by_source.items() %}
-      <tr>
-        <td><span style="font-size:0.8rem;padding:2px 8px;border-radius:4px;background:#f1f5f9;font-weight:600;">{{ source }}</span></td>
-        <td>{{ bucket.total }}</td>
-        <td style="color:#16a34a;">{{ bucket.correct }}</td>
-        <td style="color:#ca8a04;">{{ bucket.modifie }}</td>
-        <td style="color:#dc2626;">{{ bucket.supprime }}</td>
-        <td style="font-weight:600;">{{ "%.1f" | format(bucket.precision * 100) }}%</td>
-        <td style="font-weight:600;color:#dc2626;">{{ "%.1f" | format(bucket.hallucination * 100) }}%</td>
-      </tr>
-      {% endfor %}
-    </tbody>
-  </table>
-</div>
-{% endif %}
-
-<!-- Top corrections DAS -->
-{% if metrics.top_corrections %}
-<div class="card" style="margin-bottom:1rem;">
-  <h3>Top corrections DAS (code pipeline &rarr; code DIM)</h3>
-  <table style="margin-top:0.75rem;">
-    <thead>
-      <tr>
-        <th>Code pipeline</th>
-        <th></th>
-        <th>Code corrigé</th>
-        <th>Occurrences</th>
-      </tr>
-    </thead>
-    <tbody>
-      {% for (code_from, code_to), count in metrics.top_corrections %}
-      <tr>
-        <td><span style="font-family:monospace;font-weight:600;color:#dc2626;">{{ code_from }}</span></td>
-        <td style="color:#94a3b8;">&rarr;</td>
-        <td><span style="font-family:monospace;font-weight:600;color:#16a34a;">{{ code_to }}</span></td>
-        <td>{{ count }}</td>
-      </tr>
-      {% endfor %}
-    </tbody>
-  </table>
-</div>
-{% endif %}
-
-<!-- Top corrections DP -->
-{% if metrics.dp_corrections %}
-<div class="card" style="margin-bottom:1rem;">
-  <h3>Top corrections DP (code pipeline &rarr; code DIM)</h3>
-  <table style="margin-top:0.75rem;">
-    <thead>
-      <tr>
-        <th>Code pipeline</th>
-        <th></th>
-        <th>Code corrigé</th>
-        <th>Occurrences</th>
-      </tr>
-    </thead>
-    <tbody>
-      {% for (code_from, code_to), count in metrics.dp_corrections %}
-      <tr>
-        <td><span style="font-family:monospace;font-weight:600;color:#dc2626;">{{ code_from }}</span></td>
-        <td style="color:#94a3b8;">&rarr;</td>
-        <td><span style="font-family:monospace;font-weight:600;color:#16a34a;">{{ code_to }}</span></td>
-        <td>{{ count }}</td>
-      </tr>
-      {% endfor %}
-    </tbody>
-  </table>
-</div>
-{% endif %}
-
-{% endif %}
-{% endblock %}
diff --git a/t2a_install_rag_cleanup/src/viewer/validation.py b/t2a_install_rag_cleanup/src/viewer/validation.py
deleted file mode 100644
index a0856e6..0000000
--- a/t2a_install_rag_cleanup/src/viewer/validation.py
+++ /dev/null
@@ -1,272 +0,0 @@
-"""Gestionnaire de données pour la validation DIM (gold standard)."""
-
-from __future__ import annotations
-
-import json
-import logging
-import os
-import tempfile
-from datetime import datetime
-from pathlib import Path
-
-from ..config import BASE_DIR
-
-logger = logging.getLogger(__name__)
-
-GOLD_DIR = BASE_DIR / "data" / "gold_standard"
-
-
-class ValidationManager:
-    """Gère les annotations de validation DIM (fichiers JSON par dossier)."""
-
-    def __init__(self, gold_dir: Path | None = None):
-        self.gold_dir = gold_dir or GOLD_DIR
-        self.gold_dir.mkdir(parents=True, exist_ok=True)
-
-    # ------------------------------------------------------------------
-    # Helpers
-    # ------------------------------------------------------------------
-
-    def _annotation_path(self, dossier_id: str) -> Path:
-        """Chemin du fichier annotation pour un dossier donné."""
-        safe_name = dossier_id.replace("/", "__") + ".json"
-        return self.gold_dir / safe_name
-
-    # ------------------------------------------------------------------
-    # CRUD
-    # ------------------------------------------------------------------
-
-    def load_annotation(self, dossier_id: str) -> dict | None:
-        """Charge l'annotation existante pour un dossier."""
-        path = self._annotation_path(dossier_id)
-        if not path.exists():
-            return None
-        try:
-            return json.loads(path.read_text(encoding="utf-8"))
-        except Exception:
-            logger.warning("Impossible de charger l'annotation %s", path)
-            return None
-
-    def save_annotation(self, dossier_id: str, data: dict) -> None:
-        """Sauvegarde atomique (write temp + rename) d'une annotation."""
-        path = self._annotation_path(dossier_id)
-        data["dossier_id"] = dossier_id
-        data.setdefault("date_validation", datetime.now().isoformat(timespec="seconds"))
-
-        fd, tmp_path = tempfile.mkstemp(
-            dir=str(self.gold_dir), suffix=".tmp", prefix=".annot_"
-        )
-        try:
-            with os.fdopen(fd, "w", encoding="utf-8") as f:
-                json.dump(data, f, ensure_ascii=False, indent=2)
-            os.replace(tmp_path, path)
-        except Exception:
-            # Nettoyage en cas d'erreur
-            try:
-                os.unlink(tmp_path)
-            except OSError:
-                pass
-            raise
-
-    def list_annotations(self) -> list[dict]:
-        """Liste toutes les annotations avec métadonnées (statut, validateur, date)."""
-        results = []
-        for path in sorted(self.gold_dir.glob("*.json")):
-            if path.name.startswith("_"):
-                continue
-            try:
-                data = json.loads(path.read_text(encoding="utf-8"))
-                results.append({
-                    "dossier_id": data.get("dossier_id", path.stem.replace("__", "/")),
-                    "statut": data.get("statut", "non_commence"),
-                    "validateur": data.get("validateur", ""),
-                    "date_validation": data.get("date_validation", ""),
-                })
-            except Exception:
-                logger.warning("Annotation illisible : %s", path)
-        return results
-
-    def load_selection(self) -> list[str]:
-        """Charge la liste des dossiers sélectionnés depuis _selection.json."""
-        selection_path = self.gold_dir / "_selection.json"
-        if not selection_path.exists():
-            return []
-        try:
-            data = json.loads(selection_path.read_text(encoding="utf-8"))
-            return data.get("dossiers", [])
-        except Exception:
-            return []
-
-    # ------------------------------------------------------------------
-    # Métriques
-    # ------------------------------------------------------------------
-
-    def compute_metrics(self, groups: dict) -> dict:
-        """Calcule precision, recall, F1 et hallucination rate depuis les annotations.
-
-        Args:
-            groups: résultat de scan_dossiers() pour accéder aux données pipeline.
-
-        Returns:
-            Dictionnaire de métriques globales et ventilées.
-        """
-        annotations = []
-        for path in sorted(self.gold_dir.glob("*.json")):
-            if path.name.startswith("_"):
-                continue
-            try:
-                data = json.loads(path.read_text(encoding="utf-8"))
-                if data.get("statut") == "valide":
-                    annotations.append(data)
-            except Exception:
-                continue
-
-        total = len(annotations)
-        if total == 0:
-            return {"total_valides": 0}
-
-        # --- Métriques DP ---
-        dp_correct = 0
-        dp_modifie = 0
-        dp_supprime = 0
-        dp_corrections: list[tuple[str, str]] = []  # (pipeline, corrige)
-
-        # --- Métriques DAS ---
-        das_correct = 0
-        das_modifie = 0
-        das_supprime = 0
-        das_ajoutes = 0
-        das_total_pipeline = 0
-        das_corrections: list[tuple[str, str]] = []
-
-        # --- Ventilation par confiance ---
-        by_confidence: dict[str, dict] = {}
-        # --- Ventilation par source ---
-        by_source: dict[str, dict] = {}
-
-        for annot in annotations:
-            dossier_id = annot.get("dossier_id", "")
-
-            # Trouver les données pipeline correspondantes
-            pipeline_data = self._find_pipeline_data(dossier_id, groups)
-
-            # DP
-            dp = annot.get("dp", {})
-            dp_statut = dp.get("statut", "correct")
-            if dp_statut == "correct":
-                dp_correct += 1
-            elif dp_statut == "modifie":
-                dp_modifie += 1
-                code_orig = dp.get("code_pipeline", "")
-                code_corr = dp.get("code_corrige", "")
-                if code_orig and code_corr:
-                    dp_corrections.append((code_orig, code_corr))
-            elif dp_statut == "supprime":
-                dp_supprime += 1
-
-            # DAS
-            das_list = annot.get("das", [])
-            das_aj = annot.get("das_ajoutes", [])
-            das_total_pipeline += len(das_list)
-            das_ajoutes += len(das_aj)
-
-            for das in das_list:
-                das_statut = das.get("statut", "correct")
-                conf = das.get("confidence", "")
-                source = das.get("source", "")
-
-                if das_statut == "correct":
-                    das_correct += 1
-                elif das_statut == "modifie":
-                    das_modifie += 1
-                    code_orig = das.get("code_pipeline", "")
-                    code_corr = das.get("code_corrige", "")
-                    if code_orig and code_corr:
-                        das_corrections.append((code_orig, code_corr))
-                elif das_statut == "supprime":
-                    das_supprime += 1
-
-                # Ventilation par confiance
-                if conf:
-                    bucket = by_confidence.setdefault(conf, {
-                        "correct": 0, "modifie": 0, "supprime": 0, "total": 0
-                    })
-                    bucket["total"] += 1
-                    bucket[das_statut] = bucket.get(das_statut, 0) + 1
-
-                # Ventilation par source
-                if source:
-                    bucket = by_source.setdefault(source, {
-                        "correct": 0, "modifie": 0, "supprime": 0, "total": 0
-                    })
-                    bucket["total"] += 1
-                    bucket[das_statut] = bucket.get(das_statut, 0) + 1
-
-        # --- Calculs ---
-        # DAS reference = correct + modifié + ajoutés (les vrais DAS selon le DIM)
-        das_reference = das_correct + das_modifie + das_ajoutes
-        # DAS pipeline valides = correct + modifié (non supprimés)
-        das_pipeline_valides = das_correct + das_modifie
-
-        precision = das_pipeline_valides / das_total_pipeline if das_total_pipeline > 0 else 0
-        recall = das_pipeline_valides / das_reference if das_reference > 0 else 0
-        f1 = 2 * precision * recall / (precision + recall) if (precision + recall) > 0 else 0
-        hallucination_rate = das_supprime / das_total_pipeline if das_total_pipeline > 0 else 0
-        miss_rate = das_ajoutes / das_reference if das_reference > 0 else 0
-
-        # Top corrections DAS
-        from collections import Counter
-        correction_counter = Counter(das_corrections)
-        top_corrections = correction_counter.most_common(10)
-
-        # Ventilation par confiance : calculer precision par bucket
-        for bucket in by_confidence.values():
-            t = bucket["total"]
-            valides = bucket.get("correct", 0) + bucket.get("modifie", 0)
-            bucket["precision"] = valides / t if t > 0 else 0
-            bucket["hallucination"] = bucket.get("supprime", 0) / t if t > 0 else 0
-
-        for bucket in by_source.values():
-            t = bucket["total"]
-            valides = bucket.get("correct", 0) + bucket.get("modifie", 0)
-            bucket["precision"] = valides / t if t > 0 else 0
-            bucket["hallucination"] = bucket.get("supprime", 0) / t if t > 0 else 0
-
-        return {
-            "total_valides": total,
-            "dp": {
-                "total": total,
-                "correct": dp_correct,
-                "modifie": dp_modifie,
-                "supprime": dp_supprime,
-                "accuracy": dp_correct / total if total > 0 else 0,
-            },
-            "das": {
-                "total_pipeline": das_total_pipeline,
-                "correct": das_correct,
-                "modifie": das_modifie,
-                "supprime": das_supprime,
-                "ajoutes": das_ajoutes,
-                "reference": das_reference,
-                "precision": precision,
-                "recall": recall,
-                "f1": f1,
-                "hallucination_rate": hallucination_rate,
-                "miss_rate": miss_rate,
-            },
-            "by_confidence": by_confidence,
-            "by_source": by_source,
-            "top_corrections": top_corrections,
-            "dp_corrections": Counter(dp_corrections).most_common(10),
-        }
-
-    def _find_pipeline_data(self, dossier_id: str, groups: dict) -> dict | None:
-        """Trouve les données pipeline pour un dossier_id donné."""
-        # dossier_id est de la forme "45_23183041/fusionne"
-        parts = dossier_id.split("/")
-        group_name = parts[0] if parts else ""
-        items = groups.get(group_name, [])
-        for item in items:
-            if "fusionne" in item["name"]:
-                return item
-        return items[0] if items else None
diff --git a/tests/test_atih_rules.py b/tests/test_atih_rules.py
index afd70d5..0739803 100644
--- a/tests/test_atih_rules.py
+++ b/tests/test_atih_rules.py
@@ -135,46 +135,46 @@ class TestVeto22SameCategory:
 
 
 # ================================================================
-# VETO-23 : Exclusions mutuelles
+# VETO-25 : Exclusions mutuelles (ex-VETO-23, refactorisé via diagnostic_conflicts.yaml)
 # ================================================================
 
-class TestVeto23MutualExclusions:
+class TestVeto25MutualExclusions:
     def test_e10_e11_mutual(self):
-        """E10 + E11 = diabète type 1 et 2 → VETO-23."""
+        """E10 + E11 = diabète type 1 et 2 → VETO-25."""
         d = _make_dossier(dp_code="E10.9", das_codes=["E11.9", "I10"])
         report = apply_vetos(d)
-        v23 = [i for i in report.issues if i.veto == "VETO-23"]
-        assert len(v23) == 1
-        assert "Diabète" in v23[0].message
+        v25 = [i for i in report.issues if i.veto == "VETO-25"]
+        assert len(v25) == 1
+        assert "Diabète" in v25[0].message
 
     def test_i10_i11_mutual(self):
-        """I10 + I11 = HTA essentielle + secondaire → VETO-23."""
+        """I10 + I11 = HTA essentielle + secondaire → VETO-25."""
         d = _make_dossier(dp_code="I10", das_codes=["I11.9"])
         report = apply_vetos(d)
-        v23 = [i for i in report.issues if i.veto == "VETO-23"]
-        assert len(v23) == 1
-        assert "HTA" in v23[0].message
+        v25 = [i for i in report.issues if i.veto == "VETO-25"]
+        assert len(v25) == 1
+        assert "HTA" in v25[0].message
 
     def test_i10_i13_mutual(self):
-        """I10 + I13 (HTA cardiorénale) → VETO-23."""
+        """I10 + I13 (HTA cardiorénale) → VETO-25."""
         d = _make_dossier(dp_code="K35.8", das_codes=["I10", "I13.0"])
         report = apply_vetos(d)
-        v23 = [i for i in report.issues if i.veto == "VETO-23"]
-        assert len(v23) == 1
+        v25 = [i for i in report.issues if i.veto == "VETO-25"]
+        assert len(v25) == 1
 
     def test_no_mutual_exclusion(self):
-        """Pas de conflit → pas de VETO-23."""
+        """Pas de conflit → pas de VETO-25."""
         d = _make_dossier(dp_code="E11.9", das_codes=["I10", "K35.8"])
         report = apply_vetos(d)
-        v23 = [i for i in report.issues if i.veto == "VETO-23"]
-        assert len(v23) == 0
+        v25 = [i for i in report.issues if i.veto == "VETO-25"]
+        assert len(v25) == 0
 
     def test_e10_alone_no_veto(self):
-        """E10 seul → pas de VETO-23."""
+        """E10 seul → pas de VETO-25."""
         d = _make_dossier(dp_code="E10.9", das_codes=["I10"])
         report = apply_vetos(d)
-        v23 = [i for i in report.issues if i.veto == "VETO-23"]
-        assert len(v23) == 0
+        v25 = [i for i in report.issues if i.veto == "VETO-25"]
+        assert len(v25) == 0
 
 
 # ================================================================
@@ -237,7 +237,7 @@ class TestVerdictIntegration:
         veto_ids = {i.veto for i in report.issues}
         # Z45 interdit en DP → VETO-20
         assert "VETO-20" in veto_ids
-        # E10+E11 → VETO-23
-        assert "VETO-23" in veto_ids
+        # E10+E11 → VETO-25 (ex-VETO-23, via diagnostic_conflicts.yaml)
+        assert "VETO-25" in veto_ids
         # S72 sans externe → VETO-24
         assert "VETO-24" in veto_ids
diff --git a/tests/test_completude.py b/tests/test_completude.py
new file mode 100644
index 0000000..9637677
--- /dev/null
+++ b/tests/test_completude.py
@@ -0,0 +1,885 @@
+"""Tests de la checklist de complétude documentaire DIM."""
+
+import pytest
+
+from src.config import (
+    ActeCCAM,
+    BiologieCle,
+    CheckCompletude,
+    CompletudeDossier,
+    Diagnostic,
+    DossierMedical,
+    Imagerie,
+    ItemCompletude,
+    PreuveClinique,
+    Sejour,
+    load_completude_rules,
+)
+from src.quality.completude import build_completude_checklist
+
+
+# ── Helpers ──────────────────────────────────────────────────────────
+
+
+def _make_dossier(**kwargs) -> DossierMedical:
+    """Crée un DossierMedical minimal avec des valeurs par défaut."""
+    return DossierMedical(
+        sejour=kwargs.get("sejour", Sejour()),
+        diagnostic_principal=kwargs.get("dp", None),
+        diagnostics_associes=kwargs.get("das", []),
+        biologie_cle=kwargs.get("bio", []),
+        imagerie=kwargs.get("imagerie", []),
+        actes_ccam=kwargs.get("actes", []),
+        document_type=kwargs.get("document_type", "crh"),
+        source_files=kwargs.get("source_files", []),
+    )
+
+
+# ── Tests du chargement YAML ────────────────────────────────────────
+
+
+class TestLoadRules:
+    def test_load_completude_rules(self):
+        rules = load_completude_rules()
+        assert "diagnostics" in rules
+        assert "actes" in rules
+        assert len(rules["diagnostics"]) >= 10  # Au moins 10 familles
+
+    def test_rules_structure(self):
+        rules = load_completude_rules()
+        for family_id, family in rules["diagnostics"].items():
+            assert "prefixes" in family, f"Famille {family_id} sans prefixes"
+            assert "items" in family, f"Famille {family_id} sans items"
+            for item in family["items"]:
+                assert "categorie" in item
+                assert "element" in item
+                assert "importance" in item
+                assert item["importance"] in ("obligatoire", "recommande")
+
+    def test_yaml_version_2(self):
+        """Le YAML enrichi doit être en version 2."""
+        rules = load_completude_rules()
+        assert rules.get("version") == 2
+
+    def test_seuils_present_in_yaml(self):
+        """Vérifier que les seuils sont bien chargés sur certains items."""
+        rules = load_completude_rules()
+        denut = rules["diagnostics"]["denutrition"]
+        items_with_seuil = [i for i in denut["items"] if "seuil" in i]
+        assert len(items_with_seuil) >= 2, "Dénutrition doit avoir au moins 2 items avec seuil"
+
+
+# ── Tests dénutrition ────────────────────────────────────────────────
+
+
+class TestDenutrition:
+    def test_denutrition_complete(self):
+        """E43 avec albumine + IMC → defendable, score élevé."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Dénutrition sévère", cim10_suggestion="E43"),
+            sejour=Sejour(imc=16.5),
+            bio=[BiologieCle(test="Albumine", valeur="28 g/L", valeur_num=28.0)],
+        )
+        result = build_completude_checklist(dossier)
+        assert len(result.checks) >= 1
+        check_e43 = next(c for c in result.checks if c.code == "E43")
+        assert check_e43.verdict == "defendable"
+        assert check_e43.score >= 70
+
+        # Vérifier les items
+        alb = next(i for i in check_e43.items if i.element == "Albumine")
+        assert alb.statut == "present_confirme"  # 28 < 30 → confirmé
+        assert alb.confirmation_detail is not None
+
+        imc = next(i for i in check_e43.items if i.element == "IMC")
+        assert imc.statut == "present_confirme"  # 16.5 < 18.5 → confirmé
+
+    def test_denutrition_albumine_haute(self):
+        """E43 avec albumine 38 (> 30) → present_non_confirme."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Dénutrition sévère", cim10_suggestion="E43"),
+            sejour=Sejour(imc=16.5),
+            bio=[BiologieCle(test="Albumine", valeur="38 g/L", valeur_num=38.0)],
+        )
+        result = build_completude_checklist(dossier)
+        check_e43 = next(c for c in result.checks if c.code == "E43")
+        alb = next(i for i in check_e43.items if i.element == "Albumine")
+        assert alb.statut == "present_non_confirme"
+        assert alb.confirmation_detail is not None
+        # Verdict doit refléter la non-confirmation
+        assert check_e43.verdict == "fragile"
+
+    def test_denutrition_sans_albumine(self):
+        """E43 sans albumine → fragile."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Dénutrition sévère", cim10_suggestion="E43"),
+            sejour=Sejour(imc=16.5),
+        )
+        result = build_completude_checklist(dossier)
+        check_e43 = next(c for c in result.checks if c.code == "E43")
+        assert check_e43.verdict == "fragile"
+        alb = next(i for i in check_e43.items if i.element == "Albumine")
+        assert alb.statut == "absent"
+
+    def test_denutrition_sans_rien(self):
+        """E43 sans albumine ni IMC → indefendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Dénutrition sévère", cim10_suggestion="E43"),
+        )
+        result = build_completude_checklist(dossier)
+        check_e43 = next(c for c in result.checks if c.code == "E43")
+        assert check_e43.verdict == "indefendable"
+        assert check_e43.score < 30
+
+    def test_e44_match_aussi(self):
+        """E44.0 (dénutrition modérée) doit aussi matcher les règles de dénutrition."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Dénutrition modérée", cim10_suggestion="E44.0"),
+            sejour=Sejour(imc=19.5),
+            bio=[BiologieCle(test="Albumine", valeur="32 g/L", valeur_num=32.0)],
+        )
+        result = build_completude_checklist(dossier)
+        assert any(c.code == "E44.0" for c in result.checks)
+        check = next(c for c in result.checks if c.code == "E44.0")
+        # 32 est dans [30-35] et 19.5 est dans [18.5-21]
+        alb = next(i for i in check.items if i.element == "Albumine")
+        assert alb.statut == "present_confirme"
+
+    def test_e44_with_e43_seuils_not_applied(self):
+        """E44 ne doit pas appliquer les seuils E43 (code_filter)."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Dénutrition modérée", cim10_suggestion="E44.1"),
+            sejour=Sejour(imc=19.0),
+            bio=[BiologieCle(test="Albumine", valeur="32 g/L", valeur_num=32.0)],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "E44.1")
+        # Les items avec code_filter=E43 ne doivent PAS apparaître pour E44
+        # Les items avec code_filter=E44 DOIVENT apparaître
+        alb = next((i for i in check.items if i.element == "Albumine"), None)
+        assert alb is not None
+        # IMC doit utiliser les seuils E44 (range 18.5-21)
+        imc = next((i for i in check.items if i.element == "IMC"), None)
+        assert imc is not None
+        assert imc.statut == "present_confirme"  # 19.0 in [18.5, 21]
+
+
+# ── Tests anémie ─────────────────────────────────────────────────────
+
+
+class TestAnemie:
+    def test_anemie_sans_hb(self):
+        """D50 sans hémoglobine → indefendable (Hb est obligatoire)."""
+        dossier = _make_dossier(
+            das=[Diagnostic(texte="Anémie ferriprive", cim10_suggestion="D50.9")],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "D50.9")
+        assert check.verdict == "indefendable"
+
+    def test_anemie_avec_hb_basse(self):
+        """D64 avec Hb basse (homme) → present_confirme."""
+        dossier = _make_dossier(
+            sejour=Sejour(sexe="M"),
+            das=[Diagnostic(texte="Anémie", cim10_suggestion="D64.9")],
+            bio=[BiologieCle(test="Hémoglobine", valeur="9.5 g/dL", valeur_num=9.5)],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "D64.9")
+        assert check.verdict == "defendable"
+        hb = next(i for i in check.items if i.element == "Hémoglobine")
+        assert hb.statut == "present_confirme"  # 9.5 < 13
+
+    def test_anemie_hb_normale(self):
+        """D64 avec Hb 14 (homme) → present_non_confirme."""
+        dossier = _make_dossier(
+            sejour=Sejour(sexe="M"),
+            das=[Diagnostic(texte="Anémie", cim10_suggestion="D64.9")],
+            bio=[BiologieCle(test="Hémoglobine", valeur="14 g/dL", valeur_num=14.0)],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "D64.9")
+        hb = next(i for i in check.items if i.element == "Hémoglobine")
+        assert hb.statut == "present_non_confirme"
+
+    def test_anemie_seuil_femme(self):
+        """D50 avec Hb 12.5 (femme) → non_confirme (seuil femme: < 12)."""
+        dossier = _make_dossier(
+            sejour=Sejour(sexe="F"),
+            das=[Diagnostic(texte="Anémie", cim10_suggestion="D50.9")],
+            bio=[BiologieCle(test="Hb", valeur="12.5 g/dL", valeur_num=12.5)],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "D50.9")
+        hb = next(i for i in check.items if i.element == "Hémoglobine")
+        assert hb.statut == "present_non_confirme"
+
+
+# ── Tests insuffisance rénale ────────────────────────────────────────
+
+
+class TestInsuffisanceRenale:
+    def test_ir_avec_creatinine_haute(self):
+        """N18 avec créatinine 180 (> 120) → present_confirme."""
+        dossier = _make_dossier(
+            das=[Diagnostic(texte="IRC stade 3", cim10_suggestion="N18.3")],
+            bio=[BiologieCle(test="Créatinine", valeur="180 µmol/L", valeur_num=180.0)],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "N18.3")
+        assert check.verdict == "defendable"
+        creat = next(i for i in check.items if i.element == "Créatinine")
+        assert creat.statut == "present_confirme"
+
+    def test_ir_creatinine_normale(self):
+        """N18 avec créatinine 90 (≤ 120) → present_non_confirme."""
+        dossier = _make_dossier(
+            das=[Diagnostic(texte="IRC", cim10_suggestion="N18.3")],
+            bio=[BiologieCle(test="Créatinine", valeur="90 µmol/L", valeur_num=90.0)],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "N18.3")
+        creat = next(i for i in check.items if i.element == "Créatinine")
+        assert creat.statut == "present_non_confirme"
+
+
+# ── Tests sepsis ─────────────────────────────────────────────────────
+
+
+class TestSepsis:
+    def test_sepsis_complet_confirme(self):
+        """A41 avec CRP > 50 + leucocytes > 10 → confirme."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Sepsis", cim10_suggestion="A41.9"),
+            bio=[
+                BiologieCle(test="CRP", valeur="180 mg/L", valeur_num=180.0),
+                BiologieCle(test="Leucocytes", valeur="15 G/L", valeur_num=15.0),
+            ],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "A41.9")
+        assert check.verdict == "defendable"
+        crp = next(i for i in check.items if i.element == "CRP")
+        assert crp.statut == "present_confirme"  # 180 > 50
+        leuco = next(i for i in check.items if i.element == "Leucocytes")
+        assert leuco.statut == "present_confirme"  # 15 hors [4-10]
+
+    def test_sepsis_leucocytes_normaux(self):
+        """A41 avec leucocytes 7 (dans norme) → present_non_confirme."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Sepsis", cim10_suggestion="A41.9"),
+            bio=[
+                BiologieCle(test="CRP", valeur="180 mg/L", valeur_num=180.0),
+                BiologieCle(test="Leucocytes", valeur="7 G/L", valeur_num=7.0),
+            ],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "A41.9")
+        leuco = next(i for i in check.items if i.element == "Leucocytes")
+        assert leuco.statut == "present_non_confirme"
+
+    def test_sepsis_sans_bio(self):
+        """A41 sans CRP ni leucocytes → indefendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Sepsis", cim10_suggestion="A41.9"),
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "A41.9")
+        assert check.verdict == "indefendable"
+
+
+# ── Tests seuils spécifiques ─────────────────────────────────────────
+
+
+class TestSeuils:
+    def test_pancreatite_lipase_haute(self):
+        """K85 avec lipase 250 (> 180) → present_confirme."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Pancréatite aiguë", cim10_suggestion="K85"),
+            bio=[BiologieCle(test="Lipase", valeur="250 UI/L", valeur_num=250.0)],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "K85")
+        lip = next(i for i in check.items if i.element == "Lipasémie")
+        assert lip.statut == "present_confirme"
+
+    def test_pancreatite_lipase_basse(self):
+        """K85 avec lipase 120 (≤ 180) → present_non_confirme."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Pancréatite aiguë", cim10_suggestion="K85"),
+            bio=[BiologieCle(test="Lipase", valeur="120 UI/L", valeur_num=120.0)],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "K85")
+        lip = next(i for i in check.items if i.element == "Lipasémie")
+        assert lip.statut == "present_non_confirme"
+
+    def test_obesite_imc_confirme(self):
+        """E66 avec IMC 42 (> 30) → present_confirme."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Obésité morbide", cim10_suggestion="E66.0"),
+            sejour=Sejour(imc=42.0, poids=130.0, taille=176.0),
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "E66.0")
+        imc = next(i for i in check.items if i.element == "IMC")
+        assert imc.statut == "present_confirme"
+
+    def test_obesite_imc_non_confirme(self):
+        """E66 avec IMC 25 (< 30) → present_non_confirme."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Obésité", cim10_suggestion="E66.9"),
+            sejour=Sejour(imc=25.0, poids=75.0),
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "E66.9")
+        imc = next(i for i in check.items if i.element == "IMC")
+        assert imc.statut == "present_non_confirme"
+
+    def test_hepatique_transaminases(self):
+        """K72 avec ASAT 85 + ALAT 92 → present_confirme."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Insuffisance hépatique", cim10_suggestion="K72.0"),
+            bio=[
+                BiologieCle(test="ASAT", valeur="85 UI/L", valeur_num=85.0),
+                BiologieCle(test="ALAT", valeur="92 UI/L", valeur_num=92.0),
+            ],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "K72.0")
+        asat = next(i for i in check.items if i.element == "ASAT")
+        alat = next(i for i in check.items if i.element == "ALAT")
+        assert asat.statut == "present_confirme"
+        assert alat.statut == "present_confirme"
+
+    def test_ic_bnp_confirme(self):
+        """I50 avec BNP 450 (> 100) → present_confirme."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Insuffisance cardiaque", cim10_suggestion="I50.0"),
+            bio=[BiologieCle(test="BNP", valeur="450 pg/mL", valeur_num=450.0)],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "I50.0")
+        bnp = next(i for i in check.items if "BNP" in i.element)
+        assert bnp.statut == "present_confirme"
+
+    def test_electrolytes_sodium_bas(self):
+        """E87 avec Na 128 (< 135) → present_confirme."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Hyponatrémie", cim10_suggestion="E87.1"),
+            bio=[
+                BiologieCle(test="Sodium", valeur="128 mmol/L", valeur_num=128.0),
+                BiologieCle(test="Potassium", valeur="4.2 mmol/L", valeur_num=4.2),
+            ],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "E87.1")
+        na = next(i for i in check.items if i.element == "Sodium")
+        assert na.statut == "present_confirme"
+        # K normal (4.2 dans [3.5-5.0]) → non confirmé
+        k = next(i for i in check.items if i.element == "Potassium")
+        assert k.statut == "present_non_confirme"
+
+    def test_bio_sans_valeur_num(self):
+        """Bio présente mais sans valeur_num → statut 'present' (pas de confrontation seuil)."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="IRC", cim10_suggestion="N18.3"),
+            bio=[BiologieCle(test="Créatinine", valeur="élevée")],  # pas de valeur_num
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "N18.3")
+        creat = next(i for i in check.items if i.element == "Créatinine")
+        assert creat.statut == "present"
+
+
+# ── Tests preuves cliniques ──────────────────────────────────────────
+
+
+class TestPreuvesCliniques:
+    def test_preuve_clinique_indirect(self):
+        """Élément absent mais mentionné dans preuves_cliniques → present_indirect."""
+        dossier = _make_dossier(
+            dp=Diagnostic(
+                texte="Sepsis",
+                cim10_suggestion="A41.9",
+                preuves_cliniques=[
+                    PreuveClinique(
+                        type="biologie",
+                        element="CRP 180 mg/L",
+                        interpretation="syndrome inflammatoire majeur",
+                    ),
+                ],
+            ),
+            bio=[
+                # Pas de CRP dans biologie_cle, mais leucocytes oui
+                BiologieCle(test="Leucocytes", valeur="15 G/L", valeur_num=15.0),
+            ],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "A41.9")
+        crp = next(i for i in check.items if i.element == "CRP")
+        assert crp.statut == "present_indirect"
+        assert crp.valeur == "CRP 180 mg/L"
+        assert "preuves cliniques" in crp.confirmation_detail.lower()
+
+    def test_preuve_clinique_ne_remplace_pas_present(self):
+        """Si l'élément est déjà présent, les preuves ne sont pas utilisées."""
+        dossier = _make_dossier(
+            dp=Diagnostic(
+                texte="Sepsis",
+                cim10_suggestion="A41.9",
+                preuves_cliniques=[
+                    PreuveClinique(
+                        type="biologie",
+                        element="CRP 180 mg/L",
+                        interpretation="syndrome inflammatoire majeur",
+                    ),
+                ],
+            ),
+            bio=[
+                BiologieCle(test="CRP", valeur="180 mg/L", valeur_num=180.0),
+                BiologieCle(test="Leucocytes", valeur="15 G/L", valeur_num=15.0),
+            ],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "A41.9")
+        crp = next(i for i in check.items if i.element == "CRP")
+        # Doit être present_confirme, pas present_indirect
+        assert crp.statut == "present_confirme"
+
+    def test_preuve_imagerie_indirect(self):
+        """Imagerie absente mais mentionnée dans preuves → present_indirect."""
+        dossier = _make_dossier(
+            dp=Diagnostic(
+                texte="AVC ischémique",
+                cim10_suggestion="I63.9",
+                preuves_cliniques=[
+                    PreuveClinique(
+                        type="imagerie",
+                        element="IRM cérébral avec lésion ischémique",
+                        interpretation="AVC ischémique confirmé à l'IRM",
+                    ),
+                ],
+            ),
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "I63.9")
+        img = next(i for i in check.items if "Scanner/IRM" in i.element)
+        assert img.statut == "present_indirect"
+
+
+# ── Tests scoring pondéré ────────────────────────────────────────────
+
+
+class TestScoringPondere:
+    def test_present_confirme_full_weight(self):
+        """present_confirme compte pour 1.0."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="IRC", cim10_suggestion="N18.3"),
+            bio=[BiologieCle(test="Créatinine", valeur="200 µmol/L", valeur_num=200.0)],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "N18.3")
+        assert check.score >= 70
+
+    def test_present_non_confirme_reduced_weight(self):
+        """present_non_confirme compte pour 0.25 → score réduit."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="IRC", cim10_suggestion="N18.3"),
+            bio=[BiologieCle(test="Créatinine", valeur="90 µmol/L", valeur_num=90.0)],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "N18.3")
+        # present_non_confirme → 0.25 weight
+        assert check.score < 70
+
+    def test_present_indirect_half_weight(self):
+        """present_indirect compte pour 0.5."""
+        dossier = _make_dossier(
+            dp=Diagnostic(
+                texte="Sepsis",
+                cim10_suggestion="A41.9",
+                preuves_cliniques=[
+                    PreuveClinique(type="biologie", element="CRP 200 mg/L", interpretation="CRP élevée"),
+                    PreuveClinique(type="biologie", element="Leucocytes 18 G/L", interpretation="hyperleucocytose"),
+                ],
+            ),
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "A41.9")
+        # Les deux obligatoires sont indirect (0.5 chacun)
+        assert 20 <= check.score <= 60
+
+
+# ── Tests tumeurs ────────────────────────────────────────────────────
+
+
+class TestTumeurs:
+    def test_tumeur_sans_anapath(self):
+        """C34 sans ANAPATH → indefendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Cancer bronchique", cim10_suggestion="C34.1"),
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "C34.1")
+        assert check.verdict == "indefendable"
+        assert "ANAPATH" in result.documents_manquants
+
+    def test_tumeur_avec_anapath(self):
+        """C34 avec ANAPATH dans les fichiers sources → defendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Cancer bronchique", cim10_suggestion="C34.1"),
+            source_files=["CRH_patient.pdf", "ANAPATH_biopsie.pdf"],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "C34.1")
+        assert check.verdict == "defendable"
+
+
+# ── Tests actes chirurgicaux ─────────────────────────────────────────
+
+
+class TestActesChirurgicaux:
+    def test_chirurgie_sans_cro(self):
+        """Acte CCAM chirurgical sans CRO → indefendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Cholécystite", cim10_suggestion="K80.1"),
+            actes=[ActeCCAM(texte="Cholécystectomie", code_ccam_suggestion="HMFC004")],
+        )
+        result = build_completude_checklist(dossier)
+        acte_check = next((c for c in result.checks if c.type_diag == "Acte"), None)
+        assert acte_check is not None
+        assert acte_check.verdict == "indefendable"
+        assert "CRO" in result.documents_manquants
+
+    def test_chirurgie_avec_cro(self):
+        """Acte chirurgical avec CRO → defendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Cholécystite", cim10_suggestion="K80.1"),
+            actes=[ActeCCAM(texte="Cholécystectomie", code_ccam_suggestion="HMFC004")],
+            source_files=["CRH_patient.pdf", "CRO_cholecystectomie.pdf"],
+        )
+        result = build_completude_checklist(dossier)
+        acte_check = next((c for c in result.checks if c.type_diag == "Acte"), None)
+        assert acte_check is not None
+        assert acte_check.verdict == "defendable"
+
+
+# ── Tests embolie pulmonaire ─────────────────────────────────────────
+
+
+class TestEmboliePulmonaire:
+    def test_ep_avec_scanner(self):
+        """I26 avec angioscanner → defendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Embolie pulmonaire", cim10_suggestion="I26.0"),
+            imagerie=[Imagerie(type="Angioscanner thoracique", conclusion="EP bilatérale")],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "I26.0")
+        assert check.verdict == "defendable"
+
+    def test_ep_sans_imagerie(self):
+        """I26 sans imagerie → indefendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Embolie pulmonaire", cim10_suggestion="I26.9"),
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "I26.9")
+        assert check.verdict == "indefendable"
+
+
+# ── Tests 8 nouvelles familles ───────────────────────────────────────
+
+
+class TestNouvellesFamilles:
+    def test_avc_avec_scanner(self):
+        """I63 avec scanner cérébral → defendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="AVC ischémique", cim10_suggestion="I63.3"),
+            imagerie=[Imagerie(type="Scanner cérébral", conclusion="Ischémie sylvienne gauche")],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "I63.3")
+        assert check.verdict == "defendable"
+
+    def test_avc_sans_imagerie(self):
+        """I63 sans imagerie → indefendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="AVC ischémique", cim10_suggestion="I63.3"),
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "I63.3")
+        assert check.verdict == "indefendable"
+
+    def test_idm_avec_troponine_haute(self):
+        """I21 avec troponine 0.5 (> 0.04) → present_confirme."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="IDM", cim10_suggestion="I21.0"),
+            bio=[BiologieCle(test="Troponine I", valeur="0.5 ng/mL", valeur_num=0.5)],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "I21.0")
+        tropo = next(i for i in check.items if i.element == "Troponine")
+        assert tropo.statut == "present_confirme"
+
+    def test_idm_sans_troponine(self):
+        """I21 sans troponine → indefendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="IDM", cim10_suggestion="I21.0"),
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "I21.0")
+        assert check.verdict == "indefendable"
+
+    def test_pneumopathie_avec_radio(self):
+        """J18 avec radio thorax → defendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Pneumopathie", cim10_suggestion="J18.9"),
+            imagerie=[Imagerie(type="Radio thorax", conclusion="Foyer alvéolaire droit")],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "J18.9")
+        assert check.verdict == "defendable"
+
+    def test_tvp_avec_echodoppler(self):
+        """I80 avec écho-doppler → defendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="TVP", cim10_suggestion="I80.2"),
+            imagerie=[Imagerie(type="Écho-doppler veineux MI", conclusion="TVP fémorale")],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "I80.2")
+        assert check.verdict == "defendable"
+
+    def test_tvp_sans_imagerie(self):
+        """I80 sans écho-doppler → indefendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="TVP", cim10_suggestion="I80.2"),
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "I80.2")
+        assert check.verdict == "indefendable"
+
+    def test_insuff_resp_avec_gds(self):
+        """J96 avec gaz du sang → defendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Insuffisance respiratoire", cim10_suggestion="J96.0"),
+            bio=[BiologieCle(test="Gaz du sang", valeur="PaO2 55 mmHg")],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "J96.0")
+        assert check.verdict == "defendable"
+
+    def test_fracture_avec_radio(self):
+        """S72 avec imagerie → defendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Fracture col fémoral", cim10_suggestion="S72.0"),
+            imagerie=[Imagerie(type="Radiographie bassin", conclusion="Fracture cervicale vraie")],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "S72.0")
+        assert check.verdict == "defendable"
+
+    def test_fracture_sans_imagerie(self):
+        """S72 sans imagerie → indefendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Fracture col fémoral", cim10_suggestion="S72.0"),
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "S72.0")
+        assert check.verdict == "indefendable"
+
+    def test_iu_avec_ecbu(self):
+        """N39.0 avec ECBU → defendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Infection urinaire", cim10_suggestion="N39.0"),
+            bio=[BiologieCle(test="ECBU", valeur="E.coli > 10^5")],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "N39.0")
+        assert check.verdict == "defendable"
+
+    def test_iu_sans_ecbu(self):
+        """N39.0 sans ECBU → indefendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Infection urinaire", cim10_suggestion="N39.0"),
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "N39.0")
+        assert check.verdict == "indefendable"
+
+    def test_fa_avec_ecg(self):
+        """I48 avec ECG → defendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="FA", cim10_suggestion="I48.0"),
+            bio=[BiologieCle(test="ECG", valeur="FA rapide")],
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "I48.0")
+        assert check.verdict == "defendable"
+
+    def test_fa_sans_ecg(self):
+        """I48 sans ECG → indefendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="FA", cim10_suggestion="I48.0"),
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "I48.0")
+        assert check.verdict == "indefendable"
+
+    def test_ait_g45(self):
+        """G45 (AIT) doit aussi matcher la famille AVC/AIT."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="AIT", cim10_suggestion="G45.9"),
+            imagerie=[Imagerie(type="IRM cérébral", conclusion="Pas de lésion récente")],
+        )
+        result = build_completude_checklist(dossier)
+        assert any(c.code == "G45.9" for c in result.checks)
+        check = next(c for c in result.checks if c.code == "G45.9")
+        assert check.verdict == "defendable"
+
+
+# ── Tests sans règle applicable ──────────────────────────────────────
+
+
+class TestSansRegle:
+    def test_code_sans_regle(self):
+        """Code sans règle applicable → pas de check."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Grippe", cim10_suggestion="J11.1"),
+        )
+        result = build_completude_checklist(dossier)
+        assert not any(c.code == "J11.1" for c in result.checks)
+        # Score global par défaut (pas de checks → pas de verdict)
+        assert result.score_global == 100
+
+    def test_dossier_vide(self):
+        """Dossier sans codes → pas de checks."""
+        dossier = _make_dossier()
+        result = build_completude_checklist(dossier)
+        assert result.checks == []
+        assert result.score_global == 100
+
+
+# ── Tests verdict global ─────────────────────────────────────────────
+
+
+class TestVerdictGlobal:
+    def test_mix_defendable_et_fragile(self):
+        """Un code defendable + un fragile → verdict global fragile."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="IRC", cim10_suggestion="N18.3"),
+            das=[Diagnostic(texte="Dénutrition", cim10_suggestion="E43")],
+            bio=[BiologieCle(test="Créatinine", valeur="180", valeur_num=180.0)],
+            # E43 n'a ni albumine ni IMC → indefendable
+        )
+        result = build_completude_checklist(dossier)
+        assert result.verdict_global in ("fragile", "indefendable")
+
+    def test_tous_defendables(self):
+        """Tous les codes defendables → verdict global defendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="IRC", cim10_suggestion="N18.3"),
+            bio=[BiologieCle(test="Créatinine", valeur="180", valeur_num=180.0)],
+        )
+        result = build_completude_checklist(dossier)
+        assert result.verdict_global == "defendable"
+
+
+# ── Tests DAS ruled_out (ignorés) ────────────────────────────────────
+
+
+class TestDasRuledOut:
+    def test_das_ruled_out_ignore(self):
+        """Un DAS ruled_out ne doit pas apparaître dans les checks."""
+        dossier = _make_dossier(
+            das=[
+                Diagnostic(texte="Anémie", cim10_suggestion="D50.9", status="ruled_out"),
+            ],
+        )
+        result = build_completude_checklist(dossier)
+        assert not any(c.code == "D50.9" for c in result.checks)
+
+
+# ── Tests documents présents ─────────────────────────────────────────
+
+
+class TestDocumentsPresents:
+    def test_documents_listes(self):
+        """Les types de documents sont listés."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Test", cim10_suggestion="J18.9"),
+            document_type="crh",
+            source_files=["CRH_1.pdf", "CRO_op.pdf"],
+            imagerie=[Imagerie(type="Radio thorax", conclusion="Normal")],
+        )
+        result = build_completude_checklist(dossier)
+        assert "crh" in result.documents_presents
+        assert "cro" in result.documents_presents
+
+
+# ── Tests obésité ────────────────────────────────────────────────────
+
+
+class TestObesite:
+    def test_obesite_avec_imc_et_poids(self):
+        """E66 avec IMC 42 + poids → defendable, score élevé."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Obésité morbide", cim10_suggestion="E66.0"),
+            sejour=Sejour(imc=42.0, poids=130.0, taille=176.0),
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "E66.0")
+        assert check.verdict == "defendable"
+        assert check.score == 100
+
+    def test_obesite_sans_imc(self):
+        """E66 sans IMC → fragile/indefendable."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Obésité", cim10_suggestion="E66.9"),
+            sejour=Sejour(poids=130.0),  # Poids mais pas d'IMC
+        )
+        result = build_completude_checklist(dossier)
+        check = next(c for c in result.checks if c.code == "E66.9")
+        assert check.verdict in ("fragile", "indefendable")
+
+
+# ── Test intégration pipeline ────────────────────────────────────────
+
+
+class TestIntegration:
+    def test_completude_dans_dossier_medical(self):
+        """Le champ completude existe et accepte un CompletudeDossier."""
+        dossier = DossierMedical()
+        assert dossier.completude is None
+        dossier.completude = build_completude_checklist(dossier)
+        assert isinstance(dossier.completude, CompletudeDossier)
+
+    def test_serialization_json(self):
+        """Le résultat se sérialise en JSON sans erreur."""
+        dossier = _make_dossier(
+            dp=Diagnostic(texte="Dénutrition", cim10_suggestion="E43"),
+            sejour=Sejour(imc=16.5),
+            bio=[BiologieCle(test="Albumine", valeur="28 g/L", valeur_num=28.0)],
+        )
+        result = build_completude_checklist(dossier)
+        json_str = result.model_dump_json()
+        assert "E43" in json_str
+        assert "defendable" in json_str
+        # Le nouveau champ doit apparaître
+        assert "confirmation_detail" in json_str
+
+    def test_confirmation_detail_in_model(self):
+        """Le champ confirmation_detail est bien sérialisé."""
+        item = ItemCompletude(
+            categorie="biologie",
+            element="Albumine",
+            statut="present_confirme",
+            valeur="28 g/L",
+            importance="obligatoire",
+            confirmation_detail="Albumine 28 g/L < 30 → confirme E43",
+        )
+        data = item.model_dump()
+        assert data["confirmation_detail"] == "Albumine 28 g/L < 30 → confirme E43"
+        assert data["statut"] == "present_confirme"
diff --git a/tests/test_cpam_response.py b/tests/test_cpam_response.py
index f3a88c2..4c3ea57 100644
--- a/tests/test_cpam_response.py
+++ b/tests/test_cpam_response.py
@@ -1,5 +1,6 @@
 """Tests pour la génération de contre-argumentation CPAM."""
 
+import os
 from unittest.mock import patch, call
 
 import pytest
@@ -1659,6 +1660,7 @@ class TestBuildBioSummary:
         assert "CRP" not in summary
 
 
+@patch.dict(os.environ, {"T2A_CPAM_MAX_CORRECTIONS": "2"})
 class TestCorrectionLoop:
     """Tests pour la boucle de correction adversariale."""
 
diff --git a/tests/test_extraction_multiformat.py b/tests/test_extraction_multiformat.py
new file mode 100644
index 0000000..84812c2
--- /dev/null
+++ b/tests/test_extraction_multiformat.py
@@ -0,0 +1,417 @@
+"""Tests pour l'extraction multi-format (PDF, images, DOCX)."""
+
+from __future__ import annotations
+
+from pathlib import Path
+from unittest.mock import MagicMock, patch
+
+import pytest
+
+from src.extraction.document_router import (
+    SUPPORTED_EXTENSIONS,
+    extract_document_with_pages,
+)
+from src.extraction.page_tracker import PageTracker
+from src.extraction.pdf_extractor import (
+    ExtractionMethod,
+    ExtractionStats,
+    _compute_extraction_stats,
+)
+
+
+# ---------------------------------------------------------------------------
+# Tests du router — dispatch par extension
+# ---------------------------------------------------------------------------
+
+
+class TestDocumentRouter:
+    """Tests unitaires du dispatch par extension."""
+
+    def test_router_pdf_dispatches_correctly(self, tmp_path):
+        """Un fichier .pdf est dispatché vers extract_text_with_pages."""
+        pdf_file = tmp_path / "test.pdf"
+        pdf_file.touch()
+
+        mock_stats = ExtractionStats(total_pages=1, source_format="pdf")
+        mock_tracker = PageTracker([(0, 10)])
+        mock_return = ("texte pdf", mock_tracker, mock_stats)
+
+        with patch(
+            "src.extraction.pdf_extractor.extract_text_with_pages",
+            return_value=mock_return,
+        ):
+            result = extract_document_with_pages(pdf_file)
+            assert len(result) == 3
+            assert result[0] == "texte pdf"
+            assert result[2].source_format == "pdf"
+
+    def test_router_image_dispatches_correctly(self, tmp_path):
+        """Un fichier .png est dispatché vers extract_text_from_image."""
+        png_file = tmp_path / "test.png"
+        png_file.touch()
+
+        mock_stats = ExtractionStats(
+            total_pages=1, source_format="image",
+            methods=[ExtractionMethod.IMAGE],
+        )
+        mock_tracker = PageTracker([(0, 10)])
+        mock_return = ("texte ocr", mock_tracker, mock_stats)
+
+        with patch(
+            "src.extraction.image_extractor.extract_text_from_image",
+            return_value=mock_return,
+        ):
+            result = extract_document_with_pages(png_file)
+            assert len(result) == 3
+            assert result[0] == "texte ocr"
+            assert result[2].source_format == "image"
+
+    def test_router_docx_dispatches_correctly(self, tmp_path):
+        """Un fichier .docx est dispatché vers extract_text_from_docx."""
+        docx_file = tmp_path / "test.docx"
+        docx_file.touch()
+
+        mock_stats = ExtractionStats(
+            total_pages=1, source_format="docx",
+            methods=[ExtractionMethod.DOCX],
+        )
+        mock_tracker = PageTracker([(0, 10)])
+        mock_return = ("texte docx", mock_tracker, mock_stats)
+
+        with patch(
+            "src.extraction.docx_extractor.extract_text_from_docx",
+            return_value=mock_return,
+        ):
+            result = extract_document_with_pages(docx_file)
+            assert len(result) == 3
+            assert result[0] == "texte docx"
+            assert result[2].source_format == "docx"
+
+    def test_router_unsupported_extension_raises(self, tmp_path):
+        """Une extension non supportée lève ValueError."""
+        xyz_file = tmp_path / "test.xyz"
+        xyz_file.touch()
+
+        with pytest.raises(ValueError, match="Format non supporté"):
+            extract_document_with_pages(xyz_file)
+
+    def test_router_supported_extensions_complete(self):
+        """Vérifie que SUPPORTED_EXTENSIONS contient tous les formats prévus."""
+        expected = {".pdf", ".jpg", ".jpeg", ".png", ".tiff", ".tif", ".docx"}
+        assert SUPPORTED_EXTENSIONS == expected
+
+    @pytest.mark.parametrize("ext", [".jpg", ".jpeg", ".tiff", ".tif"])
+    def test_router_all_image_extensions(self, tmp_path, ext):
+        """Toutes les extensions image sont reconnues."""
+        img_file = tmp_path / f"test{ext}"
+        img_file.touch()
+
+        mock_stats = ExtractionStats(total_pages=1, source_format="image")
+        mock_tracker = PageTracker([(0, 5)])
+
+        with patch(
+            "src.extraction.image_extractor.extract_text_from_image",
+            return_value=("texte", mock_tracker, mock_stats),
+        ):
+            result = extract_document_with_pages(img_file)
+            assert result[2].source_format == "image"
+
+
+# ---------------------------------------------------------------------------
+# Tests ExtractionStats enrichi
+# ---------------------------------------------------------------------------
+
+
+class TestExtractionStats:
+    """Tests des nouveaux champs d'ExtractionStats."""
+
+    def test_stats_tracks_method(self):
+        """Vérifie que methods/backend/source_format sont renseignés."""
+        methods = [
+            ExtractionMethod.NATIVE_PDFPLUMBER,
+            ExtractionMethod.NATIVE_PDFPLUMBER,
+            ExtractionMethod.OCR_DOCTR,
+        ]
+        stats = _compute_extraction_stats(
+            ["page 1 avec du texte", "page 2 avec du texte", "page 3 ocr"],
+            methods=methods,
+            backend="pdfplumber",
+        )
+
+        assert stats.methods == methods
+        assert stats.backend == "pdfplumber"
+        assert stats.source_format == "pdf"
+        assert stats.native_pages == 2
+        assert stats.ocr_pages == 1
+
+    def test_stats_default_values(self):
+        """Les valeurs par défaut sont correctes."""
+        stats = ExtractionStats()
+        assert stats.methods == []
+        assert stats.native_pages == 0
+        assert stats.ocr_pages == 0
+        assert stats.backend == "pdfplumber"
+        assert stats.source_format == "pdf"
+
+    def test_stats_image_format(self):
+        """ExtractionStats pour une image."""
+        stats = ExtractionStats(
+            total_pages=1,
+            source_format="image",
+            methods=[ExtractionMethod.IMAGE],
+            backend="doctr",
+        )
+        assert stats.source_format == "image"
+        assert stats.methods[0] == ExtractionMethod.IMAGE
+
+    def test_stats_docx_format(self):
+        """ExtractionStats pour un DOCX."""
+        stats = ExtractionStats(
+            total_pages=3,
+            source_format="docx",
+            methods=[ExtractionMethod.DOCX] * 3,
+            backend="python-docx",
+            native_pages=3,
+        )
+        assert stats.source_format == "docx"
+        assert len(stats.methods) == 3
+        assert all(m == ExtractionMethod.DOCX for m in stats.methods)
+
+    def test_compute_stats_with_methods(self):
+        """_compute_extraction_stats calcule correctement native_pages et ocr_pages."""
+        pages = ["Hello world" * 10, "", "Texte OCR récupéré"]
+        methods = [
+            ExtractionMethod.NATIVE_PDFPLUMBER,
+            ExtractionMethod.OCR_DOCTR,
+            ExtractionMethod.OCR_DOCTR,
+        ]
+        stats = _compute_extraction_stats(pages, methods, "pdfplumber")
+
+        assert stats.total_pages == 3
+        assert stats.native_pages == 1
+        assert stats.ocr_pages == 2
+        assert 2 in stats.empty_pages  # page 2 (1-indexed) est vide
+
+    def test_extraction_method_enum_values(self):
+        """Vérifie les valeurs de l'enum ExtractionMethod."""
+        assert ExtractionMethod.NATIVE_PDFPLUMBER.value == "native_pdfplumber"
+        assert ExtractionMethod.NATIVE_PYMUPDF.value == "native_pymupdf"
+        assert ExtractionMethod.OCR_DOCTR.value == "ocr_doctr"
+        assert ExtractionMethod.DOCX.value == "docx"
+        assert ExtractionMethod.IMAGE.value == "image_ocr"
+
+
+# ---------------------------------------------------------------------------
+# Tests OCR fallback
+# ---------------------------------------------------------------------------
+
+
+class TestOCRFallback:
+    """Tests du mécanisme de fallback OCR."""
+
+    def test_ocr_fallback_disabled_by_default(self):
+        """Le fallback OCR est désactivé par défaut."""
+        from src.extraction.pdf_extractor import OCR_FALLBACK_ENABLED
+
+        # Par défaut (sans variable d'environnement), le fallback est désactivé
+        # Note : ce test vérifie le comportement par défaut, pas une variable statique
+        # car elle peut être modifiée par les variables d'environnement du CI
+        assert isinstance(OCR_FALLBACK_ENABLED, bool)
+
+    def test_ocr_fallback_config_values(self):
+        """Les constantes de config sont cohérentes."""
+        from src.extraction.pdf_extractor import OCR_FALLBACK_MIN_CHARS, PDF_BACKEND
+
+        assert isinstance(OCR_FALLBACK_MIN_CHARS, int)
+        assert OCR_FALLBACK_MIN_CHARS > 0
+        assert PDF_BACKEND in ("pdfplumber", "pymupdf")
+
+
+# ---------------------------------------------------------------------------
+# Tests DOCX extracteur (avec fixture)
+# ---------------------------------------------------------------------------
+
+
+class TestDocxExtractor:
+    """Tests de l'extracteur DOCX."""
+
+    @pytest.fixture
+    def sample_docx(self, tmp_path):
+        """Crée un petit DOCX de test."""
+        try:
+            from docx import Document
+        except ImportError:
+            pytest.skip("python-docx non installé")
+
+        doc = Document()
+        doc.add_paragraph("Premier paragraphe du document médical.")
+        doc.add_paragraph("Diagnostic principal : Pneumopathie J18.9")
+        doc.add_paragraph("Traitement de sortie : Amoxicilline 1g x3/j")
+        docx_path = tmp_path / "test_medical.docx"
+        doc.save(str(docx_path))
+        return docx_path
+
+    @pytest.fixture
+    def docx_with_page_breaks(self, tmp_path):
+        """Crée un DOCX avec des sauts de page."""
+        try:
+            from docx import Document
+            from docx.oxml.ns import qn
+            from docx.oxml import OxmlElement
+        except ImportError:
+            pytest.skip("python-docx non installé")
+
+        doc = Document()
+        doc.add_paragraph("Page 1 : Antécédents du patient.")
+
+        # Ajouter un saut de page
+        p = doc.add_paragraph()
+        run = p.add_run()
+        br = OxmlElement("w:br")
+        br.set(qn("w:type"), "page")
+        run._element.append(br)
+
+        doc.add_paragraph("Page 2 : Compte-rendu opératoire.")
+        docx_path = tmp_path / "test_pages.docx"
+        doc.save(str(docx_path))
+        return docx_path
+
+    def test_extract_docx_basic(self, sample_docx):
+        """Extraction basique d'un DOCX."""
+        from src.extraction.docx_extractor import extract_text_from_docx
+
+        text, tracker, stats = extract_text_from_docx(sample_docx)
+
+        assert "Pneumopathie" in text
+        assert "Amoxicilline" in text
+        assert stats.source_format == "docx"
+        assert stats.total_pages >= 1
+        assert stats.total_chars > 0
+        assert all(m == ExtractionMethod.DOCX for m in stats.methods)
+
+    def test_extract_docx_with_page_breaks(self, docx_with_page_breaks):
+        """Extraction d'un DOCX avec sauts de page."""
+        from src.extraction.docx_extractor import extract_text_from_docx
+
+        text, tracker, stats = extract_text_from_docx(docx_with_page_breaks)
+
+        assert stats.total_pages == 2
+        assert "Antécédents" in text
+        assert "Compte-rendu" in text
+        # PageTracker fonctionne
+        assert tracker.char_to_page(0) == 1
+
+    def test_extract_docx_file_not_found(self, tmp_path):
+        """FileNotFoundError si le fichier n'existe pas."""
+        from src.extraction.docx_extractor import extract_text_from_docx
+
+        with pytest.raises(FileNotFoundError):
+            extract_text_from_docx(tmp_path / "inexistant.docx")
+
+    def test_extract_docx_stats_backend(self, sample_docx):
+        """Le backend est bien 'python-docx'."""
+        from src.extraction.docx_extractor import extract_text_from_docx
+
+        _, _, stats = extract_text_from_docx(sample_docx)
+        assert stats.backend == "python-docx"
+
+
+# ---------------------------------------------------------------------------
+# Tests image extracteur (mock OCR)
+# ---------------------------------------------------------------------------
+
+
+class TestImageExtractor:
+    """Tests de l'extracteur d'images (avec OCR mocké)."""
+
+    def test_extract_image_file_not_found(self, tmp_path):
+        """FileNotFoundError si l'image n'existe pas."""
+        from src.extraction.image_extractor import extract_text_from_image
+
+        with pytest.raises(FileNotFoundError):
+            extract_text_from_image(tmp_path / "inexistant.png")
+
+    def test_extract_image_stats_format(self, tmp_path):
+        """Vérifie le format des stats pour une image."""
+        # Créer une petite image PNG
+        from PIL import Image
+
+        img = Image.new("RGB", (100, 50), color="white")
+        img_path = tmp_path / "test.png"
+        img.save(str(img_path))
+
+        with patch("src.extraction.image_extractor.ocr_image", return_value="Texte OCR extrait"):
+            from src.extraction.image_extractor import extract_text_from_image
+
+            text, tracker, stats = extract_text_from_image(img_path)
+
+            assert text == "Texte OCR extrait"
+            assert stats.source_format == "image"
+            assert stats.total_pages == 1
+            assert stats.ocr_pages == 1
+            assert stats.native_pages == 0
+            assert stats.methods == [ExtractionMethod.IMAGE]
+            assert stats.backend == "doctr"
+
+    def test_extract_image_empty_result(self, tmp_path):
+        """Image sans texte détectable."""
+        from PIL import Image
+
+        img = Image.new("RGB", (100, 50), color="white")
+        img_path = tmp_path / "blank.png"
+        img.save(str(img_path))
+
+        with patch("src.extraction.image_extractor.ocr_image", return_value=""):
+            from src.extraction.image_extractor import extract_text_from_image
+
+            text, tracker, stats = extract_text_from_image(img_path)
+
+            assert text == ""
+            assert stats.empty_pages == [1]
+            assert stats.total_chars == 0
+
+
+# ---------------------------------------------------------------------------
+# Tests de non-régression
+# ---------------------------------------------------------------------------
+
+
+class TestBackwardCompat:
+    """Tests de rétrocompatibilité."""
+
+    def test_process_pdf_alias_exists(self):
+        """process_pdf est un alias de process_document."""
+        from src.main import process_document, process_pdf
+
+        assert process_pdf is process_document
+
+    def test_extraction_stats_existing_properties(self):
+        """Les propriétés existantes d'ExtractionStats fonctionnent toujours."""
+        stats = ExtractionStats(
+            total_pages=5,
+            empty_pages=[2, 4],
+            chars_per_page=[100, 0, 200, 0, 300],
+            total_chars=600,
+        )
+        assert stats.usable_pages == 3
+        assert stats.coverage_ratio == 0.6
+        assert stats.has_quality_issues() is True
+        alert = stats.to_alert()
+        assert alert is not None
+        assert "2/5" in alert
+
+        flags = stats.to_flags()
+        assert flags["extraction_empty_pages"] == [2, 4]
+        assert flags["extraction_total_pages"] == 5
+        assert flags["extraction_coverage"] == 0.6
+
+    def test_extraction_stats_no_issues(self):
+        """Pas d'alerte quand tout va bien."""
+        stats = ExtractionStats(
+            total_pages=3,
+            chars_per_page=[100, 200, 300],
+            total_chars=600,
+        )
+        assert not stats.has_quality_issues()
+        assert stats.to_alert() is None
+        assert stats.to_flags() == {}
diff --git a/tests/test_nutrition_has2021.py b/tests/test_nutrition_has2021.py
new file mode 100644
index 0000000..178d5b6
--- /dev/null
+++ b/tests/test_nutrition_has2021.py
@@ -0,0 +1,198 @@
+"""Tests unitaires pour la détection dénutrition HAS/FFN 2021."""
+
+import re
+import pytest
+
+from src.config import BiologieCle, Diagnostic, DossierMedical, Sejour
+from src.medical.diagnostic_extraction import _detect_nutrition_has2021, _DAS_PATTERNS
+from src.medical.cim10_dict import normalize_text
+
+
+# ── Helpers ──────────────────────────────────────────────────────────
+
+
+def _make_dossier(age=None, imc=None, albumine=None, existing_codes=None):
+    """Construit un DossierMedical minimal pour les tests."""
+    dossier = DossierMedical()
+    dossier.sejour = Sejour(age=age, imc=imc)
+    if albumine is not None:
+        dossier.biologie_cle.append(
+            BiologieCle(
+                test="Albumine",
+                valeur=str(albumine),
+                valeur_num=float(albumine),
+                anomalie=True,
+                quality="ok",
+            )
+        )
+    for code in (existing_codes or []):
+        dossier.diagnostics_associes.append(
+            Diagnostic(texte="existant", cim10_suggestion=code, source="test")
+        )
+    return dossier
+
+
+# ── Tests _detect_nutrition_has2021 ──────────────────────────────────
+
+
+class TestDetectNutritionHAS2021:
+    """Tests de la détection déterministe basée sur IMC/âge/albumine."""
+
+    def test_adulte_imc17_albumine28_gives_E43(self):
+        """Adulte IMC 17.0 + albumine 28 → E43 (sévère via IMC ≤17 ET albumine <30)."""
+        dossier = _make_dossier(age=50, imc=17.0, albumine=28)
+        _detect_nutrition_has2021(dossier)
+        codes = [d.cim10_suggestion for d in dossier.diagnostics_associes]
+        assert "E43" in codes
+
+    def test_adulte_imc18_sans_albumine_gives_E44(self):
+        """Adulte IMC 18.0 sans albumine → E44.0 (modéré, 17 < IMC < 18.5)."""
+        dossier = _make_dossier(age=45, imc=18.0)
+        _detect_nutrition_has2021(dossier)
+        codes = [d.cim10_suggestion for d in dossier.diagnostics_associes]
+        assert "E44.0" in codes
+
+    def test_personne_agee_75_imc21_gives_E44(self):
+        """≥70 ans IMC 21.0 → E44.0 (seuil gériatrique < 22)."""
+        dossier = _make_dossier(age=75, imc=21.0)
+        _detect_nutrition_has2021(dossier)
+        codes = [d.cim10_suggestion for d in dossier.diagnostics_associes]
+        assert "E44.0" in codes
+
+    def test_personne_agee_75_imc19_gives_E43(self):
+        """≥70 ans IMC 19.0 → E43 (sévère, IMC < 20)."""
+        dossier = _make_dossier(age=75, imc=19.0)
+        _detect_nutrition_has2021(dossier)
+        codes = [d.cim10_suggestion for d in dossier.diagnostics_associes]
+        assert "E43" in codes
+
+    def test_adulte_imc25_no_das(self):
+        """Adulte IMC 25.0 → aucun DAS (au-dessus du seuil)."""
+        dossier = _make_dossier(age=40, imc=25.0)
+        _detect_nutrition_has2021(dossier)
+        codes = [d.cim10_suggestion for d in dossier.diagnostics_associes]
+        assert not any(c in codes for c in ("E43", "E44.0", "E46"))
+
+    def test_e46_deja_code_no_ajout(self):
+        """E46 déjà codé → aucun ajout."""
+        dossier = _make_dossier(age=50, imc=16.0, existing_codes=["E46"])
+        _detect_nutrition_has2021(dossier)
+        e_codes = [d.cim10_suggestion for d in dossier.diagnostics_associes
+                   if d.cim10_suggestion in ("E43", "E44.0", "E46")]
+        # Seul le E46 existant doit être présent
+        assert e_codes == ["E46"]
+
+    def test_pas_imc_no_ajout(self):
+        """Pas d'IMC → aucun ajout (dégradation gracieuse)."""
+        dossier = _make_dossier(age=50, imc=None)
+        _detect_nutrition_has2021(dossier)
+        codes = [d.cim10_suggestion for d in dossier.diagnostics_associes]
+        assert not any(c in codes for c in ("E43", "E44.0", "E46"))
+
+    def test_albumine_upgrade_severity(self):
+        """IMC modéré + albumine < 30 → upgrade vers E43."""
+        dossier = _make_dossier(age=50, imc=18.0, albumine=25)
+        _detect_nutrition_has2021(dossier)
+        codes = [d.cim10_suggestion for d in dossier.diagnostics_associes]
+        assert "E43" in codes  # Albumine < 30 → sévère
+
+    def test_alerte_codage_added(self):
+        """Vérifie qu'une alerte codage est ajoutée."""
+        dossier = _make_dossier(age=50, imc=17.0)
+        _detect_nutrition_has2021(dossier)
+        assert any("HAS 2021" in a for a in dossier.alertes_codage)
+
+    def test_source_is_has2021(self):
+        """Vérifie que la source est 'has2021'."""
+        dossier = _make_dossier(age=50, imc=17.0)
+        _detect_nutrition_has2021(dossier)
+        has_diags = [d for d in dossier.diagnostics_associes if d.source == "has2021"]
+        assert len(has_diags) == 1
+
+    def test_age_inconnu_seuils_adulte(self):
+        """Âge inconnu → seuils adulte par défaut."""
+        dossier = _make_dossier(age=None, imc=17.0)
+        _detect_nutrition_has2021(dossier)
+        codes = [d.cim10_suggestion for d in dossier.diagnostics_associes]
+        assert "E43" in codes  # IMC ≤ 17 → sévère (seuils adulte)
+
+    def test_personne_agee_70_exact_seuil(self):
+        """70 ans exactement → utilise les seuils gériatriques."""
+        dossier = _make_dossier(age=70, imc=21.5)
+        _detect_nutrition_has2021(dossier)
+        codes = [d.cim10_suggestion for d in dossier.diagnostics_associes]
+        assert "E44.0" in codes  # < 22 → modéré avec seuils ≥70
+
+
+# ── Tests regex albumine (bio_extraction) ────────────────────────────
+
+
+class TestAlbumineRegex:
+    """Vérifie l'extraction regex de l'albumine."""
+
+    ALBUMINE_PATTERN = r"(?:[Aa]lbumin[ée]?(?:mie)?|[Aa]lb(?:u)?[ée]?(?:mie)?)\s*[=:àa]?\s*(\d+(?:[.,]\d+)?)\s*(?:g/[Ll])?"
+    PREALBUMINE_PATTERN = r"(?:[Pp]r[ée]albumine|[Tt]ransthyr[ée]tine)\s*[=:àa]?\s*(\d+(?:[.,]\d+)?)\s*(?:mg/[Ll]|g/[Ll])?"
+
+    def test_albumine_standard(self):
+        m = re.search(self.ALBUMINE_PATTERN, "Albumine = 28 g/L")
+        assert m and m.group(1) == "28"
+
+    def test_albumine_colon(self):
+        m = re.search(self.ALBUMINE_PATTERN, "albumine: 32.5 g/L")
+        assert m and m.group(1) == "32.5"
+
+    def test_albumine_sans_unite(self):
+        m = re.search(self.ALBUMINE_PATTERN, "Albumine 28")
+        assert m and m.group(1) == "28"
+
+    def test_albuminemie(self):
+        m = re.search(self.ALBUMINE_PATTERN, "Albuminémie à 25 g/L")
+        assert m and m.group(1) == "25"
+
+    def test_prealbumine(self):
+        m = re.search(self.PREALBUMINE_PATTERN, "Préalbumine = 0.15 g/L")
+        assert m and m.group(1) == "0.15"
+
+    def test_transthyretine(self):
+        m = re.search(self.PREALBUMINE_PATTERN, "Transthyrétine: 180 mg/L")
+        assert m and m.group(1) == "180"
+
+
+# ── Tests regex texte dénutrition (DAS patterns) ────────────────────
+
+
+class TestDenutritionRegexSeverity:
+    """Vérifie que les patterns textuels de dénutrition détectent la sévérité."""
+
+    def _match_pattern(self, text):
+        """Retourne le (label, code) du premier pattern DAS matché."""
+        text_norm = normalize_text(text.lower())
+        for pat, label, code in _DAS_PATTERNS:
+            if re.search(pat, text_norm):
+                return label, code
+        return None, None
+
+    def test_denutrition_severe_gives_E43(self):
+        _, code = self._match_pattern("denutrition severe")
+        assert code == "E43"
+
+    def test_denutrition_moderee_gives_E44(self):
+        _, code = self._match_pattern("denutrition moderee")
+        assert code == "E44.0"
+
+    def test_denutrition_generic_gives_E46(self):
+        _, code = self._match_pattern("denutrition")
+        assert code == "E46"
+
+    def test_malnutrition_severe_gives_E43(self):
+        _, code = self._match_pattern("malnutrition severe")
+        assert code == "E43"
+
+    def test_denutrition_grade_iii_gives_E43(self):
+        _, code = self._match_pattern("denutrition grade III")
+        assert code == "E43"
+
+    def test_hypoalbuminemie_severe_gives_E46(self):
+        """hypoalbuminemie severe → E46 (pattern générique)."""
+        _, code = self._match_pattern("hypoalbuminemie severe")
+        assert code == "E46"
diff --git a/tests/test_nutrition_has2021_integration.py b/tests/test_nutrition_has2021_integration.py
new file mode 100644
index 0000000..80eb356
--- /dev/null
+++ b/tests/test_nutrition_has2021_integration.py
@@ -0,0 +1,364 @@
+"""Tests d'intégration : détection dénutrition HAS/FFN 2021 sur dossiers réalistes.
+
+4 cas cliniques réalistes passés dans le pipeline complet extract_medical_info.
+Vérifie l'interaction entre regex bio, détection HAS 2021, conflits, et sévérité CMA.
+"""
+
+import pytest
+
+from src.config import DossierMedical
+from src.medical.cim10_extractor import extract_medical_info
+
+
+# ── Cas 1 : Personne âgée dénutrie (≥70 ans, seuils gériatriques) ───
+
+
+class TestCas1PersonneAgeeDenutrie:
+    """Mme D., 81 ans, hospitalisée pour pneumopathie.
+
+    IMC 20.5 → sous le seuil gériatrique < 22 → dénutrition modérée.
+    Albumine 27 g/L → < 30 → critère de sévérité → upgrade vers E43.
+    Attendu : E43 (dénutrition sévère) détecté par HAS 2021.
+    """
+
+    @pytest.fixture
+    def dossier(self) -> DossierMedical:
+        parsed = {
+            "type": "crh",
+            "patient": {
+                "sexe": "F",
+                "date_naissance": "15/03/1943",
+            },
+            "sejour": {
+                "date_entree": "10/01/2025",
+                "date_sortie": "20/01/2025",
+            },
+            "diagnostics": [],
+            "signes_vitaux": {"imc": 20.5, "poids_kg": 48, "taille_cm": 153},
+        }
+        text = """\
+Votre patiente née le 15/03/1943 a été hospitalisée du 10/01/2025 au 20/01/2025.
+
+Antécédents :
+- Hypertension artérielle
+- Fibrillation auriculaire paroxystique
+- Arthrose invalidante
+
+Au total : Pneumopathie basale droite d'évolution favorable sous antibiothérapie.
+
+Biologie d'entrée :
+CRP = 145 mg/L
+Albumine = 27 g/L
+Créatinine = 95 µmol/L
+Sodium = 138 mmol/L
+Potassium = 4.1 mmol/L
+Hémoglobine = 10.2 g/dL
+
+IMC: 20.5
+
+TTT de sortie :
+Amoxicilline 1g matin et soir pendant 5 jours
+Paracétamol si besoin
+
+Devenir : retour à domicile."""
+        return extract_medical_info(parsed, text)
+
+    def test_age_81_ans(self, dossier):
+        assert dossier.sejour.age == 81
+
+    def test_imc_extrait(self, dossier):
+        assert dossier.sejour.imc == 20.5
+
+    def test_albumine_extraite(self, dossier):
+        """L'albumine doit être extraite par le nouveau regex."""
+        alb = [b for b in dossier.biologie_cle if b.test == "Albumine"]
+        assert len(alb) >= 1
+        assert alb[0].valeur_num == 27.0
+
+    def test_denutrition_severe_E43(self, dossier):
+        """IMC 20.5 (modéré ≥70 ans) + albumine 27 (<30) → E43 sévère."""
+        codes = {d.cim10_suggestion for d in dossier.diagnostics_associes}
+        assert "E43" in codes, f"E43 attendu, trouvé : {codes}"
+
+    def test_source_has2021(self, dossier):
+        has_diags = [d for d in dossier.diagnostics_associes if d.source == "has2021"]
+        assert len(has_diags) == 1
+        assert has_diags[0].cim10_suggestion == "E43"
+
+    def test_alerte_has2021(self, dossier):
+        assert any("HAS 2021" in a for a in dossier.alertes_codage)
+
+    def test_pneumopathie_detectee(self, dossier):
+        """Le DP/DAS pneumopathie ne doit pas être impacté."""
+        codes = {d.cim10_suggestion for d in dossier.diagnostics_associes}
+        # Pneumopathie J18.9 ou DP
+        all_codes = codes.copy()
+        if dossier.diagnostic_principal and dossier.diagnostic_principal.cim10_suggestion:
+            all_codes.add(dossier.diagnostic_principal.cim10_suggestion)
+        assert "J18.9" in all_codes
+
+    def test_hta_detectee(self, dossier):
+        codes = {d.cim10_suggestion for d in dossier.diagnostics_associes}
+        assert "I10" in codes
+
+
+# ── Cas 2 : Patient obèse ET dénutri (conflit E66 + E43 = MEDIUM) ───
+
+
+class TestCas2ObeseDenutri:
+    """M. B., 58 ans, hospitalisé pour pancréatite aiguë sur obésité.
+
+    IMC 35.2 → obèse (E66.0). Dénutrition sévère mentionnée dans le texte (E43).
+    Le conflit E66/dénutrition doit être MEDIUM (pas HARD) selon HAS 2021.
+    La coexistence est cliniquement possible (sarcopénie de l'obèse).
+
+    DP fourni via Trackare (K85.9) pour éviter que NUKE-3 ne réorganise les codes.
+    """
+
+    @pytest.fixture
+    def dossier(self) -> DossierMedical:
+        parsed = {
+            "type": "trackare",
+            "patient": {
+                "sexe": "M",
+                "date_naissance": "22/07/1967",
+            },
+            "sejour": {
+                "date_entree": "05/02/2025",
+                "date_sortie": "12/02/2025",
+            },
+            "diagnostics": [
+                {
+                    "type": "Principal",
+                    "statut": "actif",
+                    "code_cim10": "K85.9",
+                    "libelle": "Pancréatite aiguë",
+                }
+            ],
+            "signes_vitaux": {"imc": 35.2, "poids_kg": 110, "taille_cm": 177},
+        }
+        text = """\
+Pancréatite aiguë sur terrain d'obésité morbide.
+Dénutrition sévère protéique avec sarcopénie documentée,
+perte de poids de 15 kg en 3 mois.
+
+Antécédents :
+- Diabète type 2
+- Tabagisme actif
+
+Biologie :
+CRP = 145 mg/L
+Albumine = 25 g/L
+Lipasémie = 1200 UI/L
+HbA1c = 7.8 %
+Hémoglobine = 13.5 g/dL
+
+IMC: 35.2
+
+TTT de sortie :
+Metformine 1000mg matin et soir
+Paracétamol si besoin
+
+Devenir : retour à domicile."""
+        return extract_medical_info(parsed, text)
+
+    def test_dp_pancreatite(self, dossier):
+        """DP = K85.9 (fourni par Trackare)."""
+        assert dossier.diagnostic_principal is not None
+        assert dossier.diagnostic_principal.cim10_suggestion == "K85.9"
+
+    def test_obesite_E66_detectee(self, dossier):
+        """L'obésité doit être détectée via IMC ≥ 30."""
+        codes = {d.cim10_suggestion for d in dossier.diagnostics_associes}
+        assert "E66.0" in codes
+
+    def test_denutrition_severe_regex_E43(self, dossier):
+        """'Dénutrition sévère' dans le texte → E43 via regex."""
+        codes = {d.cim10_suggestion for d in dossier.diagnostics_associes}
+        assert "E43" in codes, f"E43 attendu via regex 'denutrition severe', trouvé : {codes}"
+
+    def test_coexistence_E66_E43(self, dossier):
+        """E66.0 et E43 doivent coexister (pas de blocage HARD)."""
+        codes = {d.cim10_suggestion for d in dossier.diagnostics_associes}
+        assert "E66.0" in codes and "E43" in codes
+
+    def test_albumine_extraite(self, dossier):
+        alb = [b for b in dossier.biologie_cle if b.test == "Albumine"]
+        assert len(alb) >= 1
+        assert alb[0].valeur_num == 25.0
+
+    def test_diabete_detecte(self, dossier):
+        codes = {d.cim10_suggestion for d in dossier.diagnostics_associes}
+        assert "E11.9" in codes
+
+    def test_tabagisme_detecte(self, dossier):
+        codes = {d.cim10_suggestion for d in dossier.diagnostics_associes}
+        assert "F17.2" in codes
+
+
+# ── Cas 3 : Adulte dénutri modéré sans albumine (IMC seul) ──────────
+
+
+class TestCas3AdulteDenutriModere:
+    """Mme L., 45 ans, hospitalisée pour angiocholite.
+
+    IMC 17.8 → entre 17 et 18.5 → dénutrition modérée (E44.0) par HAS 2021.
+    Pas d'albumine → pas d'upgrade de sévérité.
+    """
+
+    @pytest.fixture
+    def dossier(self) -> DossierMedical:
+        parsed = {
+            "type": "crh",
+            "patient": {
+                "sexe": "F",
+                "date_naissance": "12/09/1979",
+            },
+            "sejour": {
+                "date_entree": "15/03/2025",
+                "date_sortie": "21/03/2025",
+            },
+            "diagnostics": [],
+            "signes_vitaux": {"imc": 17.8, "poids_kg": 48, "taille_cm": 164},
+        }
+        text = """\
+Votre patiente née le 12/09/1979 a été hospitalisée du 15/03/2025 au 21/03/2025.
+
+Antécédents :
+- Lithiases vésiculaires
+- Anorexie restrictive ancienne (adolescence)
+
+Au total : Angiocholite sur lithiase du cholédoque traitée par CPRE
+puis cholécystectomie par cœlioscopie.
+
+Biologie d'entrée :
+CRP = 92 mg/L
+ASAT = 180 UI/L
+ALAT = 210 UI/L
+Bilirubine totale = 45 µmol/L
+Lipasémie = 890 UI/L
+Hémoglobine = 11.8 g/dL
+Leucocytes = 12.5 G/L
+
+IMC: 17.8
+
+TTT de sortie :
+Paracétamol 1g x3/jour
+Spasfon si besoin
+
+Devenir : retour à domicile."""
+        return extract_medical_info(parsed, text)
+
+    def test_imc_178(self, dossier):
+        assert dossier.sejour.imc == 17.8
+
+    def test_denutrition_moderee_E44(self, dossier):
+        """IMC 17.8 adulte → E44.0 (modéré, 17 < IMC < 18.5)."""
+        codes = {d.cim10_suggestion for d in dossier.diagnostics_associes}
+        assert "E44.0" in codes, f"E44.0 attendu, trouvé : {codes}"
+
+    def test_pas_E43(self, dossier):
+        """Pas de sévère sans albumine basse ni IMC ≤ 17."""
+        codes = {d.cim10_suggestion for d in dossier.diagnostics_associes}
+        assert "E43" not in codes
+
+    def test_pas_albumine_extraite(self, dossier):
+        """Pas d'albumine dans le texte → pas d'extraction."""
+        alb = [b for b in dossier.biologie_cle if b.test == "Albumine"]
+        assert len(alb) == 0
+
+    def test_angiocholite_detectee(self, dossier):
+        codes = {d.cim10_suggestion for d in dossier.diagnostics_associes}
+        all_codes = codes.copy()
+        if dossier.diagnostic_principal and dossier.diagnostic_principal.cim10_suggestion:
+            all_codes.add(dossier.diagnostic_principal.cim10_suggestion)
+        assert "K83.0" in all_codes
+
+    def test_cholecystectomie_detectee(self, dossier):
+        acte_codes = {a.code_ccam_suggestion for a in dossier.actes_ccam}
+        assert "HMFC004" in acte_codes
+
+    def test_alerte_has2021(self, dossier):
+        assert any("HAS 2021" in a for a in dossier.alertes_codage)
+
+
+# ── Cas 4 : IMC normal, pas de dénutrition (contrôle négatif) ───────
+
+
+class TestCas4ControleNegatif:
+    """M. R., 55 ans, hospitalisé pour colique hépatique.
+
+    IMC 26.3 → au-dessus de tous les seuils → aucune dénutrition.
+    Albumine 38 g/L → normale.
+    Vérifie que la détection HAS 2021 ne produit pas de faux positif.
+    """
+
+    @pytest.fixture
+    def dossier(self) -> DossierMedical:
+        parsed = {
+            "type": "crh",
+            "patient": {
+                "sexe": "M",
+                "date_naissance": "30/11/1969",
+            },
+            "sejour": {
+                "date_entree": "01/04/2025",
+                "date_sortie": "03/04/2025",
+            },
+            "diagnostics": [],
+            "signes_vitaux": {"imc": 26.3, "poids_kg": 82, "taille_cm": 176},
+        }
+        text = """\
+Votre patient né le 30/11/1969 a été hospitalisé du 01/04/2025 au 03/04/2025.
+
+Antécédents :
+- Hypertension artérielle
+- Dyslipidémie
+
+Au total : Colique hépatique sur lithiase vésiculaire.
+Bonne évolution. Cholécystectomie programmée à distance.
+
+Biologie :
+CRP = 12 mg/L
+Albumine = 38 g/L
+ASAT = 35 UI/L
+ALAT = 42 UI/L
+Hémoglobine = 14.5 g/dL
+Créatinine = 78 µmol/L
+
+IMC: 26.3
+
+TTT de sortie :
+Paracétamol si besoin
+Spasfon si besoin
+
+Devenir : retour à domicile."""
+        return extract_medical_info(parsed, text)
+
+    def test_imc_normal(self, dossier):
+        assert dossier.sejour.imc == 26.3
+
+    def test_albumine_normale_extraite(self, dossier):
+        """Albumine 38 g/L → extraite mais normale."""
+        alb = [b for b in dossier.biologie_cle if b.test == "Albumine"]
+        assert len(alb) >= 1
+        assert alb[0].valeur_num == 38.0
+
+    def test_pas_de_denutrition(self, dossier):
+        """IMC 26.3 + albumine 38 → aucun code E40-E46."""
+        codes = {d.cim10_suggestion for d in dossier.diagnostics_associes}
+        nutrition_codes = {c for c in codes if c and c.startswith("E4") and c[:3] in
+                          ("E40", "E41", "E42", "E43", "E44", "E45", "E46")}
+        assert not nutrition_codes, f"Faux positif dénutrition : {nutrition_codes}"
+
+    def test_pas_alerte_has2021(self, dossier):
+        """Aucune alerte HAS 2021 ne doit apparaître."""
+        assert not any("HAS 2021" in a for a in dossier.alertes_codage)
+
+    def test_hta_detectee(self, dossier):
+        codes = {d.cim10_suggestion for d in dossier.diagnostics_associes}
+        assert "I10" in codes
+
+    def test_dyslipidemie_detectee(self, dossier):
+        codes = {d.cim10_suggestion for d in dossier.diagnostics_associes}
+        assert "E78.5" in codes
diff --git a/tests/test_splitter.py b/tests/test_splitter.py
index 7b2d365..e34adbe 100644
--- a/tests/test_splitter.py
+++ b/tests/test_splitter.py
@@ -192,7 +192,7 @@ class TestSplitDocuments:
 # --- Test intégration process_pdf ---
 
 class TestProcessPdfMulti:
-    @patch("src.main.extract_text_with_pages")
+    @patch("src.main.extract_document_with_pages")
     @patch("src.main.extract_medical_info")
     @patch("src.main._run_edsnlp", return_value=None)
     @patch("src.main._use_edsnlp", False)
@@ -203,9 +203,14 @@ class TestProcessPdfMulti:
         from src.main import process_pdf
         from src.config import DossierMedical, Diagnostic
         from src.extraction.page_tracker import PageTracker
+        from src.extraction.pdf_extractor import ExtractionStats
 
-        # Mock extract_text_with_pages retournant un texte multi-épisodes Trackare
-        mock_extract.return_value = (TRACKARE_MULTI, PageTracker([(0, len(TRACKARE_MULTI))]))
+        # Mock extract_document_with_pages retournant un texte multi-épisodes Trackare
+        mock_extract.return_value = (
+            TRACKARE_MULTI,
+            PageTracker([(0, len(TRACKARE_MULTI))]),
+            ExtractionStats(total_pages=1, chars_per_page=[len(TRACKARE_MULTI)], total_chars=len(TRACKARE_MULTI)),
+        )
 
         # Mock extract_medical_info retournant un DossierMedical minimal
         mock_medical.return_value = DossierMedical(
diff --git a/tests/test_viewer.py b/tests/test_viewer.py
index 85c1923..95b835b 100644
--- a/tests/test_viewer.py
+++ b/tests/test_viewer.py
@@ -1,6 +1,7 @@
 """Tests pour le viewer Flask."""
 
 import json
+import os
 import pytest
 from pathlib import Path
 from unittest.mock import patch
@@ -12,9 +13,10 @@ from src.config import DossierMedical, Diagnostic, ActeCCAM
 
 @pytest.fixture
 def app():
-    app = create_app()
-    app.config["TESTING"] = True
-    return app
+    with patch.dict(os.environ, {"T2A_DEMO_USER": "", "T2A_DEMO_PASS": ""}):
+        app = create_app()
+        app.config["TESTING"] = True
+        yield app
 
 
 @pytest.fixture