feat: cache Ollama + parallélisation ThreadPool + filtrage DAS renforcé + modules GHM/CPAM/export RUM

- Cache persistant JSON thread-safe pour les résultats Ollama (invalidation par modèle) - Parallélisation des appels Ollama (ThreadPoolExecutor, 2 workers) - 6 nouvelles règles de filtrage DAS parasites (doublons, ponctuation, OCR, labo, fragments) - Client Ollama centralisé (mode JSON natif + retry) - Module GHM (estimation CMD/sévérité) - Module contrôle CPAM (parser + contre-argumentation RAG) - Export RUM (format RSS) - Viewer enrichi (détail dossier) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-02-12 13:44:34 +01:00
parent a00e5f1147
commit a58398f5d4
25 changed files with 2872 additions and 97 deletions
--- a/src/config.py
+++ b/src/config.py
@@ -33,6 +33,14 @@ NER_CONFIDENCE_THRESHOLD = 0.80
 OLLAMA_URL = "http://localhost:11434"
 OLLAMA_MODEL = "gemma3:12b"
 OLLAMA_TIMEOUT = 120
+OLLAMA_CACHE_PATH = BASE_DIR / "data" / "ollama_cache.json"
+OLLAMA_MAX_PARALLEL = 2
+
+
+# --- Configuration RUM / établissement ---
+
+FINESS = "000000000"
+NUM_UM = "0000"


 # --- Configuration RAG ---
@@ -83,6 +91,10 @@ class Diagnostic(BaseModel):
 class ActeCCAM(BaseModel):
    texte: str
    code_ccam_suggestion: Optional[str] = None
+    ccam_confidence: Optional[str] = None
+    justification: Optional[str] = None
+    raisonnement: Optional[str] = None
+    sources_rag: list[RAGSource] = Field(default_factory=list)
    date: Optional[str] = None
    validite: Optional[str] = None  # "valide" | "obsolete" | "non_verifie"
    alertes: list[str] = Field(default_factory=list)
@@ -120,12 +132,38 @@ class DossierMedical(BaseModel):
    complications: list[str] = Field(default_factory=list)
    alertes_codage: list[str] = Field(default_factory=list)
    source_files: list[str] = Field(default_factory=list)
+    ghm_estimation: Optional[GHMEstimation] = None
+    controles_cpam: list[ControleCPAM] = Field(default_factory=list)
    processing_time_s: float | None = None


 # --- Rapport d'anonymisation ---


+class GHMEstimation(BaseModel):
+    cmd: Optional[str] = None
+    cmd_libelle: Optional[str] = None
+    type_ghm: Optional[str] = None  # "C" / "M" / "K"
+    severite: int = 1  # 1-4
+    ghm_approx: Optional[str] = None  # ex: "07C??2"
+    cma_count: int = 0
+    cms_count: int = 0
+    alertes: list[str] = Field(default_factory=list)
+
+
+class ControleCPAM(BaseModel):
+    numero_ogc: int
+    titre: str = ""
+    arg_ucr: str = ""
+    decision_ucr: str = ""
+    dp_ucr: Optional[str] = None
+    da_ucr: Optional[str] = None
+    dr_ucr: Optional[str] = None
+    actes_ucr: Optional[str] = None
+    contre_argumentation: Optional[str] = None
+    sources_reponse: list[RAGSource] = Field(default_factory=list)
+
+
 class AnonymizationReport(BaseModel):
    source_file: str
    total_replacements: int = 0
--- a/src/control/init.py
+++ b/src/control/init.py
--- a/src/control/cpam_parser.py
+++ b/src/control/cpam_parser.py
@@ -0,0 +1,115 @@
+"""Parsing du fichier Excel de contrôle CPAM (UCR) et matching OGC."""
+
+from __future__ import annotations
+
+import logging
+import re
+from pathlib import Path
+
+import openpyxl
+
+from ..config import ControleCPAM
+
+logger = logging.getLogger(__name__)
+
+# Colonnes attendues dans le fichier Excel
+_EXPECTED_COLUMNS = ("N° OGC", "Titre", "Arg_UCR", "Décision_UCR", "DP_UCR", "DA_UCR", "DR_UCR", "Actes_UCR")
+
+
+def parse_cpam_excel(path: str | Path) -> dict[int, list[ControleCPAM]]:
+    """Lit le fichier Excel de contrôle CPAM et retourne un dict OGC -> liste de contrôles.
+
+    Args:
+        path: Chemin vers le fichier .xlsx CPAM.
+
+    Returns:
+        Dict avec le numéro OGC comme clé et la liste des contrôles associés.
+    """
+    path = Path(path)
+    if not path.exists():
+        logger.error("Fichier CPAM introuvable : %s", path)
+        return {}
+
+    wb = openpyxl.load_workbook(path, read_only=True)
+    ws = wb[wb.sheetnames[0]]
+
+    # Lire l'en-tête
+    rows = ws.iter_rows(values_only=True)
+    header = next(rows, None)
+    if header is None:
+        logger.error("Fichier CPAM vide : %s", path)
+        return {}
+
+    # Construire le mapping colonne -> index
+    col_map = {}
+    for i, col_name in enumerate(header):
+        if col_name:
+            col_map[col_name.strip()] = i
+
+    # Vérifier les colonnes requises
+    missing = [c for c in _EXPECTED_COLUMNS[:4] if c not in col_map]
+    if missing:
+        logger.error("Colonnes manquantes dans le fichier CPAM : %s", missing)
+        return {}
+
+    result: dict[int, list[ControleCPAM]] = {}
+    count = 0
+
+    for row in rows:
+        ogc_val = row[col_map["N° OGC"]]
+        if ogc_val is None:
+            continue
+
+        try:
+            numero_ogc = int(ogc_val)
+        except (ValueError, TypeError):
+            logger.warning("N° OGC invalide ignoré : %s", ogc_val)
+            continue
+
+        controle = ControleCPAM(
+            numero_ogc=numero_ogc,
+            titre=str(row[col_map.get("Titre", 1)] or "").strip(),
+            arg_ucr=str(row[col_map.get("Arg_UCR", 2)] or "").strip(),
+            decision_ucr=str(row[col_map.get("Décision_UCR", 3)] or "").strip(),
+            dp_ucr=_clean_optional(row, col_map.get("DP_UCR")),
+            da_ucr=_clean_optional(row, col_map.get("DA_UCR")),
+            dr_ucr=_clean_optional(row, col_map.get("DR_UCR")),
+            actes_ucr=_clean_optional(row, col_map.get("Actes_UCR")),
+        )
+
+        result.setdefault(numero_ogc, []).append(controle)
+        count += 1
+
+    logger.info("CPAM : %d contrôles chargés pour %d OGC distincts", count, len(result))
+    return result
+
+
+def _clean_optional(row: tuple, idx: int | None) -> str | None:
+    """Extrait une valeur optionnelle depuis une ligne Excel."""
+    if idx is None or idx >= len(row):
+        return None
+    val = row[idx]
+    if val is None:
+        return None
+    val = str(val).strip()
+    return val if val else None
+
+
+def match_dossier_ogc(source_name: str, cpam_data: dict[int, list[ControleCPAM]]) -> list[ControleCPAM]:
+    """Cherche les contrôles CPAM correspondant à un dossier par préfixe OGC.
+
+    Le nom du dossier suit le format "17_23100690" où 17 est le N° OGC.
+
+    Args:
+        source_name: Nom du sous-dossier (ex: "17_23100690").
+        cpam_data: Dict OGC -> contrôles retourné par parse_cpam_excel().
+
+    Returns:
+        Liste des contrôles CPAM pour cet OGC, ou liste vide.
+    """
+    match = re.match(r"^(\d+)_", source_name)
+    if not match:
+        return []
+
+    ogc = int(match.group(1))
+    return cpam_data.get(ogc, [])
--- a/src/control/cpam_response.py
+++ b/src/control/cpam_response.py
@@ -0,0 +1,228 @@
+"""Génération de contre-argumentation pour les contrôles CPAM via RAG + Ollama."""
+
+from __future__ import annotations
+
+import logging
+
+from ..config import ControleCPAM, DossierMedical, RAGSource
+from ..medical.ollama_client import call_ollama
+
+logger = logging.getLogger(__name__)
+
+
+def _search_rag_for_control(controle: ControleCPAM, dossier: DossierMedical) -> list[dict]:
+    """Recherche RAG ciblée pour le sujet du désaccord."""
+    try:
+        from ..medical.rag_search import search_similar
+    except Exception:
+        logger.warning("Index RAG non disponible pour la contre-argumentation")
+        return []
+
+    # Construire une requête combinant l'argument CPAM et le diagnostic concerné
+    query_parts = []
+
+    if controle.titre:
+        query_parts.append(controle.titre)
+
+    # Ajouter les codes contestés pour cibler la recherche
+    if controle.dp_ucr:
+        query_parts.append(f"diagnostic principal {controle.dp_ucr}")
+    if controle.da_ucr:
+        query_parts.append(f"diagnostic associé {controle.da_ucr}")
+
+    # Tronquer l'argument CPAM pour ne garder que le coeur
+    arg_short = controle.arg_ucr[:300] if controle.arg_ucr else ""
+    if arg_short:
+        query_parts.append(arg_short)
+
+    query = " ".join(query_parts)
+    if not query.strip():
+        return []
+
+    return search_similar(query, top_k=8)
+
+
+def _build_cpam_prompt(
+    dossier: DossierMedical,
+    controle: ControleCPAM,
+    sources: list[dict],
+) -> str:
+    """Construit le prompt pour la contre-argumentation CPAM."""
+    # Résumé du dossier médical
+    dossier_lines = []
+
+    if dossier.diagnostic_principal:
+        dp = dossier.diagnostic_principal
+        dp_code = f" ({dp.cim10_suggestion})" if dp.cim10_suggestion else ""
+        dossier_lines.append(f"- DP : {dp.texte}{dp_code}")
+
+    if dossier.diagnostics_associes:
+        das_parts = []
+        for das in dossier.diagnostics_associes:
+            code = f" ({das.cim10_suggestion})" if das.cim10_suggestion else ""
+            das_parts.append(f"{das.texte}{code}")
+        dossier_lines.append(f"- DAS : {', '.join(das_parts)}")
+
+    if dossier.actes_ccam:
+        actes = [f"{a.texte} ({a.code_ccam_suggestion})" if a.code_ccam_suggestion else a.texte
+                 for a in dossier.actes_ccam]
+        dossier_lines.append(f"- Actes CCAM : {', '.join(actes)}")
+
+    sejour = dossier.sejour
+    if sejour.duree_sejour is not None:
+        dossier_lines.append(f"- Durée séjour : {sejour.duree_sejour} jours")
+    if sejour.sexe or sejour.age is not None:
+        patient_info = []
+        if sejour.sexe:
+            patient_info.append(sejour.sexe)
+        if sejour.age is not None:
+            patient_info.append(f"{sejour.age} ans")
+        dossier_lines.append(f"- Patient : {', '.join(patient_info)}")
+
+    if dossier.biologie_cle:
+        bio = [f"{b.test}: {b.valeur}" for b in dossier.biologie_cle[:5] if b.valeur]
+        if bio:
+            dossier_lines.append(f"- Biologie clé : {', '.join(bio)}")
+
+    if dossier.complications:
+        dossier_lines.append(f"- Complications : {', '.join(dossier.complications)}")
+
+    dossier_str = "\n".join(dossier_lines) if dossier_lines else "Non disponible"
+
+    # Codes contestés par la CPAM
+    codes_contestes = []
+    if controle.dp_ucr:
+        codes_contestes.append(f"DP proposé par UCR : {controle.dp_ucr}")
+    if controle.da_ucr:
+        codes_contestes.append(f"DA proposés par UCR : {controle.da_ucr}")
+    if controle.dr_ucr:
+        codes_contestes.append(f"DR proposé par UCR : {controle.dr_ucr}")
+    if controle.actes_ucr:
+        codes_contestes.append(f"Actes proposés par UCR : {controle.actes_ucr}")
+    codes_str = "\n".join(codes_contestes) if codes_contestes else "Aucun code spécifique proposé"
+
+    # Sources RAG
+    sources_text = ""
+    for i, src in enumerate(sources, 1):
+        doc_name = {
+            "cim10": "CIM-10 FR 2026",
+            "cim10_alpha": "CIM-10 Index Alphabétique 2026",
+            "guide_methodo": "Guide Méthodologique MCO 2026",
+            "ccam": "CCAM PMSI V4 2025",
+        }.get(src.get("document", ""), src.get("document", ""))
+
+        code_info = f" (code: {src['code']})" if src.get("code") else ""
+        page_info = f" [page {src['page']}]" if src.get("page") else ""
+
+        sources_text += f"--- Source {i}: {doc_name}{code_info}{page_info} ---\n"
+        sources_text += (src.get("extrait", "")[:800]) + "\n\n"
+
+    return f"""Tu es un médecin DIM (Département d'Information Médicale) expert en contentieux T2A.
+Tu dois contre-argumenter la décision de la CPAM (UCR) point par point, en t'appuyant sur le guide méthodologique et la CIM-10.
+
+DOSSIER MÉDICAL DE L'ÉTABLISSEMENT :
+{dossier_str}
+
+OBJET DU DÉSACCORD : {controle.titre}
+
+ARGUMENTATION DE LA CPAM (UCR) :
+{controle.arg_ucr}
+
+DÉCISION UCR : {controle.decision_ucr}
+
+CODES CONTESTÉS :
+{codes_str}
+
+SOURCES RÉGLEMENTAIRES (Guide méthodologique, CIM-10) :
+{sources_text}
+
+CONSIGNES :
+- Analyse objectivement l'argument de la CPAM
+- Identifie les points où la CPAM a raison (le cas échéant)
+- Contre-argumente point par point en citant le guide méthodologique et la CIM-10
+- Cite les références précises (pages, articles, fascicules)
+- Propose une conclusion et la position recommandée
+
+Réponds UNIQUEMENT avec un objet JSON au format suivant :
+{{
+  "analyse_contestation": "Résumé de ce que conteste la CPAM",
+  "points_accord": "Points où la CPAM a raison (ou 'Aucun' si non applicable)",
+  "contre_arguments": "Arguments point par point en faveur de l'établissement",
+  "references": "Références guide méthodologique / CIM-10 citées",
+  "conclusion": "Synthèse et position recommandée"
+}}"""
+
+
+def _format_response(parsed: dict) -> str:
+    """Formate la réponse LLM en texte lisible."""
+    sections = []
+
+    analyse = parsed.get("analyse_contestation")
+    if analyse:
+        sections.append(f"ANALYSE DE LA CONTESTATION\n{analyse}")
+
+    accord = parsed.get("points_accord")
+    if accord and accord.lower() not in ("aucun", "non applicable", "n/a", ""):
+        sections.append(f"POINTS D'ACCORD\n{accord}")
+
+    contre = parsed.get("contre_arguments")
+    if contre:
+        sections.append(f"CONTRE-ARGUMENTS\n{contre}")
+
+    refs = parsed.get("references")
+    if refs:
+        sections.append(f"REFERENCES\n{refs}")
+
+    conclusion = parsed.get("conclusion")
+    if conclusion:
+        sections.append(f"CONCLUSION\n{conclusion}")
+
+    return "\n\n".join(sections)
+
+
+def generate_cpam_response(
+    dossier: DossierMedical,
+    controle: ControleCPAM,
+) -> tuple[str, list[RAGSource]]:
+    """Génère une contre-argumentation pour un contrôle CPAM.
+
+    Args:
+        dossier: Le dossier médical analysé.
+        controle: Le contrôle CPAM à contester.
+
+    Returns:
+        Tuple (texte de contre-argumentation, sources RAG utilisées).
+    """
+    logger.info("CPAM : génération contre-argumentation pour OGC %d — %s",
+                controle.numero_ogc, controle.titre)
+
+    # 1. Recherche RAG ciblée
+    sources = _search_rag_for_control(controle, dossier)
+    logger.info("  RAG : %d sources trouvées", len(sources))
+
+    # 2. Construction du prompt
+    prompt = _build_cpam_prompt(dossier, controle, sources)
+
+    # 3. Appel Ollama
+    result = call_ollama(prompt, temperature=0.1, max_tokens=3000)
+
+    # 4. Conversion des sources RAG
+    rag_sources = [
+        RAGSource(
+            document=s.get("document", ""),
+            page=s.get("page"),
+            code=s.get("code"),
+            extrait=s.get("extrait", "")[:200],
+        )
+        for s in sources
+    ]
+
+    if result is None:
+        logger.warning("  Ollama non disponible — contre-argumentation non générée")
+        return "", rag_sources
+
+    # 5. Formater la réponse
+    text = _format_response(result)
+    logger.info("  Contre-argumentation générée (%d caractères)", len(text))
+
+    return text, rag_sources
--- a/src/export/init.py
+++ b/src/export/init.py
--- a/src/export/rum_export.py
+++ b/src/export/rum_export.py
@@ -0,0 +1,190 @@
+"""Export au format RUM (Résumé d'Unité Médicale) V016 pour le groupeur ATIH.
+
+Génère une ligne fixe de 165 caractères suivie de zones variables
+(DAS en 8 chars, actes CCAM en 29 chars chacun).
+"""
+
+from __future__ import annotations
+
+import re
+from dataclasses import dataclass
+from pathlib import Path
+
+from ..config import FINESS, NUM_UM, DossierMedical
+
+
+@dataclass
+class RUMConfig:
+    finess: str = FINESS
+    num_um: str = NUM_UM
+
+
+def _format_cim10(code: str | None) -> str:
+    """Formate un code CIM-10 sur 8 caractères (sans point, padded)."""
+    if not code:
+        return " " * 8
+    clean = code.upper().replace(".", "").strip()
+    return clean.ljust(8)[:8]
+
+
+def _format_date(date_str: str | None) -> str:
+    """Convertit une date DD/MM/YYYY ou YYYY-MM-DD en DDMMYYYY (8 chars)."""
+    if not date_str:
+        return " " * 8
+    date_str = date_str.strip()
+    # Format DD/MM/YYYY
+    m = re.match(r"(\d{2})/(\d{2})/(\d{4})", date_str)
+    if m:
+        return f"{m.group(1)}{m.group(2)}{m.group(3)}"
+    # Format YYYY-MM-DD
+    m = re.match(r"(\d{4})-(\d{2})-(\d{2})", date_str)
+    if m:
+        return f"{m.group(3)}{m.group(2)}{m.group(1)}"
+    return " " * 8
+
+
+def _format_sex(sexe: str | None) -> str:
+    """Convertit le sexe en code RUM (1=M, 2=F)."""
+    if not sexe:
+        return " "
+    s = sexe.strip().upper()
+    if s in ("M", "MASCULIN", "HOMME", "H"):
+        return "1"
+    if s in ("F", "FEMININ", "FÉMININ", "FEMME"):
+        return "2"
+    return " "
+
+
+def _map_mode_entree(text: str | None) -> str:
+    """Convertit le mode d'entrée textuel en code RUM (1 char)."""
+    if not text:
+        return " "
+    t = text.strip().lower()
+    mapping = {
+        "domicile": "8",
+        "mutation": "6",
+        "transfert": "7",
+        "urgences": "8",
+        "urgence": "8",
+    }
+    for key, code in mapping.items():
+        if key in t:
+            return code
+    return " "
+
+
+def _map_mode_sortie(text: str | None) -> str:
+    """Convertit le mode de sortie textuel en code RUM (1 char)."""
+    if not text:
+        return " "
+    t = text.strip().lower()
+    mapping = {
+        "domicile": "8",
+        "mutation": "6",
+        "transfert": "7",
+        "deces": "9",
+        "décès": "9",
+        "décédé": "9",
+        "decede": "9",
+    }
+    for key, code in mapping.items():
+        if key in t:
+            return code
+    return " "
+
+
+def _format_ccam_act(acte) -> str:
+    """Formate un acte CCAM sur 29 caractères.
+
+    Structure : code(7) + phase(1) + activité(1) + date(8) + doc/extension(12)
+    """
+    code = (acte.code_ccam_suggestion or "").upper().replace(" ", "")
+    code = code.ljust(7)[:7]
+    phase = "1"
+    activite = "1"
+    date = _format_date(acte.date)
+    extension = " " * 12
+    return f"{code}{phase}{activite}{date}{extension}"
+
+
+def export_rum(dossier: DossierMedical, config: RUMConfig | None = None) -> str:
+    """Génère le texte RUM complet pour un dossier médical.
+
+    Returns:
+        Chaîne texte au format RUM V016 (165 chars fixes + zones variables).
+    """
+    if config is None:
+        config = RUMConfig()
+
+    sejour = dossier.sejour
+    dp = dossier.diagnostic_principal
+
+    # Compteurs
+    das_list = dossier.diagnostics_associes
+    actes_list = dossier.actes_ccam
+    nb_das = len(das_list)
+    nb_actes = len(actes_list)
+
+    # Numéros générés
+    source = dossier.source_file or "UNKNOWN"
+    num_rss = source.replace(".pdf", "").replace(" ", "_").ljust(20)[:20]
+    num_admin = num_rss
+    num_rum = source[:10].ljust(10)[:10]
+
+    # Construction de la zone fixe (165 caractères)
+    parts = [
+        " " * 2,                                          # 1-2   : Version classification (vide)
+        " " * 6,                                          # 3-8   : GHM (vide, rempli par groupeur)
+        " ",                                              # 9     : Filler
+        "016",                                            # 10-12 : Version format
+        " " * 3,                                          # 13-15 : Code retour
+        config.finess.ljust(9)[:9],                       # 16-24 : FINESS
+        "016",                                            # 25-27 : Version RUM
+        num_rss,                                          # 28-47 : N° RSS
+        num_admin,                                        # 48-67 : N° admin
+        num_rum,                                          # 68-77 : N° RUM
+        _format_date(None),                               # 78-85 : Date naissance (non disponible)
+        _format_sex(sejour.sexe),                         # 86    : Sexe
+        config.num_um.ljust(4)[:4],                       # 87-90 : N° UM
+        " " * 2,                                          # 91-92 : Type autorisation
+        _format_date(sejour.date_entree),                 # 93-100: Date entrée UM
+        _map_mode_entree(sejour.mode_entree),             # 101   : Mode entrée
+        " ",                                              # 102   : Provenance
+        _format_date(sejour.date_sortie),                 # 103-110: Date sortie UM
+        _map_mode_sortie(sejour.mode_sortie),             # 111   : Mode sortie
+        " ",                                              # 112   : Destination
+        " " * 5,                                          # 113-117: CP résidence
+        " " * 4,                                          # 118-121: Poids nné
+        " " * 2,                                          # 122-123: Âge gestationnel
+        "00",                                             # 124-125: Nb séances
+        str(nb_das).zfill(2)[-2:],                        # 126-127: Nb DAS
+        "00",                                             # 128-129: Nb DAD
+        str(nb_actes).zfill(2)[-2:],                      # 130-131: Nb actes
+        _format_cim10(dp.cim10_suggestion if dp else None),  # 132-139: DP
+        " " * 8,                                          # 140-147: DR
+        " " * 3,                                          # 148-150: IGS2
+        " " * 15,                                         # 151-165: Réservé
+    ]
+
+    fixed = "".join(parts)
+    assert len(fixed) == 165, f"Zone fixe RUM: attendu 165, obtenu {len(fixed)}"
+
+    # Zones variables
+    variable_parts: list[str] = []
+
+    # DAS (8 chars chacun)
+    for das in das_list:
+        variable_parts.append(_format_cim10(das.cim10_suggestion))
+
+    # Actes CCAM (29 chars chacun)
+    for acte in actes_list:
+        variable_parts.append(_format_ccam_act(acte))
+
+    return fixed + "".join(variable_parts)
+
+
+def save_rum(dossier: DossierMedical, path: Path, config: RUMConfig | None = None) -> None:
+    """Exporte un dossier au format RUM dans un fichier."""
+    rum_text = export_rum(dossier, config)
+    path.parent.mkdir(parents=True, exist_ok=True)
+    path.write_text(rum_text, encoding="utf-8")
--- a/src/main.py
+++ b/src/main.py
@@ -10,13 +10,14 @@ import time
 from pathlib import Path

 from .anonymization.anonymizer import Anonymizer
-from .config import ANONYMIZED_DIR, REPORTS_DIR, STRUCTURED_DIR, AnonymizationReport, DossierMedical
+from .config import ANONYMIZED_DIR, OUTPUT_DIR, REPORTS_DIR, STRUCTURED_DIR, AnonymizationReport, DossierMedical
 from .extraction.document_classifier import classify
 from .extraction.crh_parser import parse_crh
 from .extraction.document_splitter import split_documents
 from .extraction.pdf_extractor import extract_text
 from .extraction.trackare_parser import parse_trackare
 from .medical.cim10_extractor import extract_medical_info
+from .medical.ghm import estimate_ghm

 logging.basicConfig(
    level=logging.INFO,
@@ -84,10 +85,20 @@ def process_pdf(pdf_path: Path) -> list[tuple[str, DossierMedical, Anonymization
        dossier = extract_medical_info(parsed, anonymized_text, edsnlp_result, use_rag=_use_rag)
        dossier.source_file = pdf_path.name
        dossier.document_type = doc_type
-        dossier.processing_time_s = round(time.time() - t0, 2)
        logger.info("  DP%s : %s", part_label, dossier.diagnostic_principal)
        logger.info("  DAS : %d, Actes : %d", len(dossier.diagnostics_associes), len(dossier.actes_ccam))

+        # 8. Estimation GHM
+        try:
+            ghm = estimate_ghm(dossier)
+            dossier.ghm_estimation = ghm
+            logger.info("  GHM : CMD=%s, Type=%s, Sévérité=%d → %s",
+                        ghm.cmd or "?", ghm.type_ghm or "?",
+                        ghm.severite, ghm.ghm_approx or "?")
+        except Exception:
+            logger.warning("  Erreur estimation GHM", exc_info=True)
+
+        dossier.processing_time_s = round(time.time() - t0, 2)
        results.append((anonymized_text, dossier, report))

    logger.info("  Temps total : %.2fs", time.time() - t0)
@@ -120,6 +131,7 @@ def write_outputs(
    dossier: DossierMedical,
    report: AnonymizationReport,
    subdir: str | None = None,
+    export_rum_flag: bool = False,
 ) -> None:
    """Écrit les fichiers de sortie."""
    anon_dir = ANONYMIZED_DIR / subdir if subdir else ANONYMIZED_DIR
@@ -151,6 +163,17 @@ def write_outputs(
    )
    logger.info("  → %s", report_path)

+    # Export RUM
+    if export_rum_flag:
+        from .export.rum_export import save_rum
+        rum_dir = OUTPUT_DIR / "rum"
+        if subdir:
+            rum_dir = rum_dir / subdir
+        rum_dir.mkdir(parents=True, exist_ok=True)
+        rum_path = rum_dir / f"{stem}_rum.txt"
+        save_rum(dossier, rum_path)
+        logger.info("  → %s", rum_path)
+

 def main(input_path: str | None = None) -> None:
    """Point d'entrée principal."""
@@ -197,6 +220,16 @@ def main(input_path: str | None = None) -> None:
        action="store_true",
        help="Forcer la reconstruction de l'index FAISS",
    )
+    parser.add_argument(
+        "--export-rum",
+        action="store_true",
+        help="Exporter les dossiers au format RUM V016 (pour groupeur ATIH)",
+    )
+    parser.add_argument(
+        "--control-cpam",
+        metavar="PATH",
+        help="Fichier Excel de contrôle CPAM (enrichit les dossiers avec contre-argumentation)",
+    )
    args = parser.parse_args()

    if args.build_dict:
@@ -226,6 +259,16 @@ def main(input_path: str | None = None) -> None:
    if args.no_rag:
        _use_rag = False

+    export_rum_flag = args.export_rum
+
+    # Chargement contrôle CPAM
+    cpam_data = None
+    if args.control_cpam:
+        from .control.cpam_parser import parse_cpam_excel
+        cpam_data = parse_cpam_excel(args.control_cpam)
+        if not cpam_data:
+            logger.warning("Aucun contrôle CPAM chargé depuis %s", args.control_cpam)
+
    input_paths = args.input

    # Collecte des groupes (pdfs, subdir) à traiter
@@ -274,12 +317,13 @@ def main(input_path: str | None = None) -> None:
                multi = len(pdf_results) > 1
                for part_idx, (anonymized_text, dossier, report) in enumerate(pdf_results):
                    part_stem = f"{stem}_part{part_idx + 1}" if multi else stem
-                    write_outputs(part_stem, anonymized_text, dossier, report, subdir=subdir)
+                    write_outputs(part_stem, anonymized_text, dossier, report, subdir=subdir, export_rum_flag=export_rum_flag)
                    group_dossiers.append(dossier)
            except Exception:
                logger.exception("Erreur lors du traitement de %s", pdf_path.name)

        # Fusion multi-PDFs si plusieurs documents dans le même groupe
+        merged = None
        if len(group_dossiers) > 1 and subdir:
            try:
                from .medical.fusion import merge_dossiers
@@ -287,13 +331,47 @@ def main(input_path: str | None = None) -> None:
                struct_dir = STRUCTURED_DIR / subdir
                struct_dir.mkdir(parents=True, exist_ok=True)
                merged_path = struct_dir / f"{subdir}_fusionne_cim10.json"
+
+                # Export RUM du dossier fusionné
+                if export_rum_flag:
+                    from .export.rum_export import save_rum
+                    rum_dir = OUTPUT_DIR / "rum" / subdir
+                    rum_dir.mkdir(parents=True, exist_ok=True)
+                    rum_path = rum_dir / f"{subdir}_fusionne_rum.txt"
+                    save_rum(merged, rum_path)
+                    logger.info("  → RUM fusionné : %s", rum_path)
+            except Exception:
+                logger.exception("Erreur lors de la fusion du groupe %s", subdir)
+                merged = None
+
+        # Contrôle CPAM : enrichir le dossier principal (fusionné ou dernier)
+        if cpam_data and subdir:
+            from .control.cpam_parser import match_dossier_ogc
+            controles = match_dossier_ogc(subdir, cpam_data)
+            if controles:
+                from .control.cpam_response import generate_cpam_response
+                target = merged if merged else (group_dossiers[-1] if group_dossiers else None)
+                if target:
+                    logger.info("  CPAM : %d contrôle(s) pour %s", len(controles), subdir)
+                    for ctrl in controles:
+                        text, sources = generate_cpam_response(target, ctrl)
+                        ctrl.contre_argumentation = text
+                        ctrl.sources_reponse = sources
+                    target.controles_cpam = controles
+
+        # Écrire le dossier fusionné (après enrichissement CPAM éventuel)
+        if merged is not None and subdir:
+            try:
+                struct_dir = STRUCTURED_DIR / subdir
+                struct_dir.mkdir(parents=True, exist_ok=True)
+                merged_path = struct_dir / f"{subdir}_fusionne_cim10.json"
                merged_path.write_text(
                    merged.model_dump_json(indent=2, exclude_none=True),
                    encoding="utf-8",
                )
                logger.info("  → Dossier fusionné : %s", merged_path)
            except Exception:
-                logger.exception("Erreur lors de la fusion du groupe %s", subdir)
+                logger.exception("Erreur écriture dossier fusionné %s", subdir)

    logger.info("Terminé.")

--- a/src/medical/cim10_dict.py
+++ b/src/medical/cim10_dict.py
@@ -173,6 +173,32 @@ def lookup(
    return None


+def normalize_code(code: str) -> str:
+    """Normalise un code CIM-10 : K810 → K81.0, k85.1 → K85.1."""
+    code = code.strip().upper()
+    # Insérer le point si absent : K810 → K81.0
+    if len(code) > 3 and "." not in code:
+        code = code[:3] + "." + code[3:]
+    return code
+
+
+def validate_code(code: str) -> tuple[bool, str]:
+    """Vérifie si un code CIM-10 existe dans le dictionnaire.
+
+    Returns:
+        (is_valid, label) — label vide si invalide.
+    """
+    d = load_dict()
+    normalized = normalize_code(code)
+    if normalized in d:
+        return True, d[normalized]
+    # Tenter aussi le code brut (3 caractères sans point)
+    raw = code.upper().strip()
+    if raw in d:
+        return True, d[raw]
+    return False, ""
+
+
 def reset_cache() -> None:
    """Réinitialise les caches (utile pour les tests)."""
    global _dict_cache, _normalized_cache
--- a/src/medical/cim10_extractor.py
+++ b/src/medical/cim10_extractor.py
@@ -9,7 +9,7 @@ from typing import Optional

 logger = logging.getLogger(__name__)

-from .cim10_dict import lookup as dict_lookup, normalize_text
+from .cim10_dict import lookup as dict_lookup, normalize_text, normalize_code, validate_code as cim10_validate
 from .ccam_dict import lookup as ccam_lookup, validate_code as ccam_validate
 from .das_filter import clean_diagnostic_text, is_valid_diagnostic_text
 from ..config import (
@@ -118,6 +118,9 @@ def extract_medical_info(
    # Post-processing : validation des codes CCAM contre le dictionnaire
    _validate_ccam(dossier)

+    # Post-processing : validation des codes CIM-10 contre le dictionnaire
+    _validate_cim10(dossier)
+
    # Post-processing : exclusions symptôme vs diagnostic précis
    _apply_exclusion_rules(dossier)

@@ -663,6 +666,68 @@ def _validate_ccam(dossier: DossierMedical) -> None:
            )


+_INVALID_CODE_PATTERNS = {"aucun", "none", "n/a", "non_codable", "aucun_code_valide", "inconnu"}
+
+
+def _fallback_cim10(texte: str) -> str | None:
+    """Tente de trouver un code CIM-10 via le dictionnaire à partir du texte diagnostic."""
+    code = dict_lookup(texte, domain_overrides=CIM10_MAP)
+    if code:
+        is_valid, _ = cim10_validate(code)
+        if is_valid:
+            return code
+    return None
+
+
+def _validate_cim10(dossier: DossierMedical) -> None:
+    """Valide les codes CIM-10 suggérés par Ollama contre le dictionnaire."""
+    diags: list[tuple[str, Diagnostic]] = []
+    if dossier.diagnostic_principal:
+        diags.append(("DP", dossier.diagnostic_principal))
+    for das in dossier.diagnostics_associes:
+        diags.append(("DAS", das))
+
+    for type_diag, diag in diags:
+        if not diag.cim10_suggestion:
+            continue
+
+        # Rejeter les hallucinations
+        if diag.cim10_suggestion.lower().strip() in _INVALID_CODE_PATTERNS:
+            fallback = _fallback_cim10(diag.texte)
+            if fallback:
+                dossier.alertes_codage.append(
+                    f"CIM-10 {type_diag} ({diag.texte}) : code rejeté « {diag.cim10_suggestion} » → fallback {fallback}"
+                )
+                diag.cim10_suggestion = fallback
+                diag.cim10_confidence = "medium"
+            else:
+                dossier.alertes_codage.append(
+                    f"CIM-10 {type_diag} ({diag.texte}) : code rejeté « {diag.cim10_suggestion} »"
+                )
+                diag.cim10_suggestion = None
+                diag.cim10_confidence = None
+            continue
+
+        # Normaliser le format (K810 → K81.0)
+        diag.cim10_suggestion = normalize_code(diag.cim10_suggestion)
+
+        # Valider contre le dictionnaire
+        is_valid, label = cim10_validate(diag.cim10_suggestion)
+        if not is_valid:
+            fallback = _fallback_cim10(diag.texte)
+            if fallback:
+                dossier.alertes_codage.append(
+                    f"CIM-10 {type_diag} {diag.cim10_suggestion} ({diag.texte}) : code invalide → fallback {fallback}"
+                )
+                diag.cim10_suggestion = fallback
+                diag.cim10_confidence = "medium"
+            else:
+                dossier.alertes_codage.append(
+                    f"CIM-10 {type_diag} {diag.cim10_suggestion} ({diag.texte}) : code absent du dictionnaire CIM-10"
+                )
+                diag.cim10_confidence = "low"
+
+
 def _find_act_date(text: str, act_pattern: str) -> str | None:
    """Trouve la date associée à un acte."""
    # Chercher "acte le DD/MM" ou "acte le DD/MM/YYYY"
@@ -705,7 +770,7 @@ def _apply_severity_rules(dossier: DossierMedical) -> None:
    """Enrichit les diagnostics avec les informations de sévérité heuristique."""
    try:
        from .severity import enrich_dossier_severity
-        alertes = enrich_dossier_severity(
+        alertes, _cma_count, _cms_count = enrich_dossier_severity(
            dossier.diagnostic_principal, dossier.diagnostics_associes,
        )
        dossier.alertes_codage.extend(alertes)
--- a/src/medical/das_filter.py
+++ b/src/medical/das_filter.py
@@ -33,9 +33,12 @@ def is_valid_diagnostic_text(text: str) -> bool:
    if re.match(r"^([a-zà-ÿ]{3,})\1+[a-zà-ÿ]*$", t, re.IGNORECASE):
        return False

-    # 5. Mots répétés ≥ 3 fois : "Spontanée spontanée spontanée spontanée"
+    # 5. Mots répétés : tous identiques ("Absence absence", "Anticoagulant anticoagulant")
+    # ou ≥ 3 occurrences du même mot
    words = t.lower().split()
-    if words:
+    if len(words) >= 2:
+        if len(set(words)) == 1:
+            return False
        from collections import Counter
        counts = Counter(words)
        if counts.most_common(1)[0][1] >= 3:
@@ -47,4 +50,27 @@ def is_valid_diagnostic_text(text: str) -> bool:
    if t in {"Isolement", "Pp 500"}:
        return False

+    # 7. Ponctuation initiale (artefacts OCR) : ", sans précision"
+    if re.match(r'^[,.\-;:!)\]]\s', t):
+        return False
+
+    # 8. Pattern "À X.X" / "A X.X" (valeurs numériques OCR)
+    if re.match(r'^[ÀA]\s+\d+([.,]\d+)?$', t):
+        return False
+
+    # 9. Crochets (artefacts OCR) : "Episode [episode"
+    if '[' in t or ']' in t:
+        return False
+
+    # 10. Termes de laboratoire isolés (un seul mot ≠ diagnostic)
+    _LAB_TERMS = {"hémoglobine", "créatinine", "plaquettes", "leucocytes", "glycémie",
+                  "natrémie", "kaliémie", "calcémie", "bilirubine", "albumine",
+                  "fibrinogène", "hématocrite", "cétonurie", "glycosurie"}
+    if t.lower() in _LAB_TERMS:
+        return False
+
+    # 11. Fragments anatomiques courts sans pathologie : "Dans la vessie", "Le rein"
+    if re.match(r'^(Dans |La |Le |Les |Au |Aux )', t) and len(t) < 30:
+        return False
+
    return True
--- a/src/medical/ghm.py
+++ b/src/medical/ghm.py
@@ -0,0 +1,215 @@
+"""Estimation heuristique du GHM (Groupe Homogène de Malades).
+
+L'algorithme officiel (ATIH FG-MCO) est propriétaire. Ce module fournit une
+estimation approximative utile comme pré-codage / aide au DIM :
+  1. CMD depuis le DP (table de plages CIM-10)
+  2. Type de prise en charge depuis les actes CCAM
+  3. Sévérité depuis les CMA/CMS
+  4. Construction du code GHM approximatif
+"""
+
+from __future__ import annotations
+
+import bisect
+from typing import Optional
+
+from ..config import DossierMedical, GHMEstimation
+
+
+# ---------------------------------------------------------------------------
+# Table CIM-10 → CMD (Catégorie Majeure de Diagnostic)
+# Triée par borne inférieure pour lookup par bisect.
+# Format : (debut, fin, cmd, libelle)
+# ---------------------------------------------------------------------------
+
+_CMD_RANGES: list[tuple[str, str, str, str]] = [
+    ("A00", "A99", "18", "Maladies infectieuses et parasitaires"),
+    ("B00", "B19", "18", "Maladies infectieuses et parasitaires"),
+    ("B20", "B24", "25", "Maladies dues au VIH"),
+    ("B25", "B99", "18", "Maladies infectieuses et parasitaires"),
+    ("C00", "C97", "17", "Tumeurs malignes"),
+    ("D00", "D09", "17", "Tumeurs malignes"),
+    ("D10", "D48", "16", "Tumeurs bénignes, hémopathies"),
+    ("D50", "D89", "16", "Tumeurs bénignes, hémopathies"),
+    ("E00", "E07", "10", "Maladies endocriniennes"),
+    ("E10", "E14", "10", "Maladies endocriniennes"),
+    ("E15", "E46", "10", "Maladies endocriniennes"),
+    ("E47", "E90", "10", "Maladies endocriniennes"),
+    ("F00", "F09", "19", "Maladies mentales"),
+    ("F10", "F19", "20", "Troubles mentaux liés à l'alcool et aux toxiques"),
+    ("F20", "F99", "19", "Maladies mentales"),
+    ("G00", "G99", "01", "Affections du système nerveux"),
+    ("H00", "H59", "02", "Affections de l'oeil"),
+    ("H60", "H95", "03", "Affections ORL"),
+    ("I00", "I99", "05", "Affections de l'appareil circulatoire"),
+    ("J00", "J99", "04", "Affections de l'appareil respiratoire"),
+    ("K00", "K67", "06", "Affections du tube digestif"),
+    ("K70", "K87", "07", "Affections hépatobiliaires et pancréatiques"),
+    ("K90", "K93", "06", "Affections du tube digestif"),
+    ("L00", "L99", "09", "Affections de la peau"),
+    ("M00", "M99", "08", "Affections du système ostéo-articulaire"),
+    ("N00", "N39", "11", "Affections du rein et des voies urinaires"),
+    ("N40", "N51", "12", "Affections de l'appareil génital masculin"),
+    ("N60", "N98", "13", "Affections de l'appareil génital féminin"),
+    ("N99", "N99", "11", "Affections du rein et des voies urinaires"),
+    ("O00", "O99", "14", "Grossesses, accouchements, post-partum"),
+    ("P00", "P96", "15", "Nouveau-nés, période périnatale"),
+    ("Q00", "Q99", "15", "Nouveau-nés, période périnatale"),
+    ("R00", "R99", "23", "Facteurs influençant l'état de santé (symptômes)"),
+    ("S00", "S99", "21", "Traumatismes"),
+    ("T00", "T19", "21", "Traumatismes"),
+    ("T20", "T32", "22", "Brûlures"),
+    ("T33", "T98", "21", "Traumatismes"),
+    ("U00", "U99", "26", "Catégories spéciales"),
+    ("V00", "Y98", "24", "Causes externes"),
+    ("Z00", "Z99", "23", "Facteurs influençant l'état de santé"),
+]
+
+# Pré-calcul : liste triée des bornes inférieures pour bisect
+_CMD_STARTS = [r[0] for r in _CMD_RANGES]
+
+
+def find_cmd(code_cim10: str) -> tuple[Optional[str], Optional[str]]:
+    """Trouve la CMD correspondant à un code CIM-10.
+
+    Returns:
+        (cmd, libelle) ou (None, None) si non trouvé.
+    """
+    if not code_cim10:
+        return None, None
+
+    # Normaliser : majuscules, retirer le point
+    code = code_cim10.upper().replace(".", "").strip()
+    if len(code) < 3:
+        return None, None
+
+    # Prendre les 3 premiers caractères pour le lookup
+    code3 = code[:3]
+
+    # bisect pour trouver la plage candidate
+    idx = bisect.bisect_right(_CMD_STARTS, code3) - 1
+    if idx < 0:
+        return None, None
+
+    debut, fin, cmd, libelle = _CMD_RANGES[idx]
+    if debut <= code3 <= fin:
+        return cmd, libelle
+
+    return None, None
+
+
+# ---------------------------------------------------------------------------
+# Préfixes CCAM classants (chirurgicaux)
+# Les codes CCAM commençant par ces lettres correspondent à des organes
+# et sont considérés chirurgicaux quand ils désignent un acte opératoire.
+# ---------------------------------------------------------------------------
+
+_CCAM_CHIRURGICAL_PREFIXES = {"H", "J", "K", "L", "N", "P", "Q"}
+
+# Préfixes interventionnels (imagerie, endoscopie)
+_CCAM_INTERVENTIONNEL_PREFIXES = {"Z", "Y"}
+
+
+def _detect_type_ghm(actes_ccam: list) -> str:
+    """Détermine le type de prise en charge depuis les actes CCAM.
+
+    Returns:
+        "C" (chirurgical), "K" (interventionnel) ou "M" (médical).
+    """
+    has_chirurgical = False
+    has_interventionnel = False
+
+    for acte in actes_ccam:
+        code = acte.code_ccam_suggestion
+        if not code or len(code) < 4:
+            continue
+
+        prefix = code[0].upper()
+        if prefix in _CCAM_CHIRURGICAL_PREFIXES:
+            has_chirurgical = True
+            break
+        if prefix in _CCAM_INTERVENTIONNEL_PREFIXES:
+            has_interventionnel = True
+
+    if has_chirurgical:
+        return "C"
+    if has_interventionnel:
+        return "K"
+    return "M"
+
+
+def _compute_severity(das_list: list) -> tuple[int, int, int]:
+    """Calcule le niveau de sévérité à partir des DAS.
+
+    Returns:
+        (niveau, cma_count, cms_count)
+    """
+    cma_count = 0
+    cms_count = 0
+
+    for das in das_list:
+        if getattr(das, "est_cma", False):
+            cma_count += 1
+        if getattr(das, "est_cms", False):
+            cms_count += 1
+
+    if cms_count >= 2:
+        niveau = 4
+    elif cms_count >= 1 or cma_count >= 3:
+        niveau = 3
+    elif cma_count >= 2:
+        niveau = 2
+    else:
+        niveau = 1
+
+    return niveau, cma_count, cms_count
+
+
+def estimate_ghm(dossier: DossierMedical) -> GHMEstimation:
+    """Estime le GHM d'un dossier médical.
+
+    Heuristique en 4 étapes :
+    1. CMD depuis le DP
+    2. Type de prise en charge depuis les actes CCAM
+    3. Sévérité depuis les CMA/CMS
+    4. Construction du code approximatif
+    """
+    estimation = GHMEstimation()
+
+    # 1. CMD depuis le DP
+    dp = dossier.diagnostic_principal
+    dp_code = dp.cim10_suggestion if dp else None
+
+    if not dp:
+        estimation.alertes.append("DP absent — CMD non déterminable")
+    elif not dp_code:
+        estimation.alertes.append("DP sans code CIM-10 — CMD non déterminable")
+    else:
+        cmd, libelle = find_cmd(dp_code)
+        if cmd:
+            estimation.cmd = cmd
+            estimation.cmd_libelle = libelle
+        else:
+            estimation.alertes.append(f"CMD inconnue pour le code {dp_code}")
+
+        # Alerte DP symptomatique
+        code_letter = dp_code.upper().replace(".", "").strip()[:1]
+        if code_letter in ("R", "Z"):
+            estimation.alertes.append(
+                f"DP symptomatique ({dp_code}) — risque de CMD 23, impact tarif"
+            )
+
+    # 2. Type de prise en charge
+    estimation.type_ghm = _detect_type_ghm(dossier.actes_ccam)
+
+    # 3. Sévérité
+    niveau, cma_count, cms_count = _compute_severity(dossier.diagnostics_associes)
+    estimation.severite = niveau
+    estimation.cma_count = cma_count
+    estimation.cms_count = cms_count
+
+    # 4. Code approximatif
+    if estimation.cmd and estimation.type_ghm:
+        estimation.ghm_approx = f"{estimation.cmd}{estimation.type_ghm}??{estimation.severite}"
+
+    return estimation
--- a/src/medical/ollama_cache.py
+++ b/src/medical/ollama_cache.py
@@ -0,0 +1,85 @@
+"""Cache persistant thread-safe pour les résultats Ollama."""
+
+from __future__ import annotations
+
+import json
+import logging
+import threading
+from pathlib import Path
+
+logger = logging.getLogger(__name__)
+
+
+class OllamaCache:
+    """Cache JSON persistant pour éviter les appels Ollama redondants.
+
+    Clé = (texte_diagnostic_normalisé, type).
+    Le modèle Ollama est stocké dans les métadonnées : si le modèle change,
+    le cache est automatiquement invalidé.
+    """
+
+    def __init__(self, cache_path: Path, model: str):
+        self._path = cache_path
+        self._model = model
+        self._lock = threading.Lock()
+        self._data: dict[str, dict] = {}
+        self._dirty = False
+        self._load()
+
+    def _load(self) -> None:
+        """Charge le cache depuis le disque."""
+        if not self._path.exists():
+            logger.info("Cache Ollama : nouveau cache (%s)", self._path)
+            return
+        try:
+            raw = json.loads(self._path.read_text(encoding="utf-8"))
+            if raw.get("model") != self._model:
+                logger.info(
+                    "Cache Ollama : modèle changé (%s → %s), cache invalidé",
+                    raw.get("model"), self._model,
+                )
+                return
+            self._data = raw.get("entries", {})
+            logger.info("Cache Ollama : %d entrées chargées", len(self._data))
+        except (json.JSONDecodeError, KeyError) as e:
+            logger.warning("Cache Ollama : fichier corrompu (%s), réinitialisé", e)
+            self._data = {}
+
+    @staticmethod
+    def _make_key(texte: str, diag_type: str) -> str:
+        """Construit une clé normalisée."""
+        return f"{diag_type}::{texte.strip().lower()}"
+
+    def get(self, texte: str, diag_type: str) -> dict | None:
+        """Récupère un résultat caché, ou None si absent."""
+        key = self._make_key(texte, diag_type)
+        with self._lock:
+            return self._data.get(key)
+
+    def put(self, texte: str, diag_type: str, result: dict) -> None:
+        """Stocke un résultat dans le cache."""
+        key = self._make_key(texte, diag_type)
+        with self._lock:
+            self._data[key] = result
+            self._dirty = True
+
+    def save(self) -> None:
+        """Persiste le cache sur disque si modifié."""
+        with self._lock:
+            if not self._dirty:
+                return
+            self._path.parent.mkdir(parents=True, exist_ok=True)
+            payload = {
+                "model": self._model,
+                "entries": self._data,
+            }
+            self._path.write_text(
+                json.dumps(payload, ensure_ascii=False, indent=2),
+                encoding="utf-8",
+            )
+            self._dirty = False
+            logger.info("Cache Ollama : %d entrées sauvegardées", len(self._data))
+
+    def __len__(self) -> int:
+        with self._lock:
+            return len(self._data)
--- a/src/medical/ollama_client.py
+++ b/src/medical/ollama_client.py
@@ -0,0 +1,80 @@
+"""Client Ollama partagé — appel LLM en mode JSON natif."""
+
+from __future__ import annotations
+
+import json
+import logging
+
+import requests
+
+from ..config import OLLAMA_URL, OLLAMA_MODEL, OLLAMA_TIMEOUT
+
+logger = logging.getLogger(__name__)
+
+
+def parse_json_response(raw: str) -> dict | None:
+    """Parse une réponse JSON d'Ollama, en gérant les blocs markdown."""
+    text = raw.strip()
+    if text.startswith("```"):
+        first_nl = text.find("\n")
+        if first_nl != -1:
+            text = text[first_nl + 1:]
+        if text.rstrip().endswith("```"):
+            text = text.rstrip()[:-3]
+        text = text.strip()
+
+    try:
+        return json.loads(text)
+    except json.JSONDecodeError:
+        logger.warning("Ollama : JSON invalide : %s", raw[:200])
+        return None
+
+
+def call_ollama(
+    prompt: str,
+    temperature: float = 0.1,
+    max_tokens: int = 2500,
+) -> dict | None:
+    """Appelle Ollama en mode JSON natif avec retry.
+
+    Args:
+        prompt: Le prompt à envoyer.
+        temperature: Température de génération (défaut: 0.1).
+        max_tokens: Nombre max de tokens (défaut: 2500).
+
+    Returns:
+        Le dict JSON parsé, ou None en cas d'erreur.
+    """
+    for attempt in range(2):
+        try:
+            response = requests.post(
+                f"{OLLAMA_URL}/api/generate",
+                json={
+                    "model": OLLAMA_MODEL,
+                    "prompt": prompt,
+                    "stream": False,
+                    "format": "json",
+                    "options": {
+                        "temperature": temperature,
+                        "num_predict": max_tokens,
+                    },
+                },
+                timeout=OLLAMA_TIMEOUT,
+            )
+            response.raise_for_status()
+            raw = response.json().get("response", "")
+            result = parse_json_response(raw)
+            if result is not None:
+                return result
+            if attempt == 0:
+                logger.info("Ollama : retry après échec de parsing")
+        except requests.ConnectionError:
+            logger.warning("Ollama non disponible (connexion refusée)")
+            return None
+        except requests.Timeout:
+            logger.warning("Ollama timeout après %ds", OLLAMA_TIMEOUT)
+            return None
+        except (requests.RequestException, json.JSONDecodeError) as e:
+            logger.warning("Ollama erreur : %s", e)
+            return None
+    return None
--- a/src/medical/rag_search.py
+++ b/src/medical/rag_search.py
@@ -2,12 +2,17 @@

 from __future__ import annotations

-import json
 import logging
+from concurrent.futures import ThreadPoolExecutor, as_completed

-import requests
-
-from ..config import Diagnostic, DossierMedical, RAGSource, OLLAMA_URL, OLLAMA_MODEL, OLLAMA_TIMEOUT
+from ..config import (
+    ActeCCAM, Diagnostic, DossierMedical, RAGSource,
+    OLLAMA_CACHE_PATH, OLLAMA_MAX_PARALLEL, OLLAMA_MODEL,
+)
+from .cim10_dict import normalize_code, validate_code as cim10_validate
+from .ccam_dict import validate_code as ccam_validate
+from .ollama_client import call_ollama, parse_json_response
+from .ollama_cache import OllamaCache

 logger = logging.getLogger(__name__)

@@ -85,6 +90,52 @@ def search_similar(query: str, top_k: int = 10) -> list[dict]:
    return final


+def search_similar_ccam(query: str, top_k: int = 8) -> list[dict]:
+    """Recherche les passages CCAM les plus similaires dans l'index FAISS.
+
+    Même logique que search_similar() mais priorise les sources CCAM.
+    """
+    from .rag_index import get_index
+    import numpy as np
+
+    result = get_index()
+    if result is None:
+        logger.warning("Index FAISS non disponible")
+        return []
+
+    faiss_index, metadata = result
+
+    model = _get_embed_model()
+    query_vec = model.encode([query], normalize_embeddings=True)
+    query_vec = np.array(query_vec, dtype=np.float32)
+
+    fetch_k = min(top_k * 2, faiss_index.ntotal)
+    scores, indices = faiss_index.search(query_vec, fetch_k)
+
+    raw_results = []
+    for score, idx in zip(scores[0], indices[0]):
+        if idx < 0:
+            continue
+        if float(score) < _MIN_SCORE:
+            continue
+        meta = metadata[idx].copy()
+        meta["score"] = float(score)
+        raw_results.append(meta)
+
+    # Prioriser les sources CCAM (au moins 5 sur top_k)
+    ccam_results = [r for r in raw_results if r["document"] == "ccam"]
+    other_results = [r for r in raw_results if r["document"] != "ccam"]
+
+    min_ccam = min(5, len(ccam_results))
+    final = ccam_results[:min_ccam]
+    remaining_slots = top_k - len(final)
+    remaining = ccam_results[min_ccam:] + other_results
+    remaining.sort(key=lambda r: r["score"], reverse=True)
+    final.extend(remaining[:remaining_slots])
+
+    return final
+
+
 def _format_contexte(contexte: dict) -> str:
    """Formate le contexte patient de manière structurée pour le prompt."""
    lines = []
@@ -193,31 +244,63 @@ Réponds UNIQUEMENT avec un objet JSON au format suivant, sans aucun texte avant
 }}"""


+def _build_prompt_ccam(texte: str, sources: list[dict], contexte: dict) -> str:
+    """Construit le prompt expert DIM pour le codage CCAM avec raisonnement structuré."""
+    sources_text = ""
+    for i, src in enumerate(sources, 1):
+        doc_name = {
+            "cim10": "CIM-10 FR 2026",
+            "cim10_alpha": "CIM-10 Index Alphabétique 2026",
+            "guide_methodo": "Guide Méthodologique MCO 2026",
+            "ccam": "CCAM PMSI V4 2025",
+        }.get(src["document"], src["document"])
+
+        code_info = f" (code: {src['code']})" if src.get("code") else ""
+        page_info = f" [page {src['page']}]" if src.get("page") else ""
+
+        sources_text += f"--- Source {i}: {doc_name}{code_info}{page_info} ---\n"
+        sources_text += (src.get("extrait", "")[:800]) + "\n\n"
+
+    ctx_str = _format_contexte(contexte)
+
+    return f"""Tu es un médecin DIM (Département d'Information Médicale) expert en codage CCAM PMSI.
+Tu dois coder l'acte chirurgical/médical suivant en respectant STRICTEMENT la nomenclature CCAM.
+
+RÈGLES IMPÉRATIVES :
+- Le code doit provenir UNIQUEMENT des sources CCAM fournies
+- Un code CCAM est composé de 4 lettres + 3 chiffres (ex: HMFC004)
+- Vérifie l'activité (1=acte technique, 4=anesthésie) et le regroupement
+- Tiens compte du tarif secteur 1 pour valider la cohérence
+- Si plusieurs codes sont possibles, choisis le plus spécifique à l'acte décrit
+- En cas de doute, indique confidence "low" plutôt que de proposer un code inadapté
+
+ACTE À CODER : "{texte}"
+
+CONTEXTE CLINIQUE :
+{ctx_str}
+
+SOURCES CCAM :
+{sources_text}
+Réponds UNIQUEMENT avec un objet JSON au format suivant, sans aucun texte avant ou après :
+{{
+  "analyse_acte": "que décrit cet acte sur le plan technique/chirurgical",
+  "codes_candidats": "quels codes CCAM des sources sont compatibles",
+  "discrimination": "pourquoi choisir ce code plutôt qu'un autre (activité, regroupement, tarif)",
+  "code": "ABCD123",
+  "confidence": "high ou medium ou low",
+  "justification": "explication courte en français"
+}}"""
+
+
 def _parse_ollama_response(raw: str) -> dict | None:
-    """Parse la réponse JSON d'Ollama (mode JSON).
-
-    Reconstitue le raisonnement à partir des champs structurés.
-    """
-    # Stripper les blocs markdown ```json ... ``` que certains modèles ajoutent
-    text = raw.strip()
-    if text.startswith("```"):
-        first_nl = text.find("\n")
-        if first_nl != -1:
-            text = text[first_nl + 1:]
-        # Retirer la fence fermante seulement si elle existe en fin de texte
-        if text.rstrip().endswith("```"):
-            text = text.rstrip()[:-3]
-        text = text.strip()
-
-    try:
-        parsed = json.loads(text)
-    except json.JSONDecodeError:
-        logger.warning("Ollama : JSON invalide : %s", raw[:200])
+    """Parse la réponse JSON d'Ollama et reconstitue le raisonnement structuré."""
+    parsed = parse_json_response(raw)
+    if parsed is None:
        return None

    # Reconstituer le raisonnement à partir des champs structurés
    reasoning_parts = []
-    for key in ("analyse_clinique", "codes_candidats", "discrimination", "regle_pmsi"):
+    for key in ("analyse_clinique", "analyse_acte", "codes_candidats", "discrimination", "regle_pmsi"):
        val = parsed.pop(key, None)
        if val:
            titre = key.replace("_", " ").upper()
@@ -229,59 +312,70 @@ def _parse_ollama_response(raw: str) -> dict | None:


 def _call_ollama(prompt: str) -> dict | None:
-    """Appelle Ollama (mode JSON) et parse la réponse. Retry une fois si parsing échoue."""
-    for attempt in range(2):
-        try:
-            response = requests.post(
-                f"{OLLAMA_URL}/api/generate",
-                json={
-                    "model": OLLAMA_MODEL,
-                    "prompt": prompt,
-                    "stream": False,
-                    "format": "json",
-                    "options": {
-                        "temperature": 0.1,
-                        "num_predict": 2500,
-                    },
-                },
-                timeout=OLLAMA_TIMEOUT,
+    """Appelle Ollama (mode JSON) et parse la réponse avec reconstitution du raisonnement."""
+    result = call_ollama(prompt, temperature=0.1, max_tokens=2500)
+    if result is None:
+        return None
+    # Reconstituer le raisonnement structuré
+    reasoning_parts = []
+    for key in ("analyse_clinique", "analyse_acte", "codes_candidats", "discrimination", "regle_pmsi"):
+        val = result.pop(key, None)
+        if val:
+            titre = key.replace("_", " ").upper()
+            reasoning_parts.append(f"{titre} :\n{val}")
+    if reasoning_parts:
+        result["raisonnement"] = "\n\n".join(reasoning_parts)
+    return result
+
+
+def _apply_llm_result_diagnostic(diagnostic: Diagnostic, llm_result: dict) -> None:
+    """Applique un résultat LLM (frais ou caché) à un Diagnostic."""
+    code = llm_result.get("code")
+    confidence = llm_result.get("confidence")
+    justification = llm_result.get("justification")
+    raisonnement = llm_result.get("raisonnement")
+
+    if code:
+        code = normalize_code(code)
+        is_valid, _ = cim10_validate(code)
+        if is_valid:
+            diagnostic.cim10_suggestion = code
+        else:
+            logger.warning(
+                "RAG : code Ollama %s invalide pour « %s », code ignoré",
+                code, diagnostic.texte,
            )
-            response.raise_for_status()
-            raw = response.json().get("response", "")
-            result = _parse_ollama_response(raw)
-            if result is not None:
-                return result
-            if attempt == 0:
-                logger.info("Ollama : retry après échec de parsing")
-        except requests.ConnectionError:
-            logger.warning("Ollama non disponible (connexion refusée)")
-            return None
-        except requests.Timeout:
-            logger.warning("Ollama timeout après %ds", OLLAMA_TIMEOUT)
-            return None
-        except (requests.RequestException, json.JSONDecodeError) as e:
-            logger.warning("Ollama erreur : %s", e)
-            return None
-    return None
+    if confidence in ("high", "medium", "low"):
+        diagnostic.cim10_confidence = confidence
+    if justification:
+        diagnostic.justification = justification
+    if raisonnement:
+        diagnostic.raisonnement = raisonnement


 def enrich_diagnostic(
    diagnostic: Diagnostic,
    contexte: dict,
    est_dp: bool = True,
+    cache: OllamaCache | None = None,
 ) -> None:
    """Enrichit un Diagnostic avec le RAG (FAISS + Ollama).

    Modifie le diagnostic en place. Fallback gracieux si FAISS ou Ollama échouent.
    """
-    # 1. Recherche FAISS
+    diag_type = "dp" if est_dp else "das"
+
+    # 1. Vérifier le cache
+    cached = cache.get(diagnostic.texte, diag_type) if cache else None
+
+    # 2. Recherche FAISS (toujours, pour les sources_rag fraîches)
    sources = search_similar(diagnostic.texte, top_k=10)

    if not sources:
        logger.debug("Aucune source RAG trouvée pour : %s", diagnostic.texte)
        return

-    # 2. Stocker les sources RAG
+    # 3. Stocker les sources RAG
    diagnostic.sources_rag = [
        RAGSource(
            document=s["document"],
@@ -292,30 +386,101 @@ def enrich_diagnostic(
        for s in sources
    ]

-    # 3. Appel Ollama pour justification avec raisonnement structuré
+    # 4. Si cache hit, appliquer et court-circuiter Ollama
+    if cached is not None:
+        logger.info("Cache hit pour %s : « %s »", diag_type.upper(), diagnostic.texte)
+        _apply_llm_result_diagnostic(diagnostic, cached)
+        return
+
+    # 5. Appel Ollama pour justification avec raisonnement structuré
    prompt = _build_prompt(diagnostic.texte, sources, contexte, est_dp=est_dp)
    llm_result = _call_ollama(prompt)

    if llm_result:
-        code = llm_result.get("code")
-        confidence = llm_result.get("confidence")
-        justification = llm_result.get("justification")
-        raisonnement = llm_result.get("raisonnement")
-
-        if code:
-            diagnostic.cim10_suggestion = code
-        if confidence in ("high", "medium", "low"):
-            diagnostic.cim10_confidence = confidence
-        if justification:
-            diagnostic.justification = justification
-        if raisonnement:
-            diagnostic.raisonnement = raisonnement
+        _apply_llm_result_diagnostic(diagnostic, llm_result)
+        if cache:
+            cache.put(diagnostic.texte, diag_type, llm_result)
    else:
        logger.info("Ollama non disponible — sources FAISS conservées sans justification LLM")


+def _apply_llm_result_acte(acte: ActeCCAM, llm_result: dict) -> None:
+    """Applique un résultat LLM (frais ou caché) à un ActeCCAM."""
+    code = llm_result.get("code")
+    confidence = llm_result.get("confidence")
+    justification = llm_result.get("justification")
+    raisonnement = llm_result.get("raisonnement")
+
+    if code:
+        code = code.strip().upper()
+        is_valid, _ = ccam_validate(code)
+        if is_valid:
+            acte.code_ccam_suggestion = code
+        else:
+            logger.warning(
+                "RAG : code CCAM Ollama %s invalide pour « %s », code ignoré",
+                code, acte.texte,
+            )
+    if confidence in ("high", "medium", "low"):
+        acte.ccam_confidence = confidence
+    if justification:
+        acte.justification = justification
+    if raisonnement:
+        acte.raisonnement = raisonnement
+
+
+def enrich_acte(acte: ActeCCAM, contexte: dict, cache: OllamaCache | None = None) -> None:
+    """Enrichit un ActeCCAM avec le RAG (FAISS + Ollama).
+
+    Modifie l'acte en place. Fallback gracieux si FAISS ou Ollama échouent.
+    """
+    # 1. Vérifier le cache
+    cached = cache.get(acte.texte, "ccam") if cache else None
+
+    # 2. Recherche FAISS (sources CCAM priorisées)
+    sources = search_similar_ccam(acte.texte, top_k=8)
+
+    if not sources:
+        logger.debug("Aucune source RAG CCAM trouvée pour : %s", acte.texte)
+        return
+
+    # 3. Stocker les sources RAG
+    acte.sources_rag = [
+        RAGSource(
+            document=s["document"],
+            page=s.get("page"),
+            code=s.get("code"),
+            extrait=s.get("extrait", "")[:200],
+        )
+        for s in sources
+    ]
+
+    # 4. Si cache hit, appliquer et court-circuiter Ollama
+    if cached is not None:
+        logger.info("Cache hit pour CCAM : « %s »", acte.texte)
+        _apply_llm_result_acte(acte, cached)
+        return
+
+    # 5. Appel Ollama pour justification avec raisonnement structuré
+    prompt = _build_prompt_ccam(acte.texte, sources, contexte)
+    llm_result = _call_ollama(prompt)
+
+    if llm_result:
+        _apply_llm_result_acte(acte, llm_result)
+        if cache:
+            cache.put(acte.texte, "ccam", llm_result)
+    else:
+        logger.info("Ollama non disponible — sources FAISS CCAM conservées sans justification LLM")
+
+
 def enrich_dossier(dossier: DossierMedical) -> None:
-    """Enrichit le DP et tous les DAS d'un dossier via le RAG."""
+    """Enrichit le DP et tous les DAS d'un dossier via le RAG.
+
+    Utilise un cache persistant et parallélise les appels Ollama
+    pour les DAS et actes CCAM (max_workers = OLLAMA_MAX_PARALLEL).
+    """
+    cache = OllamaCache(OLLAMA_CACHE_PATH, OLLAMA_MODEL)
+
    contexte = {
        "sexe": dossier.sejour.sexe,
        "age": dossier.sejour.age,
@@ -327,11 +492,12 @@ def enrich_dossier(dossier: DossierMedical) -> None:
        "complications": dossier.complications,
    }

+    # Phase 1 : DP seul (le contexte DAS en dépend)
    if dossier.diagnostic_principal:
        logger.info("RAG enrichissement DP : %s", dossier.diagnostic_principal.texte)
-        enrich_diagnostic(dossier.diagnostic_principal, contexte, est_dp=True)
+        enrich_diagnostic(dossier.diagnostic_principal, contexte, est_dp=True, cache=cache)

-    # Pour les DAS, ajouter le DP et les DAS existants au contexte pour cohérence
+    # Mettre à jour le contexte avec le DP pour les DAS
    if dossier.diagnostic_principal:
        contexte["dp_texte"] = dossier.diagnostic_principal.texte
    contexte["das_codes_existants"] = [
@@ -340,6 +506,20 @@ def enrich_dossier(dossier: DossierMedical) -> None:
        if d.cim10_suggestion
    ]

-    for das in dossier.diagnostics_associes:
-        logger.info("RAG enrichissement DAS : %s", das.texte)
-        enrich_diagnostic(das, contexte, est_dp=False)
+    # Phase 2 : DAS + Actes en parallèle
+    das_list = dossier.diagnostics_associes
+    actes_list = dossier.actes_ccam
+
+    if das_list or actes_list:
+        with ThreadPoolExecutor(max_workers=OLLAMA_MAX_PARALLEL) as executor:
+            futures = []
+            for das in das_list:
+                logger.info("RAG enrichissement DAS : %s", das.texte)
+                futures.append(executor.submit(enrich_diagnostic, das, contexte, False, cache))
+            for acte in actes_list:
+                logger.info("RAG enrichissement CCAM : %s", acte.texte)
+                futures.append(executor.submit(enrich_acte, acte, contexte, cache))
+            for f in as_completed(futures):
+                f.result()  # propage les exceptions
+
+    cache.save()
--- a/src/medical/severity.py
+++ b/src/medical/severity.py
@@ -158,7 +158,7 @@ def evaluate_severity(diagnostic) -> SeverityInfo:
    return info


-def enrich_dossier_severity(dp, das_list: list) -> list[str]:
+def enrich_dossier_severity(dp, das_list: list) -> tuple[list[str], int, int]:
    """Enrichit les diagnostics d'un dossier avec les informations de sévérité.

    Modifie les diagnostics en place (attributs est_cma, est_cms, niveau_severite).
@@ -168,7 +168,7 @@ def enrich_dossier_severity(dp, das_list: list) -> list[str]:
        das_list: Liste des diagnostics associés.

    Returns:
-        Liste d'alertes de sévérité générées.
+        (alertes, cma_count, cms_count).
    """
    alertes = []

@@ -181,6 +181,7 @@ def enrich_dossier_severity(dp, das_list: list) -> list[str]:

    # Évaluer chaque DAS
    cma_count = 0
+    cms_count = 0
    for das in das_list:
        if not das.cim10_suggestion:
            continue
@@ -189,6 +190,10 @@ def enrich_dossier_severity(dp, das_list: list) -> list[str]:
        if info.est_cma_probable:
            das.est_cma = True
            cma_count += 1
+            # CMS = CMA sévère
+            if info.niveau_severite == "severe":
+                das.est_cms = True
+                cms_count += 1
            alertes.append(
                f"CMA probable : '{das.texte}' ({das.cim10_suggestion}) — "
                f"sévérité {info.niveau_severite}"
@@ -198,4 +203,4 @@ def enrich_dossier_severity(dp, das_list: list) -> list[str]:
    if cma_count >= 2:
        alertes.insert(0, f"{cma_count} CMA probables détectées — impact potentiel sur le niveau de sévérité GHM")

-    return alertes
+    return alertes, cma_count, cms_count
--- a/src/viewer/templates/detail.html
+++ b/src/viewer/templates/detail.html
@@ -69,6 +69,125 @@
 </div>
 {% endif %}

+{# ---- Estimation GHM ---- #}
+{% if dossier.ghm_estimation %}
+{% set ghm = dossier.ghm_estimation %}
+<div class="card section" style="border-left:4px solid #8b5cf6;">
+  <h3 style="color:#6d28d9;">Estimation GHM</h3>
+  <div class="info-grid">
+    {% if ghm.cmd %}
+    <div class="info-item">
+      <label>CMD</label>
+      <span><strong>{{ ghm.cmd }}</strong>{% if ghm.cmd_libelle %} — {{ ghm.cmd_libelle }}{% endif %}</span>
+    </div>
+    {% endif %}
+    <div class="info-item">
+      <label>Type</label>
+      {% if ghm.type_ghm == 'C' %}
+        <span class="badge" style="background:#fee2e2;color:#dc2626;">C — Chirurgical</span>
+      {% elif ghm.type_ghm == 'K' %}
+        <span class="badge" style="background:#fef3c7;color:#92400e;">K — Interventionnel</span>
+      {% elif ghm.type_ghm == 'M' %}
+        <span class="badge" style="background:#dbeafe;color:#1d4ed8;">M — Médical</span>
+      {% endif %}
+    </div>
+    <div class="info-item">
+      <label>Sévérité</label>
+      {% if ghm.severite <= 1 %}
+        <span class="badge" style="background:#d1fae5;color:#065f46;">Niveau {{ ghm.severite }}</span>
+      {% elif ghm.severite == 2 %}
+        <span class="badge" style="background:#fef3c7;color:#92400e;">Niveau {{ ghm.severite }}</span>
+      {% elif ghm.severite == 3 %}
+        <span class="badge" style="background:#fed7aa;color:#9a3412;">Niveau {{ ghm.severite }}</span>
+      {% else %}
+        <span class="badge" style="background:#fee2e2;color:#dc2626;">Niveau {{ ghm.severite }}</span>
+      {% endif %}
+    </div>
+    {% if ghm.ghm_approx %}
+    <div class="info-item">
+      <label>Code GHM approx.</label>
+      <code style="font-size:1.1rem;font-weight:700;letter-spacing:0.05em;">{{ ghm.ghm_approx }}</code>
+    </div>
+    {% endif %}
+    <div class="info-item">
+      <label>CMA / CMS</label>
+      <span>{{ ghm.cma_count }} CMA, {{ ghm.cms_count }} CMS</span>
+    </div>
+  </div>
+  {% if ghm.alertes %}
+  <div style="margin-top:0.75rem;">
+    {% for alerte in ghm.alertes %}
+      <div style="font-size:0.8rem;color:#c2410c;margin-bottom:0.2rem;">{{ alerte }}</div>
+    {% endfor %}
+  </div>
+  {% endif %}
+  <div style="margin-top:0.75rem;font-size:0.7rem;color:#94a3b8;font-style:italic;">
+    Estimation heuristique — le GHM définitif nécessite le groupeur officiel ATIH
+  </div>
+</div>
+{% endif %}
+
+{# ---- Contrôle CPAM ---- #}
+{% if dossier.controles_cpam %}
+<div class="card section" style="border-left:4px solid #f59e0b;">
+  <h3 style="color:#b45309;">Contrôle CPAM ({{ dossier.controles_cpam|length }})</h3>
+  {% for ctrl in dossier.controles_cpam %}
+  <div style="margin-bottom:1.5rem;{% if not loop.last %}border-bottom:1px solid #e2e8f0;padding-bottom:1rem;{% endif %}">
+    <div style="display:flex;align-items:center;gap:0.5rem;margin-bottom:0.5rem;">
+      <strong>OGC {{ ctrl.numero_ogc }} — {{ ctrl.titre }}</strong>
+      {% if 'retient' in ctrl.decision_ucr|lower %}
+        <span class="badge" style="background:#d1fae5;color:#065f46;">{{ ctrl.decision_ucr }}</span>
+      {% elif 'confirme' in ctrl.decision_ucr|lower %}
+        <span class="badge" style="background:#fee2e2;color:#dc2626;">{{ ctrl.decision_ucr }}</span>
+      {% else %}
+        <span class="badge" style="background:#e0e7ff;color:#3730a3;">{{ ctrl.decision_ucr }}</span>
+      {% endif %}
+    </div>
+
+    {# Argument CPAM #}
+    {% if ctrl.arg_ucr %}
+    <div style="border-left:3px solid #f59e0b;padding:0.5rem 0.75rem;background:#fffbeb;margin-bottom:0.75rem;font-size:0.85rem;color:#78350f;">
+      <div style="font-size:0.7rem;color:#92400e;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Argument CPAM</div>
+      {{ ctrl.arg_ucr }}
+    </div>
+    {% endif %}
+
+    {# Codes contestés #}
+    {% if ctrl.dp_ucr or ctrl.da_ucr or ctrl.dr_ucr or ctrl.actes_ucr %}
+    <div style="margin-bottom:0.75rem;">
+      <div style="font-size:0.7rem;color:#64748b;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Codes contestés</div>
+      <div style="display:flex;gap:0.5rem;flex-wrap:wrap;">
+        {% if ctrl.dp_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">DP: {{ ctrl.dp_ucr }}</span>{% endif %}
+        {% if ctrl.da_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">DA: {{ ctrl.da_ucr }}</span>{% endif %}
+        {% if ctrl.dr_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">DR: {{ ctrl.dr_ucr }}</span>{% endif %}
+        {% if ctrl.actes_ucr %}<span class="badge" style="background:#fef3c7;color:#92400e;">Actes: {{ ctrl.actes_ucr }}</span>{% endif %}
+      </div>
+    </div>
+    {% endif %}
+
+    {# Contre-argumentation #}
+    {% if ctrl.contre_argumentation %}
+    <div style="border-left:3px solid #3b82f6;padding:0.5rem 0.75rem;background:#eff6ff;margin-bottom:0.75rem;font-size:0.85rem;color:#1e3a5f;">
+      <div style="font-size:0.7rem;color:#1d4ed8;text-transform:uppercase;font-weight:600;margin-bottom:0.25rem;">Contre-argumentation</div>
+      <pre style="white-space:pre-wrap;font-family:inherit;margin:0;">{{ ctrl.contre_argumentation }}</pre>
+    </div>
+    {% endif %}
+
+    {# Sources RAG #}
+    {% if ctrl.sources_reponse %}
+    <details>
+      <summary style="font-size:0.8rem;color:#64748b;">Sources RAG ({{ ctrl.sources_reponse|length }})</summary>
+      {% for src in ctrl.sources_reponse %}
+      <pre style="font-size:0.75rem;">{{ src.document }}{% if src.code %} — {{ src.code }}{% endif %}{% if src.page %} [p.{{ src.page }}]{% endif %}
+{{ src.extrait or '' }}</pre>
+      {% endfor %}
+    </details>
+    {% endif %}
+  </div>
+  {% endfor %}
+</div>
+{% endif %}
+
 {# ---- Alertes de codage ---- #}
 {% if dossier.alertes_codage %}
 <div class="card section" style="border-left:4px solid #f97316;background:#fff7ed;">