feat: méthode TIM experte CPAM + moteur de règles étendu
CPAM — Méthode TIM (mémoire en défense) : - Réécriture CPAM_ARGUMENTATION avec raisonnement 5 passes TIM (contexte admin → motif réel → confrontation bio → hiérarchie → validation défensive) - _BIO_THRESHOLDS (19 entrées) + _build_bio_confrontation() pour confrontation biologie/diagnostic avec seuils chiffrés et verdicts - _format_response() dual format : nouveau TIM (moyens numérotés, tableau bio, codes non défendables, conclusion dispositive) + rétrocompat legacy - CPAM_ADVERSARIAL mis à jour pour vérifier honnêteté intellectuelle - Tests adaptés + 12 nouveaux tests (bio confrontation, format TIM) Moteur de règles : - Nouvelles règles YAML : demographic, diagnostic_conflicts, procedure_diagnosis, temporal, parcours - Bio extraction FAISS (synonymes vectoriels) - Veto engine enrichi (citations, Trackare skip, règles démographiques) - Decision engine : _apply_bio_rules_gen() + matchers analytiques Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
@@ -33,7 +33,11 @@ def _fuzzy_match_ref(ref: str, tag_map: dict[str, str]) -> str | None:
|
||||
|
||||
|
||||
def _validate_grounding(response_data: dict, tag_map: dict[str, str]) -> list[str]:
|
||||
"""Vérifie que les références dans preuves_dossier correspondent à des tags existants.
|
||||
"""Vérifie que les références dans preuves correspondent à des tags existants.
|
||||
|
||||
Supporte les deux formats :
|
||||
- Ancien : response_data["preuves_dossier"][].ref
|
||||
- Nouveau TIM : response_data["moyens_defense"][].preuves[].ref
|
||||
|
||||
Applique un fuzzy matching par code CIM-10 avant de flaguer un warning.
|
||||
|
||||
@@ -44,24 +48,40 @@ def _validate_grounding(response_data: dict, tag_map: dict[str, str]) -> list[st
|
||||
return []
|
||||
|
||||
warnings: list[str] = []
|
||||
preuves = response_data.get("preuves_dossier")
|
||||
if not preuves or not isinstance(preuves, list):
|
||||
return warnings
|
||||
|
||||
for p in preuves:
|
||||
if not isinstance(p, dict):
|
||||
continue
|
||||
ref = p.get("ref", "")
|
||||
def _check_ref(ref: str, context: str) -> None:
|
||||
if not ref:
|
||||
continue
|
||||
if ref not in tag_map:
|
||||
matched_tag = _fuzzy_match_ref(ref, tag_map)
|
||||
if matched_tag:
|
||||
logger.info("Grounding : ref [%s] résolue vers [%s]", ref, matched_tag)
|
||||
continue # pas de warning
|
||||
valeur = p.get("valeur", "?")
|
||||
warnings.append(f"Preuve [{ref}] non traçable (« {valeur} »)")
|
||||
logger.warning("Grounding : preuve [%s] introuvable dans les tags du dossier", ref)
|
||||
return
|
||||
# Nettoyer les crochets si présents (nouveau format utilise "[BIO-1]")
|
||||
clean_ref = ref.strip("[]")
|
||||
if clean_ref in tag_map or ref in tag_map:
|
||||
return
|
||||
matched_tag = _fuzzy_match_ref(clean_ref, tag_map)
|
||||
if matched_tag:
|
||||
logger.info("Grounding : ref [%s] résolue vers [%s]", ref, matched_tag)
|
||||
return
|
||||
warnings.append(f"Preuve [{ref}] non traçable (« {context} »)")
|
||||
logger.warning("Grounding : preuve [%s] introuvable dans les tags du dossier", ref)
|
||||
|
||||
# Ancien format : preuves_dossier
|
||||
preuves = response_data.get("preuves_dossier")
|
||||
if preuves and isinstance(preuves, list):
|
||||
for p in preuves:
|
||||
if isinstance(p, dict):
|
||||
_check_ref(p.get("ref", ""), p.get("valeur", "?"))
|
||||
|
||||
# Nouveau format TIM : moyens_defense[].preuves
|
||||
moyens = response_data.get("moyens_defense")
|
||||
if moyens and isinstance(moyens, list):
|
||||
for moyen in moyens:
|
||||
if not isinstance(moyen, dict):
|
||||
continue
|
||||
moyen_preuves = moyen.get("preuves")
|
||||
if not moyen_preuves or not isinstance(moyen_preuves, list):
|
||||
continue
|
||||
for p in moyen_preuves:
|
||||
if isinstance(p, dict):
|
||||
_check_ref(p.get("ref", ""), p.get("fait", "?"))
|
||||
|
||||
return warnings
|
||||
|
||||
@@ -111,12 +131,19 @@ def _validate_references(parsed: dict, sources: list[dict]) -> list[str]:
|
||||
_CIM10_CODE_RE = re.compile(r"\b([A-Z]\d{2}\.?\d{0,2})\b")
|
||||
|
||||
# Champs textuels de la réponse LLM à scanner pour les codes CIM-10
|
||||
# Supporte les deux formats : ancien (contre_arguments_*) et nouveau (moyens_defense TIM)
|
||||
_TEXT_FIELDS = (
|
||||
# Ancien format
|
||||
"analyse_contestation",
|
||||
"contre_arguments_medicaux",
|
||||
"contre_arguments_asymetrie",
|
||||
"contre_arguments_reglementaires",
|
||||
"conclusion",
|
||||
# Nouveau format TIM
|
||||
"rappel_faits",
|
||||
"asymetrie_information",
|
||||
"reponse_points_cpam",
|
||||
"conclusion_dispositive",
|
||||
)
|
||||
|
||||
|
||||
@@ -220,7 +247,7 @@ def _sanitize_unauthorized_codes(
|
||||
if new_val != val:
|
||||
parsed[key] = new_val
|
||||
|
||||
# Sanitiser aussi les preuves_dossier.valeur
|
||||
# Sanitiser aussi les preuves_dossier.valeur (ancien format)
|
||||
preuves = parsed.get("preuves_dossier")
|
||||
if preuves and isinstance(preuves, list):
|
||||
for p in preuves:
|
||||
@@ -240,6 +267,27 @@ def _sanitize_unauthorized_codes(
|
||||
if new_v != v:
|
||||
p["valeur"] = new_v
|
||||
|
||||
# Sanitiser les moyens_defense[].argument (nouveau format TIM)
|
||||
moyens = parsed.get("moyens_defense")
|
||||
if moyens and isinstance(moyens, list):
|
||||
for moyen in moyens:
|
||||
if not isinstance(moyen, dict):
|
||||
continue
|
||||
for field_key in ("argument", "titre"):
|
||||
val = moyen.get(field_key, "")
|
||||
if not val or not isinstance(val, str):
|
||||
continue
|
||||
new_val = val
|
||||
for pattern in _SANITIZE_PATTERNS:
|
||||
new_val = pattern.sub(
|
||||
lambda m, _p=pattern: _replace_code(m),
|
||||
new_val,
|
||||
)
|
||||
new_val = re.sub(r"\(\s*\)", "", new_val)
|
||||
new_val = re.sub(r" +", " ", new_val).strip()
|
||||
if new_val != val:
|
||||
moyen[field_key] = new_val
|
||||
|
||||
if removed:
|
||||
for code in removed:
|
||||
norm = normalize_code(code)
|
||||
@@ -275,7 +323,7 @@ def _validate_codes_in_response(
|
||||
if val and isinstance(val, str):
|
||||
text_fields.append(val)
|
||||
|
||||
# Preuves du dossier — valeurs
|
||||
# Preuves du dossier — valeurs (ancien format)
|
||||
preuves = parsed.get("preuves_dossier")
|
||||
if preuves and isinstance(preuves, list):
|
||||
for p in preuves:
|
||||
@@ -284,6 +332,16 @@ def _validate_codes_in_response(
|
||||
if v and isinstance(v, str):
|
||||
text_fields.append(v)
|
||||
|
||||
# Moyens de défense (nouveau format TIM)
|
||||
moyens = parsed.get("moyens_defense")
|
||||
if moyens and isinstance(moyens, list):
|
||||
for moyen in moyens:
|
||||
if isinstance(moyen, dict):
|
||||
for mkey in ("argument", "titre"):
|
||||
v = moyen.get(mkey, "")
|
||||
if v and isinstance(v, str):
|
||||
text_fields.append(v)
|
||||
|
||||
combined_text = "\n".join(text_fields)
|
||||
found_codes = _CIM10_CODE_RE.findall(combined_text)
|
||||
|
||||
@@ -330,6 +388,18 @@ def _validate_adversarial(
|
||||
"""
|
||||
import json as _json
|
||||
|
||||
# LOGIC-3 — Vérifier si les modèles CPAM et validation sont identiques
|
||||
from ..config import check_adversarial_model_config
|
||||
|
||||
same_model, model_msg = check_adversarial_model_config()
|
||||
if same_model:
|
||||
logger.warning("LOGIC-3: %s", model_msg)
|
||||
return {
|
||||
"coherent": True,
|
||||
"erreurs": [f"Validation adversariale dégradée : {model_msg}"],
|
||||
"score_confiance": 0,
|
||||
}
|
||||
|
||||
# Construire le résumé des éléments factuels disponibles
|
||||
if tag_map:
|
||||
factual_lines = "\n".join(f" [{tag}] {content}" for tag, content in tag_map.items())
|
||||
@@ -341,8 +411,8 @@ def _validate_adversarial(
|
||||
try:
|
||||
response_json = _json.dumps(response_data, ensure_ascii=False, indent=None)
|
||||
# Tronquer si trop long pour le prompt de validation
|
||||
if len(response_json) > 3000:
|
||||
response_json = response_json[:3000] + "..."
|
||||
if len(response_json) > 10000:
|
||||
response_json = response_json[:10000] + "..."
|
||||
except (TypeError, ValueError):
|
||||
logger.warning("Validation adversariale : impossible de sérialiser la réponse")
|
||||
return None
|
||||
@@ -365,9 +435,9 @@ def _validate_adversarial(
|
||||
)
|
||||
|
||||
logger.debug(" Validation adversariale")
|
||||
result = call_ollama(prompt, temperature=0.0, max_tokens=3000, role="validation")
|
||||
result = call_ollama(prompt, temperature=0.0, max_tokens=6000, role="validation")
|
||||
if result is None:
|
||||
result = call_anthropic(prompt, temperature=0.0, max_tokens=3000)
|
||||
result = call_anthropic(prompt, temperature=0.0, max_tokens=6000)
|
||||
if result is None:
|
||||
logger.warning(" Validation adversariale échouée — LLM indisponible")
|
||||
return None
|
||||
@@ -407,14 +477,20 @@ def _build_correction_prompt(
|
||||
erreurs = adversarial_result.get("erreurs", [])
|
||||
erreurs_text = "\n".join(f" {i}. {e}" for i, e in enumerate(erreurs, 1))
|
||||
|
||||
# Résumé compact de la réponse problématique
|
||||
# Résumé compact de la réponse problématique (supporte les deux formats)
|
||||
summary_fields = {}
|
||||
# Ancien format
|
||||
for key in ("analyse_contestation", "contre_arguments_medicaux",
|
||||
"contre_arguments_asymetrie", "contre_arguments_reglementaires",
|
||||
"conclusion"):
|
||||
val = original_response.get(key)
|
||||
if val and isinstance(val, str):
|
||||
# Tronquer chaque champ à 400 chars
|
||||
summary_fields[key] = val[:400] + ("..." if len(val) > 400 else "")
|
||||
# Nouveau format TIM
|
||||
for key in ("rappel_faits", "asymetrie_information", "reponse_points_cpam",
|
||||
"conclusion_dispositive"):
|
||||
val = original_response.get(key)
|
||||
if val and isinstance(val, str):
|
||||
summary_fields[key] = val[:400] + ("..." if len(val) > 400 else "")
|
||||
|
||||
try:
|
||||
@@ -522,13 +598,182 @@ def _assess_quality_tier(
|
||||
return tier, requires_review, categorized
|
||||
|
||||
|
||||
def _is_new_tim_format(parsed: dict) -> bool:
|
||||
"""Détecte si la réponse LLM utilise le nouveau format TIM (moyens_defense)."""
|
||||
return "moyens_defense" in parsed
|
||||
|
||||
|
||||
def _format_response(
|
||||
parsed: dict,
|
||||
ref_warnings: list[str] | None = None,
|
||||
quality_tier: str | None = None,
|
||||
categorized_warnings: list[str] | None = None,
|
||||
) -> str:
|
||||
"""Formate la réponse LLM en texte lisible."""
|
||||
"""Formate la réponse LLM en texte lisible.
|
||||
|
||||
Supporte deux formats via duck-typing :
|
||||
- Nouveau TIM : moyens_defense, confrontation_bio, conclusion_dispositive
|
||||
- Ancien : contre_arguments_medicaux, points_accord, conclusion
|
||||
"""
|
||||
if _is_new_tim_format(parsed):
|
||||
return _format_response_tim(parsed, ref_warnings, quality_tier, categorized_warnings)
|
||||
return _format_response_legacy(parsed, ref_warnings, quality_tier, categorized_warnings)
|
||||
|
||||
|
||||
def _format_response_tim(
|
||||
parsed: dict,
|
||||
ref_warnings: list[str] | None = None,
|
||||
quality_tier: str | None = None,
|
||||
categorized_warnings: list[str] | None = None,
|
||||
) -> str:
|
||||
"""Formate la réponse LLM au format mémoire en défense TIM."""
|
||||
sections: list[str] = []
|
||||
sep = "───────────────────────────────────────────────────────"
|
||||
sep_heavy = "═══════════════════════════════════════════════════════"
|
||||
|
||||
# En-tête
|
||||
objet = parsed.get("objet", "Mémoire en défense")
|
||||
sections.append(f"{sep_heavy}\nMÉMOIRE EN DÉFENSE — {objet}\n{sep_heavy}")
|
||||
|
||||
# Bandeau qualité si tier C
|
||||
if quality_tier == "C":
|
||||
sections.append("⚠ REVUE MANUELLE REQUISE (Qualité : C)")
|
||||
|
||||
# Rappel des faits
|
||||
rappel = parsed.get("rappel_faits")
|
||||
if rappel:
|
||||
sections.append(f"RAPPEL DES FAITS\n{rappel}")
|
||||
|
||||
sections.append(sep)
|
||||
|
||||
# Moyens de défense numérotés
|
||||
moyens = parsed.get("moyens_defense")
|
||||
if moyens and isinstance(moyens, list):
|
||||
for moyen in moyens:
|
||||
if not isinstance(moyen, dict):
|
||||
continue
|
||||
num = moyen.get("numero", "?")
|
||||
titre = moyen.get("titre", "")
|
||||
argument = moyen.get("argument", "")
|
||||
|
||||
moyen_lines = [f"MOYEN N°{num} — {titre}"]
|
||||
if argument:
|
||||
moyen_lines.append(argument)
|
||||
|
||||
# Preuves intégrées dans chaque moyen
|
||||
moyen_preuves = moyen.get("preuves")
|
||||
if moyen_preuves and isinstance(moyen_preuves, list):
|
||||
for p in moyen_preuves:
|
||||
if isinstance(p, dict):
|
||||
ref = p.get("ref", "")
|
||||
fait = p.get("fait", "")
|
||||
signif = p.get("signification", "")
|
||||
moyen_lines.append(f" Preuve : {ref} {fait} → {signif}")
|
||||
|
||||
# Source réglementaire du moyen
|
||||
src_regl = moyen.get("source_reglementaire")
|
||||
if src_regl and src_regl != "null":
|
||||
moyen_lines.append(f" Source : {src_regl}")
|
||||
|
||||
sections.append("\n".join(moyen_lines))
|
||||
|
||||
sections.append(sep)
|
||||
|
||||
# Confrontation biologie / diagnostic (tableau)
|
||||
confrontation = parsed.get("confrontation_bio")
|
||||
if confrontation and isinstance(confrontation, list):
|
||||
table_lines = ["CONFRONTATION BIOLOGIE / DIAGNOSTIC"]
|
||||
table_lines.append(
|
||||
"┌─────────────────┬─────────────┬──────────────┬───────────┬───────────────┐"
|
||||
)
|
||||
table_lines.append(
|
||||
"│ Diagnostic │ Test requis │ Seuil │ Valeur │ Verdict │"
|
||||
)
|
||||
table_lines.append(
|
||||
"├─────────────────┼─────────────┼──────────────┼───────────┼───────────────┤"
|
||||
)
|
||||
for row in confrontation:
|
||||
if not isinstance(row, dict):
|
||||
continue
|
||||
diag = str(row.get("diagnostic", ""))[:17].ljust(17)
|
||||
test = str(row.get("test", ""))[:13].ljust(13)
|
||||
seuil = str(row.get("seuil", ""))[:14].ljust(14)
|
||||
valeur = str(row.get("valeur", ""))[:11].ljust(11)
|
||||
verdict = str(row.get("verdict", ""))[:15].ljust(15)
|
||||
table_lines.append(f"│ {diag}│ {test}│ {seuil}│ {valeur}│ {verdict}│")
|
||||
table_lines.append(
|
||||
"└─────────────────┴─────────────┴──────────────┴───────────┴───────────────┘"
|
||||
)
|
||||
sections.append("\n".join(table_lines))
|
||||
|
||||
sections.append(sep)
|
||||
|
||||
# Codes non défendables (honnêteté intellectuelle)
|
||||
codes_nd = parsed.get("codes_non_defendables")
|
||||
if codes_nd and isinstance(codes_nd, list) and len(codes_nd) > 0:
|
||||
nd_lines = ["⚠ CODES NON DÉFENDABLES (honnêteté intellectuelle)"]
|
||||
for nd in codes_nd:
|
||||
if isinstance(nd, dict):
|
||||
code = nd.get("code", "?")
|
||||
raison = nd.get("raison", "")
|
||||
reco = nd.get("recommandation", "")
|
||||
nd_lines.append(f"- {code} : {raison}")
|
||||
if reco:
|
||||
nd_lines.append(f" → {reco}")
|
||||
sections.append("\n".join(nd_lines))
|
||||
sections.append(sep)
|
||||
|
||||
# Asymétrie d'information
|
||||
asymetrie = parsed.get("asymetrie_information")
|
||||
if asymetrie:
|
||||
sections.append(f"ASYMÉTRIE D'INFORMATION\n{asymetrie}")
|
||||
sections.append(sep)
|
||||
|
||||
# Réponse aux points CPAM
|
||||
reponse_cpam = parsed.get("reponse_points_cpam")
|
||||
if reponse_cpam:
|
||||
sections.append(f"RÉPONSE AUX POINTS DE LA CPAM\n{reponse_cpam}")
|
||||
sections.append(sep)
|
||||
|
||||
# Références réglementaires
|
||||
refs = parsed.get("references")
|
||||
if refs:
|
||||
if isinstance(refs, list):
|
||||
ref_lines = ["RÉFÉRENCES RÉGLEMENTAIRES"]
|
||||
for r in refs:
|
||||
if isinstance(r, dict):
|
||||
doc = r.get("document", "")
|
||||
page = r.get("page", "")
|
||||
citation = r.get("citation", "")
|
||||
ref_lines.append(f"- [{doc}, p.{page}] {citation}")
|
||||
else:
|
||||
ref_lines.append(f"- {r}")
|
||||
sections.append("\n".join(ref_lines))
|
||||
else:
|
||||
sections.append(f"RÉFÉRENCES RÉGLEMENTAIRES\n{refs}")
|
||||
|
||||
sections.append(sep_heavy)
|
||||
|
||||
# Conclusion dispositive
|
||||
conclusion = parsed.get("conclusion_dispositive")
|
||||
if conclusion:
|
||||
sections.append(f"CONCLUSION\n{conclusion}")
|
||||
|
||||
sections.append(sep_heavy)
|
||||
|
||||
# Avertissements
|
||||
sections.extend(_format_warnings(categorized_warnings, ref_warnings))
|
||||
|
||||
return "\n\n".join(sections)
|
||||
|
||||
|
||||
def _format_response_legacy(
|
||||
parsed: dict,
|
||||
ref_warnings: list[str] | None = None,
|
||||
quality_tier: str | None = None,
|
||||
categorized_warnings: list[str] | None = None,
|
||||
) -> str:
|
||||
"""Formate la réponse LLM au format hérité (rétro-compatibilité cache)."""
|
||||
sections = []
|
||||
|
||||
# Bandeau qualité si tier C
|
||||
@@ -543,12 +788,12 @@ def _format_response(
|
||||
if accord and accord.lower() not in ("aucun", "non applicable", "n/a", ""):
|
||||
sections.append(f"POINTS D'ACCORD\n{accord}")
|
||||
|
||||
# Nouveaux champs structurés par axe
|
||||
# Champs structurés par axe
|
||||
contre_med = parsed.get("contre_arguments_medicaux")
|
||||
if contre_med:
|
||||
sections.append(f"CONTRE-ARGUMENTS MÉDICAUX\n{contre_med}")
|
||||
|
||||
# Preuves du dossier (nouveau champ structuré)
|
||||
# Preuves du dossier
|
||||
preuves = parsed.get("preuves_dossier")
|
||||
if preuves and isinstance(preuves, list):
|
||||
preuves_lines = []
|
||||
@@ -577,7 +822,7 @@ def _format_response(
|
||||
if contre:
|
||||
sections.append(f"CONTRE-ARGUMENTS\n{contre}")
|
||||
|
||||
# Références structurées (nouveau format liste) ou ancien format string
|
||||
# Références structurées ou ancien format string
|
||||
refs = parsed.get("references")
|
||||
if refs:
|
||||
if isinstance(refs, list):
|
||||
@@ -599,7 +844,18 @@ def _format_response(
|
||||
if conclusion:
|
||||
sections.append(f"CONCLUSION\n{conclusion}")
|
||||
|
||||
# Avertissements catégorisés (nouveau format)
|
||||
# Avertissements
|
||||
sections.extend(_format_warnings(categorized_warnings, ref_warnings))
|
||||
|
||||
return "\n\n".join(sections)
|
||||
|
||||
|
||||
def _format_warnings(
|
||||
categorized_warnings: list[str] | None = None,
|
||||
ref_warnings: list[str] | None = None,
|
||||
) -> list[str]:
|
||||
"""Formate les avertissements qualité (partagé entre les deux formats)."""
|
||||
sections: list[str] = []
|
||||
if categorized_warnings:
|
||||
critiques = [w for w in categorized_warnings if w.startswith("[CRITIQUE]")]
|
||||
mineurs = [w for w in categorized_warnings if w.startswith("[MINEUR]")]
|
||||
@@ -612,8 +868,6 @@ def _format_response(
|
||||
"AVERTISSEMENTS MINEURS\n" + "\n".join(f"- {w}" for w in mineurs)
|
||||
)
|
||||
elif ref_warnings:
|
||||
# Fallback ancien format
|
||||
warning_text = "\n".join(f"- {w}" for w in ref_warnings)
|
||||
sections.append(f"AVERTISSEMENT — REFERENCES NON VÉRIFIÉES\n{warning_text}")
|
||||
|
||||
return "\n\n".join(sections)
|
||||
return sections
|
||||
|
||||
Reference in New Issue
Block a user