chore(bench): résultats V2 et rapports de benchmarking

Snapshot des 18 JSONs produits par le pipeline V2 (Qwen2.5-VL-3B +
checkboxes densité + validation ATIH), utiles au collaborateur comme
référence de ce que la chaîne actuelle produit.

Rapports :
- bench_v2_report.md       : comparaison V2 vs legacy docTR+VLM
                             (couverture, divergences, régressions
                             notables sur codage_reco et praticien).
- validation_report.md     : résumé de la validation ATIH sur les 18
                             JSONs (131/149 → 140/149 codes valides
                             après fix suffixes `*` et `+N`, 0
                             incohérence GHM↔GHS, 8 suggestions de
                             correction OCR).

Script de comparaison :
- bench_v11_vs_legacy.py   : tableau d'accord champ par champ entre
                             un run du pipeline (output/v2/) et les
                             JSONs legacy (output/).

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
Dom
2026-04-24 15:06:30 +02:00
parent 1f75670770
commit b6dd9ff1df
21 changed files with 9524 additions and 0 deletions

551
output/v2/OGC 86.json Normal file
View File

@@ -0,0 +1,551 @@
{
"fichier": "OGC 86",
"pdf_hash": "ff2bb027e50bd9f6",
"pages": [
{
"page": 1,
"type": "recueil",
"header": "Here's the transcription of the image:\n\nFICHE MEDICALE DE RECUEIL DU PRATICIEN CONSEIL (une fiche par RUM)\n(à transmettre au médecin du DIM avant consultation)\n\nSeul le recodage impactant la facturation est renseigné\n\nEtablissement : CLINIQUE D'ARCACHON\nFINESS : 330780206\nDate début contrôle : 13/02/2018\n\nN° champ : 1 Libellé champ de contrôle : Champ 1 : séjours ayant des caractéristiques communes\nséjours de niveau 2, 3 et 4 mono RUM\nN° OGC : 86\n\nDossier manquant : 0\nDates du séjour : 14/04/2016 au 29/04/2016",
"elapsed_s": 7.18,
"ocr_raw": "```json\n{\n \"etablissement\": \"CLINIQUE D'ARCACHON\",\n \"finess\": \"330780206\",\n \"date_debut_controle\": \"13/02/2018\",\n \"n_ogc\": \"86\",\n \"n_champ\": \"1\",\n \"dates_sejour\": \"14/04/2016 au 20/04/2016\",\n \"sejour_etab\": {\n \"age\": \"75\", \"sexe\": \"1\", \"duree_sejour\": \"\",\n \"mode_entree\": \"1\", \"provenance\": \"\", \"mode_sortie\": \"9\", \"destination\": \"\"\n },\n \"sejour_reco\": {\n \"age\": \"75\", \"sexe\": \"1\", \"duree_sejour\": \"\",\n \"mode_entree\": \"1\", \"provenance\": \"\", \"mode_sortie\": \"9\", \"destination\": \"\"\n },\n \"rum_etab\": {\"um\": \"\", \"igs\": \"\", \"duree\": \"\", \"dates\": \"\"},\n \"codage_etab\": {\n \"dp\": \"C349\", \"dp_libelle\": \"T.M. DE BRONCHE OU DU POUMON, SAI\", \"dr\": \"\",\n \"das\": []\n },\n \"codage_reco\": {\n \"dp\": \"\", \"dr\": \"\", \"das\": []\n },\n \"actes_etab\": [], \"actes_reco\": [],\n \"ghm_etab\": \"04M093\", \"ghs_etab\": \"1163\",\n \"ghm_reco\": \"04M092\", \"ghs_reco\": \"1162\",\n \"recodage_impactant\": \"1\",\n \"ghs_injustifie\": \"0 SE 1 2 3 4 ATU FFM FSD\",\n \"praticien_conseil\": \"DR VIGNAU\"\n}\n```",
"parsed": {
"etablissement": "CLINIQUE D'ARCACHON",
"finess": "330780206",
"date_debut_controle": "13/02/2018",
"n_ogc": "86",
"n_champ": "1",
"dates_sejour": "14/04/2016 au 20/04/2016",
"sejour_etab": {
"age": "75",
"sexe": "1",
"duree_sejour": "",
"mode_entree": "1",
"provenance": "",
"mode_sortie": "9",
"destination": ""
},
"sejour_reco": {
"age": "75",
"sexe": "1",
"duree_sejour": "",
"mode_entree": "1",
"provenance": "",
"mode_sortie": "9",
"destination": ""
},
"rum_etab": {
"um": "",
"igs": "",
"duree": "",
"dates": ""
},
"codage_etab": {
"dp": "C349",
"dp_libelle": "T.M. DE BRONCHE OU DU POUMON, SAI",
"dr": "",
"das": []
},
"codage_reco": {
"dp": "",
"dr": "",
"das": []
},
"actes_etab": [],
"actes_reco": [],
"ghm_etab": "04M093",
"ghs_etab": "1163",
"ghm_reco": "04M092",
"ghs_reco": "1162",
"recodage_impactant": "1",
"ghs_injustifie": "0 SE 1 2 3 4 ATU FFM FSD",
"praticien_conseil": "DR VIGNAU",
"accord_desaccord": "désaccord",
"_checkbox_debug": {
"decision": "désaccord",
"ratio_accord": 0.0,
"ratio_desaccord": 0.443,
"diff": -0.443
}
}
},
{
"page": 2,
"type": "concertation_med",
"header": "",
"elapsed_s": 0.0
},
{
"page": 3,
"type": "hospitalisation",
"header": "",
"elapsed_s": 0.0
},
{
"page": 4,
"type": "preuves",
"header": "",
"elapsed_s": 14.21,
"ocr_raw": "```json\n{\n \"date\": \"28/12/14\",\n \"praticien_controleur\": [\"Dr RADZIKOWSKI\", \"Dr DELAYE-PHULPIN\", \"Dr TURBAN\", \"Dr DUVAL\", \"Dr VIGNAU\", \"Dr PROMAX\"],\n \"medecin_dim\": \"Dr ETTORCHI-TARDY\",\n \"pieces\": [\n {\n \"intitule\": \"Compte-rendu d'acte\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Compte-rendu opératoire\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Compte-rendu d'accouchement\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Compte-rendu d'examen complémentaire\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Compte-rendu d'imagerie\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Compte-rendu d'anatomopathologie\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Observations médicales\",\n \"present\": true,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Dossier de transfusion\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Dossier d'anesthésie\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Administration thérapeutique\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Compte-rendu d'hospitalisation\",\n \"present\": true,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Lettre de sortie\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Eléments de surveillance du dossier infirmier\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Prise en charge psychologue\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Prise en charge kinésithérapeute\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Prise en charge diététique\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Autre\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n }\n ]\n}\n```",
"parsed": {
"date": "28/12/14",
"praticien_controleur": [
"Dr RADZIKOWSKI",
"Dr DELAYE-PHULPIN",
"Dr TURBAN",
"Dr DUVAL",
"Dr VIGNAU",
"Dr PROMAX"
],
"medecin_dim": "Dr ETTORCHI-TARDY",
"pieces": [
{
"intitule": "Compte-rendu d'acte",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Compte-rendu opératoire",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Compte-rendu d'accouchement",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Compte-rendu d'examen complémentaire",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Compte-rendu d'imagerie",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Compte-rendu d'anatomopathologie",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Observations médicales",
"present": true,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Dossier de transfusion",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Dossier d'anesthésie",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Administration thérapeutique",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Compte-rendu d'hospitalisation",
"present": true,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Lettre de sortie",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Eléments de surveillance du dossier infirmier",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Prise en charge psychologue",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Prise en charge kinésithérapeute",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Prise en charge diététique",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Autre",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
}
]
}
},
{
"page": 5,
"type": "concertation_2",
"header": "",
"elapsed_s": 2.05,
"ocr_raw": "```json\n{\n \"ghs_initial\": \"1163\",\n \"ghs_avant_concertation\": \"1162\",\n \"ghs_final\": \"A-162\",\n \"decision\": \"\",\n \"date_concertation\": \"2.3.18\",\n \"praticien_controleur\": \"DR VIGNAU\",\n \"medecin_dim\": \"DR ETTORCHI-TARDY\"\n}\n```",
"parsed": {
"ghs_initial": "1163",
"ghs_avant_concertation": "1162",
"ghs_final": "A-162",
"decision": "",
"date_concertation": "2.3.18",
"praticien_controleur": "DR VIGNAU",
"medecin_dim": "DR ETTORCHI-TARDY"
}
},
{
"page": 6,
"type": "concertation_1",
"header": "",
"elapsed_s": 5.7,
"ocr_raw": "```json\n{\n \"date_concertation\": \"2.3\",\n \"argumentaire\": \"105 : La facturation du GHS par l'établissement n'est pas conforme à l'article 1 de l'arrêté du 19 février 2015 modifié du fait d'un non-respect des règles de codage édictées dans l'annexe II de l'arrêté du 21 décembre 2015 modifiant l'arrêté du 22 février 2008. Le non-respect des règles porte sur un diagnostic associé significatif (DAS) codé par l'établissement dans le résumé d'unité médicale (RUM). Ce DAS n'est pas conforme aux règles de codage des diagnostics rappelées par l'annexe II, chapitre IV, paragraphe 2.1 : « Lorsqu'un patient atteint d'une maladie chronique ou de longue durée est naturellement un DAS, à moins qu'elle n'ait pas bénéficié d'une surveillance et que son traitement ait été interrompu pendant le séjour. (...) Les informations attestant de la majoration de l'effort de soins devant figurer dans le dossier médical. » Au vu des éléments du dossier du patient, la maladie chronique ou de longue durée codée en DAS par l'établissement n'a bénéficié d'aucune prise en charge diagnostique ou thérapeutique, ni majoré l'effort de prise en charge d'une autre affection.\"\n}\n```",
"parsed": {
"date_concertation": "2.3",
"argumentaire": "105 : La facturation du GHS par l'établissement n'est pas conforme à l'article 1 de l'arrêté du 19 février 2015 modifié du fait d'un non-respect des règles de codage édictées dans l'annexe II de l'arrêté du 21 décembre 2015 modifiant l'arrêté du 22 février 2008. Le non-respect des règles porte sur un diagnostic associé significatif (DAS) codé par l'établissement dans le résumé d'unité médicale (RUM). Ce DAS n'est pas conforme aux règles de codage des diagnostics rappelées par l'annexe II, chapitre IV, paragraphe 2.1 : « Lorsqu'un patient atteint d'une maladie chronique ou de longue durée est naturellement un DAS, à moins qu'elle n'ait pas bénéficié d'une surveillance et que son traitement ait été interrompu pendant le séjour. (...) Les informations attestant de la majoration de l'effort de soins devant figurer dans le dossier médical. » Au vu des éléments du dossier du patient, la maladie chronique ou de longue durée codée en DAS par l'établissement n'a bénéficié d'aucune prise en charge diagnostique ou thérapeutique, ni majoré l'effort de prise en charge d'une autre affection."
}
}
],
"extraction": {
"recueil": {
"etablissement": "CLINIQUE D'ARCACHON",
"finess": "330780206",
"date_debut_controle": "13/02/2018",
"n_ogc": "86",
"n_champ": "1",
"dates_sejour": "14/04/2016 au 20/04/2016",
"sejour_etab": {
"age": "75",
"sexe": "1",
"duree_sejour": "",
"mode_entree": "1",
"provenance": "",
"mode_sortie": "9",
"destination": ""
},
"sejour_reco": {
"age": "75",
"sexe": "1",
"duree_sejour": "",
"mode_entree": "1",
"provenance": "",
"mode_sortie": "9",
"destination": ""
},
"rum_etab": {
"um": "",
"igs": "",
"duree": "",
"dates": ""
},
"codage_etab": {
"dp": "C349",
"dp_libelle": "T.M. DE BRONCHE OU DU POUMON, SAI",
"dr": "",
"das": []
},
"codage_reco": {
"dp": "",
"dr": "",
"das": []
},
"actes_etab": [],
"actes_reco": [],
"ghm_etab": "04M093",
"ghs_etab": "1163",
"ghm_reco": "04M092",
"ghs_reco": "1162",
"recodage_impactant": "1",
"ghs_injustifie": "0 SE 1 2 3 4 ATU FFM FSD",
"praticien_conseil": "DR VIGNAU",
"accord_desaccord": "désaccord",
"_checkbox_debug": {
"decision": "désaccord",
"ratio_accord": 0.0,
"ratio_desaccord": 0.443,
"diff": -0.443
},
"_validation": {
"codage_etab": {
"dp": {
"code": "C349",
"valid": true,
"libelle_ref": "Bronche ou poumon, sans précision"
},
"dr": {
"code": "",
"valid": null
},
"das": []
},
"codage_reco": {
"dp": {
"code": "",
"valid": null
},
"dr": {
"code": "",
"valid": null
},
"das": []
},
"actes_etab": [],
"actes_reco": [],
"ghm_etab": {
"code": "04M093",
"valid": true,
"ghs_possibles": [
"1163"
]
},
"ghs_etab": {
"code": "1163",
"valid": true
},
"ghm_reco": {
"code": "04M092",
"valid": true,
"ghs_possibles": [
"1162"
]
},
"ghs_reco": {
"code": "1162",
"valid": true
},
"cross_checks": {
"etab": {
"checked": true,
"coherent": true,
"ghs_extrait": "1163",
"ghs_possibles": [
"1163"
]
},
"reco": {
"checked": true,
"coherent": true,
"ghs_extrait": "1162",
"ghs_possibles": [
"1162"
]
}
},
"summary": {
"valid": 5,
"invalid": 0,
"empty": 3,
"total_codes": 5,
"ghm_ghs_incoherents": 0
}
}
},
"preuves": {
"date": "28/12/14",
"praticien_controleur": [
"Dr RADZIKOWSKI",
"Dr DELAYE-PHULPIN",
"Dr TURBAN",
"Dr DUVAL",
"Dr VIGNAU",
"Dr PROMAX"
],
"medecin_dim": "Dr ETTORCHI-TARDY",
"pieces": [
{
"intitule": "Compte-rendu d'acte",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Compte-rendu opératoire",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Compte-rendu d'accouchement",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Compte-rendu d'examen complémentaire",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Compte-rendu d'imagerie",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Compte-rendu d'anatomopathologie",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Observations médicales",
"present": true,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Dossier de transfusion",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Dossier d'anesthésie",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Administration thérapeutique",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Compte-rendu d'hospitalisation",
"present": true,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Lettre de sortie",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Eléments de surveillance du dossier infirmier",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Prise en charge psychologue",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Prise en charge kinésithérapeute",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Prise en charge diététique",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Autre",
"present": false,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
}
]
},
"concertation_2": {
"ghs_initial": "1163",
"ghs_avant_concertation": "1162",
"ghs_final": "A-162",
"decision": "",
"date_concertation": "2.3.18",
"praticien_controleur": "DR VIGNAU",
"medecin_dim": "DR ETTORCHI-TARDY",
"_validation": {
"ghs_initial": {
"code": "1163",
"valid": true
},
"ghs_avant_concertation": {
"code": "1162",
"valid": true
},
"ghs_final": {
"code": "A-162",
"valid": false
}
}
},
"concertation_1": {
"date_concertation": "2.3",
"argumentaire": "105 : La facturation du GHS par l'établissement n'est pas conforme à l'article 1 de l'arrêté du 19 février 2015 modifié du fait d'un non-respect des règles de codage édictées dans l'annexe II de l'arrêté du 21 décembre 2015 modifiant l'arrêté du 22 février 2008. Le non-respect des règles porte sur un diagnostic associé significatif (DAS) codé par l'établissement dans le résumé d'unité médicale (RUM). Ce DAS n'est pas conforme aux règles de codage des diagnostics rappelées par l'annexe II, chapitre IV, paragraphe 2.1 : « Lorsqu'un patient atteint d'une maladie chronique ou de longue durée est naturellement un DAS, à moins qu'elle n'ait pas bénéficié d'une surveillance et que son traitement ait été interrompu pendant le séjour. (...) Les informations attestant de la majoration de l'effort de soins devant figurer dans le dossier médical. » Au vu des éléments du dossier du patient, la maladie chronique ou de longue durée codée en DAS par l'établissement n'a bénéficié d'aucune prise en charge diagnostique ou thérapeutique, ni majoré l'effort de prise en charge d'une autre affection."
}
},
"_meta": {
"pipeline_version": "v1",
"ocr_model": "zai-org/GLM-OCR",
"generated_at": "2026-04-24T12:18:12+00:00"
}
}