chore(bench): résultats V2 et rapports de benchmarking
Snapshot des 18 JSONs produits par le pipeline V2 (Qwen2.5-VL-3B +
checkboxes densité + validation ATIH), utiles au collaborateur comme
référence de ce que la chaîne actuelle produit.
Rapports :
- bench_v2_report.md : comparaison V2 vs legacy docTR+VLM
(couverture, divergences, régressions
notables sur codage_reco et praticien).
- validation_report.md : résumé de la validation ATIH sur les 18
JSONs (131/149 → 140/149 codes valides
après fix suffixes `*` et `+N`, 0
incohérence GHM↔GHS, 8 suggestions de
correction OCR).
Script de comparaison :
- bench_v11_vs_legacy.py : tableau d'accord champ par champ entre
un run du pipeline (output/v2/) et les
JSONs legacy (output/).
Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
297
output/v2/OGC 29.json
Normal file
297
output/v2/OGC 29.json
Normal file
@@ -0,0 +1,297 @@
|
||||
{
|
||||
"fichier": "OGC 29",
|
||||
"pdf_hash": "0347fc1e23968220",
|
||||
"pages": [
|
||||
{
|
||||
"page": 1,
|
||||
"type": "recueil",
|
||||
"header": "Here is the transcription of the text in the image:\n\nFICHE MEDICALE DE RECUEIL DU PRATICIEN CONSEIL (une fiche par RUM)\n\n(à transmettre au médecin du DIM avant concertation)\n\nSeul le recodage impactant la facturation est renseigné\n\nEtablissement : CLINIQUE D'ARCACHON\nFINESS : 330780206\nDate début contrôle : 13/02/2018\n\nN° champ : 1\nLibellé champ de contrôle : Champ 1 : séjours ayant des caractéristiques communes\nséjours de niveau 2, 3 et 4 mono RUM\nN° OGC : 29\n\nDossier : non existant\nDates du séjour : 14/02/2015 au 17/02/2015",
|
||||
"elapsed_s": 6.96,
|
||||
"ocr_raw": "```json\n{\n \"etablissement\": \"CLINIQUE D'ARCACHON\",\n \"finess\": \"330780206\",\n \"date_debut_controle\": \"13/02/2018\",\n \"n_ogc\": \"29\",\n \"n_champ\": \"1\",\n \"dates_sejour\": \"14/03/2016 au 17/03/2016\",\n \"sejour_etab\": {\n \"age\": \"82\", \"sexe\": \"1\", \"duree_sejour\": \"3\"\n },\n \"sejour_reco\": {\n \"age\": \"82\", \"sexe\": \"1\", \"duree_sejour\": \"3\"\n },\n \"rum_etab\": {\n \"um\": \"UM\", \"igs\": \"IGS II\", \"duree\": \"3\", \"dates\": \"du 14/03/2016 au 17/03/2016\"\n },\n \"codage_etab\": {\n \"dp\": \"K635+0\", \"dp_libelle\": \"POLYPOSE HYPERPLASIQUE\", \"dr\": \"D509\"\n },\n \"codage_reco\": {\n \"dp\": \"\", \"dr\": \"E46\", \"das\": []\n },\n \"actes_etab\": [], \"actes_reco\": [],\n \"ghm_etab\": \"06M092\", \"ghs_etab\": \"2159\",\n \"ghm_reco\": \"16M112\", \"ghs_reco\": \"6183\",\n \"recodage_impactant\": \"1\",\n \"ghs_injustifie\": \"0\",\n \"praticien_conseil\": \"DR VIGNAU\"\n}\n```",
|
||||
"parsed": {
|
||||
"etablissement": "CLINIQUE D'ARCACHON",
|
||||
"finess": "330780206",
|
||||
"date_debut_controle": "13/02/2018",
|
||||
"n_ogc": "29",
|
||||
"n_champ": "1",
|
||||
"dates_sejour": "14/03/2016 au 17/03/2016",
|
||||
"sejour_etab": {
|
||||
"age": "82",
|
||||
"sexe": "1",
|
||||
"duree_sejour": "3"
|
||||
},
|
||||
"sejour_reco": {
|
||||
"age": "82",
|
||||
"sexe": "1",
|
||||
"duree_sejour": "3"
|
||||
},
|
||||
"rum_etab": {
|
||||
"um": "UM",
|
||||
"igs": "IGS II",
|
||||
"duree": "3",
|
||||
"dates": "du 14/03/2016 au 17/03/2016"
|
||||
},
|
||||
"codage_etab": {
|
||||
"dp": "K635+0",
|
||||
"dp_libelle": "POLYPOSE HYPERPLASIQUE",
|
||||
"dr": "D509"
|
||||
},
|
||||
"codage_reco": {
|
||||
"dp": "",
|
||||
"dr": "E46",
|
||||
"das": []
|
||||
},
|
||||
"actes_etab": [],
|
||||
"actes_reco": [],
|
||||
"ghm_etab": "06M092",
|
||||
"ghs_etab": "2159",
|
||||
"ghm_reco": "16M112",
|
||||
"ghs_reco": "6183",
|
||||
"recodage_impactant": "1",
|
||||
"ghs_injustifie": "0",
|
||||
"praticien_conseil": "DR VIGNAU",
|
||||
"accord_desaccord": "accord",
|
||||
"_checkbox_debug": {
|
||||
"decision": "accord",
|
||||
"ratio_accord": 0.3467,
|
||||
"ratio_desaccord": 0.0341,
|
||||
"diff": 0.3126
|
||||
}
|
||||
}
|
||||
},
|
||||
{
|
||||
"page": 2,
|
||||
"type": "concertation_med",
|
||||
"header": "",
|
||||
"elapsed_s": 0.0
|
||||
},
|
||||
{
|
||||
"page": 3,
|
||||
"type": "hospitalisation",
|
||||
"header": "",
|
||||
"elapsed_s": 0.0
|
||||
},
|
||||
{
|
||||
"page": 4,
|
||||
"type": "preuves",
|
||||
"header": "",
|
||||
"elapsed_s": 1.91,
|
||||
"ocr_raw": "```json\n{\n \"date\": \"\",\n \"praticien_controleur\": true,\n \"medecin_dim\": true,\n \"pieces\": [\n {\n \"intitule\": \"Séjour d'hospitalisation complète\",\n \"present\": false,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n }\n ]\n}\n```",
|
||||
"parsed": {
|
||||
"date": "",
|
||||
"praticien_controleur": true,
|
||||
"medecin_dim": true,
|
||||
"pieces": [
|
||||
{
|
||||
"intitule": "Séjour d'hospitalisation complète",
|
||||
"present": false,
|
||||
"photocopie": false,
|
||||
"absent_date": "",
|
||||
"date_obtention": ""
|
||||
}
|
||||
]
|
||||
}
|
||||
},
|
||||
{
|
||||
"page": 5,
|
||||
"type": "concertation_2",
|
||||
"header": "",
|
||||
"elapsed_s": 2.17,
|
||||
"ocr_raw": "```json\n{\n \"ghs_initial\": \"2159\",\n \"ghs_avant_concertation\": \"6183\",\n \"ghs_final\": \"6183\",\n \"decision\": \"\",\n \"date_concertation\": \"1.3.18\",\n \"praticien_controleur\": \"DR VIGNAU\",\n \"medecin_dim\": \"DR ETTORCHI-TARDY\"\n}\n```",
|
||||
"parsed": {
|
||||
"ghs_initial": "2159",
|
||||
"ghs_avant_concertation": "6183",
|
||||
"ghs_final": "6183",
|
||||
"decision": "",
|
||||
"date_concertation": "1.3.18",
|
||||
"praticien_controleur": "DR VIGNAU",
|
||||
"medecin_dim": "DR ETTORCHI-TARDY"
|
||||
}
|
||||
},
|
||||
{
|
||||
"page": 6,
|
||||
"type": "concertation_1",
|
||||
"header": "",
|
||||
"elapsed_s": 5.56,
|
||||
"ocr_raw": "```json\n{\n \"date_concertation\": \"1.3.18\",\n \"argumentaire\": \"109 : La facturation du GHs par l'établissement n'est pas conforme à l'article 1 de l'arrêté du 19 février 2015 modifié du fait d'un non-respect des règles de codage édictées dans l'annexe II de l'arrêté du 21 décembre 2015 modifiant l'arrêté du 22 février 2008. Le non-respect des règles porte sur le diagnostic principal (DP) codé par l'établissement dans le résumé d'unité médicale (RUM). Le DP n'est pas conforme aux règles de codage des diagnostics rappelées par l'annexe II, chapitre V, paragraphe 1 : « les diagnostics doivent figurer dans le RUM sous forme codée selon la plus récente mise à jour de la 10e révision de la Classification internationale des maladies (CIM-10) de l'Organisation mondiale de la santé et selon les extensions nationales données dans la plus récente version du Manuel des groupes homogènes de malades. (...) Le meilleur code est le plus précis par rapport à l'information à coder. » Au vu des éléments présents dans le dossier du patient, le code CIM-10 choisi pour le DP par l'établissement n'est pas le plus précis par rapport à l'information à coder.\"\n}\n```",
|
||||
"parsed": {
|
||||
"date_concertation": "1.3.18",
|
||||
"argumentaire": "109 : La facturation du GHs par l'établissement n'est pas conforme à l'article 1 de l'arrêté du 19 février 2015 modifié du fait d'un non-respect des règles de codage édictées dans l'annexe II de l'arrêté du 21 décembre 2015 modifiant l'arrêté du 22 février 2008. Le non-respect des règles porte sur le diagnostic principal (DP) codé par l'établissement dans le résumé d'unité médicale (RUM). Le DP n'est pas conforme aux règles de codage des diagnostics rappelées par l'annexe II, chapitre V, paragraphe 1 : « les diagnostics doivent figurer dans le RUM sous forme codée selon la plus récente mise à jour de la 10e révision de la Classification internationale des maladies (CIM-10) de l'Organisation mondiale de la santé et selon les extensions nationales données dans la plus récente version du Manuel des groupes homogènes de malades. (...) Le meilleur code est le plus précis par rapport à l'information à coder. » Au vu des éléments présents dans le dossier du patient, le code CIM-10 choisi pour le DP par l'établissement n'est pas le plus précis par rapport à l'information à coder."
|
||||
}
|
||||
}
|
||||
],
|
||||
"extraction": {
|
||||
"recueil": {
|
||||
"etablissement": "CLINIQUE D'ARCACHON",
|
||||
"finess": "330780206",
|
||||
"date_debut_controle": "13/02/2018",
|
||||
"n_ogc": "29",
|
||||
"n_champ": "1",
|
||||
"dates_sejour": "14/03/2016 au 17/03/2016",
|
||||
"sejour_etab": {
|
||||
"age": "82",
|
||||
"sexe": "1",
|
||||
"duree_sejour": "3"
|
||||
},
|
||||
"sejour_reco": {
|
||||
"age": "82",
|
||||
"sexe": "1",
|
||||
"duree_sejour": "3"
|
||||
},
|
||||
"rum_etab": {
|
||||
"um": "UM",
|
||||
"igs": "IGS II",
|
||||
"duree": "3",
|
||||
"dates": "du 14/03/2016 au 17/03/2016"
|
||||
},
|
||||
"codage_etab": {
|
||||
"dp": "K635+0",
|
||||
"dp_libelle": "POLYPOSE HYPERPLASIQUE",
|
||||
"dr": "D509"
|
||||
},
|
||||
"codage_reco": {
|
||||
"dp": "",
|
||||
"dr": "E46",
|
||||
"das": []
|
||||
},
|
||||
"actes_etab": [],
|
||||
"actes_reco": [],
|
||||
"ghm_etab": "06M092",
|
||||
"ghs_etab": "2159",
|
||||
"ghm_reco": "16M112",
|
||||
"ghs_reco": "6183",
|
||||
"recodage_impactant": "1",
|
||||
"ghs_injustifie": "0",
|
||||
"praticien_conseil": "DR VIGNAU",
|
||||
"accord_desaccord": "accord",
|
||||
"_checkbox_debug": {
|
||||
"decision": "accord",
|
||||
"ratio_accord": 0.3467,
|
||||
"ratio_desaccord": 0.0341,
|
||||
"diff": 0.3126
|
||||
},
|
||||
"_validation": {
|
||||
"codage_etab": {
|
||||
"dp": {
|
||||
"code": "K635+0",
|
||||
"valid": true,
|
||||
"libelle_ref": "Polype du côlon"
|
||||
},
|
||||
"dr": {
|
||||
"code": "D509",
|
||||
"valid": true,
|
||||
"libelle_ref": "Anémie par carence en fer, sans précision"
|
||||
},
|
||||
"das": []
|
||||
},
|
||||
"codage_reco": {
|
||||
"dp": {
|
||||
"code": "",
|
||||
"valid": null
|
||||
},
|
||||
"dr": {
|
||||
"code": "E46",
|
||||
"valid": true,
|
||||
"libelle_ref": "Malnutrition protéinoénergétique, sans précision"
|
||||
},
|
||||
"das": []
|
||||
},
|
||||
"actes_etab": [],
|
||||
"actes_reco": [],
|
||||
"ghm_etab": {
|
||||
"code": "06M092",
|
||||
"valid": true,
|
||||
"ghs_possibles": [
|
||||
"2159"
|
||||
]
|
||||
},
|
||||
"ghs_etab": {
|
||||
"code": "2159",
|
||||
"valid": true
|
||||
},
|
||||
"ghm_reco": {
|
||||
"code": "16M112",
|
||||
"valid": true,
|
||||
"ghs_possibles": [
|
||||
"6183"
|
||||
]
|
||||
},
|
||||
"ghs_reco": {
|
||||
"code": "6183",
|
||||
"valid": true
|
||||
},
|
||||
"cross_checks": {
|
||||
"etab": {
|
||||
"checked": true,
|
||||
"coherent": true,
|
||||
"ghs_extrait": "2159",
|
||||
"ghs_possibles": [
|
||||
"2159"
|
||||
]
|
||||
},
|
||||
"reco": {
|
||||
"checked": true,
|
||||
"coherent": true,
|
||||
"ghs_extrait": "6183",
|
||||
"ghs_possibles": [
|
||||
"6183"
|
||||
]
|
||||
}
|
||||
},
|
||||
"summary": {
|
||||
"valid": 7,
|
||||
"invalid": 0,
|
||||
"empty": 1,
|
||||
"total_codes": 7,
|
||||
"ghm_ghs_incoherents": 0
|
||||
}
|
||||
}
|
||||
},
|
||||
"preuves": {
|
||||
"date": "",
|
||||
"praticien_controleur": true,
|
||||
"medecin_dim": true,
|
||||
"pieces": [
|
||||
{
|
||||
"intitule": "Séjour d'hospitalisation complète",
|
||||
"present": false,
|
||||
"photocopie": false,
|
||||
"absent_date": "",
|
||||
"date_obtention": ""
|
||||
}
|
||||
]
|
||||
},
|
||||
"concertation_2": {
|
||||
"ghs_initial": "2159",
|
||||
"ghs_avant_concertation": "6183",
|
||||
"ghs_final": "6183",
|
||||
"decision": "",
|
||||
"date_concertation": "1.3.18",
|
||||
"praticien_controleur": "DR VIGNAU",
|
||||
"medecin_dim": "DR ETTORCHI-TARDY",
|
||||
"_validation": {
|
||||
"ghs_initial": {
|
||||
"code": "2159",
|
||||
"valid": true
|
||||
},
|
||||
"ghs_avant_concertation": {
|
||||
"code": "6183",
|
||||
"valid": true
|
||||
},
|
||||
"ghs_final": {
|
||||
"code": "6183",
|
||||
"valid": true
|
||||
}
|
||||
}
|
||||
},
|
||||
"concertation_1": {
|
||||
"date_concertation": "1.3.18",
|
||||
"argumentaire": "109 : La facturation du GHs par l'établissement n'est pas conforme à l'article 1 de l'arrêté du 19 février 2015 modifié du fait d'un non-respect des règles de codage édictées dans l'annexe II de l'arrêté du 21 décembre 2015 modifiant l'arrêté du 22 février 2008. Le non-respect des règles porte sur le diagnostic principal (DP) codé par l'établissement dans le résumé d'unité médicale (RUM). Le DP n'est pas conforme aux règles de codage des diagnostics rappelées par l'annexe II, chapitre V, paragraphe 1 : « les diagnostics doivent figurer dans le RUM sous forme codée selon la plus récente mise à jour de la 10e révision de la Classification internationale des maladies (CIM-10) de l'Organisation mondiale de la santé et selon les extensions nationales données dans la plus récente version du Manuel des groupes homogènes de malades. (...) Le meilleur code est le plus précis par rapport à l'information à coder. » Au vu des éléments présents dans le dossier du patient, le code CIM-10 choisi pour le DP par l'établissement n'est pas le plus précis par rapport à l'information à coder."
|
||||
}
|
||||
},
|
||||
"_meta": {
|
||||
"pipeline_version": "v1",
|
||||
"ocr_model": "zai-org/GLM-OCR",
|
||||
"generated_at": "2026-04-24T12:12:07+00:00"
|
||||
}
|
||||
}
|
||||
Reference in New Issue
Block a user