Files
Aivanov_scan_ogc/output/v2/OGC 20.json
Dom 7d45018139 feat(extract): normaliser ghs_injustifie en 0/1 (P2)
Qwen renvoie typiquement le libellé complet `0 SE 1 2 3 4 ATU FFM FSD`
dans le champ ghs_injustifie alors qu'une seule valeur 0/1 est attendue.
Ajout de `pipeline.checkboxes.parse_ghs_injustifie` qui extrait le
premier chiffre 0/1 via regex, ou "" si illisible.

Post-traitement appliqué à chaque extraction recueil et aux 18 JSONs
V2 existants (10 fichiers corrigés en place — les 8 autres avaient
déjà ghs_injustifie absent ou vide).

Note sur les 7 cases SE1-4/ATU/FFM/FSD : zones trop petites pour être
calibrées à l'œil et aucun cas positif (`ghs_injustifie=1`) dans
l'échantillon 2018 pour valider visuellement. La détection est en
placeholder, à recalibrer sur un cas positif réel.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-04-24 15:54:16 +02:00

380 lines
13 KiB
JSON

{
"fichier": "OGC 20",
"pdf_hash": "eb280d07819ff75d",
"pages": [
{
"page": 1,
"type": "recueil",
"header": "Here is the transcription of the text in the image:\n\nFICHE MEDICALE DE RECUEIL DU PRATICIEN CONSEIL (une fiche par RUM)\n(à transmettre au médecin du DIM avant concertation)\nSeul le recodage impactant la facturation est renseigné\n\nEtablissement : CLINIQUE D'ARCACHON\nFINESS : 330780206\nDate début contrôle : 13/02/2018\n\nN° champ : 1 Libellé champ de contrôle : Champ 1 : séjours ayant des caractéristiques communes séjours de niveau 2, 3 et 4 mono RUM\nN° OGC : 20",
"elapsed_s": 8.99,
"ocr_raw": "```json\n{\n \"etablissement\": \"CLINIQUE D'ARCACHON\",\n \"finess\": \"330780206\",\n \"date_debut_controle\": \"13/02/2018\",\n \"n_ogc\": \"20\",\n \"n_champ\": \"1\",\n \"dates_sejour\": \"09/03/2016 au 18/03/2016\",\n \"sejour_etab\": {\n \"age\": \"57\", \"sexe\": \"1\", \"duree_sejour\": \"9\",\n \"mode_entree\": \"8\", \"provenance\": \"8\",\n \"mode_sortie\": \"8\", \"destination\": \"\"\n },\n \"sejour_reco\": {\n \"age\": \"57\", \"sexe\": \"1\", \"duree_sejour\": \"9\",\n \"mode_entree\": \"8\", \"provenance\": \"8\",\n \"mode_sortie\": \"8\", \"destination\": \"\"\n },\n \"rum_etab\": {\"um\": \"0\", \"igs\": \"53 C\", \"duree\": \"9\", \"dates\": \"du 09/03/2016 au 18/03/2016\"},\n \"codage_etab\": {\n \"dp\": \"D374\", \"dr\": \"I022\", \"das\": [\n {\"code\": \"T814\", \"position\": \"3\", \"libelle\": \"INFECT. APRES UN ACTE, NCA\"}\n ]\n },\n \"codage_reco\": {\n \"dp\": \"D374\", \"dr\": \"I022\", \"das\": [\n {\"code\": \"T814\", \"position\": \"3\", \"libelle\": \"INFECT. APRES UN ACTE, NCA\"}\n ]\n },\n \"actes_etab\": [], \"actes_reco\": [],\n \"ghm_etab\": \"06C043\", \"ghs_etab\": \"1941\",\n \"ghm_reco\": \"06C042\", \"ghs_reco\": \"1940\",\n \"recodage_impactant\": \"1\",\n \"ghs_injustifie\": \"0 SE 1 2 3 4 ATU FFM FSD\",\n \"praticien_conseil\": \"DR VIGNAÚ\"\n}\n```",
"parsed": {
"etablissement": "CLINIQUE D'ARCACHON",
"finess": "330780206",
"date_debut_controle": "13/02/2018",
"n_ogc": "20",
"n_champ": "1",
"dates_sejour": "09/03/2016 au 18/03/2016",
"sejour_etab": {
"age": "57",
"sexe": "1",
"duree_sejour": "9",
"mode_entree": "8",
"provenance": "8",
"mode_sortie": "8",
"destination": ""
},
"sejour_reco": {
"age": "57",
"sexe": "1",
"duree_sejour": "9",
"mode_entree": "8",
"provenance": "8",
"mode_sortie": "8",
"destination": ""
},
"rum_etab": {
"um": "0",
"igs": "53 C",
"duree": "9",
"dates": "du 09/03/2016 au 18/03/2016"
},
"codage_etab": {
"dp": "D374",
"dr": "I022",
"das": [
{
"code": "T814",
"position": "3",
"libelle": "INFECT. APRES UN ACTE, NCA"
}
]
},
"codage_reco": {
"dp": "D374",
"dr": "I022",
"das": [
{
"code": "T814",
"position": "3",
"libelle": "INFECT. APRES UN ACTE, NCA"
}
]
},
"actes_etab": [],
"actes_reco": [],
"ghm_etab": "06C043",
"ghs_etab": "1941",
"ghm_reco": "06C042",
"ghs_reco": "1940",
"recodage_impactant": "1",
"ghs_injustifie": "0 SE 1 2 3 4 ATU FFM FSD",
"praticien_conseil": "DR VIGNAÚ",
"accord_desaccord": "désaccord",
"_checkbox_debug": {
"decision": "désaccord",
"ratio_accord": 0.1185,
"ratio_desaccord": 0.1659,
"diff": -0.0474
}
}
},
{
"page": 2,
"type": "concertation_med",
"header": "",
"elapsed_s": 0.0
},
{
"page": 3,
"type": "hospitalisation",
"header": "",
"elapsed_s": 0.0
},
{
"page": 4,
"type": "preuves",
"header": "",
"elapsed_s": 4.6,
"ocr_raw": "```json\n{\n \"date\": \"\",\n \"praticien_controleur\": \"\",\n \"medecin_dim\": \"\",\n \"pieces\": [\n {\n \"intitule\": \"Patient de 57 ans, puis en charge pour une colo-rectalgie et l'anapath. Confirme le Kc du colon.\",\n \"present\": true,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"En post-op, présence d'un escoulement au niveau du bas de la muqueuse ; retrait d'un aquafili et luchage.\",\n \"present\": true,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n },\n {\n \"intitule\": \"Il n'a pas d'abcès : une déficatga. Des JAS en T81.8. Pas de moton. Disphagie restaurée, pas de prétendu ad. de l'escoulement.\",\n \"present\": true,\n \"photocopie\": false,\n \"absent_date\": \"\",\n \"date_obtention\": \"\"\n }\n ]\n}\n```",
"parsed": {
"date": "",
"praticien_controleur": "",
"medecin_dim": "",
"pieces": [
{
"intitule": "Patient de 57 ans, puis en charge pour une colo-rectalgie et l'anapath. Confirme le Kc du colon.",
"present": true,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "En post-op, présence d'un escoulement au niveau du bas de la muqueuse ; retrait d'un aquafili et luchage.",
"present": true,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Il n'a pas d'abcès : une déficatga. Des JAS en T81.8. Pas de moton. Disphagie restaurée, pas de prétendu ad. de l'escoulement.",
"present": true,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
}
]
}
},
{
"page": 5,
"type": "concertation_2",
"header": "",
"elapsed_s": 1.63,
"ocr_raw": "```json\n{\n \"ghs_initial\": \"\",\n \"ghs_avant_concertation\": \"\",\n \"ghs_final\": \"\",\n \"decision\": \"\",\n \"date_concertation\": \"2.3.18\",\n \"praticien_controleur\": \"\",\n \"medecin_dim\": \"\"\n}\n```",
"parsed": {
"ghs_initial": "",
"ghs_avant_concertation": "",
"ghs_final": "",
"decision": "",
"date_concertation": "2.3.18",
"praticien_controleur": "",
"medecin_dim": ""
}
},
{
"page": 6,
"type": "concertation_1",
"header": "",
"elapsed_s": 1.38,
"ocr_raw": "```json\n{\n \"date_concertation\": \"2.3.18\",\n \"argumentaire\": \"Désaccord : (les éléments couverts par le secret médical sont à mentionner sur la fiche médicale de concertation)\"\n}\n```",
"parsed": {
"date_concertation": "2.3.18",
"argumentaire": "Désaccord : (les éléments couverts par le secret médical sont à mentionner sur la fiche médicale de concertation)"
}
}
],
"extraction": {
"recueil": {
"etablissement": "CLINIQUE D'ARCACHON",
"finess": "330780206",
"date_debut_controle": "13/02/2018",
"n_ogc": "20",
"n_champ": "1",
"dates_sejour": "09/03/2016 au 18/03/2016",
"sejour_etab": {
"age": "57",
"sexe": "1",
"duree_sejour": "9",
"mode_entree": "8",
"provenance": "8",
"mode_sortie": "8",
"destination": ""
},
"sejour_reco": {
"age": "57",
"sexe": "1",
"duree_sejour": "9",
"mode_entree": "8",
"provenance": "8",
"mode_sortie": "8",
"destination": ""
},
"rum_etab": {
"um": "0",
"igs": "53 C",
"duree": "9",
"dates": "du 09/03/2016 au 18/03/2016"
},
"codage_etab": {
"dp": "D374",
"dr": "I022",
"das": [
{
"code": "T814",
"position": "3",
"libelle": "INFECT. APRES UN ACTE, NCA"
}
]
},
"codage_reco": {
"dp": "D374",
"dr": "I022",
"das": [
{
"code": "T814",
"position": "3",
"libelle": "INFECT. APRES UN ACTE, NCA"
}
]
},
"actes_etab": [],
"actes_reco": [],
"ghm_etab": "06C043",
"ghs_etab": "1941",
"ghm_reco": "06C042",
"ghs_reco": "1940",
"recodage_impactant": "1",
"ghs_injustifie": "0",
"praticien_conseil": "DR VIGNAÚ",
"accord_desaccord": "désaccord",
"_checkbox_debug": {
"decision": "désaccord",
"ratio_accord": 0.1185,
"ratio_desaccord": 0.1659,
"diff": -0.0474
},
"_validation": {
"codage_etab": {
"dp": {
"code": "D374",
"valid": true,
"libelle_ref": "Côlon"
},
"dr": {
"code": "I022",
"valid": false,
"suggestion": "A022",
"suggestion_libelle": "Infection localisée à Salmonella"
},
"das": [
{
"code": "T814",
"valid": true,
"libelle_ref": "Infection après un acte à visée diagnostique et thérapeutique, non classée ailleurs"
}
]
},
"codage_reco": {
"dp": {
"code": "D374",
"valid": true,
"libelle_ref": "Côlon"
},
"dr": {
"code": "I022",
"valid": false,
"suggestion": "A022",
"suggestion_libelle": "Infection localisée à Salmonella"
},
"das": [
{
"code": "T814",
"valid": true,
"libelle_ref": "Infection après un acte à visée diagnostique et thérapeutique, non classée ailleurs"
}
]
},
"actes_etab": [],
"actes_reco": [],
"ghm_etab": {
"code": "06C043",
"valid": true,
"ghs_possibles": [
"1941"
]
},
"ghs_etab": {
"code": "1941",
"valid": true
},
"ghm_reco": {
"code": "06C042",
"valid": true,
"ghs_possibles": [
"1940"
]
},
"ghs_reco": {
"code": "1940",
"valid": true
},
"cross_checks": {
"etab": {
"checked": true,
"coherent": true,
"ghs_extrait": "1941",
"ghs_possibles": [
"1941"
]
},
"reco": {
"checked": true,
"coherent": true,
"ghs_extrait": "1940",
"ghs_possibles": [
"1940"
]
}
},
"summary": {
"valid": 8,
"invalid": 2,
"empty": 0,
"total_codes": 10,
"ghm_ghs_incoherents": 0
}
}
},
"preuves": {
"date": "",
"praticien_controleur": "",
"medecin_dim": "",
"pieces": [
{
"intitule": "Patient de 57 ans, puis en charge pour une colo-rectalgie et l'anapath. Confirme le Kc du colon.",
"present": true,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "En post-op, présence d'un escoulement au niveau du bas de la muqueuse ; retrait d'un aquafili et luchage.",
"present": true,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
},
{
"intitule": "Il n'a pas d'abcès : une déficatga. Des JAS en T81.8. Pas de moton. Disphagie restaurée, pas de prétendu ad. de l'escoulement.",
"present": true,
"photocopie": false,
"absent_date": "",
"date_obtention": ""
}
]
},
"concertation_2": {
"ghs_initial": "",
"ghs_avant_concertation": "",
"ghs_final": "",
"decision": "",
"date_concertation": "2.3.18",
"praticien_controleur": "",
"medecin_dim": "",
"_validation": {
"ghs_initial": {
"code": "",
"valid": null
},
"ghs_avant_concertation": {
"code": "",
"valid": null
},
"ghs_final": {
"code": "",
"valid": null
}
}
},
"concertation_1": {
"date_concertation": "2.3.18",
"argumentaire": "Désaccord : (les éléments couverts par le secret médical sont à mentionner sur la fiche médicale de concertation)"
}
},
"_meta": {
"pipeline_version": "v1",
"ocr_model": "zai-org/GLM-OCR",
"generated_at": "2026-04-24T12:11:05+00:00"
}
}