Le pipeline produit un JSON riche pendant l'exécution (ratios
checkbox, OCR raw, flags _parse_error/_truncated_loop/_crop_recodage,
_source, _elapsed_s…). Utile en audit, mais pollue quand on veut
exposer le résultat à un consommateur aval (Excel, dashboard, API).
pipeline/schema.py :
- SCHEMA_VERSION "2.0"
- clean_dossier(raw) : retourne une copie propre avec structure stable
(en-tête → codage → GHM/GHS → décisions) et validation ATIH en
format compact (summary + cross_checks + flags par champ).
- CLEAN_FIELDS_RECUEIL / CLEAN_FIELDS_CONCERTATION_{1,2} / CLEAN_FIELDS_PREUVES
documentent les champs stables par type de page.
- CLI : `python -m pipeline.schema` → nettoie `output/v2/*.json` vers
`output/v2_clean/`.
Séparation claire : `output/v2/` reste le JSON raw (audit), `output/v2_clean/`
est la sortie propre et stable pour livrables.
Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
262 lines
8.3 KiB
JSON
262 lines
8.3 KiB
JSON
{
|
|
"fichier": "OGC 76",
|
|
"pdf_hash": "96f8ce5a1672aad9",
|
|
"schema_version": "2.0",
|
|
"extraction": {
|
|
"recueil": {
|
|
"etablissement": "CLINIQUE D'ARCACHON",
|
|
"finess": "330780206",
|
|
"date_debut_controle": "13/02/2018",
|
|
"n_ogc": "76",
|
|
"n_champ": "1",
|
|
"dates_sejour": "05/04/2016 au 11/04/2016",
|
|
"sejour_etab": {
|
|
"age": "54",
|
|
"sexe": "2",
|
|
"duree_sejour": "6"
|
|
},
|
|
"sejour_reco": {
|
|
"age": "54",
|
|
"sexe": "2",
|
|
"duree_sejour": "6"
|
|
},
|
|
"rum_etab": {
|
|
"um": "UM",
|
|
"igs": "IGS II",
|
|
"duree": "6",
|
|
"dates": "du 05/04/2016 au 11/04/2016"
|
|
},
|
|
"codage_etab": {
|
|
"dp": "F329",
|
|
"dp_libelle": "EPISODE DEPRES., SAI",
|
|
"dr": "Z511",
|
|
"das": []
|
|
},
|
|
"codage_reco": {
|
|
"dp": "",
|
|
"dr": "",
|
|
"das": []
|
|
},
|
|
"actes_etab": [],
|
|
"actes_reco": [],
|
|
"ghm_etab": "19M113",
|
|
"ghs_etab": "7086",
|
|
"ghm_reco": "17M061",
|
|
"ghs_reco": "6487",
|
|
"recodage_impactant": "1",
|
|
"ghs_injustifie": "0",
|
|
"accord_desaccord": "désaccord",
|
|
"praticien_conseil": "DR VIGNAU",
|
|
"_validation": {
|
|
"summary": {
|
|
"valid": 6,
|
|
"invalid": 0,
|
|
"empty": 2,
|
|
"total_codes": 6,
|
|
"ghm_ghs_incoherents": 0
|
|
},
|
|
"codage_etab": {
|
|
"dp": {
|
|
"valid": true,
|
|
"libelle_ref": "Épisode dépressif, sans précision"
|
|
},
|
|
"dr": {
|
|
"valid": true,
|
|
"libelle_ref": "Séance de chimiothérapie pour tumeur"
|
|
},
|
|
"das": []
|
|
},
|
|
"codage_reco": {
|
|
"dp": {
|
|
"valid": null
|
|
},
|
|
"dr": {
|
|
"valid": null
|
|
},
|
|
"das": []
|
|
},
|
|
"ghm_etab": {
|
|
"valid": true
|
|
},
|
|
"ghs_etab": {
|
|
"valid": true
|
|
},
|
|
"ghm_reco": {
|
|
"valid": true
|
|
},
|
|
"ghs_reco": {
|
|
"valid": true
|
|
},
|
|
"cross_checks": {
|
|
"etab_ghm_ghs_coherent": true,
|
|
"reco_ghm_ghs_coherent": true
|
|
}
|
|
}
|
|
},
|
|
"concertation_2": {
|
|
"ghs_initial": "7086",
|
|
"ghs_avant_concertation": "6487",
|
|
"ghs_final": "6487",
|
|
"decision": "maintien_avis_controleur",
|
|
"date_concertation": "1.3.19",
|
|
"praticien_controleur": "DR VIGNAU",
|
|
"medecin_dim": "DR ETTORCHI-TARDY",
|
|
"_validation": {
|
|
"ghs_initial": {
|
|
"code": "7086",
|
|
"valid": true
|
|
},
|
|
"ghs_avant_concertation": {
|
|
"code": "6487",
|
|
"valid": true
|
|
},
|
|
"ghs_final": {
|
|
"code": "6487",
|
|
"valid": true
|
|
}
|
|
}
|
|
},
|
|
"concertation_1": {
|
|
"date_concertation": "13.2018",
|
|
"argumentaire": "124: La facturation du GHS par l'établissement n'est pas conforme à l'article 1 de l'arrêté du 19 février 2015 modifié du fait d'un non-respect des règles de codage édictées dans l'annexe II de l'arrêté du 21 décembre 2015 modifiant l'arrêté du 22 février 2008. En préalable, chapitre VI, paragraphe 1.2 : « Les circonstances du diagnostic préalable n'importent pas (...) La situation de traitement est présente lorsque le diagnostic de l'affection est fait au moment de l'entrée du patient dans l'unité médicale et que l'admission a pour but le traitement de l'affection. » Le non-respect des règles porte sur le diagnostic principal (DP) codé par l'établissement dans le résumé d'unité médicale (RUM). Le DP n'est pas conforme aux règles de codage des diagnostics rappelées par l'annexe II, chapitre VI, paragraphe 1.2.1 : « La dénomination traitement répétitif rassemble les traitements qui, par nature, imposent une administration répétitive. (...) Dans les situations de traitement répétitif le codage du DP utilise des codes du chapitre XXI de la CIM-10 (« codes Z »). [Règle T1]. La règle est la même si la prise en charge, incidentellement, n'a lieu qu'une fois : c'est la nature du traitement qui est prise en considération. (...) Les séjours pour chimiothérapie, radiothérapie, transfusion sanguine, apheresis sanguine, oxygénothérapie hyperbare, injection de fer (pour carence martiale) qu'il s'agisse de séances ou d'hospitalisation complète, doivent avoir en position de DP le code adéquat de la catégorie Z51 de la CIM10. » Au vu des éléments présents dans le dossier du patient, alors que l'affection a été motivée par un traitement correspondant à la définition de traitement répétitif, l'établissement n'a pas retenu en DP le code du chapitre XXI de la CIM-10 en Z imposé par l'annexe II."
|
|
},
|
|
"preuves": {
|
|
"date": "27/04/2018",
|
|
"praticien_controleur": [
|
|
"Dr RADZIKOWSKI",
|
|
"Dr DELAYE-PHULPIN",
|
|
"Dr TURBAN",
|
|
"Dr DUVAL",
|
|
"Dr VIGNAU",
|
|
"Dr PROMAX"
|
|
],
|
|
"medecin_dim": "Dr ETTORCHI-TARDY",
|
|
"pieces": [
|
|
{
|
|
"intitule": "Compte-rendu d'acte",
|
|
"present": false,
|
|
"photocopie": true,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Compte-rendu opératoire",
|
|
"present": false,
|
|
"photocopie": true,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Compte-rendu d'accouchement",
|
|
"present": false,
|
|
"photocopie": true,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Compte-rendu d'examen complémentaire",
|
|
"present": false,
|
|
"photocopie": true,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Compte-rendu d'imagerie",
|
|
"present": false,
|
|
"photocopie": true,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Compte-rendu d'anatomopathologie",
|
|
"present": false,
|
|
"photocopie": true,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Observations médicales",
|
|
"present": true,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Dossier de transfusion",
|
|
"present": false,
|
|
"photocopie": true,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Dossier d'anesthésie",
|
|
"present": false,
|
|
"photocopie": true,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Administration thérapeutique",
|
|
"present": false,
|
|
"photocopie": true,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Compte-rendu d'hospitalisation",
|
|
"present": false,
|
|
"photocopie": true,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Lettre de sortie",
|
|
"present": true,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Eléments de surveillance du dossier infirmier",
|
|
"present": false,
|
|
"photocopie": true,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Prise en charge psychologue",
|
|
"present": false,
|
|
"photocopie": true,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Prise en charge kinésithérapeute",
|
|
"present": false,
|
|
"photocopie": true,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Prise en charge diététique",
|
|
"present": false,
|
|
"photocopie": true,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Autre : CR psychologue",
|
|
"present": true,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
}
|
|
]
|
|
}
|
|
},
|
|
"_meta": {
|
|
"pipeline_version": "v1",
|
|
"ocr_model": "zai-org/GLM-OCR",
|
|
"generated_at": "2026-04-24T12:16:57+00:00"
|
|
}
|
|
} |