Le pipeline produit un JSON riche pendant l'exécution (ratios
checkbox, OCR raw, flags _parse_error/_truncated_loop/_crop_recodage,
_source, _elapsed_s…). Utile en audit, mais pollue quand on veut
exposer le résultat à un consommateur aval (Excel, dashboard, API).
pipeline/schema.py :
- SCHEMA_VERSION "2.0"
- clean_dossier(raw) : retourne une copie propre avec structure stable
(en-tête → codage → GHM/GHS → décisions) et validation ATIH en
format compact (summary + cross_checks + flags par champ).
- CLEAN_FIELDS_RECUEIL / CLEAN_FIELDS_CONCERTATION_{1,2} / CLEAN_FIELDS_PREUVES
documentent les champs stables par type de page.
- CLI : `python -m pipeline.schema` → nettoie `output/v2/*.json` vers
`output/v2_clean/`.
Séparation claire : `output/v2/` reste le JSON raw (audit), `output/v2_clean/`
est la sortie propre et stable pour livrables.
Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
372 lines
11 KiB
JSON
372 lines
11 KiB
JSON
{
|
|
"fichier": "OGC 99",
|
|
"pdf_hash": "078ba737e95e7659",
|
|
"schema_version": "2.0",
|
|
"extraction": {
|
|
"recueil": {
|
|
"etablissement": "CLINIQUE D'ARCACHON",
|
|
"finess": "330780206",
|
|
"date_debut_controle": "13/02/2018",
|
|
"n_ogc": "99",
|
|
"n_champ": "1",
|
|
"dates_sejour": "16/04/2016 au 06/05/2016",
|
|
"sejour_etab": {
|
|
"age": "66",
|
|
"sexe": "1",
|
|
"duree_sejour": "20"
|
|
},
|
|
"sejour_reco": {
|
|
"age": "66",
|
|
"sexe": "1",
|
|
"duree_sejour": "20"
|
|
},
|
|
"rum_etab": {
|
|
"um": "UM",
|
|
"igs": "IGS II",
|
|
"duree": "20",
|
|
"dates": "du 16/04/2016 au 06/05/2016"
|
|
},
|
|
"codage_etab": {
|
|
"dp": "T827",
|
|
"dp_libelle": "INFECT. ET REAC. INFL. DUES A PROTH.",
|
|
"dr": "B957 *",
|
|
"das": [
|
|
{
|
|
"code": "B957",
|
|
"position": "2",
|
|
"libelle": "STAPHYLO. NICA, CAUSE DE MAL. CLASSES DANS D'AUTRES CHAP."
|
|
},
|
|
{
|
|
"code": "B957",
|
|
"position": "2",
|
|
"libelle": "STAPHYLO. NICA, CAUSE DE MAL. CLASSES DANS D'AUTRES CHAP."
|
|
},
|
|
{
|
|
"code": "C795",
|
|
"position": "2",
|
|
"libelle": "PSEUDOMONAS, CAUSE DE MAL. CLASSES DANS D'AUTRES CHAP."
|
|
},
|
|
{
|
|
"code": "C795",
|
|
"position": "2",
|
|
"libelle": "PSEUDOMONAS, CAUSE DE MAL. CLASSES DANS D'AUTRES CHAP."
|
|
},
|
|
{
|
|
"code": "C797",
|
|
"position": "2",
|
|
"libelle": "T.M. IRE. DES OS ET DE LA MOELLE OSSEUSE"
|
|
},
|
|
{
|
|
"code": "C797",
|
|
"position": "2",
|
|
"libelle": "T.M. IRE. DES OS ET DE LA MOELLE OSSEUSE"
|
|
},
|
|
{
|
|
"code": "D619",
|
|
"position": "2",
|
|
"libelle": "APLAISIE MEDULLAIRE, SAI"
|
|
},
|
|
{
|
|
"code": "D619",
|
|
"position": "2",
|
|
"libelle": "APLAISIE MEDULLAIRE, SAI"
|
|
},
|
|
{
|
|
"code": "R650",
|
|
"position": "2",
|
|
"libelle": "ANEMIE AVEC MAL. TUMORALES"
|
|
},
|
|
{
|
|
"code": "R650",
|
|
"position": "2",
|
|
"libelle": "ANEMIE AVEC MAL. TUMORALES"
|
|
},
|
|
{
|
|
"code": "Z290",
|
|
"position": "2",
|
|
"libelle": "ISOLEMENT"
|
|
},
|
|
{
|
|
"code": "Z290",
|
|
"position": "2",
|
|
"libelle": "ISOLEMENT"
|
|
}
|
|
]
|
|
},
|
|
"codage_reco": {
|
|
"dp": "A415",
|
|
"dr": "",
|
|
"das": []
|
|
},
|
|
"actes_etab": [],
|
|
"actes_reco": [],
|
|
"ghm_etab": "21M164",
|
|
"ghs_etab": "7612",
|
|
"ghm_reco": "18M073",
|
|
"ghs_reco": "6783",
|
|
"recodage_impactant": "1",
|
|
"ghs_injustifie": "0",
|
|
"accord_desaccord": "désaccord",
|
|
"praticien_conseil": "DR VIGNAU",
|
|
"_validation": {
|
|
"summary": {
|
|
"valid": 19,
|
|
"invalid": 0,
|
|
"empty": 1,
|
|
"total_codes": 19,
|
|
"ghm_ghs_incoherents": 0
|
|
},
|
|
"codage_etab": {
|
|
"dp": {
|
|
"valid": true,
|
|
"libelle_ref": "Infection et réaction inflammatoire dues à d'autres prothèses, implants et greffes cardiaques et vasculaires"
|
|
},
|
|
"dr": {
|
|
"valid": true,
|
|
"libelle_ref": "Autres staphylocoques, cause de maladies classées dans d'autres chapitres"
|
|
},
|
|
"das": [
|
|
{
|
|
"valid": true,
|
|
"libelle_ref": "Autres staphylocoques, cause de maladies classées dans d'autres chapitres"
|
|
},
|
|
{
|
|
"valid": true,
|
|
"libelle_ref": "Autres staphylocoques, cause de maladies classées dans d'autres chapitres"
|
|
},
|
|
{
|
|
"valid": true,
|
|
"libelle_ref": "Tumeur maligne secondaire des os et de la moelle osseuse"
|
|
},
|
|
{
|
|
"valid": true,
|
|
"libelle_ref": "Tumeur maligne secondaire des os et de la moelle osseuse"
|
|
},
|
|
{
|
|
"valid": true,
|
|
"libelle_ref": "Tumeur maligne secondaire de la glande surrénale"
|
|
},
|
|
{
|
|
"valid": true,
|
|
"libelle_ref": "Tumeur maligne secondaire de la glande surrénale"
|
|
},
|
|
{
|
|
"valid": true,
|
|
"libelle_ref": "Anémie médullaire [aplastique], sans précision"
|
|
},
|
|
{
|
|
"valid": true,
|
|
"libelle_ref": "Anémie médullaire [aplastique], sans précision"
|
|
},
|
|
{
|
|
"valid": true,
|
|
"libelle_ref": "Syndrome de réponse inflammatoire systémique d'origine infectieuse sans défaillance d'organe"
|
|
},
|
|
{
|
|
"valid": true,
|
|
"libelle_ref": "Syndrome de réponse inflammatoire systémique d'origine infectieuse sans défaillance d'organe"
|
|
},
|
|
{
|
|
"valid": true,
|
|
"libelle_ref": "Isolement"
|
|
},
|
|
{
|
|
"valid": true,
|
|
"libelle_ref": "Isolement"
|
|
}
|
|
]
|
|
},
|
|
"codage_reco": {
|
|
"dp": {
|
|
"valid": true,
|
|
"libelle_ref": "Sepsis à d'autres microorganismes Gram négatif"
|
|
},
|
|
"dr": {
|
|
"valid": null
|
|
},
|
|
"das": []
|
|
},
|
|
"ghm_etab": {
|
|
"valid": true
|
|
},
|
|
"ghs_etab": {
|
|
"valid": true
|
|
},
|
|
"ghm_reco": {
|
|
"valid": true
|
|
},
|
|
"ghs_reco": {
|
|
"valid": true
|
|
},
|
|
"cross_checks": {
|
|
"etab_ghm_ghs_coherent": true,
|
|
"reco_ghm_ghs_coherent": true
|
|
}
|
|
}
|
|
},
|
|
"concertation_2": {
|
|
"ghs_initial": "7612",
|
|
"ghs_avant_concertation": "6783",
|
|
"ghs_final": "6783",
|
|
"decision": "maintien_avis_controleur",
|
|
"date_concertation": "2.3.19",
|
|
"praticien_controleur": "DR VIGNAU",
|
|
"medecin_dim": "DR ETTORCHI-TARDY",
|
|
"_validation": {
|
|
"ghs_initial": {
|
|
"code": "7612",
|
|
"valid": true
|
|
},
|
|
"ghs_avant_concertation": {
|
|
"code": "6783",
|
|
"valid": true
|
|
},
|
|
"ghs_final": {
|
|
"code": "6783",
|
|
"valid": true
|
|
}
|
|
}
|
|
},
|
|
"concertation_1": {
|
|
"date_concertation": "2.3",
|
|
"argumentaire": "109 : La facturation du GHS par l'établissement n'est pas conforme à l'article 1 de l'arrêté du 19 février 2015 modifié du fait d'un non-respect des règles de codage édictées dans l'annexe II de l'arrêté du 21 décembre 2015 modifiant l'arrêté du 22 février 2008. Le non-respect des règles porte sur le diagnostic principal (DP) codé par l'établissement dans le résumé d'unité médicale (RUM). Le DP n'est pas conforme aux règles de codage des diagnostics rappelées par l'annexe II, chapitre V, paragraphe 1 : « les diagnostics doivent figurer dans le RUM sous forme codée selon la plus récente mise à jour de la 10e révision de la Classification internationale des maladies (CIM-10) de l'Organisation mondiale de la santé et selon les extensions nationales données dans la plus récente version du Manuel des groupes homogènes de malades. (...) Le meilleur code est le plus précis par rapport à l'information à coder. » Au vu des éléments présents dans le dossier du patient, le code CIM-10 choisi pour le DP par l'établissement n'est pas le plus précis par rapport à l'information à coder."
|
|
},
|
|
"preuves": {
|
|
"date": "27.2.18",
|
|
"praticien_controleur": [
|
|
"Dr RADZIKOWSKI",
|
|
"Dr DELAYE-PHULPIN",
|
|
"Dr TURBAN",
|
|
"Dr DUVAL",
|
|
"Dr VIGNAU"
|
|
],
|
|
"medecin_dim": "Dr ETTORCHI-TARDY",
|
|
"pieces": [
|
|
{
|
|
"intitule": "Compte-rendu d'acte",
|
|
"present": true,
|
|
"photocopie": false,
|
|
"absent_date": "3 à 6",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Compte-rendu opératoire",
|
|
"present": false,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Compte-rendu d'accouchement",
|
|
"present": false,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Compte-rendu d'examen complémentaire",
|
|
"present": false,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Compte-rendu d'imagerie",
|
|
"present": false,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Compte-rendu d'anatomopathologie",
|
|
"present": false,
|
|
"photocopie": false,
|
|
"absent_date": "1er demande",
|
|
"date_obtention": "16"
|
|
},
|
|
{
|
|
"intitule": "Observations médicales",
|
|
"present": true,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Dossier de transfusion",
|
|
"present": false,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Dossier d'anesthésie",
|
|
"present": false,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Administration thérapeutique",
|
|
"present": false,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Compte-rendu d'hospitalisation",
|
|
"present": true,
|
|
"photocopie": false,
|
|
"absent_date": "1-2",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Lettre de sortie",
|
|
"present": false,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Eléments de surveillance du dossier infirmier",
|
|
"present": false,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Prise en charge psychologue",
|
|
"present": false,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Prise en charge kinésithérapeute",
|
|
"present": false,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Prise en charge diététique",
|
|
"present": false,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
},
|
|
{
|
|
"intitule": "Autre",
|
|
"present": false,
|
|
"photocopie": false,
|
|
"absent_date": "",
|
|
"date_obtention": ""
|
|
}
|
|
]
|
|
}
|
|
},
|
|
"_meta": {
|
|
"pipeline_version": "v1",
|
|
"ocr_model": "zai-org/GLM-OCR",
|
|
"generated_at": "2026-04-24T12:19:48+00:00"
|
|
}
|
|
} |