feat(extract): normaliser ghs_injustifie en 0/1 (P2)
Qwen renvoie typiquement le libellé complet `0 SE 1 2 3 4 ATU FFM FSD` dans le champ ghs_injustifie alors qu'une seule valeur 0/1 est attendue. Ajout de `pipeline.checkboxes.parse_ghs_injustifie` qui extrait le premier chiffre 0/1 via regex, ou "" si illisible. Post-traitement appliqué à chaque extraction recueil et aux 18 JSONs V2 existants (10 fichiers corrigés en place — les 8 autres avaient déjà ghs_injustifie absent ou vide). Note sur les 7 cases SE1-4/ATU/FFM/FSD : zones trop petites pour être calibrées à l'œil et aucun cas positif (`ghs_injustifie=1`) dans l'échantillon 2018 pour valider visuellement. La détection est en placeholder, à recalibrer sur un cas positif réel. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -324,7 +324,7 @@
|
||||
"ghm_reco": "23Z02Z",
|
||||
"ghs_reco": "7992",
|
||||
"recodage_impactant": "1",
|
||||
"ghs_injustifie": "0 SE 1 2 3 4 ATU FFM FSD",
|
||||
"ghs_injustifie": "0",
|
||||
"praticien_conseil": "DR VIGNAU",
|
||||
"accord_desaccord": "accord",
|
||||
"_checkbox_debug": {
|
||||
|
||||
Reference in New Issue
Block a user