chore: mise à jour output pipeline (anonymized + structured)
Résultats de re-traitement pipeline v2 sur 261 dossiers. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
87
output/reports/178_23124458/BACTERIO_23124458_report.json
Normal file
87
output/reports/178_23124458/BACTERIO_23124458_report.json
Normal file
@@ -0,0 +1,87 @@
|
||||
{
|
||||
"source_file": "BACTERIO 23124458.pdf",
|
||||
"total_replacements": 26,
|
||||
"regex_replacements": 25,
|
||||
"ner_replacements": 1,
|
||||
"sweep_replacements": 0,
|
||||
"entities_found": [
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "ALBISTUR ORTIZ Hegoa",
|
||||
"replacement": "[PATIENT_1]",
|
||||
"source": "regex",
|
||||
"category": "patient"
|
||||
},
|
||||
{
|
||||
"original": "ALBISTUR ORTIZ Hegoa",
|
||||
"replacement": "[PATIENT_1]",
|
||||
"source": "regex",
|
||||
"category": "patient"
|
||||
},
|
||||
{
|
||||
"original": "ALBISTUR ORTIZ PEDIATRIE GENERALE",
|
||||
"replacement": "[PATIENT_1]",
|
||||
"source": "regex",
|
||||
"category": "patient"
|
||||
},
|
||||
{
|
||||
"original": "ALBISTUR ORTIZ PEDIATRIE GENERALE",
|
||||
"replacement": "[PATIENT_1]",
|
||||
"source": "regex",
|
||||
"category": "patient"
|
||||
},
|
||||
{
|
||||
"original": "11/07/2017",
|
||||
"replacement": "[DATE_NAISS_1]",
|
||||
"source": "regex",
|
||||
"category": "date_naissance"
|
||||
},
|
||||
{
|
||||
"original": "11/07/2017",
|
||||
"replacement": "[DATE_NAISS_1]",
|
||||
"source": "regex",
|
||||
"category": "date_naissance"
|
||||
},
|
||||
{
|
||||
"original": "SAURHANET Nelly\nReçu le",
|
||||
"replacement": "[SOIGNANT_1]",
|
||||
"source": "regex",
|
||||
"category": "soignant"
|
||||
},
|
||||
{
|
||||
"original": "GUADAGNIN Emeline\nPrélevé le",
|
||||
"replacement": "[SOIGNANT_2]",
|
||||
"source": "regex",
|
||||
"category": "soignant"
|
||||
},
|
||||
{
|
||||
"original": "2300140840",
|
||||
"replacement": "[IDENTIFIANT_1]",
|
||||
"source": "regex",
|
||||
"category": "identifiant"
|
||||
},
|
||||
{
|
||||
"original": "2300140840",
|
||||
"replacement": "[IDENTIFIANT_1]",
|
||||
"source": "regex",
|
||||
"category": "identifiant"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "Jacques Loëb",
|
||||
"replacement": "[PERSONNE_1]",
|
||||
"source": "ner",
|
||||
"score": 0.9889411926269531
|
||||
}
|
||||
]
|
||||
}
|
||||
27
output/reports/178_23124458/CRH_23124458_report.json
Normal file
27
output/reports/178_23124458/CRH_23124458_report.json
Normal file
@@ -0,0 +1,27 @@
|
||||
{
|
||||
"source_file": "CRH 23124458.pdf",
|
||||
"total_replacements": 134,
|
||||
"regex_replacements": 126,
|
||||
"ner_replacements": 2,
|
||||
"sweep_replacements": 6,
|
||||
"entities_found": [
|
||||
{
|
||||
"original": "10004040993",
|
||||
"replacement": "[CODE_BARRE_1]",
|
||||
"source": "regex",
|
||||
"category": "code_barre"
|
||||
},
|
||||
{
|
||||
"original": "J. LOEB",
|
||||
"replacement": "[PERSONNE_1]",
|
||||
"source": "ner",
|
||||
"score": 0.8884338140487671
|
||||
},
|
||||
{
|
||||
"original": "ALBISTUR ORTIZ Hegoa",
|
||||
"replacement": "[PATIENT_1]",
|
||||
"source": "ner",
|
||||
"score": 0.9937224388122559
|
||||
}
|
||||
]
|
||||
}
|
||||
@@ -0,0 +1,567 @@
|
||||
{
|
||||
"source_file": "trackare-23015166-23124458_23015166_23124458.pdf",
|
||||
"total_replacements": 523,
|
||||
"regex_replacements": 235,
|
||||
"ner_replacements": 35,
|
||||
"sweep_replacements": 253,
|
||||
"entities_found": [
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23015166",
|
||||
"replacement": "[IPP_1]",
|
||||
"source": "regex",
|
||||
"category": "ipp"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "23124458",
|
||||
"replacement": "[EPISODE_1]",
|
||||
"source": "regex",
|
||||
"category": "episode"
|
||||
},
|
||||
{
|
||||
"original": "217076410231986",
|
||||
"replacement": "[NIR_1]",
|
||||
"source": "regex",
|
||||
"category": "nir"
|
||||
},
|
||||
{
|
||||
"original": "640000162",
|
||||
"replacement": "[FINESS]",
|
||||
"source": "regex",
|
||||
"category": "finess"
|
||||
},
|
||||
{
|
||||
"original": "64102",
|
||||
"replacement": "[LIEU_NAISS_2]",
|
||||
"source": "regex",
|
||||
"category": "lieu_naissance"
|
||||
},
|
||||
{
|
||||
"original": "BAYONNE",
|
||||
"replacement": "[LIEU_NAISS_1]",
|
||||
"source": "regex",
|
||||
"category": "lieu_naissance"
|
||||
},
|
||||
{
|
||||
"original": "ALBISTUR ORTIZ",
|
||||
"replacement": "[PATIENT_1]",
|
||||
"source": "regex",
|
||||
"category": "patient"
|
||||
},
|
||||
{
|
||||
"original": "MEDECINE PEDIATRIE - PEDIATRIE GENERALE\nDossier Patient\nDétails des patients",
|
||||
"replacement": "[MEDECIN_10]",
|
||||
"source": "regex",
|
||||
"category": "patient"
|
||||
},
|
||||
{
|
||||
"original": "ALBISTUR ORTIZ",
|
||||
"replacement": "[PATIENT_1]",
|
||||
"source": "regex",
|
||||
"category": "patient"
|
||||
},
|
||||
{
|
||||
"original": "HEGOA",
|
||||
"replacement": "[PATIENT_1]",
|
||||
"source": "regex",
|
||||
"category": "patient"
|
||||
},
|
||||
{
|
||||
"original": "HEGOA",
|
||||
"replacement": "[PATIENT_1]",
|
||||
"source": "regex",
|
||||
"category": "patient"
|
||||
},
|
||||
{
|
||||
"original": "34 PLACE BERTSULARI Ville de résidence: AHETZE",
|
||||
"replacement": "[ADRESSE_1]",
|
||||
"source": "regex",
|
||||
"category": "adresse"
|
||||
},
|
||||
{
|
||||
"original": "HEGOA ALBISTUR ORTIZ",
|
||||
"replacement": "[PATIENT_1]",
|
||||
"source": "ner",
|
||||
"score": 0.9937219619750977
|
||||
},
|
||||
{
|
||||
"original": "GUILLEMAUD GUILLEMAUD JAOUEN",
|
||||
"replacement": "[PERSONNE_1]",
|
||||
"source": "ner",
|
||||
"score": 0.9968414902687073
|
||||
},
|
||||
{
|
||||
"original": "Streptococcus",
|
||||
"replacement": "[PERSONNE_2]",
|
||||
"source": "ner",
|
||||
"score": 0.9294036030769348
|
||||
},
|
||||
{
|
||||
"original": "Staphylococcus",
|
||||
"replacement": "[PERSONNE_3]",
|
||||
"source": "ner",
|
||||
"score": 0.8922439813613892
|
||||
},
|
||||
{
|
||||
"original": "Emeline SURV",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.976545512676239
|
||||
},
|
||||
{
|
||||
"original": "Emeline SURV",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.9972749948501587
|
||||
},
|
||||
{
|
||||
"original": "Emeline SURV",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.9968713521957397
|
||||
},
|
||||
{
|
||||
"original": "GUADAGNIN Signé",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.8999916911125183
|
||||
},
|
||||
{
|
||||
"original": "Emeline Glyc",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.9725255966186523
|
||||
},
|
||||
{
|
||||
"original": "GUADAGNIN Emeline",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.9806605577468872
|
||||
},
|
||||
{
|
||||
"original": "Emeline",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.9188291430473328
|
||||
},
|
||||
{
|
||||
"original": "GUADAGNIN Emeline",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.9941819310188293
|
||||
},
|
||||
{
|
||||
"original": "EGGER Justine",
|
||||
"replacement": "[SOIGNANT_1]",
|
||||
"source": "ner",
|
||||
"score": 0.9778541326522827
|
||||
},
|
||||
{
|
||||
"original": "EGGER Justine",
|
||||
"replacement": "[SOIGNANT_1]",
|
||||
"source": "ner",
|
||||
"score": 0.994054913520813
|
||||
},
|
||||
{
|
||||
"original": "EGGER Justine",
|
||||
"replacement": "[SOIGNANT_1]",
|
||||
"source": "ner",
|
||||
"score": 0.9907882809638977
|
||||
},
|
||||
{
|
||||
"original": "Emeline",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.8374759554862976
|
||||
},
|
||||
{
|
||||
"original": "GUADAGNIN Emeline",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.969163715839386
|
||||
},
|
||||
{
|
||||
"original": "Emeline SURV",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.9749323725700378
|
||||
},
|
||||
{
|
||||
"original": "Emeline SURV",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.9527155160903931
|
||||
},
|
||||
{
|
||||
"original": "Emeline",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.9541953206062317
|
||||
},
|
||||
{
|
||||
"original": "Emeline SURV",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.977171778678894
|
||||
},
|
||||
{
|
||||
"original": "GUADAGNIN Emeline",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.9899094700813293
|
||||
},
|
||||
{
|
||||
"original": "GUADAGNIN Emeline S",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.9339039325714111
|
||||
},
|
||||
{
|
||||
"original": "EGGER Justine",
|
||||
"replacement": "[SOIGNANT_1]",
|
||||
"source": "ner",
|
||||
"score": 0.9778541326522827
|
||||
},
|
||||
{
|
||||
"original": "EGGER Justine",
|
||||
"replacement": "[SOIGNANT_1]",
|
||||
"source": "ner",
|
||||
"score": 0.9695806503295898
|
||||
},
|
||||
{
|
||||
"original": "GUADAGNIN Emeline",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.9629434943199158
|
||||
},
|
||||
{
|
||||
"original": "Clara KILO",
|
||||
"replacement": "[SOIGNANT_13]",
|
||||
"source": "ner",
|
||||
"score": 0.992748498916626
|
||||
},
|
||||
{
|
||||
"original": "Caroline KT COURT",
|
||||
"replacement": "[PERSONNE_4]",
|
||||
"source": "ner",
|
||||
"score": 0.9254143834114075
|
||||
},
|
||||
{
|
||||
"original": "Justine VVP",
|
||||
"replacement": "[SOIGNANT_1]",
|
||||
"source": "ner",
|
||||
"score": 0.9771549105644226
|
||||
},
|
||||
{
|
||||
"original": "Emeline",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.855040967464447
|
||||
},
|
||||
{
|
||||
"original": "Emeline DOULEUR",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.9747917652130127
|
||||
},
|
||||
{
|
||||
"original": "Emeline Signé",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.9208798408508301
|
||||
},
|
||||
{
|
||||
"original": "Emeline GUADAGNIN",
|
||||
"replacement": "[MEDECIN_11]",
|
||||
"source": "ner",
|
||||
"score": 0.9984973073005676
|
||||
},
|
||||
{
|
||||
"original": "Justine EGGER",
|
||||
"replacement": "[SOIGNANT_1]",
|
||||
"source": "ner",
|
||||
"score": 0.9843853116035461
|
||||
},
|
||||
{
|
||||
"original": "Lise TEITON",
|
||||
"replacement": "[SOIGNANT_10]",
|
||||
"source": "ner",
|
||||
"score": 0.9336015582084656
|
||||
}
|
||||
]
|
||||
}
|
||||
Reference in New Issue
Block a user