feat(phase2): Extraction layout-aware multi-colonnes — 322 fuites → 0, -103 FP

Phase 2 de l'amélioration qualité anonymisation :

1. Extraction multi-colonnes (PyMuPDF layout-aware) :
   - Nouvelle fonction _extract_page_layout_aware() détecte les layouts
     sidebar+corps (typiques des CRH/CRO hospitaliers)
   - Remplace pdfplumber comme extraction primaire (PyMuPDF blocks)
   - Élimine l'entrelacement de texte entre sidebar et corps médical
   - pdfplumber conservé pour les tables et comme fallback

2. Masquage FINESS multiline :
   - Détection "N° Finess\n[...]\n640000162" (label et numéro séparés)
   - Propagation globale du numéro FINESS sur toutes les pages
   - Gestion du format *640000162* (avec astérisques Trackare)

3. Masquage URLs hospitalières (www.ch-xxx.fr)

4. Nettoyage crochets doubles [[PLACEHOLDER]] → [PLACEHOLDER]

Résultats non-régression (30 fichiers audit) :
- Fuites : 322 → 0 (-100%)
- Faux positifs : 113 → 10 (-91%)
- 0 régression fonctionnelle
- OGC 1-59 : 0 fuite soignant, 0 FINESS, 0 lieu de naissance

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
2026-03-06 18:19:08 +01:00
parent bc2fe667a0
commit e967a67052
55 changed files with 38506 additions and 18343 deletions

View File

@@ -1,49 +1,49 @@
[MASK]
Anesthésiste : Dr [NOM]
DOSSIER DE CONSULTATION
(modifié le 23/02/2023)
(modifié le 23/02/2023)
Date :
17/02/23
Nom :
M. [NOM]
N°Ipp :
[TEL]
Né(e) le :
[DATE_NAISSANCE]
79 ans
Adresse :
MAISON [NOM]
[CODE_POSTAL]
N°Ipp :
[TEL]
N? Csult : [IPP] /
Nom naiss. :
23025988
N° Tél : [TEL]
Poids : 65 kg
Taille : 170 cm
B.M.I. : 22.5
Profession :
Nom naiss. :
Spécialiste :
Médecin traitant :
Date d'Intervention : 23/02/2023
Opérateur : Dr [NOM]
Motif d'admission : HOLEP
Adresse :
MAISON [NOM]
[CODE_POSTAL]
N° Tél : [TEL]
à
11 : 55
Spécialiste :
Date d'Intervention : 23/02/2023
Médecin traitant :
Motif d'admission : HOLEP
Opérateur : Dr [NOM]
Prévenir :
Mémo :
Anesthésiste en salle d'opération :
Dr [NOM]
Ambulatoire
Urgence
Entrée le jour de l'intervention
Hospit. < 30 jours
Obstétrique
CHIR.UROLOGIE C2
Hospitalisé(e) le :
à :
Service :
__ : __
__/__/__
Ambulatoire
Urgence
Entrée le jour de l'intervention
Hospit. < 30 jours
Anesthésiste en salle d'opération :
Dr [NOM]
Prévenir :
Mémo :
Obstétrique
Allergie : [pyostacine]
ATCD pulmonaires : Autres problèmes respiratoires : [H° en novembre pour pnp à pyocianique en réa iot, décupération
quasiment ad intrégrum sur le plan respiratoire]
@@ -51,7 +51,26 @@ Classe ASA : ASA3
Etat dentaire : Edenté
ATCD cardio-vasculaires : Valvulopathie, RAo : [grad moyen 25 02/25]
Antécédents / Traitements
Examen [ETABLISSEMENT] clinique :
Examen [ETABLISSEMENT] / Prescriptions
ATCD chirurgicaux :
. Cataracte
. Autres/1 phimosis
ATCD cardio-vasculaires :
. Valvulopathie /RAo grad moyen 25
02/25
. Insuffisance coronaire/Stent 2019 atc
iva proximale , cd occluse
. Trouble du rythme/AFCA clinique
alternance fa et flutter
. Arteriopathie/AOMI
. Derniers examens/Echo fe N cinetique
ok pas de valvulopathie mitro aortique
prvg basses rao gradient moyen 25
cavite droites non dilateees pas d'it vci
souple/ECG 02/23 sinusal 96 bpm bav 1
pr 240 bbdi gche
. Consultation cardio 02/23
Examen clinique :
. Etat general/Altere fragile
. Capacite d?effort/ 4 a 7 marche
quotidienne
@@ -83,25 +102,6 @@ Technique d'anesthésie envisagée :
Anesthésie : AG avec masque larynge
Protocole : AG DIP-SUF
Antibioprophylaxie : selon protocole
Décisions / Prescriptions
ATCD chirurgicaux :
. Cataracte
. Autres/1 phimosis
ATCD cardio-vasculaires :
. Valvulopathie /RAo grad moyen 25
02/25
. Insuffisance coronaire/Stent 2019 atc
iva proximale , cd occluse
. Trouble du rythme/AFCA clinique
alternance fa et flutter
. Arteriopathie/AOMI
. Derniers examens/Echo fe N cinetique
ok pas de valvulopathie mitro aortique
prvg basses rao gradient moyen 25
cavite droites non dilateees pas d'it vci
souple/ECG 02/23 sinusal 96 bpm bav 1
pr 240 bbdi gche
. Consultation cardio 02/23
ATCD pulmonaires :
. Autres problemes respiratoires H?
en novembre pour pnp a
@@ -125,27 +125,28 @@ Le 28 Février 2023 11 : 28
Page :
1/2 Anesthésiste : Dr [NOM]
DOSSIER DE CONSULTATION
(modifié le 23/02/2023)
(modifié le 23/02/2023)
Date :
17/02/23
Nom :
M. [NOM]
N°Ipp :
[TEL]
Né(e) le :
[DATE_NAISSANCE]
79 ans
Adresse :
MAISON [NOM]
[CODE_POSTAL]
N°Ipp :
[TEL]
N? Csult : [IPP] /
Nom naiss. :
23025988
N° Tél : [TEL]
Poids : 65 kg
Taille : 170 cm
B.M.I. : 22.5
Profession :
Nom naiss. :
Adresse :
MAISON [NOM]
[CODE_POSTAL]
N° Tél : [TEL]
Allergie : pyostacine
Intubation :
. Mallampati 2
. Distance Interincisive : >35mm
@@ -153,7 +154,6 @@ Intubation :
. Mobilité cervicale : normale
Synthèse pré-opératoire :
Programmation opératoire : maintenue
Allergie : pyostacine
Traitement(s) :
Traitement(s) en cours :
. xarelto 15 mg [suspendu le
@@ -224,32 +224,32 @@ total) et radio prevue a distanc epour rechercher osteite...
Exam comp : note cs
Jeune : std
Adaptation TTT : derniere prise Xarelto 20/02 - forxiga 22/02 (donc sur-risque theorique d'acidocetose euglicemique a
garder en tete), presc pre-op signee.
garder en tete), presc pre-op signee.
Dossier de consultation
Le 28 Février 2023 11 : 28
Page :
2/2 Anesthésiste : Dr [NOM]
[NOM]
Date :
17/02/2023 09 : 31
Patient : [NOM] [NOM] [NOM] né(e) le :
[DATE_NAISSANCE]
I.P.P. : [TEL]
Patient : [NOM] [NOM] [NOM] né(e) le :
N? Interv : [IPP]
[DATE_NAISSANCE]
Né(e) le : [DATE_NAISSANCE]
79 ans
Date :
17/02/2023 09 : 31
Consigne(s) IDE
A jeun le 23/02/2023 à 00 : 00
PCR COVID a recuperer
Paracetamol 1gr per os en pre-medication
PREPARATIONS
A jeun le 23/02/2023 à 00 : 00
PCR COVID a recuperer
- PER-Opératoires : BIS, Baby-Noradrenaline
Paracetamol 1gr per os en pre-medication
Prescription selon ordonnance du médecin traitant
Adaptation du traitement personnel
Nom du médicament, dosage, posologie
Soir J-1
Arrêt
Matin J 0
Prescription selon ordonnance du médecin traitant
Midi J 0
Coucher J-1
abasaglar // UI, Soir : 30, A continuer jusqu'a la veille au soir
@@ -267,7 +267,7 @@ lercan 20mg // CP, Matin : 1, A continuer le matin
seresta 10 mg // CP, Soir : 1, A continuer jusqu'a la veille au soir
1 CP
Date / Heure
Validation IDE
Validation IDE
Prémédication
Le 28 Février 2023 11 : 28
Page :