Externalize dictionaries and add anonymization review corpus

This commit is contained in:
2026-04-21 10:32:57 +02:00
parent 012445755a
commit 500ebc28c2
99 changed files with 1805 additions and 805 deletions

View File

@@ -0,0 +1,27 @@
{
"required_kinds": [
"EMAIL",
"FINESS",
"IPP",
"NOM_GLOBAL",
"OGC",
"RPPS",
"TEL",
"VILLE",
"force_term"
],
"must_not_contain": [
"ETCHEVERRY",
"JEAN",
"CLAUDE",
"ABC12345",
"123456789",
"12345678901",
"Bayonne",
"Bordeaux",
"Anglet",
"06 11 22 33 44",
"jean.dupont@example.com",
"CHCB"
]
}

View File

@@ -0,0 +1,11 @@
[NOM] [NOM] [NOM]
IPP : [IPP]
FINESS : [FINESS]
RPPS : [RPPS]
[VILLE], le 12/03/2024
Lieu de naissance : [VILLE]
Ville de résidence : [VILLE]
Téléphone : [TEL]
Mail : [EMAIL]
N° OGC : [OGC]
Patient adressé au [MASK] pour avis. Retour au [MASK] demain.

View File

@@ -0,0 +1,7 @@
# Revue 004
Points critiques :
- les identifiants structurés doivent être masqués même quand le label et la valeur sont séparés ;
- la ville d'en-tête et les villes structurées doivent disparaître ;
- le nom de patient en en-tête doit être propagé ;
- les deux occurrences de `CHCB` doivent être masquées.

View File

@@ -0,0 +1,12 @@
ETCHEVERRY JEAN CLAUDE
IPP
ABC12345
FINESS : 123456789
RPPS : 12345678901
Bayonne, le 12/03/2024
Lieu de naissance : Bordeaux
Ville de résidence : Anglet
Téléphone : 06 11 22 33 44
Mail : jean.dupont@example.com
N° OGC : 12
Patient adressé au CHCB pour avis. Retour au CHCB demain.