fix(detect): RPPS avec qualificateur (RPPS prescripteur :, RPPS de garde :…) (#1)
Étend `RE_RPPS` pour tolérer 0 à 3 mots qualificateurs entre `RPPS` et le séparateur `:` ou `-`. Couvre les variantes observées : - RPPS prescripteur : - RPPS du médecin signataire : - RPPS de garde - - N° RPPS : Si un qualificateur est présent, le séparateur (`:` ou `-`) devient obligatoire pour éviter d'aspirer du narratif (faux positif type "Le RPPS est consulté pour vérifier 12345678901 dans la base"). La lambda `_repl_rpps` reconstruit `RPPS : [RPPS]` en sortie : le qualificateur est consommé mais perdu (pas de fuite, choix cosmétique). Cas 005_bacterio_complete passe désormais (retiré de KNOWN_FAILURES). La fuite `10101010101` derrière `RPPS prescripteur :` est masquée. Cohérent avec le cadrage section 10.1 (règle cœur générique applicable à tout établissement de santé français — pas de spécificité locale). Tests : 72 passed, 1 xfailed (avant : 71 passed, 2 xfailed). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -9,7 +9,7 @@ N° venue
|
||||
[NOM] [NOM]
|
||||
[NDA]
|
||||
IPP : [IPP]
|
||||
RPPS prescripteur : [RPPS]
|
||||
RPPS : [RPPS]
|
||||
|
||||
Prélèvement : ECBU
|
||||
Date de prélèvement : 02/04/2024 à 08h30
|
||||
|
||||
@@ -20,11 +20,14 @@ Points critiques :
|
||||
- le nom composé `MARIE-PIERRE` doit être traité en bloc ;
|
||||
- le biologiste signataire (`Dr DUHALDE Anne`) doit être masqué.
|
||||
|
||||
Écarts détectés au runner (à corriger) :
|
||||
- **fuite RPPS critique** : `RPPS prescripteur : 10101010101` n'est pas masqué.
|
||||
La règle RPPS courante attend `RPPS\s*:\s*\d{11}` et ne tolère pas un
|
||||
qualificateur (`prescripteur`, `signataire`, `prescripteur du jour`, …)
|
||||
entre `RPPS` et `:`. Mêmes layouts probables pour FINESS, IPP, NDA.
|
||||
Écart résolu dans la session 2026-04-27 :
|
||||
- **fuite RPPS** : pattern `RE_RPPS` étendu pour tolérer 0 à 3 mots
|
||||
qualificateurs (`prescripteur`, `signataire`, `du médecin`, `de garde`)
|
||||
entre `RPPS` et `:`. Le qualificateur est consommé par le matcher et
|
||||
la sortie reconstruit `RPPS : [RPPS]` (perte cosmétique du qualificateur,
|
||||
pas de fuite).
|
||||
|
||||
Écart résiduel cosmétique :
|
||||
- bloc `Dr DUHALDE Anne` masqué comme un seul `[NOM]` plutôt que
|
||||
`Dr [NOM] [NOM]` — accepté tant qu'aucun token de nom ne fuit ; à
|
||||
retraiter si l'usage demande la conservation du préfixe `Dr`.
|
||||
|
||||
Reference in New Issue
Block a user