Files
anonymisation/tests/synthetic_review/cases/005_bacterio_complete/review.md
Domi31tls ffb8006e91 fix(detect): RPPS avec qualificateur (RPPS prescripteur :, RPPS de garde :…) (#1)
Étend `RE_RPPS` pour tolérer 0 à 3 mots qualificateurs entre `RPPS`
et le séparateur `:` ou `-`. Couvre les variantes observées :
- RPPS prescripteur :
- RPPS du médecin signataire :
- RPPS de garde -
- N° RPPS :

Si un qualificateur est présent, le séparateur (`:` ou `-`) devient
obligatoire pour éviter d'aspirer du narratif (faux positif type
"Le RPPS est consulté pour vérifier 12345678901 dans la base").

La lambda `_repl_rpps` reconstruit `RPPS : [RPPS]` en sortie : le
qualificateur est consommé mais perdu (pas de fuite, choix cosmétique).

Cas 005_bacterio_complete passe désormais (retiré de KNOWN_FAILURES).
La fuite `10101010101` derrière `RPPS prescripteur :` est masquée.

Cohérent avec le cadrage section 10.1 (règle cœur générique
applicable à tout établissement de santé français — pas de
spécificité locale).

Tests : 72 passed, 1 xfailed (avant : 71 passed, 2 xfailed).

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-04-27 22:33:01 +02:00

1.8 KiB

Revue 005 — résultat bactériologique

Famille documentaire : résultat d'examen biologique avec entête multi-ligne typique du laboratoire (N° venue, DDN, nom, NDA, IPP empilés sans label explicite avant chaque valeur).

Points critiques :

  • le numéro de venue est rejeté plusieurs lignes après son libellé, juste avant la ligne IPP — ce layout BACTERIO est précisément ce que la règle _RE_VENUE_BEFORE_IPP doit attraper ;
  • la date de naissance doit être masquée, pas la date de prélèvement ni l'horaire de prélèvement ;
  • le RPPS du prescripteur doit disparaître ;
  • le téléphone du laboratoire est une donnée de contact à masquer ;
  • le vocabulaire microbiologique (Escherichia coli, Antibiogramme, Amoxicilline, Céfotaxime, Ciprofloxacine) doit rester lisible intégralement, c'est l'utilité métier du document ;
  • Service de néphrologie doit rester lisible ;
  • prise en charge doit rester lisible ;
  • le nom composé MARIE-PIERRE doit être traité en bloc ;
  • le biologiste signataire (Dr DUHALDE Anne) doit être masqué.

Écart résolu dans la session 2026-04-27 :

  • fuite RPPS : pattern RE_RPPS étendu pour tolérer 0 à 3 mots qualificateurs (prescripteur, signataire, du médecin, de garde) entre RPPS et :. Le qualificateur est consommé par le matcher et la sortie reconstruit RPPS : [RPPS] (perte cosmétique du qualificateur, pas de fuite).

Écart résiduel cosmétique :

  • bloc Dr DUHALDE Anne masqué comme un seul [NOM] plutôt que Dr [NOM] [NOM] — accepté tant qu'aucun token de nom ne fuit ; à retraiter si l'usage demande la conservation du préfixe Dr.

Vérification BDPM/gazetteer :

  • Amoxicilline, Céfotaxime, Ciprofloxacine, Escherichia coli, Antibiogramme doivent rester intacts (contenu métier).