- Skip EDS_TEL dans PDF (valeurs Pouls détectées comme N° de téléphone)
- Ajout EDS_VILLE au whole-word matching (évite "GEL" dans "GELULE")
- Filtre stop words étendu à EDS_HOPITAL et EDS_VILLE dans la détection NER
- Détection noms soignants dans "Note IDE\nPrenom NOM" (BARGAIN, LACOTE, etc.)
- Stop words : semaine, jour, matin, soir, nuit, midi
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
- Parseur trackare spécifique (détection par contenu, extraction structurée des PII)
- Support format "Dr X. NOM" et "Mme X. NOM" (initiales + noms composés avec tiret)
- Détection noms personnel médical (Aide, Cadre Infirmier, etc.)
- Masquage RPPS, établissements (EHPAD/SSR/USLD standalone), lieux de naissance
- Stop words médicaux enrichis (~270 entrées : DCI, spécialités, termes contextuels)
- Détection compagnon (noms adjacents à des noms connus dans le texte brut)
- Protection noms composés (JEAN-PIERRE traité comme un tout, pas JEAN + PIERRE)
- Nettoyage codes postaux orphelins, téléphones fragmentés/partiels
- Désactivation masquage dates génériques, AGE avec contexte obligatoire
- GUI : extraction OGC depuis le nom du répertoire parent, incrustation sur les pages
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>