Externalize dictionaries and add anonymization review corpus
This commit is contained in:
@@ -122,8 +122,9 @@ Fonction : `_mask_line_by_regex`
|
||||
| Dates | `[DATE]` | 12/03/2024 |
|
||||
| Adresses | `[ADRESSE]` | 12 rue de la Paix |
|
||||
|
||||
Configuration supplementaire via `config/dictionnaires.yml` :
|
||||
listes blanches, force-mask et regex personnalisees.
|
||||
Configuration :
|
||||
- `config/dictionnaires.default.yml` : template versionne, source de verite des valeurs par defaut
|
||||
- `config/dictionnaires.yml` : surcharge locale chargee par defaut, contenant uniquement les ecarts site/runtime
|
||||
|
||||
### 3. Reconnaissance d'entites nommees (NER)
|
||||
|
||||
@@ -180,6 +181,7 @@ un fallback OCR est utilise :
|
||||
|
||||
| Element | Description |
|
||||
|-------------------------------|------------------------------------------------|
|
||||
| `config/dictionnaires.yml` | Listes blanches, force-mask, regex custom |
|
||||
| `config/dictionnaires.default.yml` | Valeurs par defaut completes et versionnees |
|
||||
| `config/dictionnaires.yml` | Surcharge locale optionnelle (ecarts uniquement) |
|
||||
| `Pseudonymisation_Gui_V5.py` | Interface graphique (traitement par lots) |
|
||||
| Ligne de commande | `python anonymizer_core_refactored_onnx.py fichier.pdf --hf --raster` |
|
||||
|
||||
Reference in New Issue
Block a user